Nueva normalización

La normalización es un tratamiento de datos estándares antiguo que aparece en PMML (Predictive Model Markup Language), un lenguaje de especificación de extracción de datos definido por el Data Mining Group (DMG). La normalización se aplica con frecuencia a variables numéricas antes de la extracción de datos, y consiste en una transformación lineal definida a trozos cuya variable resultante normalmente está entre 0 y 1. Se puede utilizar para transformaciones de rango, donde la salida representa una magnitud en términos de la proporción aproximada (percentil) de valores por debajo del valor de entrada. De forma alternativa, se puede convertir un campo en base a cuántas desviaciones estándares se encuentra un valor de la media del campo. El hecho de especificar qué valor debe utilizarse cuando un valor de entrada numérico es desconocido o fuera de rango, visto en los datos de entrenamiento, también forma parte de la normalización.

  • Para crear una nueva normalización
    1. Seleccione un campo de la lista Seleccione un campo por normalizar. Solo se visualizan los campos de enteros o de números.
    2. Para cada punto de la normalización:
      1. En la sección Añadir puntos a la normalización, introduzca un valor en el campo Entrada.
      2. Introduzca el valor de salida correspondiente en el campo Salida.
      3. Haga clic en el botón + para añadir el punto definido a la normalización. El punto aparece en la lista.

        Cuando se han definido como mínimo dos puntos, se visualiza el gráfico correspondiente en la sección Resumen en la parte inferior del panel.

    3. En la lista Valores mínimos de la sección Definir comportamiento fuera de rango, seleccione el comportamiento que debería aplicarse a los valores inferiores al punto más bajo establecido previamente. Los valores disponibles se detallan en la tabla siguiente:
      Comportamiento Los valores fuera de rango corresponden a... Gráfico correspondiente
      Saturación el valor de los límites del rango IMAGEN AQUÍ
      Pendiente la continuación hacia la infinidad de la línea recta que se dirige hacia el último límite. IMAGEN AQUÍ
      Definido por el usuario

      un valor definido por el usuario.

      Para establecer un valor definido por el usuario, introduzca el valor en el campo de texto y haga clic en el botón Actualizar para actualizar el gráfico.

      IMAGEN AQUÍ
      Valor nulo el valor Nulo. Significa que no se visualiza en el gráfico. IMAGEN AQUÍ
    4. Haga clic en el botón Siguiente. Se abre el desplegable Introduzca el nombre del campo calculado.
    5. Introduzca el nuevo nombre del campo en el campo Nombre.
      Nota

      Si introduce un nombre existente, se visualiza un mensaje y se desactiva el botón De acuerdo.

    6. Haga clic en el botón De acuerdo. Se visualiza la lista Campos que contiene el campo recién creado.