Componente de normalización

Puede configurar las propiedades para el componente de preparación de normalización en escenarios HANA y que no sean HANA.

Sintaxis Use este componente para normalizar los datos de atributo. La normalización de HANA escala los grandes datos de atributo de valor para que entren en un rango específico, como -1.0 a 1.0, o 0.0 a 1.0. Puede usar este componente para el análisis en base de datos. La normalización de datos es útil para los algoritmos de clasificación que implican redes neurales, o medidas de distancia, como la clasificación y agrupamiento en clúster de los vecinos más cercanos.
Nota Si desea que los datos procesados reemplacen la columna existente, seleccione Reemplazar columna.

El componente de normalización admite los siguientes métodos de normalización:

  • Normalización mín./máx.: Efectúa una transformación lineal de los valores de datos originales y normaliza cada uno de ellos para ajustarlo a un rango específico. Al realizar la normalización mínima-máxima puede especificar el Nuevo valor máximo y el Nuevo valor mínimo. Esta normalización es útil para asegurar que los valores extremos están limitados dentro de un rango fijo.
    Nota
    • Nuevo valor máximo debe ser mayor que Nuevo valor mínimo.
  • Normalización del resultado Z: cálculo basado en el medio y la desviación estándar de cada atributo. Esta normalización es útil para determinar si un valor específico está por encima o por debajo del promedio, y por cuánto.
  • Normalización de escalado decimal: La coma decimal de los valores de cada atributo se desplaza conforme a su valor absoluto máximo.
Nota Puede seleccionar Reemplazar columna, si desea que los datos normalizados reemplacen los datos de la columna existentes, en los que se lleva a cabo la normalización.

Normalizar el tiempo utilizado para cubrir una distancia en concreto.
Tabla:
Nombre Distancia (en metros) Tiempo (en segundos)
Laura 500 66
Desi 500 360
Álex 500 201
Juan 500 78
Tomás 500 504
Para normalizar la columna de tiempo con la normalización Mínima-Máxima, realice los pasos siguientes:
  1. En la vista Predecir de la lista de componentes, seleccione la ficha Preparación de datos.
  2. Arrastre el componente Normalización HANA al editor de análisis o haga doble clic en Normalización HANA.
  3. Haga doble clic en Normalización de HANA o pase el puntero del ratón por encima de Normalización de HANA y seleccione Configurar propiedades.
  4. Seleccione las columnas que desee normalizar.
    Nota Solo puede seleccionar las columnas con valores numéricos.

    Por ejemplo, Tiempo (en segundos).

  5. Desde la lista desplegable Tipo de normalización, seleccione Mín-Máx.
  6. Introduzca los valores para Nuevo máximo y Nuevo mínimo.
  7. Seleccione Finalizado y, a continuación, Ejecutar.
Tabla de salida:
Nombre Distancia (en metros) Tiempo (en segundos) Tiempo (en segundos)_Normalizado
Laura 500 66 0,05
Desi 500 360 0,30
Álex 500 201 0,17
Juan 500 78 0,06
Tomás 500 504 0,42
Lleve a cabo los mismos pasos para la normalización del resultado Z y para la normalización del escalado decimal, tal y como se menciona en la normalización Mín-Máx. Sin embargo, en el caso de la normalización del resultado Z y de la normalización del escalado decimal, no es necesario indicar los valores de Nuevo máximo ni de Nuevo mínimo.
Salida de la normalización del resultado Z:
Tabla de salida:
Nombre Distancia (en metros) Tiempo (en segundos)
Laura 500 -0,49
Desi 500 1,77
Álex 500 0,55
Juan 500 -0,40
Tomás 500 2,88
Salida de la normalización del escalado decimal:
Tabla de salida:
Nombre Distancia (en metros) Tiempo (en segundos)
Laura 500 0,01
Desi 500 0,04
Álex 500 0,02
Juan 500 0,01
Tomás 500 0,05