Puede configurar las propiedades para el componente de preparación de normalización en escenarios HANA y que no sean HANA.
Sintaxis Use este componente para normalizar los datos de atributo. La normalización de HANA escala los grandes datos de atributo de valor para que entren en un rango específico, como -1.0 a 1.0, o 0.0 a 1.0. Puede usar este componente para el análisis en base de datos. La normalización de datos es útil para los algoritmos de clasificación que implican redes neurales, o medidas de distancia, como la clasificación y agrupamiento en clúster de los vecinos más cercanos.
Nota Si desea que los datos procesados reemplacen la columna existente, seleccione Reemplazar columna.
El componente de normalización admite los siguientes métodos de normalización:
- Normalización mín./máx.: Efectúa una transformación lineal de los valores de datos originales y normaliza cada uno de ellos para ajustarlo a un rango específico. Al realizar la normalización mínima-máxima puede especificar el Nuevo valor máximo y el Nuevo valor mínimo. Esta normalización es útil para asegurar que los valores extremos están limitados dentro de un rango fijo.
Nota - Nuevo valor máximo debe ser mayor que Nuevo valor mínimo.
- Normalización del resultado Z: cálculo basado en el medio y la desviación estándar de cada atributo. Esta normalización es útil para determinar si un valor específico está por encima o por debajo del promedio, y por cuánto.
- Normalización de escalado decimal: La coma decimal de los valores de cada atributo se desplaza conforme a su valor absoluto máximo.
Nota Puede seleccionar Reemplazar columna, si desea que los datos normalizados reemplacen los datos de la columna existentes, en los que se lleva a cabo la normalización.
Normalizar el tiempo utilizado para cubrir una distancia en concreto.
Tabla:
| Nombre |
Distancia (en metros) |
Tiempo (en segundos) |
| Laura |
500 |
66 |
| Desi |
500 |
360 |
| Álex |
500 |
201 |
| Juan |
500 |
78 |
| Tomás |
500 |
504 |
Para normalizar la columna de tiempo con la normalización
Mínima-Máxima, realice los pasos siguientes:
- En la vista Predecir de la lista de componentes, seleccione la ficha Preparación de datos.
- Arrastre el componente Normalización HANA al editor de análisis o haga doble clic en Normalización HANA.
- Haga doble clic en Normalización de HANA o pase el puntero del ratón por encima de Normalización de HANA y seleccione Configurar propiedades.
- Seleccione las columnas que desee normalizar.
Nota Solo puede seleccionar las columnas con valores numéricos.
Por ejemplo, Tiempo (en segundos).
- Desde la lista desplegable Tipo de normalización, seleccione Mín-Máx.
- Introduzca los valores para Nuevo máximo y Nuevo mínimo.
- Seleccione Finalizado y, a continuación, Ejecutar.
Tabla de salida:
| Nombre |
Distancia (en metros) |
Tiempo (en segundos) |
Tiempo (en segundos)_Normalizado |
| Laura |
500 |
66 |
0,05 |
| Desi |
500 |
360 |
0,30 |
| Álex |
500 |
201 |
0,17 |
| Juan |
500 |
78 |
0,06 |
| Tomás |
500 |
504 |
0,42 |
Lleve a cabo los mismos pasos para la normalización del
resultado Z y para la normalización del
escalado decimal, tal y como se menciona en la normalización
Mín-Máx. Sin embargo, en el caso de la normalización del
resultado Z y de la normalización del
escalado decimal, no es necesario indicar los valores de
Nuevo máximo ni de
Nuevo mínimo.
Salida de la normalización del
resultado Z:
Tabla de salida:
| Nombre |
Distancia (en metros) |
Tiempo (en segundos) |
| Laura |
500 |
-0,49 |
| Desi |
500 |
1,77 |
| Álex |
500 |
0,55 |
| Juan |
500 |
-0,40 |
| Tomás |
500 |
2,88 |
Salida de la normalización del
escalado decimal:
Tabla de salida:
| Nombre |
Distancia (en metros) |
Tiempo (en segundos) |
| Laura |
500 |
0,01 |
| Desi |
500 |
0,04 |
| Álex |
500 |
0,02 |
| Juan |
500 |
0,01 |
| Tomás |
500 |
0,05 |