É possível configurar propriedades para o componente de Preparação de Normalização em cenários HANA e não HANA.
Sintaxe Use este componente para normalizar os dados de atributo. A Normalização HANA escala os dados de atributo com grande valor para ficarem em um intervalo específico, como -1.0 a 1.0, ou 0.0 a 1.0. Você pode utilizar esse componente para análise No banco de dados. A normalização de dados é usada para classificar algoritmos envolvendo redes neurais ou medidas de distância, como classificação e clustering do vizinho mais próximo.
Nota Se deseja que os dados processados substituam a coluna existente, selecione Substituir coluna.
O componente de normalização suporta os seguintes métodos de normalização:
- Normalização Mín–Máx: executa uma transformação linear nos valores dos dados originais, e escala cada valor para adequar-se em um intervalo específico. Enquanto realiza a normalização Mín-Máx você pode especificar o valor Novo máximo e o valor Novo mínimo. Esta normalização é útil para garantir que valores extremos sejam limitados a um intervalo fixo.
Nota - O valor Novo máximo deve ser maior do que o valor Novo mínimo.
- Normalização pontuação Z: calculada com base na média e no desvio padrão para cada atributo. Esta normalização é útil para determinar se um valor específico está acima ou abaixo da média, e por quanto.
- Normalização de escala decimal: A vírgula decimal dos valores de cada atributo é movida de acordo com seu valor absoluto máximo.
Nota Selecione Substituir coluna, se quiser que os dados sejam normalizados para substituir os dados da coluna existente, na qual a normalização será executada.
Normalizando o tempo gasto para cobrir certa distância.
Tabela:
| Nome |
Distância (em metros) |
Tempo (em segundos) |
| Laura |
500 |
66 |
| Desy |
500 |
360 |
| Alex |
500 |
201 |
| John |
500 |
78 |
| Ted |
500 |
504 |
Para normalizar a coluna de tempo usando a normalização
Mín-Máx, realize as seguintes etapas:
- Na visão Prever, da Lista Componente, escolha a guia Preparação de dados.
- Arraste o componente Normalização no editor de análise, ou clique duas vezes em Normalização.
- Clique duas vezes em Normalização HANA ou passe o ponteiro do mouse sobre Normalização HANA e selecione Configurar propriedades.
- Selecione as colunas que serão normalizadas.
Nota Você só pode selecionar colunas com valores numéricos.
Por exemplo, Tempo (em segundos).
- Na lista suspensa Tipo de normalização, selecione Mín-Máx.
- Insira valores para o Novo máximo e o Novo mínimo.
- Escolha Concluído, e selecione Executar.
Tabela de saída:
| Nome |
Distância (em metros) |
Tempo (em segundos) |
Tempo (em segundos)_normalizado |
| Laura |
500 |
66 |
0,05 |
| Desy |
500 |
360 |
0,30 |
| Alex |
500 |
201 |
0,17 |
| John |
500 |
78 |
0,06 |
| Ted |
500 |
504 |
0,42 |
Execute as mesmas etapas para normalização
Pontuação Z e a normalização
Escala decimal como mencionado na normalização
Mín-Máx. Entretanto, no caso da normalização
Pontuação Z e a normalização
Escala decimal, você não precisa inserir os valores
Novo máximo e
Novo mínimo.
Saída de normalização
Pontuação Z:
Tabela de saída:
| Nome |
Distância (em metros) |
Tempo (em segundos) |
| Laura |
500 |
-0,49 |
| Desy |
500 |
1,77 |
| Alex |
500 |
0,55 |
| John |
500 |
-0,40 |
| Ted |
500 |
2,88 |
Saída de normalização
Escala decimal:
Tabela de saída:
| Nome |
Distância (em metros) |
Tempo (em segundos) |
| Laura |
500 |
0,01 |
| Desy |
500 |
0,04 |
| Alex |
500 |
0,02 |
| John |
500 |
0,01 |
| Ted |
500 |
0,05 |