Componente de normalização

É possível configurar propriedades para o componente de Preparação de Normalização em cenários HANA e não HANA.

Sintaxe Use este componente para normalizar os dados de atributo. A Normalização HANA escala os dados de atributo com grande valor para ficarem em um intervalo específico, como -1.0 a 1.0, ou 0.0 a 1.0. Você pode utilizar esse componente para análise No banco de dados. A normalização de dados é usada para classificar algoritmos envolvendo redes neurais ou medidas de distância, como classificação e clustering do vizinho mais próximo.
Nota Se deseja que os dados processados substituam a coluna existente, selecione Substituir coluna.

O componente de normalização suporta os seguintes métodos de normalização:

  • Normalização Mín–Máx: executa uma transformação linear nos valores dos dados originais, e escala cada valor para adequar-se em um intervalo específico. Enquanto realiza a normalização Mín-Máx você pode especificar o valor Novo máximo e o valor Novo mínimo. Esta normalização é útil para garantir que valores extremos sejam limitados a um intervalo fixo.
    Nota
    • O valor Novo máximo deve ser maior do que o valor Novo mínimo.
  • Normalização pontuação Z: calculada com base na média e no desvio padrão para cada atributo. Esta normalização é útil para determinar se um valor específico está acima ou abaixo da média, e por quanto.
  • Normalização de escala decimal: A vírgula decimal dos valores de cada atributo é movida de acordo com seu valor absoluto máximo.
Nota Selecione Substituir coluna, se quiser que os dados sejam normalizados para substituir os dados da coluna existente, na qual a normalização será executada.

Normalizando o tempo gasto para cobrir certa distância.
Tabela:
Nome Distância (em metros) Tempo (em segundos)
Laura 500 66
Desy 500 360
Alex 500 201
John 500 78
Ted 500 504
Para normalizar a coluna de tempo usando a normalização Mín-Máx, realize as seguintes etapas:
  1. Na visão Prever, da Lista Componente, escolha a guia Preparação de dados.
  2. Arraste o componente Normalização no editor de análise, ou clique duas vezes em Normalização.
  3. Clique duas vezes em Normalização HANA ou passe o ponteiro do mouse sobre Normalização HANA e selecione Configurar propriedades.
  4. Selecione as colunas que serão normalizadas.
    Nota Você só pode selecionar colunas com valores numéricos.

    Por exemplo, Tempo (em segundos).

  5. Na lista suspensa Tipo de normalização, selecione Mín-Máx.
  6. Insira valores para o Novo máximo e o Novo mínimo.
  7. Escolha Concluído, e selecione Executar.
Tabela de saída:
Nome Distância (em metros) Tempo (em segundos) Tempo (em segundos)_normalizado
Laura 500 66 0,05
Desy 500 360 0,30
Alex 500 201 0,17
John 500 78 0,06
Ted 500 504 0,42
Execute as mesmas etapas para normalização Pontuação Z e a normalização Escala decimal como mencionado na normalização Mín-Máx. Entretanto, no caso da normalização Pontuação Z e a normalização Escala decimal, você não precisa inserir os valores Novo máximo e Novo mínimo.
Saída de normalização Pontuação Z:
Tabela de saída:
Nome Distância (em metros) Tempo (em segundos)
Laura 500 -0,49
Desy 500 1,77
Alex 500 0,55
John 500 -0,40
Ted 500 2,88
Saída de normalização Escala decimal:
Tabela de saída:
Nome Distância (em metros) Tempo (em segundos)
Laura 500 0,01
Desy 500 0,04
Alex 500 0,02
John 500 0,01
Ted 500 0,05