HANA R de árvore CNR

As propriedades que podem ser configuradas para o algoritmo HANA R de árvore CNR.

Sintaxe Use este algoritmo para classificar observações em grupos e prever uma ou mais variáveis discretas com base em outra variáveis. No entanto, você pode usar este algoritmo para identificar tendências nos dados.
Nota
  • O pacote "rpart" que faz parte do R 2.15 não processa nomes de coluna com espaço nem caracteres especiais. O pacote "rpart" suporta apenas formato de nome de coluna de entrada suportado pelo dataframe R.
  • Nomes de coluna independente usados durante a pontuação do modelo devem ser iguais aos nomes de coluna independente usados durante a criação do modelo.
  • Nomes de coluna que contenham espaços ou qualquer outro caractere especial diferente de ponto (.) não são suportados.
Propriedades do algoritmo HANA R de árvore CNR
Tabela 1: Propriedades do algoritmo
Propriedade Descrição
Modo de saída Selecione o modo em que você deseja usar a saída deste algoritmo.
Valores possíveis:
  • Tendência: prevê os valores da coluna dependente e adiciona uma coluna extra à saída que contenha os valores previstos.
  • Preenchimento: preenche os valores em falta na coluna de destino.
Recursos Selecione as colunas de entrada com as quais você deseja executar a análise.
Variável de destino Selecione a coluna de destino com a qual você deseja executar a análise.
Valores em falta Selecione o método para manipulação dos valores em falta.
Valores possíveis:
  • Ignorar: o algoritmo ignora os registros que contenham os valores em falta na coluna independente ou dependente.
  • Manter: o algoritmo retém os registros que contenham valores em falta durante o cálculo.
Tipo de algoritmo Selecione o tipo de análise que deseja que o algoritmo execute.
Valores possíveis:
  • Classificação: use este método se a variável dependente tiver valores de categoria.
  • Regressão: use este método - se a variável dependente tiver valores numéricos.
Divisão mínima Insira um número mínimo de observações necessárias para divisão de um nó. O valor predeterminado é 10.
Critérios de divisão Selecione os critérios de divisão do nó.
Valores possíveis:
  • Gini: impureza Gini
  • Informações: ganho de informações.
Nome da coluna prevista Insira um nome para a coluna recém-criada que contenha os valores previstos.
Parâmetro de complexidade Insira o parâmetro de complexidade que economiza o tempo de cálculo, evitando qualquer divisão que não melhore o ajuste. O valor predeterminado é 0,005.
Profundidade máxima Insira o nível máximo do nó na árvore final com o nó raiz computado como nível 0.
Nota Se a profundidade máxima for maior que 30, o algoritmo não produz os resultados esperados (em máquinas de 32 bits).
Validação cruzada Insira o número de validações cruzadas. Um valor maior de validação cruzada aumenta o tempo de cálculo e produz resultados mais precisos.
Probabilidade prioritária Insira o vetor de probabilidades prioritárias.
Utilizar substituto Selecione o substituto para usar no processo de repartição.
Valores possíveis:
  • Exibir apenas - uma observação com um valor em falta para a regra de divisão primária não será enviada aos níveis inferiores da árvore.
  • Utilizar substituto - use esta opção para dividir objetos sem a variável principal; se todos os substitutos estiverem em falta, a observação não será dividida.
  • Interromper se estiver em falta – se todos os substitutos estiverem em falta, a observação será enviada na direção majoritária.
Estilo de substituto Insira o estilo que controla a seleção do melhor substituto.
Valores possíveis:
  • Usar classificação correta total - o algoritmo usa o número total de classificações corretas para encontrar uma variável substituta potencial.
  • Usar percentual de casos que não estão em falta - o algoritmo usa o percentual de casos que não estão em falta, classificados para encontrar um substituto potencial.
Substituto máximo Insira o número máximo de substitutos a ser retido em cada nó de uma árvore.
Mostrar probabilidade Selecione a caixa de seleção Mostrar probabilidade para obter a probabilidade de valores previstos durante a pontuação de um modelo de classificação.