Classificação de boosting R do HANA

Propriedades que podem ser configuradas para o algoritmo Classificação de boosting R do HANA.

Visão geral:
O algoritmo Boosting é um método popular de agrupamento que pode ser aplicado para classificação. Os algoritmos Adaboost.M1 e Adaboost-SAMME são aceitos no componente. Esse método de agrupamento foi projetado para aprimorar a precisão e solidez dos classificadores fracos nos conjuntos de dados da empresa.

Os pacotes R que implementam o algoritmo são o adabag e o rpart.

Nota

Neste componente, o método de árvore de decisões está selecionado como o algoritmo de classificação.

Nota

Se os nomes de coluna incluírem um hífen (-), use o componente Tipo de dados para redefini-los.

Propriedades da classificação de boosting R do HANA
Tabela 1: Propriedades do algoritmo
Propriedade Descrição
Profundidade máxima Insira o nível máximo de nó na árvore final com o nó raiz sendo considerado como o nível 0. Este parâmetro pode ser definido entre 1 e 20, incluindo os valores limiares.
Divisão mínima Insira um número mínimo de observações necessárias para a divisão de um nó. O valor predeterminado é 0. O parâmetro pode ser definido entre 0 e 500, incluindo os valores limiares.
Parâmetro de complexidade Insira o parâmetro de complexidade, o qual economiza tempo de cálculo, já que impede qualquer divisão que não melhore o ajuste. O valor do parâmetro deve estar entre [-1, 1], ou seja, ser igual ou superior a -1 e inferior a 1.
Número de interações Número de interações para as quais o boosting está em execução. Este parâmetro pode ser definido entre 5 e 500, incluindo os valores limiares.
Ponderações de amostra Se TRUE, uma amostra de bootstrap do conjunto de treinamento é desenhada usando as ponderações para cada observação nessa interação. Se FALSE, cada observação é usada com sua ponderação correspondente.
Coeficiente de atualização de ponderação Há três formas de calcular o coeficiente de atualização de ponderação (que é α no algoritmo AdaBoost.M1): A) ‘Breiman’: α=1/[2 ln⁡((1-err)/err)], and B) ‘Freund’: α=ln⁡((1-err)/err), and⁡ C) ‘Zhu’: α=ln⁡((1-err)/err)⁡+ln⁡(N_classes-1).
Recursos Selecione as colunas de entrada com as quais deseja executar a análise.
Colunas de destino Selecione a coluna de destino na qual deseja executar a análise.