Clasificación de aumento R de HANA

Propiedades que se pueden configurar para el algoritmo Clasificación de aumento R de HANA.

Información general:
El algoritmo de aumento es un método de conjunto popular que se puede aplicar para la clasificación. Los algoritmos Adaboost.M1 y Adaboost-SAMME se soportan en el componente. El método de conjunto está diseñado para mejorar la precisión y robustez de los clasificadores débiles en los conjuntos de datos empresariales.

Los paquetes R que implementan el algoritmo son adabag y rpart.

Nota

En este componente, se selecciona el método del árbol de decisiones como el algoritmo de clasificación.

Nota

Cuando los nombres de columna contengan el símbolo de guion (-), utilice el componente de Tipo de datos para volver a definir el nombre de la columna.

Propiedades de la clasificación de aumento R de HANA
Tabla 1: Propiedades del algoritmo
Propiedad Descripción
Profundidad máxima Introduzca el nivel de nodo máximo en el árbol final con el nodo de raíz contado como nivel 0. Este parámetro se puede fijar entre el 1 y el 20, ambos inclusive.
División mínima Introduzca el número mínimo de observaciones necesarios para dividir un nodo. El valor predeterminado es 0. El parámetro se puede fijar entre el 0 y el 500, ambos inclusive.
Parámetro de complejidad Introduzca el parámetro de complejidad que guarda el tipo de cálculo al evitar las divisiones que no mejoran el ajuste. El valor para el parámetro tiene que ser entre [-1, 1), que es igual o mayor que -1 y menor que 1.
Número de repeticiones Número de repeticiones para las que se ejecuta el aumento. Este parámetro se puede fijar entre el 5 y el 500, ambos inclusive.
Ponderaciones de muestra Si es TRUE, una muestra de arranque del conjunto de formación se muestra al utilizar las ponderaciones para cada observación en esa repetición. Si es FALSE, cada observación se utiliza con sus ponderaciones.
Coeficiente de actualización de la ponderación Las tres maneras de calcular el coeficiente de actualización de la ponderación, que es α en el algoritmo AdaBoost.M1, son las siguientes: A) ‘Breiman’: α=1/[2 ln⁡((1-err)/err)], y B) ‘Freund’: α=ln⁡((1-err)/err), y ⁡ C) ‘Zhu’: α=ln⁡((1-err)/err)⁡+ln⁡(N_classes-1).
Características Seleccione las columnas de entrada con las que desea realizar el análisis.
Columnas destino Seleccione la columna de destino en la que desea realizar el análisis.