Clasificación de bosque casual R de HANA

Propiedades que se pueden configurar para el algoritmo Clasificación de bosque casual R de HANA.

Información general:
El Bosque casual es un método de conjunto popular que se utiliza para los algoritmos de clasificación y regresión. El algoritmo se realiza al construir un conjunto de árboles de decisión en el tiempo de formación. Para una tarea de clasificación, la clase de salida se basa en los votos mayoritarios de un árbol de decisiones individual en el bosque. Comparado con otros algoritmos de clasificación, este método de conjunto lleva a una mejor precisión y generalización en los conjuntos de datos empresariales.

El paquete R que implementa el algoritmo es randomForest.

Nota

El nivel máximo soportado en cada propiedad de conjunto de datos es 53.

Propiedades de la clasificación de bosque casual R de HANA
Tabla 1: Propiedades del algoritmo
Propiedad Descripción
Características Seleccione las columnas de entrada con las que desea realizar el análisis.
Columnas destino Seleccione la columna de destino en la que desea realizar el análisis.
Número de árboles a crecer La cantidad de árboles que se requieren para crecer en el Bosque casual. Este parámetro se puede fijar entre el 5 y el 1000, ambos inclusive.
Nodos terminales mínimos Número mínimo de nodos terminales en el árbol de decisiones. Este parámetro se puede fijar entre el 10 y el 500, ambos inclusive.