Regresión de bosque casual R

Propiedades que se pueden configurar para el algoritmo Regresión bosque casual R.

El Bosque casual es un método de conjunto popular que se utiliza para los algoritmos de clasificación y regresión. El algoritmo se realiza al construir un conjunto de árboles de decisión en el tiempo de formación. Para una tarea de regresión, se calcula la predicción media de árboles individuales como la salida. Comparado con otros algoritmos de regresión, este método de conjunto lleva a una mejor precisión y generalización en los conjuntos de datos empresariales.

El paquete R que implementa el algoritmo es randomForest.

Nota

El nivel máximo soportado en cada propiedad de conjunto de datos es 53. El nivel hace referencia a la categoría, la variedad o el tipo de valores que una variable puede tomar; por ejemplo, la columna "Género" tiene dos niveles, "Masculino" y "Femenino". En este caso, la variable no puede tener más de 53 tipos de valores.

Propiedades de la regresión de bosque casual R
Tabla 1: Propiedades del algoritmo
Propiedad Descripción
Características Seleccione las columnas de entrada con las que desea realizar el análisis.
Columnas destino Seleccione la columna de destino en la que desea realizar el análisis.
Número de árboles a crecer La cantidad de árboles que se requieren para crecer en el Bosque casual. Este parámetro se puede fijar entre el 5 y el 1000, ambos inclusive.
Nodos terminales mínimos Número mínimo de nodos terminales en el árbol de decisiones. Este parámetro se puede fijar entre el 10 y el 500, ambos inclusive.