Clasificación de empaquetamiento R

Propiedades que se pueden configurar para el algoritmo Clasificación de empaquetamiento R.

Nota Para activar el algoritmo, aplique Predictive Analytics 2.3 Patch 2 del SAP Software Download Centre.Información publicada en el sitio de SAP
Sintaxis El algoritmo de empaquetamiento, también conocido como "Agregación de arranque", es un método de conjunto popular que se puede aplicar a tareas de clasificación. El algoritmo crea subconjuntos casuales de conjuntos de datos originales y realiza la clasificación en cada subconjunto. Los valores predichos del clasificador se agregan para formar la predicción final. Este método de conjunto está diseñado para mejorar la precisión y robustez del algoritmo de clasificación individual en los conjuntos de datos empresariales.

Los paquetes R que implementan el algoritmo son adabag y rpart.

Nota

En el componente de empaquetamiento R, se selecciona el método del árbol de decisiones como el algoritmo de clasificación.

Nota

Cuando los nombres de columna contengan el símbolo de guion (-), utilice el componente de Tipo de datos para volver a definir el nombre de la columna.

Propiedades de la clasificación de empaquetamiento R
Tabla 1: Propiedades del algoritmo
Propiedad Descripción
Profundidad máxima Introduzca el nivel de nodo máximo en el árbol final con el nodo de raíz contado como nivel 0. Este parámetro se puede fijar entre el 1 y el 20, ambos inclusive.
División mínima Introduzca el número mínimo de observaciones necesarios para dividir un nodo. El valor predeterminado es 0. El parámetro se puede fijar entre el 0 y el 500, ambos inclusive.
Parámetro de complejidad Introduzca el parámetro de complejidad que guarda el tipo de cálculo al evitar las divisiones que no mejoran el ajuste. El valor para el parámetro tiene que ser entre [-1, 1), que es igual o mayor que -1 y menor que 1.
Número de árboles a utilizar Número de árboles utilizados en el bosque de un algoritmo de árboles de decisión. El algoritmo de árboles de decisión se utiliza para el empaquetamiento. El parámetro se puede fijar entre el 5 y el 500, ambos inclusive.
Características Seleccione las columnas de entrada con las que desea realizar el análisis.
Columnas destino Seleccione la columna de destino en la que desea realizar el análisis.