Árbol CNR R

Propiedades que se pueden configurar para el algoritmo Árbol CNR R.

Sintaxis Use este algoritmo para clasificar las observaciones en grupos y predecir una o varias variables discretas según otras variables. Sin embargo, puede utilizar este algoritmo para encontrar tendencias en los datos.
Nota
  • El paquete "rpart" que forma parte de R 2.15 no puede tratar los nombres de columnas que contienen espacios o caracteres especiales. El paquete "rpart" solo es compatible con el formato del nombre de la columna de entrada compatible con el marco de datos R.
  • Los nombres de la columna independiente que se usen al puntuar el modelo deben ser los mismos que los nombres de la columna independiente que se usó al crear el modelo.
  • No se admiten los nombres de columnas que contienen espacios y otros caracteres especiales diferentes al punto (.)
Propiedades del árbol R-CNR
Tabla 1: Propiedades del algoritmo
Propiedad Descripción
Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
  • Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos.
  • Relleno: rellena los valores faltantes en la columna de destino.
Características Seleccione las columnas de entrada con las que desea realizar la regresión.
Variable de destino Seleccione la columna de destino para la que desea realizar el análisis.
Valores faltantes Seleccione el método para manejar los valores perdidos.
Métodos posibles:
  • Rpart: el algoritmo elimina todas las observaciones que le faltan a la columna dependiente. Sin embargo, retiene estas observaciones en aquellas columnas independientes que falten.
  • Omitir: El algoritmo omite los registros que contienen valores perdidos en la columna independiente o la columna dependiente.
  • Conservar: el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo.
  • Detener: el algoritmo detiene la ejecución si falta un valor en la columna independiente o en la columna dependiente.
Tipo de algoritmo: Seleccione el tipo de análisis que desee que ejecute el algoritmo.
Valores posibles:
  • Clasificación: utilice este método si la variable dependiente tiene valores categóricos.
  • Regresión: utilice este método si la variable dependiente tiene valores numéricos.
División mínima Introduzca el número mínimo de observaciones necesarios para dividir un nodo. El valor predeterminado es 10.
Dividir criterios Seleccione el criterio de división del nodo.
Valores posibles:
  • Gini: impurezas gini.
  • Información: ganancia de información
Nombre de columna prevista Introduzca un nombre para la columna recién creada que contiene los valores previstos.
Parámetro de complejidad Introduzca el parámetro de complejidad que guarda el tipo de cálculo al evitar las divisiones que no mejoran el ajuste. El valor predeterminado es 0,005.
Profundidad máxima Introduzca el nivel de nodo máximo en el árbol final con el nodo de raíz contado como nivel 0.
Nota Si la profundidad máxima es mayor de 30, el algoritmo no producirá los resultados esperados (en máquinas de 32 bits).
Validación cruzada Introduzca el número de validaciones cruzadas. Un valor de validación cruzada mayor incrementará el tiempo de computación y producirá resultados más precisos.
Probabilidad anterior Introduzca el vector de probabilidades anteriores.
Usar subrogado Seleccione el subrogado que se usará en el proceso de división.
Valores posibles:
  • Mostrar solo - una observación con un valor faltante en la regla de división primaria no se reproducirá en el árbol.
  • Usar subrogado: utilice esta opción para dividir sujetos faltantes en la variable primaria. Si faltan todos los subrogados, la observación no se dividirá.
  • Detener si falta: si faltan todos los subrogados, el algoritmo enviará una observación en la dirección de la mayoría.
Estilo del subrogado Introduzca el estilo que controla la selección del mejor subrogado.
Valores posibles:
  • Usar clasificación correcta total: el algoritmo usa el número total de clasificaciones correctas para encontrar una posible variable subrogada.
  • Usar porcentaje de casos no faltantes: el algoritmo usa el porcentaje de casos no faltantes clasificados para encontrar un posible subrogado.
Subrogado máximo Introduzca el número máximo de subrogados que se deben conservar en cada nodo de un árbol.
Mostrar probabilidad Seleccione la casilla de verificación Mostrar probabilidad para obtener la probabilidad de los valores previstos durante el cálculo de un modelo de clasificación.