CHAID HANA

Propiedades que se pueden configurar para el algoritmo CHAID HANA.

Sintaxis CHAID representa la detección de la interacción automática de Chi al cuadrado. Es un método de clasificación para crear árboles de decisiones mediante estadísticas de Chi al cuadrado para identificar las divisiones óptimas.
Nota El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de datos de las columnas que se usan al elaborar el modelo.
Propiedades de CHAID HANA
Tabla 1: Propiedades del algoritmo
Propiedad Descripción
Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
  • Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos.
  • Relleno: rellena los valores faltantes en la columna de destino.
Características Seleccione las columnas de entrada con las que desea realizar la regresión.
Variable de destino Seleccione la columna de destino para la que desea realizar el análisis.
Nota Solo acepta columnas con el tipo de datos enteros.
Valores faltantes Seleccione el método para manejar los valores perdidos.
Valores posibles:
  • Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes.
  • Conservar: el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo.
Porcentaje de datos de entrada Introduzca el porcentaje de datos que se tendrán en cuenta para el análisis.
División mínima Introduzca el número mínimo de registros para un nodo, más allá del cual no se permite la división ese nodo concreto. El valor predeterminado es 0.
Profundidad máxima Introduzca la profundidad máxima del árbol.
Nombre de columna Seleccione el nombre de la columna independiente que contiene los valores numéricos.
Introducir rangos de agrupamiento Introduzca los rangos de agrupamiento.
Nombre de columna prevista Introduzca un nombre para la nueva columna que contiene los valores previstos.
Número de subprocesos Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución.