HANA C 4.5

Propiedades que se pueden configurar para el algoritmo HANA C 4.5.

Sintaxis Use este algoritmo para clasificar las observaciones en grupos y predecir una o varias variables discretas según otras variables.
Nota El tipo de datos de las columnas que se usan durante el puntaje de modelo debería ser el mismo que el tipo de datos de las columnas que se usan al elaborar el modelo.
Propiedades de HANA C 4.5
Tabla 1: Propiedades del algoritmo
Propiedad Descripción
Modo de salida Seleccione el modo en el que desea usar la salida de este algoritmo.
Valores posibles:
  • Tendencia: predice los valores para la columna dependiente y agrega una columna adicional en la salida que contiene los valores previstos.
  • Relleno: rellena los valores faltantes en la columna de destino.
Características Seleccione las columnas de entrada con las que desea realizar la regresión.
Variable de destino Seleccione la columna de destino para la que desea realizar el análisis.
Nota Solo acepta columnas con el tipo de datos enteros.
Valores faltantes Seleccione el método para manejar los valores perdidos.
Métodos posibles:
  • Omitir: el algoritmo omite los registros que contienen valores faltantes en las columnas independientes o dependientes.
  • Conservar: el algoritmo conserva los registros que contiene los valores faltantes durante el cálculo.
Porcentaje de datos de entrada Introduzca el porcentaje de datos que desee considerar para el análisis.
División mínima Introduzca el número de registros a partir del cual no se permite la división del nodo de hojas. El valor predeterminado es 0.
Columnas Seleccione las columnas independientes que contengan los valores numéricos.
Rangos de agrupamiento Introduzca los rangos de agrupamiento.
Nombre de columna prevista Introduzca un nombre para la nueva columna que contiene el valor previsto.
Número de subprocesos Escriba el número de subprocesos que debe usar el algoritmo durante la ejecución. El valor predeterminado es 1.