Agrupación en clústeres

  • Buscar el mejor número de clústeres en el intervalo

Estos campos le permiten especificar cuántos clústeres generará el modelo. De manera predeterminada, el número de clústeres está definido en 10. Cuanto mayor sea el número de segmentos, menor sea la robustez (confianza de predicción). Cuanto menor sea el número de segmentos, menor será la información (poder predictivo). Normalmente, se debería empezar con el número predeterminado y aumentar o disminuir el número clústeres en base a los resultados.

  • Para una segmentación supervisada (es decir, con un destino), el usuario elige el mejor número de segmentos, por ejemplo [5;10] que significa que el usuario solicita de 5 a 10 clústeres. El motor calcula el "mejor número de clústeres" utilizando la métrica confianza de predicción + poder predictivo. Por ejemplo, puede tener 7 clústeres.
  • Para una segmentación no supervisada (es decir, sin destino), la aplicación selecciona el número mínimo de clústeres, por ejemplo [10;10] lo que significa que el usuario solicita 10 clústeres.
Nota

Al activar la opción Calcular expresiones SQL, se genera un clúster adicional que contiene los registros no asignados.

  • Calcular expresiones SQL

Esta función le permite ver, en la sesión de análisis del modelo, las expresiones SQL que definen cada clúster generado. Esta opción se activa de manera predeterminada.

  • Avanzado...

El botón Avanzado le permite acceder al panel. En este panel, podrá activar las estadísticas cruzadas, especificar el valor de clave de cada variable de destino y especificar la distancia que se va a utilizar así como la estrategia de codificación.