Informes estadísticos

Esta pantalla ofrece distintos conjuntos de informes de sesión de análisis detallados para el modelo actual, según el tipo de modelo con el que esté trabajando:

  • Estadísticas descriptivas (clasificación/regresión, agrupación en clústeres)
  • Rendimiento de modelo (clasificación/regresión, agrupación en clústeres)
  • Detalles de clúster (solo agrupación en clústeres)
  • Sesión de análisis de experto (clasificación/regresión, agrupación en clústeres)
  • Indicadores de rendimiento (serie temporal)
  • Variables cíclicas (serie temporal)
Estadísticas descriptivas
Variables

Para cada variable

  • Nombre (Variable)
  • Tipo de valor (Valor)
  • Tipo de almacenamiento (Almacenamiento)
  • Número de valores que faltan en el conjunto de datos de entrenamiento (Recuento de ausentes)
  • Rol en la modelación (Rol)
Frecuencias de categoría

Para cada variable:

  • Categorías
  • Proporción de cada categoría en todo el conjunto de datos
Variables continuas

Para cada variable continua en cada conjunto de datos (estimación, validación, test):

  • Mín.
  • Max
  • Media
  • Varianza (medida de dispersión)
  • Desviación estándar (medida del alcance del diferencial de los valores alrededor de su media, es decir, de la raíz cuadrada de la varianza)

Estadísticas cruzadas con el/los destino/s

Estadísticas cruzadas para el/los destino/s nominal/es

Estadísticas cruzadas entre variables de entrada y variables de destino nominal. Es decir, para cada variable cruzada con cada destino nominal:

  • las categorías variables
  • la proporción de la categoría de no destino del destino seleccionado en la categoría de variable
  • la proporción de la categoría de destino del destino seleccionado en la categoría de variable
  • la frecuencia de la categoría actual en el conjunto de datos
Estadísticas cruzadas para el/los destino/s continuo/s

Estadísticas cruzadas entre variables de entrada y variables de destino continuas. Es decir, para cada variable cruzada con cada destino continuo:

  • las categorías variables
  • la media de destino para cada categoría
  • la varianza de destino para cada categoría
Rendimiento de modelo
Poder predictivo & confianza de predicción

Para cada variable de destino en cada conjunto de datos (Estimación, Validación, Test):

  • Nombre de las variables
  • Valor de poder predictivo
  • Valor de confianza de predicción
Contribución máxima de variable inteligente

Para cada variable de destino:

  • Variables de entrada
  • Contribución de cada variable de entrada
Otros indicadores de rendimiento

Para cada variable de destino en cada conjunto de datos (Estimación, Validación, Test):

  • El valor de error absoluto medio (desviación) (L1)
  • El error cuadrado medio (L2)
  • El error máximo (LInf)
  • Media de errores (ErrorMean)
  • Error de desviación estándar (ErrorStdDev)
  • Porcentaje de clasificación (ClassificationRate)
Detalles de clúster
Estadísticas de clúster para las variables nominales Estadísticas cruzadas de clúster estándares con las variables nominales.

Estadísticas de clúster para las variables nominales

(normalizadas)

Estadísticas cruzadas de clúster normalizadas con las variables nominales.
Estadísticas de clúster para la/s variable/s continua/s Estadísticas cruzadas de clúster con las variables continuas.
Clústeres KL

Para cada clúster:

  • Medida Kullback-Leibler para cada entrada entre la población del clúster y la población total.
    • Kullback-Leibler (KL) mide la diferencia entre dos distribuciones. Como más elevado es el KL, más distintas son las distribuciones.
    • Con un clúster y una dimensión (o variable), el KL se calcula mediante la fórmula siguiente:
    • donde:
    • N es el número de categorías para esta dimensión,
    • p i (resp. q i) es la proporción de la categoría ith (de la dimensión en cuestión) dentro del clúster (resp. la población total). La proporción de la categoría indicada representa su ponderación sobre la ponderación total del conjunto correspondiente (el clúster o la población global).
    • KL se utiliza en la sesión de análisis de clúster de Estadísticas cruzadas para clasificar las variables en orden descendiente.
  • Medida chi cuadrado para cada entrada entre la población del clúster y la población total.
    • Chi cuadrado es otra medida de divergencia entre la distribución de clúster y la distribución de población para esta dimensión. Más concretamente, su valor representa el grado de confianza que se puede tener al exponer que las dos distribuciones son notablemente distintas.
    • A diferencia del KL, no proporciona una medida de la distancia a la que se encuentran esas distribuciones una de otra. En cambio, nos permite asegurarnos de que las dos distribuciones SON distintas cuando obtengamos un valor cercano a 1. En este caso, podemos considerar que la dimensión en cuestión es realmente discriminatoria para este clúster. Al contrario, un valor 0 sugiere que ambas distribuciones pueden ser idénticas para la dimensión, pero no puede constatarse de forma segura.
Frecuencia de clústeres

Para cada variable de destino de cada clúster:

  • Proporción de elementos de clúster en todo el conjunto de datos
  • Proporción del valor previsto de destino en el clúster o media de destino en el clúster
  • Expresiones SQL de clústeres

Para cada variable de destino:

  • Expresión SQL de clúster, si está disponible
Sesión de análisis de experto
Estadísticas de grupos (destino nominal)

Para cada variable en relación con cada variable de destino nominal:

  • Grupos de categoría
  • Proporción de cada categoría del destino para cada grupo de la variable seleccionada
  • Proporción de cada grupo en todo el conjunto de datos
ID de grupos

Para cada variable en relación con cada variable de destino:

  • Categorías

Índice del grupo que contiene la categoría actual

Si falta el índice del grupo, significa que la categoría no está agrupada.

Probabilidad de desviación

Para cada variable y cada conjunto de datos:

  • Probabilidad de desviación de la variable respecto a su valor en el conjunto de datos de Estimación.
Probabilidad de desviación de destino

Para cada variable en cada conjunto de datos en relación con cada variable de destino:

  • Probabilidad de desviación de la distribución de la variable de destino en relación con su valor en el conjunto de datos de Estimación.
Otros indicadores de rendimiento de variables

Para cada variable en cada conjunto de datos en relación con cada variable de destino:

  • las estadísticas de K-S (Ks)
  • el área bajo la curva ROC (ABC)
  • el índice de GINI (GINI)
Codificación continua

Para cada categoría de cada variable respecto a cada variable de destino:

  • el valor de categoría
  • la codificación correspondiente
Tamaño del conjunto de datos Número de registros en cada conjunto de datos (estimación, validación, test)
Indicadores de rendimiento (para KTS)
El panel... Muestra...
Barras de errores de previsiones

Para cada conjunto de datos:

  • las barras de error de previsiones calculadas Error cuadrado medio (L2)
Eficiencia de previsiones

Para cada previsión y cada conjunto de datos:

  • la eficiencia de previsiones calculada sobre el Cuadrado de Pearson (P2), que describe la calidad del vínculo entre el predictor y la señal. Un valor 1 representa un vínculo perfecto entre el predictor y la señal, y resulta un predictor perfecto.
Otros indicadores de rendimiento

Para cada previsión y cada conjunto de datos:

  • el Coeficiente de calidad (U2) (ratio entre la varianza de residuos del predictor y la varianza de la señal) describe si el modelo se ajusta a la señal. Para un valor 1, el modelo se ajusta perfectamente a la señal.
  • la Media de errores
  • la Desviación estándar de error
Variables cíclicas

Análisis de variaciones estacionales y cíclicas:

Para cada variable periódica encontrada en el modelo, el gráfico visualiza un ciclo de esta variable.

Nota

Un nombre de variable periódica corresponde a su ciclo. Por ejemplo, una variable denominada monthOfYear corresponde al ciclo de meses del año, mientras que una variable denominada 52 corresponde a un ciclo de 52 unidades (la unidad depende de la señal).