Decisión de clasificación

El panel Decisión de clasificación le permite seleccionar el umbral de decisión para cada destino binario antes de aplicar el modelo en el modo "Decisión". Esta decisión aparecerá para cada observación en fichero de resultados de aplicación de modelos.

La decisión se toma a partir de uno de los siguientes sencillos criterios de decisión:

  • Umbral de puntuación: indica la puntuación utilizada para separar observaciones positivas de observaciones negativas.
  • Porcentaje esperado del destino detectado: detecta el x % de la población de destino.
  • Porcentaje esperado de la población de destino: detecta el x % de la población total.
Definiciones
  • Una observación positiva es una observación que pertenece a la población de destino.
  • Una observación negativa es una observación que no pertenece a la población de destino.
Parámetros

Destino

Seleccione la variable de destino para la que desea visualizar la matriz de confusión haciendo clic en la pestaña correspondiente. Solo están disponibles los destinos nominales.

Matriz de confusión

Existen tres formas de establecer el umbral utilizando la barra de desplazamiento mostrada:

  • Seleccionar el porcentaje de población de destino si la población se clasifica en orden de puntuación descendiente (% de población),
  • Seleccionar el porcentaje de observaciones positivas que desee detectar (% del destino detectado)),
  • Seleccionar la puntuación utilizada para distinguir observaciones positivas de negativas (Umbral de puntuación). Las observaciones con una puntuación superior al umbral se consideran positivas. Por el contrario, las observaciones con una puntuación inferior al umbral se consideran negativas.

La barra de desplazamiento va de la puntuación más baja (a la izquierda) a la puntuación más alta (a la derecha). Los valores que corresponden a cada opción se muestran bajo la barra.

Al mover el cursor, la matriz de confusión se actualiza en consecuencia. La siguiente tabla describe cómo leer la matriz de confusión.

Predicted[Target Category]

Observaciones positivas previstas

Predicted[Non-target Category]

Observaciones negativas previstas

True[Target Category]

Observaciones positivas reales

Número de observaciones positivas previstas correctamente Número de observaciones positivas reales que se han previsto como negativas

True[Non-target Category]

Observaciones negativas reales

Número de observaciones negativas reales que se han previsto como positivas Número de observaciones negativas previstas correctamente

De manera predeterminada, la Población total es el número de registros del conjunto de datos de validación. Puede modificar este número para ver la matriz de confusión para la población en la que desea aplicar el modelo.

La métrica

  • El Porcentaje de clasificación es el porcentaje de datos que el modelo clasifica con precisión al aplicarlo en el conjunto de datos de entrenamiento.
  • La Sensibilidad es el porcentaje de positivos reales identificados correctamente.
  • La Especificidad es el porcentaje de negativos identificados correctamente.
  • La Precisión es el porcentaje de mediciones repetidas en iguales condiciones que muestran los mismos resultados.
  • La puntuación indica la medida en que una función de probabilidad depende de su parámetro.

    La probabilidad de un conjunto de valores de parámetro al que se proporcionan resultados observados es igual a la probabilidad de dichos resultados observados al proporcionarles los valores de parámetro.

Beneficio

Esta sección le permite visualizar su beneficio en función de la puntuación seleccionada o seleccionar automáticamente la puntuación en función de sus parámetros de beneficio.

Para cada categoría de observación, introduzca un beneficio o un coste por observación. El beneficio total se visualiza automáticamente a la derecha de la tabla.

Para conocer el umbral que le ofrecerá el máximo beneficio por los parámetros de beneficio que ha establecido, haga clic en el botón Maximizar beneficio.

Ejemplo

Según la siguiente tabla de beneficio/coste, conseguirá 15 dólares por cada observación positiva identificada correctamente, mientras que cada observación negativa identificada como positiva le costará 8 dólares.

Categoría Previsto [1] Previsto [0]
Verdadero [1] 15 0
Verdadero [0] -8 0