Matriz de confusión

El panel Matriz de confusión le permite visualizar la comparación entre los valores de destino previstos por el modelo y los valores reales y establecer una puntuación por encima de la cual las observaciones se considerarán positivas, en el caso que el valor de destino sea el deseado. Este panel también le permite simular sus beneficios en función del umbral de puntuación seleccionado o adaptar automáticamente el umbral para obtener el máximo beneficio.

Definiciones
  • Una observación positiva es una observación que pertenece a la población de destino.
  • Una observación negativa es una observación que no pertenece a la población de destino.
Parámetros
  • Destino

Seleccione la variable de destino para la que desea visualizar la matriz de confusión haciendo clic en la pestaña correspondiente. Solo están disponibles los destinos nominales.

Matriz de confusión

Existen tres formas de establecer el umbral utilizando la barra de desplazamiento mostrada:

  • Seleccionar el porcentaje de población de destino si la población se clasifica en orden de puntuación descendiente (% de población),
  • Seleccionar el porcentaje de observaciones positivas que desee detectar (% del destino detectado)),
  • Seleccionar la puntuación utilizada para distinguir observaciones positivas de negativas (Umbral de puntuación). Las observaciones con una puntuación superior al umbral se consideran positivas. Por el contrario, las observaciones con una puntuación inferior al umbral se consideran negativas.

La barra de desplazamiento va de la puntuación más baja (a la izquierda) a la puntuación más alta (a la derecha). Los valores que corresponden a cada opción se muestran bajo la barra.

Al mover el cursor, la matriz de confusión se actualiza en consecuencia. La siguiente tabla describe cómo leer la matriz de confusión.

Predicted[Target Category]

Observaciones positivas previstas

Predicted[Non-target Category]

Observaciones negativas previstas

Verdadero [categoría de destino]

Observaciones positivas reales

Número de observaciones positivas previstas correctamente Número de observaciones positivas reales que se han previsto como negativas

Verdadero [categoría de no destino]

Observaciones negativas reales

Número de observaciones negativas reales que se han previsto como positivas Número de observaciones negativas previstas correctamente

De manera predeterminada, la Población total es el número de registros del conjunto de datos de validación. Puede modificar este número para ver la matriz de confusión para la población en la que desea aplicar el modelo.

  • La métrica
  • El Porcentaje de clasificación es el porcentaje de datos que el modelo clasifica con precisión al aplicarlo en el conjunto de datos de entrenamiento.
  • La Sensibilidad es el porcentaje de positivos reales identificados correctamente.
  • La Especificidad es el porcentaje de negativos identificados correctamente.
  • La Precisión es el porcentaje de mediciones repetidas en iguales condiciones que muestran los mismos resultados.
  • La puntuación indica la medida en que una función de probabilidad depende de su parámetro.

    La probabilidad de un conjunto de valores de parámetro al que se proporcionan resultados observados es igual a la probabilidad de dichos resultados observados al proporcionarles los valores de parámetro.

Beneficio

Esta sección le permite visualizar su beneficio en función de la puntuación seleccionada o seleccionar automáticamente la puntuación en función de sus parámetros de beneficio.

Para cada categoría de observación, introduzca un beneficio o un coste por observación. El beneficio total se visualiza automáticamente a la derecha de la tabla.

Para conocer el umbral que le ofrecerá el máximo beneficio por los parámetros de beneficio que ha establecido, haga clic en el botón Maximizar beneficio.

Ejemplo

Según la siguiente tabla de beneficio/coste, conseguirá 15 dólares por cada observación positiva identificada correctamente, mientras que cada observación negativa identificada como positiva le costará 8 dólares.

Categoría Previsto [1] Previsto [0]
Verdadero [1] 15 0
Verdadero [0] -8 0