Le panneau Matrice de confusion vous permet de comparer les valeurs cible prédites par le modèle avec les valeurs réelles et de définir le score au-dessus duquel les observations seront considérées comme positives : la valeur cible correspond à celle souhaitée. Ce panneau vous permet également de faire des simulations de profit selon le score choisi comme seuil ou d'adapter automatiquement le seuil pour obtenir un profit maximal.
Sélectionnez la variable cible pour laquelle vous voulez afficher la matrice de confusion en cliquant sur l'onglet correspondant. Seules les cibles nominales sont disponibles.
Il existe trois façons de définir le seuil à l'aide du curseur affiché :
L'échelle est graduée du plus petit score (à gauche), au plus grand (à droite). Les valeurs correspondant à chaque option sont affichées dans des champs situés sous l'échelle.
Lorsque vous déplacez le curseur sur l'échelle, la matrice de confusion est modifiée en conséquence. Le tableau ci-dessous indique comment lire la matrice de confusion.
|
Predicted[Target Category] Observations positives prédites |
Predicted[Non-target Category] Observations négatives prédites |
Réel[Catégorie cible] Observations positives réelles |
Nombre d'observations positives correctement prévues | Nombre d'observations réellement positives mais prédites négatives |
Réel[Catégorie non-cible] Observations négatives réelles |
Nombre d'observations réellement négatives mais prédites positives | Nombre d'observations négatives correctement prévues |
Par défaut, la Population totale est égale au nombre d'enregistrements dans le jeu de données de validation. Vous pouvez modifier ce nombre pour visualiser la matrice sur la population sur laquelle vous voulez appliquer votre modèle.
La fonction de vraisemblance est une fonction de probabilités conditionnelles qui décrit les valeurs d'une loi statistique en fonction de paramètres supposés connus.
Cette section vous permet de visualiser votre profit par rapport au score sélectionné, ou bien de sélectionner automatiquement le score d'après les paramètres de profit.
Pour chaque catégorie d'observations, saisissez un profit ou un coût par observation. Le profit total est automatiquement affiché dans le champ Profit situé à droite.
Pour sélectionner automatiquement le seuil de score qui vous permettra de faire le maximum de profit, remplissez la matrice de coût puis cliquez sur le bouton Maximiser le profit.
Exemple
Dans le tableau profit-coût ci-dessous, chaque observation positive correctement identifiée rapportera 15 € mais chaque observation négative identifiée comme positive coûtera 8 €.
| Catégorie | Prévu[1] | Prévu[0] |
|---|---|---|
| Réel[1] | 15 | 0 |
| Réel[0] | -8 | 0 |