Les abscisses représentent le pourcentage de la population initiale et les ordonnées le pourcentage du profit attendu maximum (y compris toute hypothèse coût/profit définie dans l'écran de la stratégie de profit).
Vous pouvez afficher uniquement la courbe de validation (par défaut) ou les courbes des trois ensembles de données. Le bouton Afficher tous les jeux de données vous permet de sélectionner les courbes Estimation/Validation/Test.
La liste déroulante Modèles permet de sélectionner la variable cible pour laquelle vous voulez afficher les courbes.
La barre de menu située sous le titre vous permet de copier les données du graphique vers le presse-papier, d'imprimer le graphique ou de l'enregistrer au format PNG.
La liste déroulante Type d'analyse permet de sélectionner le type de courbe à afficher. Détecté (option par défaut) est la courbe de profit standard alors que l'option Normalisé affichera une courbe de profit avec une moyenne de zéro. Lift vous permet d'étudier les différences entre un modèle parfait et un modèle aléatoire et celles entre le modèle généré par SAP Predictive Analytics et un modèle aléatoire.
La courbe de profit Personnalisé vous permet de spécifier les pertes pour la catégorie non-cible (par exemple le prix d'un courrier pour une personne ne répondant pas) et un gain pour la catégorie cible (par exemple un achat suite au courrier).
Un ensemble de graphiques avancés sont proposés en plus des graphes standards décrits ci-dessus :
La courbe ROC est dérivée de la théorie de la détection du signal.
Elle mesure la performance de discrimination d'un modèle en matière de compromis entre sensibilité et spécificité ou, en fait, entre détection correcte et erronée, lorsque le seuil de détection varie.
La sensibilité, en ordonnée, est la proportion de signaux CORRECTEMENT identifiés (vrais positifs) détectés (sur tous les vrais positifs dans le jeu de données de validation).
[1 - spécificité], en abscisse, est la proportion de signaux INCORRECTEMENT identifiés (faux positifs) (sur tous les faux positifs dans le jeu de données de validation). (Par opposition, la spécificité est la proportion de NON-SIGNAUX CORRECTEMENT identifiés (vrais négatifs).
La courbe Lorenz "Bon" représente graphiquement les pourcentages cumulés de signaux manqués (faux négatifs) pour les enregistrements correspondant aux x % plus bas scores du modèle.
Les ordonnées mesurent [1 - sensibilité], c'est-à-dire [1 - proportion de vrais positifs], soit l'équivalent de la proportion de signaux manqués ou d'opportunités perdues. Comme les données sont classées des enregistrements les moins susceptibles d'être des signaux à gauche à ceux les plus susceptibles d'être des signaux à droite, plus la courbe monte lentement, plus le modèle est sensible en ce qui concerne les signaux détectés. La courbe Wizard se redresse à partir de l'axe des abscisses en un point correspondant au pourcentage de non-signaux dans le jeu de données de validation.
Les courbes de densité représentent la fonction de densité du score des variables dans l'ensemble d'événements (courbe Densité “Bon”) et dans l'ensemble de non-événements (courbe Densité “Mauvais”). Ces courbes peuvent être également vues comme les "dérivées" des courbes de Lorenz (la fonction de densité est par définition la dérivée de la fonction de densité cumulée).
La fonction de densité estimée sur une classe ou intervalle est égale à :
Les courbes de "Risque" représentent le score de risque, la densité de population et le rapport bon/mauvais. Ce rapport est calculé de la manière suivante :
L'axe des ordonnées de la courbe de probabilité se trouve sur la droite. L'axe des ordonnées des courbes de densité de la population et Bon/Mauvais se trouve à gauche.
Le profil normal peut être calculé à l'aide de la formule suivante pour des cibles binaires si f1 est la fréquence de la classe cible la moins fréquente TC1 (et f2 = 1 - f1 est la probabilité de la classe cible la plus fréquente TC2). Dans ce cas, nous "associons" la classe cible la moins fréquente à un profit égal à f2 et la classe la plus fréquente à un profit égal à -f1. Ces profits normalisés sont déterminés de la façon suivante : profit(TC1) * proba(TC1) + profit(TC2) * proba(TC2) = 0
Ensuite on peut calculer : normalProfit(C) = Profit(TC2) * P(TC2|C) + Profit(TC1) * P(TC1|C)