Classement/Régression et Mise en cluster

Pour chaque variable nominale :

<Nom> Nom de la variable cible
Clé cible Valeur attendue de la clé cible
Fréquence des catégories cible Pourcentage d'observations de toutes les valeurs cible dans le jeu de données d'estimation dans le cas d'une cible nominale
Variables cible continues

Pour chaque variable cible continue :

<nom de la cible> Nom de la variable cible
Min Valeur minimale de la variable cible dans le jeu de données d'estimation
Max Valeur maximale de la variable cible dans le jeu de données d'estimation
Moyenne Moyenne des valeurs de la variable cible pour le jeu de données d'estimation
Écart-type Moyenne de la distance entre les valeurs cible et la moyenne
Indicateurs de performance

Pour chaque cible

rr_<TargetName>

kc_<TargetName>

Nom de la cible

Il est à noter que rr_ indique une régression ou un classement et kc_ une segmentation/mise en cluster.

Capacité prédictive (KI) Indicateur de qualité qui correspond à la proportion d'information contenue dans la variable cible que les variables explicatives peuvent expliquer.
Reproductibilité (KR) Indicateur de robustesse qui précise la capacité du modèle à obtenir les mêmes performances lorsqu'il est appliqué à un nouveau jeu de données ayant les mêmes caractéristiques que le jeu de données d'entraînement.

Le graphique suivant affiche la capacité prédictive et la reproductibilité :

Nombre de clusters (segmentation uniquement)

Pour chaque variable cible

<nom de la cible> Nom de la variable cible
Nombre de clusters demandés Nombre de clusters demandés par l'utilisateur
Nombre de clusters trouvés Nombre de clusters trouvés par le moteur