Contributions par variables

Cet écran affiche plusieurs graphes montrant l'utilisation des différentes variables dans le modèle. Plus une variable est située à gauche dans le graphique et plus elle contient d'informations servant à la prédiction de la variable cible.

Quatre types de diagrammes sont disponibles :

  • Contribution des variables : L'importance relative de chaque variable du modèle généré
  • Poids des variables : Les poids (dans le polynôme final) des variables normalisées
  • Contributions intelligentes des variables : ce graphe prend en compte la contribution interne des variables.
  • Contributions max. intelligentes des variables : inclut uniquement le maximum des variables similaires. Par exemple, seul le codage des groupes de la variable continue âge sera affiché. C'est le diagramme affiché par défaut.

Les variables sont affichées sur l'axe des abscisses. Selon le type de diagramme, trois types de variables peuvent apparaître :

  • la variable d'origine
  • la variable codée par Automated Analytics Modeler (notée c_variable),
  • la différence d'information entre deux variables corrélées (notée [variable_a]-[variable_b]).

    Lorsque deux variables sont corrélées, seule celle ayant la plus forte contribution est affichée, cependant il est possible qu'une partie de l'information diffère entre les deux variables. Dans ce cas, seule la différence est conservée.

L'axe des ordonnées représente la contribution des variables en fonction du diagramme sélectionné.

Pour modifier le type de diagramme, utilisez la liste déroulante Type de diagramme.

La barre de menu située sous le titre vous permet de copier les données du graphique vers le presse-papier, d'imprimer le graphique ou de l'enregistrer au format PNG.

Formules

Contribution intelligente des variables : l'équation calculée par Automated Analytics Modeler - Régression/Classement peut s'écrire sous la forme , où Ai est le coefficient et Xi représente les valeurs d'entrée codées (i est le numéro des colonnes).

Poids des variables : le poids est simplement le coefficient associé à la variable normalisée. L'équation correspondant est la suivante : XN est la version normalisée de X