Une fois la description des données affichée dans le panneau, l'onglet Structures est ajouté au ruban, ce qui vous permet de modifier la structure des données des variables.
La dernière colonne du tableau de la description indique l'état de la structure de chaque variable. Le tableau suivant énumère les états possibles d'une structure de variable.
| Icône | État | Description |
|---|---|---|
![]() |
indéfini | Le codage des données va déterminer automatiquement le regroupement de catégories en fonction de leur interaction avec la variable cible. |
![]() |
non modifiable | La structure d'une variable de chaîne ordinale ne peut être modifiée. |
![]() |
définie par extraction des statistiques de la variable. | L'utilisateur doit ouvrir et valider la structure. |
![]() |
définie par l'utilisateur ou importée d'un modèle existant. |
Il existe plusieurs façons de définir la structure d'une variable :
L'option Activer l'optimisation des regroupements basés sur la variable cible effectués par K2C permet au codage des données de regrouper les groupes de catégories définies dans la structure de variable s'ils apportent les mêmes informations.
La traduction des catégories d'une variable n'a pas d'influence sur sa structure qui doit être définie en fonction des valeurs initiales de la variable.
Extraire la structure d'une variable à partir des statistiques
Dupliquer la structure d'une autre variable
Un message apparaît lorsque la structure d'une variable n'est pas définie.
Importer la structure d'une variable à partir d'un modèle existant
Créer une structure
correspondant à la variable dont vous voulez modifier ou créer la structure. La fenêtre de modification s'ouvre.Si vous aviez extrait la structure des statistiques de la variable ou d'un modèle, les champs de la fenêtre sont déjà préremplis.
Supprimer la structure d'une variable
Étant donné que la structure d'une variable dépend de son type de valeur (nominale, continue, ordinale), l'éditeur de structure diffère pour chaque type.
Structure d'une variable continue
La structure d'une variable continue est définie par plusieurs intervalles composés chacun de :
Tous les intervalles doivent être adjacents : il ne doit y avoir aucun trou ni chevauchement entre deux intervalles.
L'option Ajouter manquante vous permet d'indiquer avec quel intervalle les valeurs manquantes devront être regroupées.
L'option Inclure les données plus petites, vous permet d'inclure dans le premier intervalle les données plus petites que celui-ci. De la même façon l'option Inclure les données plus grandes, vous permet d'inclure dans le dernier intervalle les données plus grandes que celui-ci.
Structure d'une variable ordinale
La structure d'une variable ordinale est similaire à celle d'une variable continue, à l'exception des limites qui sont toujours fermées et ne peuvent pas être modifiées.
La structure d'une variable de chaîne ordinale ne peut être modifiée.
Structure d'une variable textuelle
La structure des variables textuelles ne peut être modifiée.
Structure d'une variable nominale
La structure d'une variable nominale est composée de plusieurs groupes rassemblant les catégories de la variable.
Si vous laissez la structure comme indéfinie, l'application détermine automatiquement le regroupement des catégories en fonction de leur interaction avec la variable cible à l'aide d'un codeur cohérent. Vous pouvez configurer deux paramètres dans ce cas :
Nombre de segments pour les variables continues
Lorsque vous ne travaillez avec aucune structure définie, vous pouvez définir le nombre de segments pour les variables continues. Les valeurs permises pour ce paramètre sont comprises entre 1 et 20.
La population est ainsi découpée en autant de segments de taille similaire. Ces segments permettent de constituer des statistiques descriptives, en particulier la répartition des variables cible pour chaque segment, ce qui influe sur le codage de la variable par rapport aux variables cible.
Le nombre de segments a une influence sur le calcul de la capacité prédictive (KI) : plus les segments sont nombreux, plus le calcul du KI est précis pour la variable explicative. Néanmoins, cette influence est très faible.
| Si vous souhaitez modifier le nombre de segments pour... | alors... |
|---|---|
| toutes les variables continues du modèle |
|
| Pour modifier le nombre de segments pour la variable en cours de modification. |
|
Optimisation des regroupements
Lorsque vous travaillez avec une structure définie et que vous souhaitez conserver vos catégories telles quelles pour la construction du modèle, vous devez désactiver cette option.
Dans le cas contraire ou si vous travaillez sans aucune structure définie, Activer l'optimisation des regroupements pour toutes les variables permet dans un grand nombre de cas, d'augmenter la robustesse du modèle (KR) avec une perte d'information minime (KI). Quand cela est possible, les segments adjacents similaires sont regroupés pour réduire les artéfacts observés entre les jeux de données d'estimation et de validation.