Structure

Une fois la description des données affichée dans le panneau, l'onglet Structures est ajouté au ruban, ce qui vous permet de modifier la structure des données des variables.

État

La dernière colonne du tableau de la description indique l'état de la structure de chaque variable. Le tableau suivant énumère les états possibles d'une structure de variable.

Icône État Description
indéfini Le codage des données va déterminer automatiquement le regroupement de catégories en fonction de leur interaction avec la variable cible.
non modifiable La structure d'une variable de chaîne ordinale ne peut être modifiée.
définie par extraction des statistiques de la variable. L'utilisateur doit ouvrir et valider la structure.
définie par l'utilisateur ou importée d'un modèle existant.
Définir une structure

Il existe plusieurs façons de définir la structure d'une variable :

  • en extrayant automatiquement les catégories à partir des statistiques de la variable, puis en modifiant ou en validant la structure extraite,
  • en dupliquant la structure d'une autre variable sur la variable sélectionnée,
  • en important automatiquement la structure à partir d'un modèle existant contenant les mêmes données.
  • en créant une structure à partir de zéro.

L'option Activer l'optimisation des regroupements basés sur la variable cible effectués par K2C permet au codage des données de regrouper les groupes de catégories définies dans la structure de variable s'ils apportent les mêmes informations.

Remarque

La traduction des catégories d'une variable n'a pas d'influence sur sa structure qui doit être définie en fonction des valeurs initiales de la variable.

Extraire la structure d'une variable à partir des statistiques

  • Pour extraire la structure d'une variable...
    • avec l'utilisation de l'onglet Structures du ruban :
      1. Sélectionnez les variables dont vous souhaitez extraire la structure.
      2. Cliquez sur le bouton À partir des statistiques. Une barre de progression est affichée au cours de l'extraction de la structure. Une fois l'extraction terminée, les icônes correspondant aux variables concernées changent, indiquant le succès de l'opération et vous permettant de les identifier clairement. Vous pouvez alors modifier la structure selon vos spécifications.
    • avec l'utilisation du menu contextuel :
      1. Sélectionnez les variables dont vous souhaitez extraire la structure. Pour sélectionner plusieurs variables, utilisez la touche CTRL.
      2. Un menu contextuel s'affiche.
      3. Sélectionnez l'option Début du chemin de navigation Définir une structure Étape de navigation suivante À partir des statistiques Fin du chemin de navigation. Une barre de progression est affichée au cours de l'extraction de la structure. Une fois l'extraction terminée, les icônes correspondant aux variables concernées changent, indiquant le succès de l'opération et vous permettant de les identifier clairement. Vous pouvez alors modifier la structure selon vos spécifications.

Dupliquer la structure d'une autre variable

  • Pour dupliquer la structure d'une autre variable sur les variables sélectionnées...
    • avec l'utilisation de l'onglet Structures du ruban :
      1. Sélectionnez les variables dont vous souhaitez extraire la structure.
      2. Cliquez sur À partir d'une variable. Un panneau s'affiche.
      3. Sélectionnez la variable dans la liste.
      4. Cliquez sur OK.
    • avec l'utilisation du menu contextuel :
      1. Faites un clic droit sur les variables dont vous souhaitez extraire la structure. Un menu contextuel s'affiche.
      2. Cliquez sur Définir une structure puis sélectionnez À partir d'une variable. Un panneau s'affiche.
      3. Sélectionnez la variable dans la liste proposée.
      4. Cliquez sur OK.
        Remarque

        Un message apparaît lorsque la structure d'une variable n'est pas définie.

Importer la structure d'une variable à partir d'un modèle existant

  • Pour importer la structure d'une variable à partir d'un modèle...
    • avec l'utilisation de l'onglet Structures du ruban :
      1. Sélectionnez les variables dont vous souhaitez extraire la structure.
      2. Cliquez sur À partir d'un modèle et sélectionnez soit Variables sélectionnées, soit Toutes les variables selon les variables que vous avez sélectionnées. Le panneau Chargement d'un modèle s'affiche.
      3. Dans la liste Type de données, sélectionnez le type de stockage du modèle.
      4. Utilisez le bouton Parcourir situé à côté du champ Dossier pour sélectionner le dossier ou la base de données où est stocké le modèle.
      5. Dans la liste des modèles qui s'affiche, sélectionnez le modèle que vous voulez utiliser pour importer les structures de variables.
      6. Cliquez sur le bouton OK.
      7. Dans la liste Cible du modèle chargé, sélectionnez la cible du modèle. Les variables que vous avez sélectionnées sont affichées dans une liste avec les variables correspondantes du modèle chargé. Vous pouvez ajouter ou supprimer des variables de cette liste et visualiser la structure des variables du modèle, comme décrit ci-dessous.
      8. Une fois que toutes les variables pour lesquelles vous souhaitez importer la structure sont affichées dans la liste, cliquez sur le bouton OK. La fenêtre de sélection se ferme et l'icône de structure est mise à jour.
    • avec l'utilisation du menu contextuel :
      1. Faites un clic droit sur les variables dont vous souhaitez extraire la structure. Un menu contextuel s'affiche.
      2. Cliquez sur À partir d'un modèle et sélectionnez soit Variables sélectionnées, soit Toutes les variables selon les variables que vous avez sélectionnées. Le panneau Chargement d'un modèle s'affiche.
      3. Référez-vous aux instructions listées au-dessus pour continuer.
  • Pour ajouter une variable à la liste
    1. Dans la liste Variable du modèle, sélectionnez la variable que vous voulez ajouter à la liste des variables pour lesquelles la structure sera importée du modèle.
    2. Cliquez sur le bouton Ajouter. La variable s'affiche dans la liste.
  • Pour supprimer une variable de la liste
    1. Dans la liste des variables pour lesquelles la structure sera importée du modèle, sélectionnez la variable que vous voulez supprimer.
    2. Cliquez sur le bouton Supprimer. La variable est supprimée de la liste et ajoutée à la liste Variable du modèle chargé.
  • Pour visualiser la structure d'une variable définie par le modèle chargé
    • Si la variable n'a pas encore été ajoutée à la liste des variables pour lesquelles la structure sera importée du modèle :
      1. Dans la liste Variable du modèle, sélectionnez la variable pour laquelle vous souhaitez importer la structure.
      2. Cliquez sur le bouton Afficher, la structure de la variable s'ouvre dans une nouvelle fenêtre.
    • Si la variable est déjà dans la liste des variables pour lesquelles la structure sera importée du modèle :
      1. Cliquez deux fois sur la variable dont vous souhaitez voir la structure.

Créer une structure

  • Pour créer ou modifier la structure d'une variable...
    • à l'aide de l'onglet Structures du ruban :
    • Cliquez sur Nouvelle Structure. La fenêtre de modification s'ouvre.
    • Utilisation de la colonne Structure
    • Cliquez deux fois sur l'icône Structure correspondant à la variable dont vous voulez modifier ou créer la structure. La fenêtre de modification s'ouvre.

      Si vous aviez extrait la structure des statistiques de la variable ou d'un modèle, les champs de la fenêtre sont déjà préremplis.

Supprimer la structure d'une variable

  • Pour supprimer la structure d'une variable...
    • à l'aide de l'onglet Structures du ruban :
      1. Sélectionnez les variables dont vous souhaitez supprimer la structure.
      2. Cliquez sur le bouton Supprimer la structure.
    • Utilisation de la colonne Structure
      1. Cliquez deux fois sur les variables dont vous souhaitez supprimer la structure.
      2. Cliquez sur Définir une structure et sélectionnez Supprimer la structure.
Structures par type de variable

Étant donné que la structure d'une variable dépend de son type de valeur (nominale, continue, ordinale), l'éditeur de structure diffère pour chaque type.

Structure d'une variable continue

La structure d'une variable continue est définie par plusieurs intervalles composés chacun de :

  • une limite inférieure ([ ]) ouverte ou fermée,
  • une valeur minimale (Minimum),
  • une valeur maximale (Maximum),
  • une limite supérieure ([ ]) ouverte ou fermée.

Tous les intervalles doivent être adjacents : il ne doit y avoir aucun trou ni chevauchement entre deux intervalles.

L'option Ajouter manquante vous permet d'indiquer avec quel intervalle les valeurs manquantes devront être regroupées.

L'option Inclure les données plus petites, vous permet d'inclure dans le premier intervalle les données plus petites que celui-ci. De la même façon l'option Inclure les données plus grandes, vous permet d'inclure dans le dernier intervalle les données plus grandes que celui-ci.

  • Pour créer un intervalle
    1. Cliquez sur le bouton Ajouter pour créer un intervalle. La fenêtre de modification s'ouvre.
    2. Sélectionnez le type de la borne de début en cliquant sur le bouton ].
    3. Saisissez la valeur minimale de l'intervalle dans le champ de texte de gauche.
    4. Saisissez la valeur maximale de l'intervalle dans le champ de texte de droite.
    5. Sélectionnez le type de la borne de début en cliquant sur le bouton [.
    6. Cochez la case Manquante si les valeurs manquantes doivent être regroupées avec cet intervalle.
    7. Cliquez sur le bouton Oui pour valider votre intervalle.
  • Pour séparer un intervalle
    1. Sélectionnez un intervalle.
    2. Cliquez sur le bouton Séparer. L'intervalle sélectionné est automatiquement séparé en deux intervalles égaux.
  • Pour fusionner plusieurs intervalles
    1. Sélectionnez les intervalles à fusionner. Ceux-ci doivent être adjacents.
    2. Cliquez sur le bouton Joindre.
  • Pour supprimer un intervalle
    1. Sélectionnez un ou plusieurs intervalles. Ceux-ci doivent être adjacents.
    2. Cliquez sur le bouton Supprimer. Les intervalles précédent et suivant sont étendus pour inclure les valeurs contenues dans les intervalles supprimés.

Structure d'une variable ordinale

La structure d'une variable ordinale est similaire à celle d'une variable continue, à l'exception des limites qui sont toujours fermées et ne peuvent pas être modifiées.

Remarque

La structure d'une variable de chaîne ordinale ne peut être modifiée.

Structure d'une variable textuelle

La structure des variables textuelles ne peut être modifiée.

Structure d'une variable nominale

La structure d'une variable nominale est composée de plusieurs groupes rassemblant les catégories de la variable.

  • Pour créer un groupe de catégories
    1. Dans la section Structure du groupe, saisissez dans le champ de texte le nom du groupe à créer. Utilisez la touche Ctrl de votre clavier pour sélectionner plusieurs catégories.
    2. Cliquez sur le bouton Ajouter un nouveau groupe. Un groupe contenant les catégories sélectionnées est créé dans la liste Structure du groupe.
  • Pour inclure les valeurs manquantes dans un groupe
    1. Dans la liste Structure du groupe, sélectionnez le groupe auquel vous voulez ajouter les valeurs manquantes.
    2. Cliquez sur le bouton Ajouter manquante, situé sous la liste Édition des catégories. La catégorie KxMissing, qui représente les valeurs manquantes, est ajoutée au groupe sélectionné et le bouton Ajouter manquante est désactivé. Comme toute catégorie, la catégorie KxMissing peut appartenir à un seul groupe à la fois.
  • Pour créer une catégorie et l'ajouter à un groupe
    1. Dans la liste Structure du groupe, sélectionnez le groupe auquel vous voulez ajouter la nouvelle catégorie.
    2. Dans le champ à droite du bouton Nouvelle catégorie, saisissez le nom de la catégorie à ajouter.
    3. Cliquez sur le bouton Nouvelle catégorie. La nouvelle catégorie est créée et assignée au groupe sélectionné.
  • Pour supprimer un groupe
    1. Dans la liste Structure du groupe, sélectionnez le groupe à supprimer.
    2. Cliquez sur le bouton Supprimer le groupe. Toutes les catégories appartenant à ce groupe sont rajoutées à la liste Édition des catégories, sauf celles qui ont été créées par l'utilisateur.
  • Pour supprimer une catégorie d'un groupe
    1. Dans la liste Structure du groupe, sélectionnez les catégories à supprimer du groupe.
    2. Cliquez sur le bouton Supprimer la catégorie. Toutes les catégories assignées à ce groupe réapparaissent dans la liste Édition des catégories, à l'exception de celles créées par l'utilisateur.
Remarque
  • Pour permettre au codage des données (K2C) de réunir les groupes de catégories définis dans la structure des variables s'ils apportent les mêmes informations, cochez le mode Activer l'optimisation des regroupements basés sur la variable cible effectués par K2C.
  • Lorsque le mode Utilise le codage naturel est activé, seule la version d'origine de la variable est utilisée. Les versions codées sont désactivées et les critères d'exclusion sont relâchés pour les versions d'origine.
Travailler sans aucune structure définie

Si vous laissez la structure comme indéfinie, l'application détermine automatiquement le regroupement des catégories en fonction de leur interaction avec la variable cible à l'aide d'un codeur cohérent. Vous pouvez configurer deux paramètres dans ce cas :

  • le nombre de segments pour les variables continues,
  • l'optimisation des regroupements pour toutes les variables.

Nombre de segments pour les variables continues

Lorsque vous ne travaillez avec aucune structure définie, vous pouvez définir le nombre de segments pour les variables continues. Les valeurs permises pour ce paramètre sont comprises entre 1 et 20.

La population est ainsi découpée en autant de segments de taille similaire. Ces segments permettent de constituer des statistiques descriptives, en particulier la répartition des variables cible pour chaque segment, ce qui influe sur le codage de la variable par rapport aux variables cible.

Le nombre de segments a une influence sur le calcul de la capacité prédictive (KI) : plus les segments sont nombreux, plus le calcul du KI est précis pour la variable explicative. Néanmoins, cette influence est très faible.

  • Pour définir le nombre de segments pour les variables continues
    1. Cliquez avec le bouton droit de la souris sur la ligne de la variable continue à modifier.
    2. Sélectionnez Définir une structure.
    3. Sélectionnez Modifier le nombre de segments pour les variables continues.
    4. Choisissez parmi les options présentées ci-dessous :
      Si vous souhaitez modifier le nombre de segments pour... alors...
      toutes les variables continues du modèle
      • Saisissez le nombre de segments voulus dans le champ en bas du panneau
      • Cliquez sur Affecter le même nombre de segments pour toutes les variables.
      • Cliquez sur OK.
      Pour modifier le nombre de segments pour la variable en cours de modification.
      • Saisissez le nombre de segments voulu dans la colonne Nombre de segments en haut du panneau.
      • Cliquez sur OK.

Optimisation des regroupements

Lorsque vous travaillez avec une structure définie et que vous souhaitez conserver vos catégories telles quelles pour la construction du modèle, vous devez désactiver cette option.

Dans le cas contraire ou si vous travaillez sans aucune structure définie, Activer l'optimisation des regroupements pour toutes les variables permet dans un grand nombre de cas, d'augmenter la robustesse du modèle (KR) avec une perte d'information minime (KI). Quand cela est possible, les segments adjacents similaires sont regroupés pour réduire les artéfacts observés entre les jeux de données d'estimation et de validation.

  • Pour activer l'optimisation des regroupements pour toutes les variables
    1. Effectuez un clic droit sur la ligne correspondant à la variable à modifier.
    2. Sélectionnez Définir une structure.
    3. Sélectionnez Activer l'optimisation des regroupements pour toutes les variables, de façon à ce que l'option soit cochée.