Ce panneau vous permet de sélectionner une variable à utiliser comme estimateur de variable cible ou de spécifier des index de clusters.
Estimateur de cible
Un estimateur de cible est une variable permettant de prédire le comportement de la variable cible. Utiliser un tel estimateur équivaut à créer un modèle.
S'il n'existe aucune variable pouvant être utilisée comme estimateur dans le jeu de données, ne remplissez rien dans ce panneau.
Remarque : Seules des variables continues peuvent être utilisées comme estimateurs.
- Pour sélectionner un estimateur de la cible
- Sélectionnez l'onglet Estimateur de cible.
- Dans la colonne Variables, cliquez sur la variable à utiliser comme estimateur.
- Cliquez dans la case correspondante de la colonne est estimateur de. Une liste des variables cible existantes s'affiche.
- Sélectionnez la variable cible à estimer.
Estimateur de cluster
Lorsque vous utilisez un jeu de données qui résulte de l'application d'un modèle de segmentation et dans lequel chaque enregistrement est assigné à un cluster, vous pouvez utiliser cet onglet pour spécifier quelle colonne du jeu de données contient les identifiants de clusters. Cela peut être utilisé pour générer des statistiques telles que la taille des clusters et la somme des carrés résiduels pour ces clusters. Un des usages les plus évidents est la comparaison des résultats de mise en cluster obtenus grâce à différents outils ou différentes méthodes de calcul.
- Pour ajouter un estimateur de cluster
- Sélectionnez l'onglet Estimateur de cluster.
- Cliquez sur le bouton Ajouter un estimateur. Une variable est ajoutée à la liste des estimateurs.
- Cliquez sur la variable pour afficher la liste de toutes les variables nominales du jeu de données.
- Sélectionnez dans la liste la variable contenant un identifiant de cluster.
- Si le modèle de mise en cluster utilisé pour générer l'identifiant de cluster était un modèle de segmentation (donc avec une variable cible), sélectionnez la variable cible dans la liste Cible du cluster.
- Répétez les étapes 2 à 5 si votre jeu de données contient plus d'un identifiant de cluster. Par exemple, si le jeu de données contient les résultats de deux outils de mise en cluster différents, vous pouvez comparer directement les statistiques sur le même jeu de données.
- Dans la liste Distance sous la liste des estimateurs, sélectionnez la distance utilisée pour évaluer la proximité de deux individus donnés dans le modèle de mise en cluster original.
- Dans la liste Codage sous la liste des estimateurs, sélectionnez le codage utilisé dans le modèle de mise en cluster original. Le codage par défaut utilisé lors de la génération d'un modèle de mise en cluster avec Automated Analytics est :
- Moyenne de la cible pour les modèles de segmentation,
- Regroupement pour les autres modèles.
Remarque Si le jeu de données contient des résultats de plusieurs modèles, ceux-ci doivent avoir été générés avec les mêmes métriques de distance et le même codage.
- Une fois tous les estimateurs indiqués, cliquez sur le bouton Valider.
- Pour supprimer un estimateur de cluster
- Sélectionnez la variable d'estimation dans la liste.
- Cliquez sur le bouton Supprimer un estimateur.