Mise en cluster

  • Choisir le meilleur nombre de clusters dans cet intervalle

Ce champ vous permet de spécifier combien de clusters devront être générés par le modèle. Par défaut, le nombre de clusters est défini à 10. Plus le nombre de segments est élevé, moins le modèle est robuste (reproductibilité). Plus le nombre de segments est faible, moins les informations sont précises (capacité prédictive). Il est généralement conseillé de commencer par le nombre de clusters par défaut, puis de l'augmenter ou le réduire selon les résultats obtenus.

  • Pour une segmentation (c'est-à-dire avec variable cible), l'utilisateur choisit le meilleur nombre de segments, par exemple [5;10], ce qui signifie que l'utilisateur souhaite avoir entre 5 et 10 clusters. Le moteur calcule le "meilleur nombre de clusters" à l'aide de la métrique Reproductibilité + Capacité prédictive. Vous pouvez, par exemple, avoir 7 clusters.
  • Pour un regroupement (c'est-à-dire sans variable cible), l'application choisit le nombre minimum de clusters, par exemple [10;10], ce qui signifie que l'utilisateur souhaite avoir 10 clusters.
Remarque

Lorsque vous activez l'option Calculer les expressions SQL, un cluster supplémentaire contenant les enregistrements non assignés est généré.

  • Calculer les expressions SQL

Cette fonctionnalité vous permet de voir les expressions SQL utilisées pour générer chaque cluster. Le calcul des expressions SQL est activé par défaut.

  • Avancé...

Le bouton Avancé vous permet d'accéder au panneau. Ce panneau vous permet d'activer les statistiques croisées, de spécifier la valeur clé de chaque variable cible ainsi que la distance à utiliser et la stratégie de codage.