Cet écran vous permet de définir les paramètres avancés de l'analyseur de séquences fourni par Data Manager.
Lorsque vous créez un modèle, l'analyseur de séquences génère une grande quantité de colonnes temporaires. Vous pouvez indiquer si les données générées doivent être stockées dans l'espace mémoire ou sur disque.
L'option En mémoire est sélectionnée par défaut.
Vous pouvez définir un préfixe spécifique qui identifiera les variables créées par Data Manager. Par défaut, la valeur du préfixe est ksc.
L'option Filtrage permet de regrouper des catégories rares en une seule appelée KxOther. Il arrive fréquemment que les fichiers de transactions comportent un grand nombre de catégories peu fréquentes qui ne constituent pas en elles-mêmes des prédicateurs fiables. Regrouper ces catégories rares en une seule apporte souvent un avantage prédictif. La règle Filtrage vous permet de choisir les catégories à conserver dans des colonnes distinctes sur la base d'un pourcentage de la totalité du fichier de transactions. Les catégories correspondant au pourcentage de transactions restant sont regroupées dans la colonne KxOther automatiquement générée par l'analyseur de séquences.
Si, par exemple, vous déplacez le curseur Filtrage sur 90 %, le nombre total de transactions obtenu en additionnant toutes les catégories affectées à des colonnes distinctes ne doit pas dépasser 90 % du nombre total de transactions. Les catégories formant les 10 % restants sont regroupées dans KxOther.
Vous pouvez également définir un seuil de façon à ce que les transitions dont la durée entre deux événements est supérieure à ce seuil soient ignorées dans le comptage des transitions.
Dans la liste déroulante, sélectionnez l'unité utilisée pour définir le seuil.
Vous pouvez également définir un seuil de façon que le nombre de transitions ne soit mis à jour que si le temps écoulé durant la transition entre deux événements est inférieur au seuil défini.
Vous pouvez également définir un seuil de façon que les transitions dont la durée entre deux événements est supérieure à ce seuil soient ignorées dans le comptage des transitions.