Cette option vous permet de définir un nombre minimal de sessions pour lesquelles les règles d'association génèrent des règles temporaires.
Rappel : une session est un ensemble de transactions identifié par une clé unique. Par exemple, l'ensemble des achats effectués en une fois par un même client.
En usage standard (taille des blocs égale à 0), toutes les transactions en mémoire sont importées avant la génération des règles d'association correspondant aux paramètres du modèle (support minimal, confiance minimal, taille maximale des règles). Avec des jeux de données volumineux, cette méthode peut être très gourmande en temps et en espace mémoire. Pour gagner en vitesse et en espace mémoire, utilisez cette option pour importer et générer les règles à partir de parties du fichier d'événements. A la fin de la phase d'apprentissage, ces règles sont rassemblées et les statistiques mises à jour pour l'ensemble du jeu de données.
Le nombre de règles trouvées peut être différent selon la méthode utilisée. Cependant, ces différences ne sont pas significatives si la taille des blocs est suffisante. La taille des blocs doit représenter environ 10 % du nombre total de sessions de votre jeu de données (à savoir 10 à 15 blocs selon la taille du jeu de données). Vous pouvez commencer avec 10 % et modifier cette valeur pour améliorer vos résultats. Si votre fichier de transactions contient moins de 5 000 lignes, vous devez utiliser une stratégie sans bloc.
Mais vous pouvez laisser Automated Analytics se charger de délimiter la taille des blocs grâce à l'option Calculer automatiquement la taille des blocs. La taille des blocs sera calculée de façon à en obtenir dix.
Les transactions présentes dans le jeu de données d'événement doivent être groupées par sessions. Cela signifie que le fichier d'événements doit être trié par sessions.
Lorsque cette option est cochée, l'application ne génère que les règles primaires et non les règles dérivées. Par exemple, soit R1 = X => Z et R2 X,Y =>Z deux règles d'association, R1 est appelée règle primaire et R2 règle dérivée.
Avant de démarrer le processus d'apprentissage, vous pouvez sélectionner les éléments à afficher comme conséquents dans les règles générées en définissant soit les conséquents à conserver soit ceux à exclure de la modélisation. Si les deux listes contiennent des éléments, la liste des éléments à conserver sera utilisée pour la modélisation.
Avant de remplir une liste, vous devez connaître la valeur exacte des éléments que vous souhaitez inclure ou exclure.