Mit dieser Option können Sie eine Mindestanzahl an Sitzungen festlegen, für die Assoziationsregeln temporäre Regeln generieren.
Zur Erinnerung: Bei einer Sitzung handelt es sich um eine Reihe von Transaktionen, die durch einen eindeutigen Schlüssel identifiziert werden. Beispiel: alle Einkäufe eines einzelnen Kunden zu einem bestimmten Zeitpunkt.
Bei einer Standardverwendung (Chunk-Größe ist 0) werden alle Transaktionen im Arbeitsspeicher importiert, bevor die Assoziationsregeln generiert werden, die den Modellparametern entsprechen (minimaler Träger, minimale Konfidenz, maximale Regellänge). Bei großen Datensets kann diese Methode im Hinblick auf Zeit und Arbeitsspeicher sehr teuer sein. Für einen Zugewinn an Geschwindigkeit und Speicherplatz besteht die Möglichkeit, Regeln aus Teilen der Ereignisdatei zu importieren und zu generieren. Am Ende des Lernschritts werden diese Regeln verknüpft, und deren Statistik wird für das gesamte Datenset aktualisiert.
Die Anzahl der gefundenen Regeln kann in Abhängigkeit von der ausgewählten Methode variieren. Diese Unterschiede sind jedoch nicht signifikant, wenn die Chunk-Größe ausreichend ist. Die Chunk-Größe sollte ungefähr 10 % der Gesamtanzahl an Sitzungen in Ihrem Datenset ausmachen (d.h. 10 bis 15 Chunks in Abhängigkeit von der Datensetgröße). Sie können mit 10 % beginnen und diese Zahl ändern, um Ihre Ergebnisse zu verbessern. Wenn Ihre Transaktionsdatei weniger als 5000 Zeilen enthält, sollten Sie eine Strategie ohne Chunk verwenden.
Die Aufteilung der Sitzungen in Chunks kann mithilfe der Option Chunk-Größe vorschlagen jedoch auch an Automated Analytics delegiert werden. Damit wird die Chunk-Größe automatisch berechnet, sodass zehn Chunks entstehen.
Die Transaktionen im Ereignisdatenset müssen nach Sitzungen gruppiert werden, das heißt, die Ereignisdatei muss nach Sitzungen sortiert werden.
Mit dieser Option wird für die Anwendung angegeben, dass nur die primären Regeln generiert und somit die abgeleiteten Regeln übersprungen werden sollen. Bei den beiden Assoziationsregeln R1 = X => Z und R2 X,Y =>Z beispielsweise ist R1 eine sogenannte primäre Regel und R2 eine abgeleitete Regel.
Bevor Sie den Lernprozess starten, können Sie auswählen, welche Elemente Sie in den generierten Regeln als Aktionsteile sehen möchten, indem Sie entweder die beizubehaltenden oder die aus der Modellierung auszuschließenden Aktionsteile definieren. Wenn beide Listen Elemente enthalten, wird die Liste der in den Aktionsteil einzubeziehenden Elemente für die Modellierung verwendet.
Bevor Sie eine Liste anlegen, müssen Sie den genauen Wert des jeweiligen einzubeziehenden bzw. auszuschließenden Elements kennen.