Dieser Bereich ermöglicht das Definieren der kolokationsspezifischen Einstellungen.
Zum Anlegen einer weiteren Kolokation, die auf einer bereits definierten Kolokation basiert, klicken Sie auf Kopieren.
Um die Kolokationen definieren zu können, müssen die folgenden Werte festgelegt werden.
| Einstellung | Beschreibung |
|---|---|
| Kolokationsname | Geben Sie den Namen der Kolokation ein. Hinweis
Der Name darf keines der folgenden Zeichen enthalten: Schrägstrich (/), größer als (>), kleiner als (<). |
| Kolokationsintervall | Geben Sie den maximalen zeitlichen Abstand ein, in dem zwei aufeinanderfolgende Ereignisse eintreten dürfen, damit sie als zeitgleich eingetretene Ereignisse eingestuft werden. Wenn das Kolokationsintervall beispielsweise 15 Minuten beträgt, dann bedeutet das, dass zwei Ereignisse zeitgleich sind, wenn ein Ereignis 15 Minuten vor bzw. nach dem anderen Ereignis eingetreten ist. |
| Maximale Anzahl an Kolokationen | Wählen Sie die Option Maximale Anzahl an Kolokationen, um die Anzahl der Kolokationen zu begrenzen, welche die Anwendung im Modell beibehalten soll. Dies ermöglicht die Begrenzung der Speicherauslastung und vereinfacht die Auswertung. Wenn mehr als die maximale Anzahl an Kolokationen gefunden wird, behält die Anwendung die Kolokationen mit den meisten Verbindungen bei. |
In der folgenden Tabelle sind alle erweiterten Einstellungen aufgeführt, die Sie festlegen können:
| Einstellung | Beschreibung |
|---|---|
| Minimaler Träger | Der Träger ist die Anzahl der Objekte, die zwei Entitäten gemeinsam haben. Wenn beispielsweise ein Graph aus einem bipartiten Graphen abgeleitet wird, der Produkte und Kunden miteinander verknüpft, ist der Träger der Verknüpfung zwischen Produkt A und Produkt B die Anzahl der Kunden, die beide Produkte gekauft haben. Eine Verknüpfung, bei welcher der Träger unter dem Minimalen Träger liegt, wird nicht angelegt. |
| Minimale Konfidenz | Die Konfidenz einer Verknüpfung ist der Prozentsatz der Datensätze, anhand derer der Aktionsteil der Regel verifiziert wird und anhand derer auch der Bedingungsteil der Regel verifiziert wird. Bei einer Regel der Form X=>Y ist die Konfidenz die Anzahl der Datensätze, die die Elementmenge X und das Attribut Y enthalten, in Relation zur Anzahl der Datensätze, die nur die Elementmenge X enthalten. Wenn Sie das Ankreuzfeld Gerichtet nicht markiert haben und die Konfidenz einer Verknüpfung nur für eine Richtung über der minimalen Konfidenz liegt, wird die Verknüpfung trotzdem beibehalten. |
| Mindestwert für prognostische Trennschärfe | Nur Verknüpfungen, bei denen die prognostische Trennschärte über dieser Zahl liegt, werden beibehalten. Wenn Sie das Ankreuzfeld Gerichtet nicht markiert haben und die prognostische Trennschärfe einer Verknüpfung nur für eine Richtung über dem Mindestwert für die prognostische Trennschärfe liegt, wird die Verknüpfung trotzdem beibehalten. |
| Gerichtet | Ein Filter, der die Unterscheidung zwischen den Verknüpfungen nach ihrer Richtung ermöglicht und gerichtete Regeln vorgibt. |
| Nächstes Übergangslimit | Begrenzt die Anzahl der Übergänge, die von der Anwendung berücksichtigt werden, nachdem ein Paar gefunden wurde. |
| Erste N beibehalten | Die Anzahl der Paarungen, die unter denen mit dem höchsten Rang beibehalten werden soll. |
| Gewichtung | Gibt an, welcher Wert als Gewichtung für die Verknüpfungen zugewiesen werden soll. Es ist empfehlenswert, den Jaccard-Index oder die Unabhängigkeitswahrscheinlichkeit zu verwenden, Letztere insbesondere bei der Arbeit mit Communitys.
verwendet den oben definierten Träger
Misst die Ähnlichkeit zwischen Beispielsets und wird als Größe der Schnittmenge geteilt durch die Größe der Vereinigung der Beispielsets definiert:
Zwei Ereignisse A und B sind unabhängig, wenn die Wahrscheinlichkeit, dass beide Ereignisse eintreten, der Wahrscheinlichkeit von Ereignis A mal der Wahrscheinlichkeit von Ereignis B entspricht: Die folgende Formel wird zur Berechnung der Gewichtung verwendet:
Ene Gewichtung von 1 zeigt vollständig unabhängige Ereignisse an. Je höher die Gewichtung ist, desto stärker ist die Korrelation zwischen den Ereignissen.
dabei ist a: der aktive Benutzer i und j: zwei Elemente : Set von Benutzern, die i gekauft haben : Spalte von Matrix R für Element i
|
| Graphspeichernutzung optimieren | Bei Auswahl dieser Option wird der Prozess verlangsamt, es wird jedoch nicht zu viel Speicherplatz benötigt. |
| Graphberechnungsgeschwindigkeit optimieren | Bei Auswahl dieser Option wird der Prozess beschleunigt, es wird jedoch mehr Speicherplatz benötigt. |