Je nach der Auswahl im Menü Generieren enthalten die generierten Daten (zusätzlich zu allen Schlüsselvariablen) Folgendes:
| Bei Auswahl der Option... | enthalten die generierten Daten für jede Zeile Folgendes: |
|---|---|
| Nur prognostizierter Wert | Nur der prognostizierte Wert der Beobachtungen (rr_TargetVariableName) |
| Wahrscheinlichkeit |
|
| Einzelne Beiträge |
|
| Entscheidung |
Durch Auswahl der Option "Entscheidung" im Pulldown-Menü "Generieren" können Sie festlegen, wie viele Beobachtungen das Modell nach der Anwendung auf ein neues Datenset ermitteln soll. |
| Erweiterte Anwendungseinstellungen | Mit dieser Option können Sie die Ausgaben auswählen, die Sie in der Ergebnisdatei sehen möchten. |
| Direkte Anwendung in der Datenbank verwenden | Wenn diese Option markiert ist, wird der optimierte Bewertungsmodus der datenbankinternen Anwendung verwendet und die Daten werden direkt in der Datenbank generiert. |
| Punktwertabweichung hinzufügen | Mit dieser Option können Sie für jede Variable und jede Variablenkategorie die Abweichungen zwischen dem Modell und dem für die Modellanwendung verwendeten Eingabedatenset prüfen. |
Verwenden des datenbankinternen Anwendungsmodus
Dieser optimierte Bewertungsmodus ermöglicht, das Modell direkt in der Datenbank anzuwenden. Dadurch wird vermieden, die Daten aus der Datenbank zu extrahieren, und der Schreibprozess der Modellausgaben wird beschleunigt. Dieser Modus kann verwendet werden, wenn alle folgenden Bedingungen erfüllt sind:
Wenn die Option Direkte Anwendung in der Datenbank verwenden markiert ist, ist die Option Punktwertabweichung hinzufügen automatisch ausgewählt.
| Bei Auswahl der Option... | enthalten die generierten Daten für jede Zeile Folgendes: |
|---|---|
| Nur prognostizierter Wert |
|
| Cluster-ID disjunktive Kodierung |
disjunktive Kodierung (bzw. "Dummy"-Kodierung) der Clusternummern. Das bedeutet, dass für jeden Cluster eine boolesche Variable angelegt wird, die darauf hinweist, ob die aktuelle Beobachtung zu diesem Cluster gehört (Wert ist 1) oder nicht (Wert ist 0). |
| Cluster-ID disjunktive Kodierung (+ Datensetkopie) |
disjunktive Kodierung (bzw. "Dummy"-Kodierung) des Clusterindex. Das bedeutet, dass für jeden Cluster eine boolesche Variable angelegt wird, die darauf hinweist, ob die aktuelle Beobachtung zu diesem Cluster gehört (Wert ist 1) oder nicht (Wert ist 0).
|
| Cluster-ID Zielmittelwert |
|
| Bei Auswahl der Option... | enthalten die generierten Daten für jede Zeile Folgendes: |
|---|---|
| Vektorisierung | alle Spalten im ursprünglichen Datenset Für jedes textuelle Feld:
|
| Spracherkennung | Für jedes textuelle Feld:
|
| Transaktional |
Mit diesem Modus wird jede Zeile in eine Transaktionsequenz umgewandelt, wodurch Datensets entstehen, die in der Sequenzkodierung verwendet werden können. |
| Nur Stämme generieren | Für jedes textuelle Feld:
|
Generierungsoptionen
| Bei Auswahl der Option... | enthalten die generierten Daten für jeden Knoten Folgendes: |
|---|---|
| Standardmodus |
|
| Kreismodus |
|
| Zentralitätsmodus |
|
| Nachbarmodus |
|
| Beschreibungsmodus |
|
| Community-Modus |
|
| Knotenpaarungsmodus |
|
| Erweiterte Einstellungen |
|
Hinweis zum Anwendungsdatenset
Um ein Social-Modell auf ein Datenset anwenden zu können, muss es folgende Variablen enthalten.
Die Variable kxComIndex, die die Community-IDs enthält. Dabei sollte es sich um eine nominale Ganzzahl handeln.
Diese Variable ermöglicht Ihnen die Anwendung auf Community-Graphen (Anfrage von Nachbarn, Knotenliste in der Community oder in aggregierten Statistiken). Mithilfe dieser Spalte können Sie eine Liste der Community-IDs erhalten, zu denen Sie Metriken berechnen möchten. Wenn Sie keine Anwendung auf Community-Graphen vornehmen möchten, sollten Sie diese Spalte leer lassen, oder im Fall einer Datenbank einen Dummy-Wert eingeben, der nicht verwendet wird.
Um die Konsistenz der Datensets sicherzustellen, verwenden Sie die im Bereich Anwenden des Modells verfügbare Zuordnungsfunktion.
Verwenden des datenbankinternen Anwendungsmodus
Dieser optimierte Bewertungsmodus ermöglicht, das Modell direkt in der Datenbank anzuwenden. Dadurch wird vermieden, die Daten aus der Datenbank zu extrahieren, und der Schreibprozess der Modellausgaben wird beschleunigt. Dieser Modus kann verwendet werden, wenn alle folgenden Bedingungen erfüllt sind:
Wenn das Modell nicht gesichert wurde, wird eine Warnung angezeigt, und Automated Analytics wechselt automatisch zum Standardanwendungsprozess.
| Bei Auswahl der Option... | enthalten die generierten Daten für jede Zeile Folgendes: |
|---|---|
| Nur prognostizierter Wert | Basisausgaben:
|
| Durch KI optimierte Aktionsteile | Basisausgaben. Wenn mehr als eine Regel denselben Aktionsteil für eine Sitzung ausgibt, wird die Regel mit der besten prognostischen Trennschärfe (KI) ausgewählt. |
| Durch Konfidenz optimierte Aktionsteile | Basisausgaben Wenn mehr als eine Regel denselben Aktionsteil für eine Sitzung ausgibt, wird die Regel mit der besten Konfidenz ausgewählt. |
| Prognostizierter Wert mit vollständiger Beschreibung der Regeln | Erweiterte Ausgaben:
|
| Durch KI optimierte Aktionsteile mit vollständiger Beschreibung der Regeln | Erweiterte Ausgaben Wenn mehr als eine Regel denselben Aktionsteil für eine Sitzung ausgibt, wird die Regel mit der besten prognostischen Trennschärfe (KI) ausgewählt. |
| Durch Konfidenz optimierte Aktionsteile mit vollständiger Beschreibung der Regeln | Erweiterte Ausgaben Wenn mehr als eine Regel denselben Aktionsteil für eine Sitzung ausgibt, wird die Regel mit der besten Konfidenz ausgewählt. |
| Bei Auswahl der Option... | enthält die Ergebnisdatei Folgendes: |
|---|---|
| Nur prognostizierter Wert |
|
| Prognosen mit zugehörigen Komponenten |
|
| Prognosen mit zugehörigen Komponenten und Residuen |
|
| Nur erste Prognosespalte und die Fehlerbalken |
|