Durch die Angabe einer exakten Beschreibung für eine Variable können die Automated-Analytics-Komponenten diese während der Modellgenerierung korrekt berechnen und genauere Ergebnisse generieren.
Jede Variable und jedes Attribut wird durch die folgenden Felder beschrieben:
| Feld | Beschreibung | Werte |
|---|---|---|
| Name | der Variablenname (kann nicht geändert werden) | |
| Speicher | Art der in dieser Variable gesicherten Werte Hinweis: Wenn Sie eine Variable als "date" oder "datetime" deklarieren, extrahiert der Date Coder automatisch Datumsinformationen aus dieser Variable, z.B. den Tag des Monats, das Jahr, das Quartal usw. Während der Modellgenerierung werden zusätzliche Variablen mit diesen Informationen angelegt und als Eingabevariablen für das Modell verwendet. Der Date Coder ist bei Zeitreihenmodellen deaktiviert. |
Number: "berechenbare" Zahlen (Vorsicht: Eine Telefonnummer oder eine Kontonummer sollte nicht als Zahl angesehen werden.) Integer: Ganzzahlen String: Zeichenfolgen DateTime: Datum und Zeitstempel Date: Datumsangaben |
| Wert | beschreibt die Art des Wertes Achtung: Beim Anlegen eines Textkodierungsmodells können Sie nicht zum nächsten Bereich wechseln, wenn nicht mindestens eine textuelle Variable vorhanden ist. |
Continuous: numerische Variable, aus der Mittelwert, Varianz usw. berechnet werden können Nominal: eindeutig bestimmte Variable, die der einzige mögliche Wert für eine Zeichenfolge ist Ordinal: diskrete numerische Variable, bei der die relative Reihenfolge wichtig ist Textual: textuelle Variable, die Phrasen, Sätze oder vollständige Texte enthält |
| Schlüssel | Schlüsselvariable oder Identifikator für den Datensatz Sie können mehrere Schlüssel deklarieren. Sie werden entsprechend der angegebenen Reihenfolge (1-2-3-...) erstellt. | 0: Variable ist kein Identifikator 1: primärer Identifikator 2: sekundärer Identifikator ... |
| Reihenfolge | Ermittelt, ob eine Variable eine natürliche Reihenfolge darstellt. Wenn der Wert auf 1 festgelegt ist, wird die Variable in SQL-Ausdrücken in einer "ORDER BY"-Bedingung verwendet. Achtung: Das Kennzeichnen einer Variable als Reihenfolge hat Auswirkungen auf die Wahl einer Unterteilungsstrategie. Bei diesen Variablen können nur die sequenziellen Strategien verwendet werden. |
0: Variable stellt keine natürliche Reihenfolge dar 1: Variable stellt eine natürliche Reihenfolge dar |
| Fehlt | Zeichenfolge, mit der in der Datenbeschreibungsdatei fehlende Werte dargestellt werden | Beispiele: 999 oder #leer |
| Gruppe | Name der Gruppe, zu der die Variable gehört. Variablen derselben Gruppe enthalten dieselben Informationen. Daher erfolgt keine Kreuztabellierung der Variablen, wenn das Modell eine Reihenfolge mit einer Komplexität über 1 aufweist. Dieser Parameter wird in einer zukünftigen Version verwendbar sein. | |
| Beschreibung | zusätzliche Beschreibungsbeschriftung für die Variable |
Über den Variablenpool können die Beschreibungen von bereits verwendeten Variablen gesichert werden, sodass diese beim Beschreiben eines Datensets durch Analyse automatisch wiederverwendet werden können.