Definitionen

Beschreibung einer Variable

Durch die Angabe einer exakten Beschreibung für eine Variable können die Automated-Analytics-Komponenten diese während der Modellgenerierung korrekt berechnen und genauere Ergebnisse generieren.

Jede Variable und jedes Attribut wird durch die folgenden Felder beschrieben:

Feld Beschreibung Werte
Name der Variablenname (kann nicht geändert werden)
Speicher

Art der in dieser Variable gesicherten Werte

Hinweis: Wenn Sie eine Variable als "date" oder "datetime" deklarieren, extrahiert der Date Coder automatisch Datumsinformationen aus dieser Variable, z.B. den Tag des Monats, das Jahr, das Quartal usw. Während der Modellgenerierung werden zusätzliche Variablen mit diesen Informationen angelegt und als Eingabevariablen für das Modell verwendet. Der Date Coder ist bei Zeitreihenmodellen deaktiviert.

Number: "berechenbare" Zahlen (Vorsicht: Eine Telefonnummer oder eine Kontonummer sollte nicht als Zahl angesehen werden.)

Integer: Ganzzahlen

String: Zeichenfolgen

DateTime: Datum und Zeitstempel

Date: Datumsangaben

Wert

beschreibt die Art des Wertes

Achtung: Beim Anlegen eines Textkodierungsmodells können Sie nicht zum nächsten Bereich wechseln, wenn nicht mindestens eine textuelle Variable vorhanden ist.

Continuous: numerische Variable, aus der Mittelwert, Varianz usw. berechnet werden können

Nominal: eindeutig bestimmte Variable, die der einzige mögliche Wert für eine Zeichenfolge ist

Ordinal: diskrete numerische Variable, bei der die relative Reihenfolge wichtig ist

Textual: textuelle Variable, die Phrasen, Sätze oder vollständige Texte enthält

Schlüssel Schlüsselvariable oder Identifikator für den Datensatz Sie können mehrere Schlüssel deklarieren. Sie werden entsprechend der angegebenen Reihenfolge (1-2-3-...) erstellt.

0: Variable ist kein Identifikator

1: primärer Identifikator

2: sekundärer Identifikator

...

Reihenfolge

Ermittelt, ob eine Variable eine natürliche Reihenfolge darstellt. Wenn der Wert auf 1 festgelegt ist, wird die Variable in SQL-Ausdrücken in einer "ORDER BY"-Bedingung verwendet.

Achtung: Das Kennzeichnen einer Variable als Reihenfolge hat Auswirkungen auf die Wahl einer Unterteilungsstrategie. Bei diesen Variablen können nur die sequenziellen Strategien verwendet werden.

0: Variable stellt keine natürliche Reihenfolge dar

1: Variable stellt eine natürliche Reihenfolge dar

Fehlt Zeichenfolge, mit der in der Datenbeschreibungsdatei fehlende Werte dargestellt werden Beispiele: 999 oder #leer
Gruppe Name der Gruppe, zu der die Variable gehört. Variablen derselben Gruppe enthalten dieselben Informationen. Daher erfolgt keine Kreuztabellierung der Variablen, wenn das Modell eine Reihenfolge mit einer Komplexität über 1 aufweist. Dieser Parameter wird in einer zukünftigen Version verwendbar sein.
Beschreibung zusätzliche Beschreibungsbeschriftung für die Variable
Variablenpool

Über den Variablenpool können die Beschreibungen von bereits verwendeten Variablen gesichert werden, sodass diese beim Beschreiben eines Datensets durch Analyse automatisch wiederverwendet werden können.