Beschreiben Ihrer Daten

Metadaten können in einem durch Tapstopps oder Kommata getrennten Textformat, aus einer ODBC-Quelle oder in einem proprietären Format geladen werden. Es gibt zwei Möglichkeiten, die Daten zu beschreiben:

  • Analysieren: Die ersten hundert Datenzeilen werden überprüft und dem Benutzer ein initialer Vorschlag der Datendateibeschreibung geliefert. Bei Dateien mit Textdaten sollte die erste Zeile die Variablennamen enthalten. Nach dem Anlegen einer Beschreibungsdatei wird mithilfe der Drucktaste Beschreibung sichern die Beschreibungsdatei in dem Unterverzeichnis gesichert, das im Feld Verzeichnis angegeben ist. Der Name der Beschreibungsdatei kann in das Feld Beschreibung eingegeben werden.
  • Beschreibung öffnen: Es wird eine zuvor gesicherte Beschreibungsdatei geöffnet.
  • Daten anzeigen: Es werden die ersten hundert Zeilen des Datensets angezeigt, um die Validierung der Beschreibung zu erleichtern.

Jede Variable und jedes Attribut wird durch die folgenden Felder beschrieben:

  • Name: der Variablenname (kann nicht geändert werden)
  • Speicher: Art der in dieser Variable gesicherten Werte
    • Zahl: die Variable enthält nur "berechenbare" Zahlen" (Vorsicht: Eine Telefonnummer oder eine Kontonummer sollte nicht als Zahl angesehen werden.)
    • Zeichenfolge: die Variable enthält Zeichenfolgen
    • DateTime: die Variable enthält Datum und Zeitstempel
    • Datum: die Variable enthält Datumsangaben
  • Wert: beschreibt die Art des Wertes
    • Continuous: numerische Variable, aus der Mittelwert, Varianz usw. berechnet werden können
    • Nominal: eindeutig bestimmte Variable, die der einzige mögliche Wert für eine Zeichenfolge ist
    • Ordinal: diskrete numerische Variable, bei der die relative Reihenfolge wichtig ist
  • Schlüssel: Schlüsselvariable oder Identifikator für den Datensatz (0: Variable ist kein Identifikator, 1: primärer Identifikator, 2: sekundärer Identifikator ...)
  • Reihenfolge: Ermittelt, ob eine Variable eine natürliche Reihenfolge darstellt. (0: die Variable stellt keine natürliche Reihenfolge dar, 1: die Variable stellt eine natürliche Reihenfolge dar). Wenn der Wert auf 1 festgelegt ist, wird die Variable in SQL-Ausdrücken in einer "order by"-Bedingung verwendet.

    Warnung: Das Kennzeichnen einer Variable als eine Reihenfolge hat Auswirkungen auf die Wahl einer Unterteilungsstrategie. Bei diesen Variablen können nur die sequenziellen Strategien verwendet werden.

  • Fehlt: Zeichenfolge, mit der in der Datenbeschreibungsdatei fehlende Werte dargestellt werden (z.B.: "999" oder "#Empty" - ohne die Anführungszeichen)
  • Gruppe: Name der Gruppe, zu der die Variable gehört. Variablen derselben Gruppe enthalten dieselben Informationen. Daher erfolgt keine Kreuztabellierung der Variablen, wenn der Komplexitätsgrad des Modells bei über 1 liegt. Dieser Parameter wird in einer zukünftigen Version verwendbar sein.

Beschreibung: zusätzliche Beschreibungsbeschriftung für die Variable