Описание данных

Метаданные можно загрузить в формате с разделением табуляторами или запятыми, из источника ODBC или в собственном формате. Существует два способа описания данных:

  • Проанализировать: сканирует первые сто строк данных и предоставляет пользователю автоматически определенное начальное описание файла данных. Для текстовых файлов рекомендуется включать в первую строку имена переменных. После создания файла описания нажмите кнопку Сохранить описание, чтобы сохранить файл описания в подкаталог, указанный в поле Каталог. Имя файла описания можно ввести в поле Описание.
  • Открыть описание: загружает ранее сохраненный файл описания.
  • Просмотреть данные: отображает первые сто строк набора данных для проверки описания.

Каждая переменная или атрибут описывается следующими полями.

  • Имя: Имя переменной (изменение невозможно)
  • Содержимое: тип значений, хранимых в этой переменной
    • Число: переменная содержит только рассчитываемые числа (обратите внимание, что номер телефона или номер счета не считываются номерами)
    • Строка: переменная содержит символьную строку
    • Метка времени: переменная содержит метку даты и времени
    • Дата: переменная содержит даты
  • Значение: описывает значение
    • Непрерывная: числовая переменная, для которой можно вычислить среднее арифметическое, отклонение и др.
    • Номинальная: категориальная переменная, которая является единственно возможным значением строки
    • Порядковая: дискретная числовая переменная, для которой важен относительный порядок
  • Ключ: ключевая переменная или ид. записи (0: переменная не является ид.; 1: первичный ид.; 2: вторичный ид. и др.)
  • Порядок: указывает, отражает ли переменная естественный порядок (0: переменная не отражает естественный порядок; 1: переменная отражает естественный порядок). При значении 1 переменная используется в выражениях SQL в условии "order by".

    Внимание! Отметка переменной как переменной порядка влияет на выбор стратегии разделения. Только последовательные стратегии можно использовать с переменной порядка.

  • Отсутствует: строка используется в файле описания данных для отражения пропущенных значений (например, "999" или "#Empty" без кавычек)
  • Группа: имя группы, к которой относится переменная. Переменные одной группы содержат одинаковую информацию, то есть не пересекаются в модели со степенью сложности выше 1. Этот параметр будет использоваться в следующей версии.

Описание: дополнительная описательная метка переменной