Структура

Когда на панели открыто описание данных, на ленте появляется вкладка Структуры для обработки структуры данных переменных.

Состояние

Последний столбец в таблице описаний содержит состояние структуры каждой переменной. В следующей таблице приведены возможные состояния структуры переменной.

Значок Состояние Описание
Не определено Кодировка данных автоматически определяет группировку категорий в зависимости от взаимодействия с целевой переменной.
Не обрабатываемо Структуру порядковой строчной переменной нельзя изменить.
Определено при извлечении из статистики переменных Пользователь должен открыть и проверить структуру переменной.
Определено пользователем или импортировано из существующей модели
Определение структуры переменной

Существует несколько способов определения структуры переменной:

  • извлечь категории из статистики переменных, обработать и проверить предложенную структуру;
  • извлечь из переменных;
  • импортировать структуру из существующей модели;
  • построить новую структуру.

Опция Активировать оптимальное группирование на основе цели, выполняемое K2C позволяет кодировке данных объединить группы категорий, определенные в структуре переменной, если они содержат одинаковую информацию.

Примечание

Перевод категорий переменной не влияет на структуру переменной, которая определяется по исходным значениям переменной.

Извлечение структуры из статистики

  • Извлечение структуры переменной
    • На вкладке Структуры выполните следующее.
      1. Выберите переменные для извлечения структуры.
      2. Нажмите кнопку Из статистики. Во время извлечения структуры будет отображаться строка динамики. По завершении извлечения значки выбранных переменных изменятся для подтверждения успешного выполнения и для идентификации. Далее структуру переменной можно изменить.
    • В контекстном меню выполните следующее.
      1. Выберите переменную для извлечения структуры. Чтобы выбрать несколько переменных, используйте клавишу CTRL.
      2. Щелкните таблицу правой кнопкой мыши для вызова контекстного меню.
      3. Выберите Начальная точка навигации Определить структуру Следующий шаг навигации Из статистики Конечная точка навигации. Во время извлечения структуры будет отображаться строка динамики. По завершении извлечения значки выбранных переменных изменятся для подтверждения успешного выполнения и для идентификации. Далее структуру переменной можно изменить.

Извлечение структуры из переменной

  • Импорт структуры переменной из переменной
    • На вкладке Структуры выполните следующее.
      1. Выберите переменные для извлечения структуры.
      2. Выберите Из переменной. Будет открыта панель.
      3. Выберите переменную из списка.
      4. Нажмите кнопку ОК.
    • В контекстном меню выполните следующее.
      1. Щелкните правой кнопкой мыши переменные, для которых требуется извлечь структуру. Будет открыто контекстное меню.
      2. Щелкните Определить структуру и выберите Из переменной. Будет открыта панель.
      3. Выберите переменную из списка.
      4. Нажмите кнопку ОК.
        Примечание

        Если структура переменной не определена, выводится сообщение.

Импорт структуры переменной из модели

  • Импорт структуры переменной из модели
    • На вкладке Структуры выполните следующее.
      1. Выберите переменные для извлечения структуры.
      2. Выберите Из модели, а затем Для выбранных переменных или Для всех переменных в зависимости от требуемых переменных. Будет отображена панель Загрузка модели.
      3. В списке Тип данных выберите тип хранилища, в котором сохранена модель.
      4. Нажмите кнопку Обзор рядом с полем Папка, чтобы выбрать папку или базу данных, содержащую модель.
      5. Из открывшегося списка моделей выберите модель для извлечения структуры переменной.
      6. Нажмите кнопку OK.
      7. В списке Цель из загруженной модели выберите цель модели. Выбранные переменные отобразятся в списке с соответствующими переменными из загруженной модели. Можно добавить переменные в список или удалить из списка, а также просмотреть структуру переменных модели, как описано ниже.
      8. Если в списке отображаются все переменные, структуру которых необходимо извлечь из модели, нажмите кнопку ОК. Окно выбора закроется, и состояние структуры изменится.
    • В контекстном меню выполните следующее.
      1. Щелкните правой кнопкой мыши переменные, для которых требуется извлечь структуру. Будет открыто контекстное меню.
      2. Выберите Из модели, а затем Для выбранных переменных или Для всех переменных в зависимости от требуемых переменных. Будет отображена панель Загрузка модели.
      3. Ознакомьтесь с инструкциями по работе с окном "Загрузка модели", приведенными выше.
  • Добавление переменной в список переменных
    1. В списке Переменные из загруженной модели выберите переменную для добавления в список переменных, структура которых будет импортирована.
    2. Нажмите кнопку Добавить. Переменная появится в списке ниже.
  • Удаление переменной из списка переменных
    1. В списке в нижней части панели выберите переменную, структуру которой не требуется импортировать.
    2. Нажмите кнопку Удалить. Переменная будет удалена из этого списка и добавлена в список Переменная из загруженной модели.
  • Просмотр структуры переменной, определенной в загруженной модели
    • Если переменная еще не добавлена в список переменных в нижней части панели, выполните следующее.
      1. В списке Переменная из загруженной модели выберите переменную для просмотра структуры, определенной в модели.
      2. Нажмите кнопку Просмотреть, структура переменной будет открыта в новом окне.
    • Если переменная уже добавлена в список переменных в нижней части панели, выполните следующее.
      1. Дважды щелкните переменную, для которой требуется просмотреть структуру, определенную в модели.

Построение новой структуры переменной

  • Создание или изменение структуры переменной
    • С использованием вкладки Структуры в ленте.
    • Нажмите кнопку Новая структура. Будет открыто окно обработки.
    • В столбце Структура выполните следующее.
    • Дважды щелкните значок Структура для переменной, структуру которой требуется обработать или создать. Будет открыто окно обработки.

      Если структура извлечена из статистики переменных или модели, поля будут уже заполнены.

Удаление структуры переменной

  • Удаление структуры переменной
    • С использованием вкладки Структуры в ленте.
      1. Выберите переменные для удаления структуры.
      2. Нажмите кнопку Удалить структуру.
    • В столбце Структура выполните следующее.
      1. Дважды щелкните переменные для удаления структуры.
      2. Выберите Определить структуру и затем Удалить структуру.
Структура по типу переменных

Поскольку структура переменной зависит от типа значения переменной (номинальная, порядковая, непрерывная), редактор структуры имеет разный вид для каждого типа.

Структура непрерывной переменной

Структура непрерывной переменной определяется несколькими интервалами, каждый из которых содержит следующие элементы:

  • нижняя граница ([ ]), которая может быть открытой или закрытой;
  • минимальное значение (Минимум);
  • максимальное значение (Максимум);
  • верхняя граница ([ ]), которая может быть открытой или закрытой.

Все интервалы должны быть соседними: пропуски и пересечения между двумя интервалами недопустимы.

Опция Добавить пропущенные позволяет указать, с каким интервалом группируются пропущенные значения.

Опция Включить меньшие данные позволяет включить в первый интервал любые значения меньше нижней границы. Аналогично опция Включить большие данные позволяет включить в последний интервал любые значения больше верхней границы.

  • Создание нового интервала
    1. Нажмите кнопку Добавить, чтобы создать новый интервал. Будет открыто окно обработки.
    2. Чтобы выбрать нижнюю границу, нажмите кнопку ].
    3. Введите минимальное значение интервала в левом текстовом поле.
    4. Введите максимальное значение интервала в правом текстовом поле.
    5. Чтобы выбрать верхнюю границу, нажмите кнопку [.
    6. Выберите опцию Добавить пропущенные, чтобы группировать пропущенные значения с этим интервалом.
    7. Нажмите кнопку Да, чтобы подтвердить интервал.
  • Разделение интервала
    1. Выберите интервал для разделения.
    2. Нажмите кнопку Разделить. Выбранный интервал будет автоматически разделен на два равных интервала.
  • Объединение двух интервалов
    1. Выберите интервалы для объединения. Можно выбрать только соседние интервалы.
    2. Нажмите кнопку Объединить.
  • Удаление интервала
    1. Выберите один или несколько интервалов. Можно выбрать только соседние интервалы.
    2. Нажмите кнопку Удалить. Предыдущий и следующий интервалы будут расширены значениями, которые ранее входили в удаленные интервалы, чтобы между интервалами не было пропусков.

Структура порядковой переменной

Структура порядковой переменной похожа на структуру непрерывной переменной, кроме границ, которые всегда закрыты и не могут быть изменены.

Примечание

Структуру порядковой строчной переменной невозможно изменить.

Структура текстовой переменной

Структуру текстовой переменной нельзя изменить.

Структура номинальной переменной

Структура номинальной переменной состоит из групп, содержащих категории переменной.

  • Создание новой группы категорий
    1. В списке Обработка категорий выберите категории для добавления в новую группу. Для выбора нескольких категорий используйте клавишу CTRL.
    2. Нажмите кнопку Добавить новую группу. Группа, содержащая выбранные категории, будет создана в списке Структура групп.
  • Включение пропущенных значений в группу
    1. В списке Структура групп выберите группу для добавления пропущенных значений.
    2. Нажмите кнопку Добавить пропущенные под списком Обработка категорий. Категория KxMissing, которая отражает пропущенные значения, будет добавлена в выбранную группу, а кнопка Добавить пропущенные будет деактивирована. Как и любая категория, категория KxMissing может входить только в одну группу.
  • Создание новой категории и добавление ее в группу
    1. В списке Структура групп выберите группу для добавления новой категории.
    2. В поле справа от кнопки Новая категория введите имя категории для добавления.
    3. Нажмите кнопку Новая категория. Категория будет создана и сразу добавлена в выбранную группу.
  • Удаление группы
    1. В списке Структура групп выберите группу для удаления.
    2. Нажмите кнопку Удалить группу. Все категории в этой группе будут снова добавлены в список Обработка категорий, кроме категорий, созданных пользователем.
  • Удаление категории из группы
    1. В списке Структура групп выберите категории для удаления из группы.
    2. Нажмите кнопку Удалить категорию. Выбранные категории будут удалены из группы и снова добавлены в список Обработка категорий, кроме категорий, созданных пользователем, которые удаляются окончательно.
Примечание
  • Чтобы при кодировке данных (в K2C) объединялись группы категорий, определенные в структуре переменной и содержащие одинаковую информацию, выберите опцию Активировать оптимальное группирование на основе цели, выполняемое K2C.
  • Когда режим Использует естественную кодировку активирован, используется только исходная версия переменной. Кодированные версии деактивируются, и критерии исключения становятся менее строгими для исходных версий.
Работа без определения структуры

Если структура не определена, приложение с помощью модуля Consistent Coder автоматически определяет группирование категорий на основе взаимодействия с целевой переменной. В этом случае можно сконфигурировать два параметра:

  • количество сегментов для непрерывных переменных;
  • оптимальное группирование всех переменных.

Количество сегментов для непрерывных переменных

При работе без определенной структуры можно установить количество сегментов для непрерывных переменных. Для этого параметра разрешены значения от 1 до 20.

Популяция разбивается на указанное число сегментов одинакового размера. Эти сегменты используются для построения описательной статистики, в частности, для распределения целевых переменных в каждом сегменте, что влияет на кодировку переменной относительно целевых переменных.

Число сегментов влияет на расчет прогностической силы (KI): чем больше сегментов, тем точнее расчет KI для объясняющей переменной. Однако это влияние незначительно.

  • Определение количества сегментов для непрерывных переменных
    1. Щелкните правой кнопкой мыши строку непрерывной переменной для обработки.
    2. Выберите Определить структуру.
    3. Выберите Установить количество сегментов для непрерывных переменных.
    4. Выполните действия, приведенные в таблице ниже:
      Операция Действие
      Изменение количества сегментов для всех непрерывных переменных модели
      • Введите требуемое количество сегментов в поле внизу панели.
      • Выберите "Установить одинаковое количество сегментов для всех переменных".
      • Нажмите кнопку "ОК".
      Изменение количества сегментов для обрабатываемой переменной
      • Введите требуемое количество сегментов в столбце "Количество сегментов" в верхней части панели.
      • Нажмите кнопку "ОК".

Оптимальное группирование всех переменных

При работе с определенной структурой деактивируйте эту опцию, чтобы сохранить категории, определенные для построения модели.

В противном случае или при отсутствии определенной структуры опция Активировать оптимальную группировку для всех переменных позволяет в большинстве случаев повысить надежность модели (KR) с минимальной потерей информации (KI). По возможности похожие соседние сегменты объединяются для устранения артефактов между наборами оценочных и проверочных данных.

  • Активация оптимальной группировки для всех переменных
    1. Щелкните правой кнопкой мыши строку переменной для обработки.
    2. Выберите Определить структуру.
    3. Установите флажок Активировать оптимальную группировку для всех переменных.