Подвыборка

Для всех стратегий разделения, кроме Пользоват. можно создать подвыборки набора данных для обучения. Нажмите кнопку (Расширенные настройки), чтобы открыть экран Подвыборка.

Для создания подвыборки можно:

  • выбрать первую строку и последнюю строку из исходных данных;
  • произвольно выбрать часть исходных данных. Случайное отправное значение можно использовать для выбора одних записей из исходных данных при создании подвыборки;
  • использовать выбор строк и произвольную подвыборку параллельно.
  • Определение произвольной подвыборки
    1. Выберите опцию Произвольный выбор.
    2. В разделе Произвольный выбор используйте ползунок Доля, чтобы выбрать сохраняемый процент исходного набора данных.
    3. В поле Случайное отправное значение введите отправное значение для подвыборки. По умолчанию установлено отправное значение 1960.
    4. С помощью курсора установите ползунок Доля на процент наблюдения, который требуется включить в набор данных. Произвольный выбор генерирует произвольный индекс для каждой строки в наборе данных на основе одинакового отправного значения и индекса.

      Чтобы уточнить выбор, щелкните Расширенно. Вместо ползунка появятся два поля, в которых можно указать диапазон сохраняемых индексов. Например, если указать [0, 20%], будут выбраны строки с индексом от 0 до 0.2, то есть [0, 20%] не аналогично [80%, 100%] (индексы от 0,8 до 1). Это единственный способ изучения 80% набора данных и применения к остальным 20% с произвольной подвыборкой. Таким образом, можно создать два взаимодополняющих набора данных с одинаковыми настройками курсора и отправного значения и двумя взаимодополняющими диапазонами.

  • Определение выбора строк
    1. Выберите опцию Выбор строк.
    2. В поле Первая строка введите номер строки, с которой должна начинаться подвыборка.
    3. В поле Последняя строка введите номер строки, которой должна заканчиваться подвыборка.
    4. После указания подвыборки нажмите кнопку ОК, чтобы сохранить настройки, и закройте окно Настройки.