Стратегия разделения в Data Manager

Функции SAP Predictive Analytics требуют двух обязательных и одной дополнительной подвыборки для моделирования.

  • Оценка: используется для обучения моделей.
  • Проверка: используется для проверки непротиворечивости или надежности моделей.
  • Тест (необязательно): используется для вычисления индикатора качества конечной модели.

Для генерации моделей доступно девять стратегий разделения.

  • Пользовательская стратегия разделения с настраиваемыми подвыборками.
  • Восемь автоматических стратегий разделения.
    • Последовательно: исходные данные последовательно присваиваются подвыборкам (3/5 для оценки, 1/5 для проверки и 1/5 для теста). Это самая быстрая стратегия разделения.
    • Периодически: исходные данные периодически присваиваются подвыборкам в группах по пять записей следующим образом: первые три относятся к оценке, четвертая к проверке и пятая к тесту. Эта стратегия используется, если исходный порядок данных следует игнорировать.
    • Произвольно: исходные данные произвольно присваиваются подвыборкам. Если данные отсортированы по переменной, такой как возраст, или по целевой переменной, рекомендуется использовать стратегию произвольного разделения.
    • Периодически с тестом в конце: стратегия периодического разделения с тестом в конце.
    • Произвольно с тестом в конце: произвольное разделение с тестом в конце.
    • Последовательно без теста: стратегия последовательного разделения только с наборами оценочных и проверочных данных.
    • Периодически без теста: стратегия периодического разделения только с наборами оценочных и проверочных данных.
    • Произвольно без теста (по умолчанию): стратегия произвольного разделения только с наборами оценочных и проверочных данных.
  • Выбор автоматической стратегии разделения
    1. Выберите опцию Предварительно определено.
    2. В списке выберите требуемую стратегию разделения.
    3. Нажмите кнопку Дальше. Будет открыта панель Данные для моделирования.
  • Выбор пользовательской стратегии разделения
    1. Выберите опцию Пользоват.
    2. Нажмите кнопку Обзор рядом с полем Оценка, чтобы выбрать набор оценочных данных.
    3. Нажмите кнопку Обзор рядом с полем Проверка, чтобы выбрать набор проверочных данных.
    4. Чтобы использовать набор тестовых данных, нажмите кнопку Обзор рядом с полем Тест и выберите набор данных. Иначе оставьте поле пустым.
    5. Нажмите кнопку Дальше. Будет открыта панель Данные для моделирования.