Функции SAP Predictive Analytics требуют двух обязательных и одной дополнительной подвыборки для моделирования.
- Оценка: используется для обучения моделей.
- Проверка: используется для проверки непротиворечивости или надежности моделей.
- Тест (необязательно): используется для вычисления индикатора качества конечной модели.
Для генерации моделей доступно девять стратегий разделения.
- Пользовательская стратегия разделения с настраиваемыми подвыборками.
- Восемь автоматических стратегий разделения.
- Последовательно: исходные данные последовательно присваиваются подвыборкам (3/5 для оценки, 1/5 для проверки и 1/5 для теста). Это самая быстрая стратегия разделения.
- Периодически: исходные данные периодически присваиваются подвыборкам в группах по пять записей следующим образом: первые три относятся к оценке, четвертая к проверке и пятая к тесту. Эта стратегия используется, если исходный порядок данных следует игнорировать.
- Произвольно: исходные данные произвольно присваиваются подвыборкам. Если данные отсортированы по переменной, такой как возраст, или по целевой переменной, рекомендуется использовать стратегию произвольного разделения.
- Периодически с тестом в конце: стратегия периодического разделения с тестом в конце.
- Произвольно с тестом в конце: произвольное разделение с тестом в конце.
- Последовательно без теста: стратегия последовательного разделения только с наборами оценочных и проверочных данных.
- Периодически без теста: стратегия периодического разделения только с наборами оценочных и проверочных данных.
- Произвольно без теста (по умолчанию): стратегия произвольного разделения только с наборами оценочных и проверочных данных.
- Выбор автоматической стратегии разделения
- Выберите опцию Предварительно определено.
- В списке выберите требуемую стратегию разделения.
- Нажмите кнопку Дальше. Будет открыта панель Данные для моделирования.
- Выбор пользовательской стратегии разделения
- Выберите опцию Пользоват.
- Нажмите кнопку Обзор рядом с полем Оценка, чтобы выбрать набор оценочных данных.
- Нажмите кнопку Обзор рядом с полем Проверка, чтобы выбрать набор проверочных данных.
- Чтобы использовать набор тестовых данных, нажмите кнопку Обзор рядом с полем Тест и выберите набор данных. Иначе оставьте поле пустым.
- Нажмите кнопку Дальше. Будет открыта панель Данные для моделирования.