Разделение данных

Компонент "Разделение" разбивает наборы данных на разделы обучения, проверки и тестирования. При этом процент данных для каждого раздела можно настраивать.

В качестве основы для построения аналитических моделей лучше всего использовать данные обучения. Это позволяет настраивать параметры алгоритмов, оценивая производительность модели с использованием набора данных проверки.

Модели подгоняются по данным обучения. Настройка параметров модели основана на производительности модели по набору данных проверки.

После оптимизации параметров модели для наилучшей производительности используются данные тестирования для выбора модели, имеющей наилучшую производительность по полностью скрытому набору данных тестирования.

Компонент "Разделение" используется во всех алгоритмах в Expert Analytics, включая PAL, APL и R как в агностических моделях, так и в моделях HANA.

Для работы с компонентом "Разделение" используется вкладка Прогноз. Дважды щелкните компонент Разделение в списке компонентов "Подготовка данных" на панели справа. Выбранный компонент препроцессора добавляется в редактор анализа и автоматически соединяется с компонентом источника данных. В контекстном меню компонента препроцессора выберите Настроить свойства. В диалоговом окне свойств компонента введите необходимые процентные доли для наборов данных обучения, тестирования и проверки и нажмите кнопку Готово. Чтобы просмотреть результаты, щелкните (выполнить анализ).