В сценариях HANA и не-HANA можно настроить свойства компонента разделения.
Компонент разделения произвольно разделяет набор входных данных на три отдельных подмножества: обучение, тестирование и проверка. Процентное соотношение для каждого подмножества определяется как параметр. Объединение трех подмножеств необязательно должно составлять полный исходный набор данных.
Во втором случае набор данных должен иметь хотя бы один атрибут категории (например тип varchar). Исходный набор данных делится в соответствии с разными значениями категорий этого атрибута. Каждое взаимоисключающее подмножество затем произвольно разделяется для получения подмножеств: обучение, тестирование и проверка. В результате в выбранном подмножестве присутствуют все "значения категорий" или "страты".
Обратите внимание: при сравнении двух или более алгоритмов в цепочке сравнения моделей компонент разделения является обязательным.
| Свойство | Описание |
|---|---|
| Метод разделения | Выберите метод разделения данных на наборы обучения, тестирования и проверки.
|
| Генератор случайных чисел | Введите случайное число для использования при вычислении. |
| Разделение строк по | Выберите метод разделения строк.
|
| Набор для обучения | Введите число строк или процентное соотношение строк в наборе для обучения. |
| Набор для тестирования | Введите число строк или процентное соотношение строк в наборе для обучения. |
| Набор для проверки | Введите число строк или процентное соотношение строк в наборе для проверки. |
| Имя столбца разделения | Введите имя нового столбца, который содержит разделенные значения. |
| Число потоков | Введите число потоков, которые алгоритм будет использовать при выполнении. |