Разделение

В сценариях HANA и не-HANA можно настроить свойства компонента разделения.

Синтаксис

Компонент разделения произвольно разделяет набор входных данных на три отдельных подмножества: обучение, тестирование и проверка. Процентное соотношение для каждого подмножества определяется как параметр. Объединение трех подмножеств необязательно должно составлять полный исходный набор данных.

Разделить набор данных можно выполнить, используя следующие методы:
  • Произвольное разделение, которое позволяет произвольно разделить все данные.
  • Стратифицированное разделение, которое позволяет произвольно разделить каждую подкатегорию.

Во втором случае набор данных должен иметь хотя бы один атрибут категории (например тип varchar). Исходный набор данных делится в соответствии с разными значениями категорий этого атрибута. Каждое взаимоисключающее подмножество затем произвольно разделяется для получения подмножеств: обучение, тестирование и проверка. В результате в выбранном подмножестве присутствуют все "значения категорий" или "страты".

Обратите внимание: при сравнении двух или более алгоритмов в цепочке сравнения моделей компонент разделения является обязательным.

Свойства разделения
Таблица 1: Свойства компонента подготовки данных
Свойство Описание
Метод разделения Выберите метод разделения данных на наборы обучения, тестирования и проверки.
  • Произвольное
  • Стратифицированное
Генератор случайных чисел Введите случайное число для использования при вычислении.
Разделение строк по Выберите метод разделения строк.
  • Доля строк в процентах
  • Число строк
Набор для обучения Введите число строк или процентное соотношение строк в наборе для обучения.
Набор для тестирования Введите число строк или процентное соотношение строк в наборе для обучения.
Набор для проверки Введите число строк или процентное соотношение строк в наборе для проверки.
Имя столбца разделения Введите имя нового столбца, который содержит разделенные значения.
Число потоков Введите число потоков, которые алгоритм будет использовать при выполнении.