Регрессия Random Forest HANA (R)

Свойства, которые можно настроить для алгоритма регрессии Random Forest HANA (R).

Random Forest — это популярный метод выборки, используемый для алгоритмов классификации и регрессии. Алгоритм выполняется посредством формирования набора деревьев решений во время обучения. Для задачи регрессии в качестве выходного значения вычисляется средний прогноз по отдельным деревьям. По сравнению с другими алгоритмами регрессии этот метод выборки приводит к большей точности и генерализации по наборам бизнес-данных.

Данный алгоритм реализуется пакетом R randomForest.

Примечание

Максимальный поддерживаемый уровень по каждому признаку набора данных — 53. Уровень ссылается на категорию, набор или тип значений, которые может принимать переменная; например, столбец "Пол" имеет два уровня: "Мужской" и "Женский". В данном случае переменная не может иметь более чем 53 типа значений.

Свойства регрессии Random Forest HANA (R)
Таблица 1: Свойства алгоритма
Свойство Описание
Функции Выберите столбцы ввода, для которых будет выполняться анализ.
Целевые столбцы Выберите целевой столбец, для которого будет выполняться анализ.
Число создаваемых деревьев Число деревьев, которые требуется создать в лесе Random Forest. Этот параметр может иметь значение от 5 до 1000 включительно.
Минимум конечных узлов Минимальное количество конечных узлов в дереве решений. Этот параметр может иметь значение от 10 до 500 включительно.