Классификация Random Forest (R)

Свойства, которые можно настроить для алгоритма классификации Random Forest (R).

Обзор
Random Forest — это популярный метод выборки, используемый для алгоритмов классификации и регрессии. Алгоритм выполняется посредством формирования набора деревьев решений во время обучения. Для задачи классификации выходной класс основывается на большинстве голосов из отдельного дерева решений в лесе. По сравнению с другими алгоритмами классификации этот метод выборки приводит к большей точности и генерализации по наборам бизнес-данных.

Данный алгоритм реализуется пакетом R randomForest.

Примечание

Максимальный поддерживаемый уровень по каждому признаку набора данных — 53.

Свойства классификации Random Forest (R)
Таблица 1: Свойства алгоритма
Свойство Описание
Функции Выберите столбцы ввода, для которых будет выполняться анализ.
Целевые столбцы Выберите целевой столбец, для которого будет выполняться анализ.
Число создаваемых деревьев Число деревьев, которые требуется создать в лесе Random Forest. Этот параметр может иметь значение от 5 до 1000 включительно.
Минимум конечных узлов Минимальное количество конечных узлов в дереве решений. Этот параметр может иметь значение от 10 до 500 включительно.