Выбор переменных

Для включения в процесс моделирования переменной должна быть присвоена одна из описанных далее ролей. По умолчанию переменные являются объясняющими, если им не приписана роль целевой или весовой переменной, а также если они не исключены.

Таблица 1: Роли переменных в процессе моделирования
Роль переменной Определение
Объясняющая переменная:

Объясняющая переменная используется для вычисления модели.

Целевая переменная

Целевая переменная — это переменная, которую необходимо объяснить, или значения которой необходимо спрогнозировать в наборе прикладных данных.

Весовая переменная

Весовая переменная присваивает относительный вес каждой строке, которую она описывает, и активно направляет фазу обучения в процессе моделирования. При объявлении весовой переменной создается новая роль пропорционально каждому значению, описанному начальной переменной.

Например, набор данных содержит заказы на поставку с количеством приобретенных товаров. Если клиент покупает одну рубашку и три юбки, строка, содержащая рубашку, считается одиночным вхождением, а строка для поставки юбок дублируется, создавая в итоге три строки вместо одной. Таким образом, заказ на поставку получает вес, который отражает его относительную важность в наборе данных более реалистично, чем предыдущее одиночное вхождение.

Обратите внимание: если значение весовой переменной отсутствует, приложение отклоняет строку. Приложение не позволяет использовать строки, в которых отсутствует более одной переменной.
Исключенная переменная

Переменные можно исключить из процесса моделирования. Исключение столбцов, которые не оказывают влияния на целевые переменные, например номер счета, может ускорить выполнение, однако их сохранение не влияет на ход процесса моделирования.

Тем не менее, необходимо исключить переменные, которые напрямую связаны с целевыми переменными, например преобразования целевых переменных и такие переменные, которые косвенно содержат ту же информацию, что и целевая переменная. Например, если набор данных содержит переменную "Приобрел продукт: да/нет", исключите переменную "Сумма счета", если она содержит стоимость продукта.