Модели, построенные функцией Automated Analytics Modeler "Регрессия/классификация", являются полиномиальными выражениями входных данных. Модели предоставляют оценку целевых переменных как функцию входных переменных X1,X2,...Xn. Порядок — максимальная степень, допустимая в таком выражении.
Единственным параметром, доступным для этой модели, является порядок полинома. Он начинается с модели порядка 1, а затем продолжается с более высоким порядком модели. Порядок полинома ограничивается:
Полином может иметь 1, 2, 3 степень и выше. Путем определения степени полинома определяется степень сложности модели.
Y = a1.X1 + ... + an.Xn
Y = A1.X1 + ... + An.Xn +
B1.X1.X1 + B2.X2.X2+ ...Bk.Xn.Xn +
C1.X1.X2 + ... + Cm.X[n-1].Xn
В большинстве случаев полином первой степени необходим для создания релевантной и надежной модели. Использование высшей степени полинома не всегда гарантирует лучшие результаты по сравнению с результатами, полученными с первой степенью полинома. Кроме того, чем выше степень полинома выбрана:
Выбор одной или другой степени полинома зависит от вида данных для анализа. Рекомендуется следующее.
Эта опция позволяет определять число интервалов для создания оценки. Это значение должно быть установлено между 20 и 100, поскольку более низкое или высокое число интервалов может повлиять на качество модели.
Эта опция позволяет активировать исключение переменных на основе значения их достоверности прогноза (KR). Automated Analytics использует внутренне рассчитанный порог, чтобы решить, имеет ли переменная низкую достоверность прогноза. Этот порог в основном зависит от размера набора данных и целевого распределения.
Автоматическое исключение переменных с низкой достоверностью прогноза деактивировано по умолчанию. Если эта функция не активирована, переменные не будут исключены на основе значения достоверности прогноза.
Выбор весовой переменной активирует опцию Квант веса.
Понятие Квант веса добавлено для определения порога, ниже которого категория будет связана с KxOther.
Статистические отчеты теперь включают информацию о весе в разделах Переменные описательной статистики и Размер набора данных.
В этом разделе можно задать параметры обзорной панели Корреляция. То есть выбрать число корреляций для отображения в этой панели.
Коррелирующие переменные дают частично одинаковую информацию о целевой переменной. Корреляция между двумя переменными и степень корреляции. При изменении числа корреляций для просмотра в механизм включены корреляции с наименьшей степенью корреляции, то есть наиболее существенные.
В этом разделе можно задать параметры регрессии согласно трем стратегиям. Эта опция может быть активирована, если модель содержит минимум одну непрерывную целевую переменную.
В приведенной ниже таблице содержится описание этих стратегий и пример кривой эффективности для каждой стратегии.
Стратегия регрессии
|
Описание |
Пример кривой для эффективности |
|---|---|---|
| Без постобработки | Первой стратегией является деактивация постобработки регрессии во время фазы обучения модели для создания регрессии аналогично той, что используется в версиях до 3.3.2. В данном случае выполняется стандартная регрессия. Окончательные оценки особо не улучшаются. Используются исходные целевые значения и необработанные значения оценки производятся как выходные данные. |
![]() |
| С исходной целевой кодировкой | Вторая стратегия, которая применяется регрессиям с помощью постобработки, заключается в использовании исходного целевого значения во время фазы обучения модели для расчета коэффициентов регрессии. Результат регрессии преобразовывается для согласования средних арифметических целевого сегмента и сегмента оценки в фазе постобработки. Примечание: эта стратегия используется в Automated Analytics по умолчанию. |
![]() |
| С единой целевой кодировкой | Последняя стратегия, которая применяется к регрессиям с помощью постобработки, заключается в использовании кодированного целевого значения вместо исходного целевого значения во время фазы обучения модели для наличия единого распределения: это фаза постобработки. Затем рассчитываются коэффициенты регрессии и оценки переносятся в исходное целевое пространство во время фазы постобработки. Примечание: это предпочтительная стратегия, если стратегия по умолчанию не предоставляет модели достаточного качества, что часто встречается при сильно искаженных целевых распределениях.
|
![]() |
Невозможно изменить целевую стратегию кодировки, если постобработка деактивирована.
Раздел Установить значение целевых ключей содержит список целевых переменных, выбранных на экране Выбор переменных, и позволяет выбрать их ключевое значение. Чтобы выбрать ключевое значение для целевых переменных, введите нужное значение в поле Целевой ключ, соответствующее каждой цели. По умолчанию в качестве ключевого значения автоматически устанавливается наименее часто используемая категория целевой переменной.