Модели с номинальной целью

Просмотр графа

Ось X отображает процент начальной популяции; ось Y представляет процент максимальной ожидаемой прибыли (включая набор предположения прибыли и затрат на экране стратегии прибыли).

Возможно отобразить только кривую переменной (по умолчанию) или кривые из всех трех поднаборов данных. Нажав кнопку Просмотреть все наборы данных, можно выбрать кривые оценки/проверки/теста.

Раскрывающееся меню Модели позволяет выбрать, для какой целевой переменной требуется отобразить кривые.

Панель инструментов под заголовком позволяет скопировать координаты в буфер обмена, распечатать график или сохранить его в формате PNG.

  • Зеленая кривая отображает максимально возможную прибыль (полученную с помощью самой целевой переменной как модели). Например, если 25% популяции имеет целевую категорию целевой переменной, лучшая модель корректно классифицирует все 25% целевой категории с 25% популяции.
  • Красная кривая отображает минимальную прибыль (полученную произвольной моделью). Случайно выбрав 50% популяции, можно указать 50% целевой категории целевой переменной.
  • Синяя кривая отображает прибыль, созданную с помощью модели набора проверки. На этой кривой отображен подъем из случайной кривой на основе модели.
Стандартные графы модели

Раскрывающееся меню Вид обзора позволяет выбрать тип графика для просмотра. Выявленная (по умолчанию) будет обычной кривой прибыли, а Стандартная построит кривую прибыли со средним арифметическим 0. Подъемная сила позволяет изучить разницу между идеальной моделью и случайной моделью, а также между моделью, созданной SAP Predictive Analytics, и случайной моделью.

Пользовательская кривая прибыли позволяет пользователю указывать затраты на нецелевую категорию (то есть стоимость отправки почты для лица, не являющегося респондентом) и прибыль для целевой категории (например, покупки для респондента).

Расширенные графы модели

Ряд графов расширенной модели предоставляется в дополнение в стандартным графам, перечисленным выше.

  • Граф ROC является графом из теории распознавания сигналов.

    Он отображает, как с точки зрения согласования модель отличает чувствительность от специфичности, а также корректное и ошибочное распознавание, поскольку порог распознавания отличается.

    Чувствительность, которая появляется на оси Y, является пропорцией КОРРЕКТНО определенных найденных сигналов (истинных положительных наблюдений) (из всех истинных положительных наблюдений для набора проверочных данных).

    [1 - специфичность], которая появляется на оси X, является пропорцией НЕКОРРЕКТНЫХ присвоений классу сигнала (ложные положительные наблюдения) (из всех истинных положительных наблюдений для набора проверочных данных). (Специфичность, против [1 - специфичность], является пропорцией КОРРЕКТНЫХ присвоений классу БЕЗ СИГНАЛОВ - истинные отрицательные наблюдения.)

  • Граф 'Хороший' по Лоренцу отображает кумулятивную пропорцию пропущенных сигналов (ложные отрицательные наблюдения), учитываемых записями, соответствующими нижней части x% оценок модели.

    Ось Y измеряет [1 - чувствительность], то есть [1 - пропорция истинных отрицательных наблюдений], эквивалентная пропорции отсутствующих сигналов упущенной возможности. Поскольку данные упорядочены от данных, вероятно представляющих сигналы слева, до данных, вероятно представляющих сигналы справа, то чем медленнее подъем, тем более чувствительна модель с точки зрения сигналов распознавания (или респондентов). Строка ассистента направляется вверх от оси X в точке, соответствующей пропорции без сигналов в наборе проверочных данных.

  • Граф 'Плохой' по Лоренцу отображает кумулятивную пропорцию истинных негативных наблюдений (специфичность), учитываемых в нижней части x% оценок модели. Чем быстрее подъем, тем ниже частота некорректного распознавания.
  • Кривые для плотности отображают функцию плотности переменной оценки в наборе событий (“хорошая” плотность кривой) и в наборе без событий (“плохая” плотность кривой). Эти кривые можно просмотреть как “дериват” кривых по Лоренцу (функцию плотности определением деривата кумулятивной функции плотности).

    Функция оцененной плотности в интервале равна:

    (число событий в интервале/общее число событий/длина интервала)
    • Кривая "Хорошая" плотность отображает распределение оценок модели для респондентов/сигналов.
    • Кривая "Плохая" плотность не отображает распределение оценок модели для респондентов/сигналов.
    • Кривая "Вся" плотность отображает распределение оценок модели для респондентов/сигналов И не отображает для них распределение, позволяя сравнить распределение в одном и том же графе.
  • Кривые риска отображают оценку риска, плотность популяции и отношение шансов. Это отношение рассчитывается следующим образом:

    (1 - возможность риска) / возможность риска
    • Кривая Плотность популяции отображает число записей в каждой оценке риска (по умолчанию 20).
    • Кривая Возможность риска отображает распределение возможности риска для оценки риска.
    • Кривая Хорошие/плохие шансы отображает распределение оценки риска для отношения шансов.
    • Кривая Журнал (хорошие/плохие шансы) отображает распределение оценки риска для отношения шансов с логарифмической осью Y.
    • Кривая "Все" риски отображает все три кривые риска в одном графе.
      Примечание

      Ось Y для кривой возможности находится справа. Ось Y плотности для популяции и хороших/плохих шансов слева.

Формулы

Стандартная прибыль может быть рассчитана по следующей формуле для двоичных целей, если f1 — частота наиболее редкого целевого класса TC1 (и f2 = 1 - f1 — вероятность наиболее частого целевого класса TC2). В этом случае наиболее частый целевой класс "ассоциируется" с прибылью, равной f2, а наиболее частый целевой класс с прибылью, равной -f1. Эти нормализованные значения прибыли выбираются, например, следующим образом: profit(TC1) * proba(TC1) + profit(TC2) * proba(TC2) = 0

Затем рассчитывается: normalProfit(C) = Profit(TC2) * P(TC2|C) + Profit(TC1) * P(TC1|C)