Стандартная прибыль вычисляется для двоичных целей по следующей формуле.
Допустим, f1 — частота наименее частого целевого класса TC1, а f2 = 1 - f1 — частота наиболее частого целевого класса TC2. Наименее частый целевой класс TC1 можно связать с прибылью profit(TC1), равной f2, а наиболее частый целевой класс — с прибылью profit(TC2), равной -f1. Эти нормализованные значения прибыли profit(TC1) и profit(TC2) выбраны так, что:
profit(TC1) * proba(TC1) + profit(TC2) * proba(TC2) = 0
Примечание: поэтому они называются стандартными.
Далее можно вычислить стандартную прибыль категории С следующим образом:
normalProfit(C) = Profit(TC2) * P(TC2|C) + Profit(TC1) * P(TC1|C)
Здесь P(TC1|C) — условная вероятность принадлежности к наименее частому целевому классу при условии принадлежности к категории C. Эта условная вероятность определяется частотой TC1 с отдельными элементами категории C.
Стандартная прибыль для непрерывных целей является обобщением двоичного случая. Она основана только на частотах целевых категорий и условных вероятностях. Подробную информацию см. в документации по продукту SAP Predictive Analytics.