Дисперсионный критерий HANA

Свойства, которые можно настроить для алгоритма дисперсионного критерия HANA.

Синтаксис При помощи дисперсионного критерия HANA можно определить выбросы на множестве числовых данных. Нижняя и верхняя границы множества вычисляются на основе среднего значения и среднеквадратичного отклонения данных с использованием вводимого пользователем множителя.

Этот множитель представляет собой коэффициент типа double, который используется для проверки на принадлежность всех значений числового вектора диапазону.

Значение, выходящее за границы диапазона, считается не соответствующим дисперсионному критерию и помечается как выброс.

Примечание Создание моделей на основе алгоритма обнаружения аномалий HANA не поддерживается.
Свойства дисперсионного критерия HANA
Таблица 1: Свойства алгоритма
Свойство Описание
Режим вывода Выберите режим, в котором требуется использовать выходные данные этого алгоритма.
  • Показывать выбросы: добавляет к входным данным столбец логического типа, в котором определяется, является ли соответствующее значение посторонним (выбросом).
  • Удалять выбросы: удаляет посторонние значения из входных данных.
Независимые столбцы Выберите исходные столбцы ввода.
Отсутствующие значения Выберите способ обработки отсутствующих значений.
Возможные способы:
  • Игнорировать: алгоритм пропускает записи независимого или зависимого столбца, содержащие отсутствующие значения.
  • Сохранять: при вычислении алгоритма сохраняются записи, содержащие отсутствующие значения.
Множитель Введите значение множителя, при помощи которого будут определяться нижняя и верхняя границы диапазона для обнаружения выбросов. Значение по умолчанию – 3,0.
Примечание Необходимо вводить целое положительное значение.
Число потоков Введите число потоков, которые алгоритм будет использовать при выполнении.
Имя столбца прогноза Введите имя нового столбца, который содержит прогнозные значения.