Наивный байесовский алгоритм HANA

Свойства, которые можно настроить для алгоритма наивного байесовского алгоритма HANA.

Синтаксис

Наивный байесовский алгоритм - алгоритм классификации, основанный на теореме Байеса. Он позволяет получить оценку условной вероятности по классу исходя из предположения, что атрибуты не имеют условной зависимости друг от друга. Несмотря на свою простоту, наивный байесовский алгоритм достаточно эффективен в таких сферах, как классификация документов и фильтрация спама, помимо этого, он требует малого количества данных для обучения, необходимых для оценки параметров для классификации.

Свойства наивного байесовского алгоритма HANA
Таблица 1: Свойства алгоритма
Свойство Описание
Режим вывода Выберите режим, в котором требуется использовать выходные данные этого алгоритма.
Функции Выберите столбцы ввода, для которых будет выполняться анализ.
Целевая переменная Выберите целевой столбец, для которого будет выполняться анализ.
Имя столбца прогноза Введите имя создаваемого столбца, который содержит прогнозные значения.
Сглаживание по Лапласу Введите сглаживающую константу для наблюдений со сглаживанием. Сглаживающая константа должна иметь значение типа double и быть больше 0. Введите 0, чтобы отключить сглаживание по Лапласу.
Отсутствующие значения Выберите способ обработки отсутствующих значений.
  • Игнорировать: алгоритм пропускает записи, которые содержат остутствующие значения в функциях или целевых переменных.
  • Сохранять: при вычислении алгоритма сохраняются записи, содержащие отсутствующие значения.
Число потоков Введите число потоков, которые алгоритм будет использовать при выполнении. По умолчанию это значение равно 1.