Алгоритм K-средних HANA

Свойства, которые можно настроить для алгоритма K-средних HANA.

Синтаксис Этот алгоритм используется для кластеризации связанных наблюдений в группы при отсутствии априорных сведений о взаимоотношениях между ними. При его использовании наблюдения кластеризуются в k групп, где значение k предоставляется в виде параметра ввода. Далее каждое наблюдение относится к соответствующему кластеру на основании его близости к среднему значению кластера. Процесс продолжается до тех пор, пока не будет достигнуто схождение кластеров.
Примечание
  • При каждом выполнении алгоритма K-средних HANA число кластеров может изменяться. Тем не менее, число наблюдений в каждом кластере остается одинаковым
  • Создание моделей на основе алгоритма K-средних HANA не поддерживается.
Свойства алгоритма K-средних HANA
Таблица 1: Свойства алгоритма
Свойство Описание
Режим вывода Выберите режим, в котором требуется использовать выходные данные этого алгоритма.
Функции Выберите столбцы ввода, для которых будет выполняться анализ.
Столбцы категорий Выберите столбцы ввода, которые следует считать столбцами категорий.
Весовые коэффициенты категорий Введите весовые коэффициенты категорий.
Расчет кластеризации Установите этот параметр для вычисления значений кластеризации. Значение показывает качество кластеризации: 1 — хорошая кластеризация, 0 — плохая.
Отсутствующие значения Выберите способ обработки отсутствующих значений.
Возможные способы:
  • Игнорировать: алгоритм пропускает записи независимых или зависимых столбцов, содержащие отсутствующие значения.
  • Сохранять: при вычислении алгоритма сохраняются записи, содержащие отсутствующие значения.
Число кластеров Введите число групп для кластеризации. Значение по умолчанию – 5.
Имя кластера Введите имя создаваемого столбца, в котором содержится имя кластера.
Расстояние Введите имя созданного столбца, который содержит значения расстояний кластеров от центра.
Максимальное число итераций Введите допустимое число итераций при поиске кластеров. Значение по умолчанию – 100.
Метод вычисления центра Выберите метод вычисления начальных центров кластера.
Показатель расстояния Введите метод для расчета расстояния между элементом и центром кластера
Тип нормализации Выберите тип нормализации.
Число потоков Введите число потоков, которые можно использовать при выполнении. Значение по умолчанию – 1.
Порог выхода Введите пороговое значение для выхода из итераций. Значение по умолчанию – 0,000000001.