Кластеризация

  • Найти лучшее число кластеров в диапазоне

В этих полях можно указать, сколько кластеров генерирует модель. По умолчанию указано 10 кластеров. Чем больше сегментов, тем ниже надежность (достоверность прогноза). Чем меньше сегментов, тем ниже информативность (прогностическая сила). Рекомендуется начать с числа по умолчанию и затем добавлять или убавлять количество кластеров в зависимости от результатов.

  • Для управляемой сегментации (то есть с целью) пользователь выбирает лучшее число сегментов, например, [5;10] означает, что пользователь запросил 5–10 сегментов. Механизм вычисляет лучшее число кластеров с помощью метрик "Достоверность прогноза + Прогностическая сила". Например, может быть 7 кластеров.
  • Для неуправляемой сегментации (то есть без цели) приложение выбирает минимальное число кластеров, например, [10;10] означает, что пользователь запросил 10 кластеров.
Примечание

При активации опции Рассчитать выражения SQL генерируется дополнительный кластер, содержащий неприсвоенные записями.

  • Рассчитать выражения SQL

Эта функция позволяет просмотреть в обзоре модели выражения SQL, определяющие каждый сгенерированный кластер. Эта опция активирована по умолчанию.

  • Расширенно...

Кнопка Расширенно служит для вызова панели. На этой панели можно активировать перекрестную проверку, указать ключевое значение каждой целевой переменной и используемое расстояние, а также стратегию кодировки.