С помощью этой панели можно выбрать оценочную переменную для целевой переменной или указать индексы кластера.
Целевая оценочная переменная
Целевая оценочная переменная может использоваться для прогнозирования поведения целевой переменной. Использование целевой оценочной переменной аналогично созданию модели.
Если нет переменной, которую можно использовать как оценочную для цели набора данных, не заполняйте эту панель.
Примечание: только непрерывные переменные можно использовать как оценочные.
- Выбор оценочной переменной для цели
- Перейдите на вкладку Целевая оценочная переменная.
- В столбце Переменные щелкните переменную, которая будет использоваться как оценочная.
- Щелкните соответствующую ячейку в столбце Оценочная переменная для. Будет открыт список доступных целей.
- Выберите цель для оценки.
Оценочная переменная кластера
При использовании набора данных, полученного в результате применения модели и содержащего идентифицированные кластеры для каждой записи, на этой вкладке можно указать столбцы с индексами кластеров. Это удобно для генерации статистики, такой как размер каждого кластера и остаточная сумма квадратов в этих кластеров. Примером типичного использования является сравнение результатов кластеризации с помощью разных инструментов или разных методов.
- Добавление оценочной переменной кластера
- Перейдите на вкладку Оценочная переменная кластера.
- Нажмите кнопку Добавить оценочную переменную. Переменная будет добавлена в список оценочных переменных.
- Щелкните имя переменной, чтобы просмотреть список всех номинальных переменных в наборе данных.
- Выберите из списка переменную, содержащую индекс кластера.
- Если кластеризация, используемая для генерации индекса кластера, была управляемой (то есть имела целевую переменную), выберите Цель кластера.
- Повторите шаги 2–5, если индексов кластеров несколько. Например, если набор данных содержит результаты двух инструментов кластеризации, можно сравнить статистику по одному набору данных.
- В списке Расстояние под списком оценочных переменных выберите расстояние, которое использовалось для оценки близости двух элементов исходной модели кластеризации.
- В списке Кодировка под списком оценочных переменных выберите кодировку исходной модели кластеризации. По умолчанию при генерации модели кластеризации в Automated Analytics используется кодировка:
- целевое среднее арифметическое для управляемой модели;
- неуправляемая в остальных случаях.
Примечание Если набор данных содержит результаты нескольких моделей, они должны быть сгенерированы с одинаковыми метриками расстояния и кодировкой.
- После указания всех оценочных переменных кластера нажмите кнопку Проверить.
- Удаление оценочной переменной кластера
- Выберите оценочную переменную для удаления.
- Нажмите кнопку Удалить оценочную переменную.