В зависимости от выбора из раскрывающегося меню Сгенерировать полученные данные будут содержать следующее (помимо всех ключевых переменных).
| Опция | Сгенерированные данные для каждой строки |
|---|---|
| Только прогнозируемое значение | Только прогнозируемое значение наблюдений (rr_ИмяЦелевойПеременной) |
| Вероятность |
|
| Отдельные вклады |
|
| Решение |
Выберите опцию "Решение" в раскрывающемся меню "Сгенерировать", чтобы указать число наблюдений, которое должна распознавать модель после применения к новому набору данных. |
| Расширенные настройки применения | Эта опция позволяет выбрать выходные данные в файле результатов. |
| Использовать прямое применение в базе данных | Когда выбрана эта опция, используется применение внутри базы данных в режиме оптимизированной оценки, и данные генерируются прямо в базе данных. |
| Добавить отклонение оценки | Эта опция позволяет проверить отклонения каждой переменной и каждой категории переменной между моделью и входным набором данных, используемым для применения модели. |
Использование режима применения внутри базы данных
Этот режим оптимизированной оценки позволяет применить модель прямо в базе данных. Не требуется извлечение данных из базы данных, и ускоряется процесс записи вывода модели. Этот режим можно использовать, если выполнены все следующие условия:
Если выбрана опция Использовать прямое применение в базе данных, опция Добавить отклонение оценки выбирается автоматически.
| Опция | Сгенерированные данные для каждой строки |
|---|---|
| Только прогнозируемое значение |
|
| Раздельная кодировка ид. кластеров |
Раздельная (или фиктивная) кодировка номеров кластеров. Это означает, что для каждого кластера создается булева переменная, указывающая, относится ли текущее наблюдение к этому кластеру (значение 1) или нет (значение 0). |
| Раздельная кодировка ид. кластеров (+ копия набора данных) |
Раздельная (или фиктивная) кодировка индекса кластера. Это означает, что для каждого кластера создается булева переменная, указывающая, относится ли текущее наблюдение к этому кластеру (значение 1) или нет (значение 0).
|
| Целевое среднее арифметическое ид. кластера |
|
| Опция | Сгенерированные данные для каждой строки |
|---|---|
| Векторизация | Все столбцы из исходного набора данных И для каждого текстового поля выполняется следующее.
|
| Распознавание языка | Для каждого текстового поля выполняется следующее.
|
| Транзакционно |
Этот режим преобразует каждую строку в последовательность транзакций и создает наборы данных, поддерживаемые кодировкой последовательностей. |
| Сгенерировать только корни | Для каждого текстового поля выполняется следующее.
|
Опции генерации
| Опция | Сгенерированные данные для каждого узла |
|---|---|
| Режим по умолчанию |
|
| Режим круга |
|
| Режим центральности |
|
| Режим соседних элементов |
|
| Режим описания |
|
| Режим семейства |
|
| Режим спаривания узлов |
|
| Расширенные настройки |
|
Примечание по набору прикладных данных
Чтобы применить модель Social к набору данных, он должен содержать следующие переменные.
Переменная kxComIndex, которая содержит ид. семейств. Это должно быть номинальное целое число.
Эта переменная позволяет применить модель к графам семейств (запрос соседних элементов, списка узлов в семействе или агрегированной статистики). С помощью этого столбца можно указать список идентификаторов семейств, по которым требуется вычислить метрики. Если применение выполняется не к графам семейств, можно оставить его пустым или, в случае базы данных, заполнить фиктивными значениями, так как он не будет использоваться.
Чтобы убедиться, что наборы данных непротиворечивы, используйте функцию мэппинга на панели Применение модели.
Использование режима применения внутри базы данных
Этот режим оптимизированной оценки позволяет применить модель прямо в базе данных. Не требуется извлечение данных из базы данных, и ускоряется процесс записи вывода модели. Этот режим можно использовать, если выполнены все следующие условия:
Если модель не сохранена, отображается предупреждение, и Automated Analytics автоматически переходит к стандартному процессу применения.
| Опция | Сгенерированные данные для каждой строки |
|---|---|
| Только прогнозируемое значение | Основные выходные данные:
|
| Последователи оптимизируются по KI | Основные выходные данные Если несколько правил дают одного последователя для сеанса, выбирается правило с лучшей прогностической силой (KI). |
| Последователи оптимизируются по достоверности | Основные выходные данные Если несколько правил дают одного последователя для сеанса, выбирается правило с лучшей достоверностью. |
| Прогнозируемое значение с полным описанием правил | Расширенные выходные данные:
|
| Последователи оптимизируются по KI с полным описанием правил | Расширенные выходные данные Если несколько правил дают одного последователя для сеанса, выбирается правило с лучшей прогностической силой (KI). |
| Последователи оптимизируются по достоверности с полным описанием правил | Расширенные выходные данные Если несколько правил дают одного последователя для сеанса, выбирается правило с лучшей достоверностью. |
| Опция | Содержимое файла результатов |
|---|---|
| Только прогнозируемые значения |
|
| Прогнозы с их компонентами |
|
| Прогнозы с их компонентами и остатками |
|
| Только первый столбец прогнозов и планка погрешностей |
|