Новая нормализация

Нормализация — это примитив стандартной манипуляции данными в PMML (Predictive Model Markup Language), языке спецификации извлечения данных, определенном группой извлечения данных (DMG). Нормализация часто применяется к числовым переменным до извлечения данных и состоит из кусочного линейного преобразования с результирующей переменной в диапазоне от 0 до 1. Она может быть использована для преобразований ранга, где вывод представляет величину с точки зрения приблизительной пропорции (процентиль) значений ниже входного значения. Или можно преобразовать поле на основе числа среднеквадратических отклонений значения из среднего арифметического поля. Часть нормализации также является спецификацией использования конкретного значения, если числовое входное значение неизвестно или за рамками диапазона в данных обучения.

  • Создание новой нормализации
    1. Выберите поле из списка Выберите поле для нормализации. Отображается только положительное число или поля чисел.
    2. Для каждой точки нормализации.
      1. В разделе Добавить точки нормализации введите значение в поле Ввод.
      2. Введите соответствующее выходное значение в поле Выход.
      3. Нажмите кнопку +, чтобы добавить определенную точку в нормализацию. Точка появится в списке.

        Если определено минимум две точки, соответствующий граф отображается в разделе Обзор в нижней части панели.

    3. В списке Минимальные значения в разделе Определить поведение для выхода из диапазона выберите поведение, которое необходимо применить значениям ниже самой низкой точки, установленной ранее. В следующей таблице приводятся доступные значения.
      Поведение Поведение для выхода из диапазона соответствует... Соответствующий график
      Насыщенность значение границ диапазона ИЗОБРАЖЕНИЕ
      Наклон продолжительность прямой линии до бесконечности, ведущая к последней границе. ИЗОБРАЖЕНИЕ
      Пользовательское

      определенное пользователем значение.

      Для установки пользовательского значения введите в текстовом поле и нажмите кнопку "Обновить" для обновления графика.

      ИЗОБРАЖЕНИЕ
      Нулевое значение нулевое значение. Обозначает, что они не будут отображены в графике. ИЗОБРАЖЕНИЕ
    4. Нажмите кнопку Дальше. Будет открыто всплывающее окно Введите имя рассчитываемого поля.
    5. Введите имя нового поля в поле Имя.
      Примечание

      В случае ввода существующего имени отображается сообщение и деактивируется кнопка OK.

    6. Нажмите кнопку ОК. Будет выведен список Поля, содержащий недавно созданное поле.