Фильтрованная популяция с меткой времени

С помощью этой панели можно создать или обработать популяцию с меткой времени.

Определение

Популяция с меткой времени представляет собой список пар <identifiers; time stamps>: семантическое значение такой конструкции можно ассоциировать с мгновенными снимками сущностей и указанным временем. Таким образом, сущность может быть представлена с разными метками времени в одной популяции с меткой времени.

Создание или обработка популяции с меткой времени
  • Создание или обработка популяции с меткой времени
    1. В поле Имя введите имя новой популяции с меткой времени.
    2. В поле Описание введите описание новой популяции с меткой времени.
  • Настройки
    1. Из раскрывающегося списка На основе сущности выберите сущность для создания новой популяции с меткой времени.
    2. Дополнительно: чтобы добавить фильтр в популяцию с меткой времени для удаления строк в зависимости от условия, нажмите кнопку Обработать фильтры. Наличие фильтра указывается следующими значками.
      • : фильтр не определен
      • : фильтр уже есть
    3. В разделе Метка времени выберите дату для создания метки времени популяции. Эта дата может быть полем (рассчитываемым или нет), константой или запросом.
    4. Щелкните Изменить содержимое KxTimeStamp, чтобы выбрать содержимое.

      Выберите Дата, если требуется использовать формат содержимого ГГГГ-ММ-ДД.

      Выберите Метка времени, если требуется использовать формат содержимого ГГГГ-ММ-ДД ЧЧ:ММ:СС.

    5. Нажмите ОК, чтобы подтвердить.
  • Цель
    1. В списке Цель выберите нужную цель. Если определение цели не требуется, выберите Не определять цель и перейдите напрямую к разделу Подтверждение создания или обработки популяции с меткой времени.
    2. Если вы указали цель, для ускорения процесса обучения можно установить флажок Активировать стратифицированную выборку. При активации стратифицированной выборки сокращается число строк в наборе данных, однако количество информации остается прежним. Эта опция удобна, если мало положительных случаев для моделирования. Например, если набор данных содержит 1000 положительных случаев и 1000000 отрицательных случаев, активация стратифицированной выборки позволяет сохранить все 1000 положительных случаев и выделить отрицательные в подвыборку. В данном примере, если сохранить один из десяти отрицательных случаев, набор данных будет содержать 1000 положительных случаев и 100000 отрицательных: целевая пропорция составляет 1%, в то время как в исходном наборе данных имела значение 0,01%. Поскольку набор данных в десять раз меньше исходного, процесс обучения будет быстрее.
    3. Выберите опцию Активировать вес, чтобы создать столбец веса, позволяющий связать каждый отрицательный случай с весом.. В примере выше значение веса будет установлено на 10. Так как вес 10 примерно отражает 10 отрицательных случаев, он позволяет сохранить статистику начальной популяции без создания выборки, то есть получить среднее значение, взвешенное количество и прогностическую силу (KI).
    4. Нажмите кнопку Определить начальную долю, чтобы извлечь или определить вручную категории переменных.
  • Подтверждение создания или обработки популяции с меткой времени
    1. Нажмите кнопку Дальше, чтобы подтвердить создание или изменение популяции с меткой времени.
    2. Если популяция с меткой времени с таким именем уже существует, будет открыто диалоговое окно с запросом действия.
      • Выберите Да, чтобы сохранить популяцию с меткой времени как новую версию существующей.
      • Выберите Нет, чтобы перезаписать существующую популяцию с меткой времени.