Представления

В разделе Представления можно просмотреть данные и сгенерированный SQL-код, а также настроить опции.

Поля

Эта вкладка содержит существующие поля исходной таблицы и позволяет добавить собственные поля.

Для существующих полей доступны следующие операции.

  • Изменение псевдонима поля.
  • Настройка видимости поля, то есть добавление поля в набор аналитических данных при необходимости. Невидимые поля не отображаются на вкладке Просмотреть данные, но могут использоваться, например, для объединения или фильтра.
  • Добавление описания поля.
  • Обработка информации о поле (только для рассчитываемых полей, созданных пользователем).

При создании нового рассчитываемого поля можно выбрать один из следующих типов.

  • Функция, такая как математические операторы, логические операторы, манипуляции строками, математические функции и манипуляции данными.
  • Агрегат, который позволяет объединить ссылочную информацию из таблицы с информацией из исторической таблицы, которая автоматически агрегируется за период времени.
  • Меняющийся агрегат, то есть агрегат, который может повторяться.
  • Условие, такое как "Начинается с", "Больше", "Не", "Ноль", "В диапазоне" и др.
  • Таблица соответствия, то есть словарь для перевода значений из идентификаторов в строки или группирования уникальных значений в меньшее число более универсальных интервалов.
  • Нормализация, то есть кусочное линейное преобразование с результирующей переменной в диапазоне от 0 до 1.
  • Выражение SQL, определенное пользователем.
  • Свободное выражение, то есть логическое выражение, определенное пользователем.
  • Чтобы создать новое рассчитываемое поле:
    1. Нажмите кнопку + Нов..
    2. Выберите тип создаваемого поля.
    3. В зависимости от выбранного типа поля определите параметры поля. Созданное поле отобразится в списке вместе с исходными полями.
Данные и статистика

Отображает данные, извлеченные из базы данных при выполнении этой манипуляции данными. Также позволяет вычислить некоторую статистику по данным. Позволяет проверить соответствие результатов ожиданиям.

Можно отсортировать таблицу, щелкнув заголовок соответствующего столбца.

Сгенерированный SQL-код

Эта вкладка содержит запрос SQL, соответствующий создаваемому набору аналитических данных.

Документация

Вкладка Документация предоставляет обзор манипуляции данными. Здесь содержатся все опции, выбранные для манипуляции данными, такие как фильтры, объединения, запросы и выражения.

На экране отображаются:

  • графический обзор;
  • видимые/невидимые поля;
  • запрос;
  • выражения;
  • Фильтры

Графический обзор включает:

  • список таблиц в манипуляции данными и информацию об их обработке, например, объединении или агрегатах;
  • поля, сохраненные в манипуляции данными, то есть видимые поля.

Видимые поля отображаются в таблице с упорядоченными столбцами.

Этот обзор можно настроить в следующих областях.

  • Настройки разделов
  • Настройки полей

Настройки обзора позволяют выбрать формат обзора как для просмотра, так и для экспорта . Сгенерированный файл можно сохранить в формате .txt, .htm или .rtf.

Информация

Нажмите кнопку Информация, чтобы просмотреть техническую информацию о базе данных. Отображается следующая информация:

  • имя и версия базы данных и версия драйвера;
  • максимальная допустимая длина имен таблиц и столбцов;
  • максимальное допустимое число столбцов в таблицах и запросах;
  • максимальная допустимая длина запроса;
  • максимальное допустимое число таблиц в запросе.
Опции
Опции Описание Значения/по умолчанию
Оптимизировать выражения с несколькими ссылками

В манипуляции данными доступны две стратегии для рассчитываемого поля/выражения с несколькими ссылками:

  • стандартная стратегия, когда каждая ссылка заменяется полным определением SQL соответствующего рассчитываемого поля, то есть вычисление выполняется несколько раз;
  • оптимизированная стратегия, когда временный столбец вычисляется однократно с помощью определения SQL поля. Затем последующие ссылки на рассчитываемое поле заменяются ссылкой на новый столбец.

Авто (по умолчанию): стратегия автоматически выбирается системой. По умолчанию при наличии нескольких ссылок на поле используется оптимизированная стратегия.

Активировано: используется оптимизированная стратегия.

Деактивировано: используется стандартная стратегия.

Максимальное число использований выражения до оптимизации

Если опция "Оптимизировать выражения с несколькими ссылками" активирована, эта опция позволяет указать число ссылок на поле/выражение, по достижении которого используется оптимизированная стратегия.

По умолчанию порог равен 2, то есть при повторной ссылке на поле используется оптимизированная стратегия.
Сгенерировать несколько запросов

Эта опция принудительно инициирует или деактивирует разбивку манипуляций данными на небольшие промежуточные шаги (автоматически определяемые системой).

Авто (по умолчанию): разбивка активируется или деактивируется в зависимости от относительной сложности манипуляции данными.

Активировано: манипуляция данными разбивается на промежуточные шаги вне зависимости от сложности.

Деактивировано: манипуляция данными никогда не разбивается на промежуточные шаги вне зависимости от сложности. Будьте внимательны при выборе значения.

Сгенерировать стандартные агрегаты как коррелирующие таблицы Эта опция позволяет принудительно инициировать или деактивировать генерацию стандартных агрегатов (минимум, максимум, число, среднее) с помощью коррелирующих таблиц вместо подзапросов SELECT.

Авто (по умолчанию): генерация агрегатов определяется автоматически.

Активировано: агрегат коррелирующих таблиц генерируется, если это поддерживается СУРБД.

Деактивировано: подзапрос SELECT генерируется, если это поддерживается СУРБД.

Некоторые базы данных игнорируют эти опции, если поддерживают только один из двух вариантов. Например, MySQL поддерживает только подзапросы SELECT, а Teradata обрабатывает только коррелирующие таблицы.

Список баз данных с поддерживаемыми опциями см. в разделе "Поддерживаемые формы агрегатов SQL".

Сгенерировать агрегаты "Перв./Последн." как коррелирующие таблицы: Эта опция позволяет принудительно инициировать или деактивировать генерацию агрегата "Перв./Последн." с помощью коррелирующих таблиц вместо подзапросов SELECT.
Сгенерировать агрегаты "Существует" как коррелирующие таблицы Эта опция позволяет принудительно инициировать или деактивировать генерацию агрегата "Существует" с помощью коррелирующих таблиц вместо подзапросов SELECT.
Генерировать условия объединения после каждого запроса

Для ясности обозначение (Т1,Т2) используется для операции (левого внешнего) соединения Т1 и Т2 в условии.

В длинных цепочках и последовательностях соединений таблиц, например, ((T1,(T2,T4)), (T3,T4)), некоторые условия соединения могут генерироваться сразу после соединения или по завершении запроса без влияния на результирующий набор строк. В некоторых случаях конечные условия соединения снижают производительность генерации SQL-кода. Эта опция позволяет настроить позицию условий соединения.

Авто (по умолчанию): предпочтительная форма выбирается автоматически на основе анализа базы данных.

Активировано: условия соединения генерируются сразу после операции соединения.

Деактивировано: условия соединения генерируются в конце цепочки соединений.

Создать таблицу популяций с меткой времени В оперативной среде наборы аналитических данных Automated Analytics генерируют сложный SQL-код, который может некорректно анализироваться некоторыми СУРБД. Это особенно часто происходит с фильтрованными популяциями с метками времени. Для предотвращения этого выполняется материализация популяции с меткой времени, которая упрощает разработку плана выполнения в оптимизаторе. Данная опция управляет этим поведением.

Авто (по умолчанию): необходимость материализации определяется автоматически на основе правил. На данный момент материализуются все фильтрованные популяции с меткой времени.

Активировано: все популяции с меткой времени материализуются.

Деактивировано: популяции с меткой времени никогда не материализуются.

Сгруппировать сведенные агрегаты (по значению сведения)

В таких базах данных, как Teradata, Oracle и DB2, агрегаты формулируются как выражения коррелирующих или производных таблиц. Каждая из таких таблиц собирает агрегаты по одному набору строк. Набор строк определяется ключевыми столбцами и условием фильтрации. Фильтр включает указание окна времени (если применимо) и дополнительного предиката.

Эта опция позволяет сгенерировать предикат так, чтобы он учитывался без отрицательного влияния на условие фильтрации. То есть связанные сведенные агрегаты генерируются в разных таблицах.

Авто (по умолчанию): необходимость добавления дополнительного предиката в условие фильтрации определяется на основе числа связанных агрегатов. Это значение можно настроить с помощью опции "Максимальное использование условия сведения перед группированием".

Активировано: дополнительный предикат никогда не включается в выражение фильтра.

Деактивировано: дополнительный предикат всегда включается в выражение фильтра.

Максимальное использование условия сведения перед группированием Если опция "Сгруппировать сведенные агрегаты (по значению сведения)" имеет значение "Авто", агрегаты с общим окном времени, но разными дополнительными условиями фильтрации группируются, когда их число превышает указанный порог. Эта опция устанавливает порог. По умолчанию он имеет значение 5.
Число сведенных агрегатов на группировку Если опция "Сгруппировать сведенные агрегаты (по значению сведения)" имеет значение "Авто", агрегаты с общим окном времени, но разными дополнительными условиями фильтрации группируются. Этот параметр определяет максимальное число агрегатов в группе. По умолчанию он имеет значение 7.
Предварительная фильтрация агрегатов

Выражения таблиц, группирующие сведенные агрегаты, могут фильтровать строки, доступные этим агрегатам.

Предварительная фильтрация часто включает не индексируемые столбцы, что приводит к полному сканированию. Если индексированы все столбцы в фильтрах агрегатов или условиях соединения, активация предварительной фильтрации может повысить производительность.

Поскольку каждый агрегат обрабатывает только совпадающие строки, эту предварительную фильтрацию можно оставить выключенной.

По умолчанию эта опция деактивирована.
Всегда видимые поля Объекты аналитических данных, такие как сущности или популяции с меткой времени, конфигурируются для отображения только определенного набора полей. Эта опция позволяет сделать другие поля видимыми для пользователей манипуляции данными.

По умолчанию отображаются поля KxTarget и KxWeight.

Чтобы добавить другие поля, введите их имена через точку с запятой.

Заменить поля констант значениями В целях оптимизации манипуляции данными для отображения поля константы распространяет фактическое значение и уведомляет вышестоящие манипуляции данными, что это поле является константой, то есть его значение должно использоваться при любой ссылке на имя поля. Это ускоряет выполнение некоторых манипуляций данными в 10 раз. Эта опция активирована по умолчанию. Чтобы деактивировать ее, снимите флажок.
Оптимизировать выражения на основе полей нижестоящей манипуляции данными

Выражения, на которые манипуляция данными ссылается несколько раз, факторизуются в целях эффективности. Если такие выражения используют поля из соединенной/нижестоящей манипуляции данными, факторизация может быть некорректной. Данная опция позволяет исключить их из процесса факторизации (также называемого оптимизацией).

Обратите внимание, что эта опция зависит от опций "Оптимизировать выражения с несколькими ссылками" и "Максимальное число использований выражения до оптимизации".

Эта опция деактивирована по умолчанию. Чтобы активировать ее, установите флажок.
Не исключать ключи без соединения из промежуточных оптимизаций

В целях оптимизации описанная факторизация выражений с несколькими ссылками выполняется, только если соответствующая таблица имеет ключевые столбцы.

В многошаговой манипуляции данными для предотвращения нулевых физических ключей и нарушения ограничений по уникальности применяются специальные правила фильтрации ключей, которые не требуются в промежуточных таблицах. В результаты некоторые выражения с несколькими ссылками могут остаться без факторизации.

Эта опция запрещает исключать из промежуточных таблиц ключевые столбцы, которые могут использоваться в процессе оптимизации.

Эта опция активирована по умолчанию. Чтобы деактивировать ее, снимите флажок.
Поддерживаемые формы агрегатов SQL
Стандарт. Перв./Последн. Существует
Доступ Только подзапрос Только подзапрос Только подзапрос
SQL Server По умолчанию коррелирующие таблицы По умолчанию коррелирующие таблицы Только подзапрос
Oracle По умолчанию коррелирующие таблицы Только коррелирующие таблицы Только подзапрос
Teradata Только коррелирующие таблицы Только коррелирующие таблицы Только коррелирующие таблицы
DB2 Только подзапрос Только коррелирующие таблицы Только подзапрос
MySQL Только подзапрос Только подзапрос Только подзапрос
PostgreSQL По умолчанию коррелирующие таблицы Только коррелирующие таблицы Только коррелирующие таблицы
SybaseIQ Только коррелирующие таблицы Только коррелирующие таблицы Только коррелирующие таблицы
Vertica Только коррелирующие таблицы Только коррелирующие таблицы Только коррелирующие таблицы
Netezza Только коррелирующие таблицы По умолчанию коррелирующие таблицы По умолчанию коррелирующие таблицы

Легенда

  • Только подзапрос: в этой базе данных агрегаты генерируются только в форме подзапроса.
  • Только коррелирующие таблицы: в этой базе данных агрегаты генерируются только с помощью коррелирующих таблиц.
  • По умолчанию коррелирующие таблицы: в этой базе данных коррелирующие таблицы генерируются по умолчанию, но по запросу можно генерировать подзапросы SELECT.