Эта опция позволяет установить минимальное количество сеансов, для которых правила ассоциации генерируют временные правила.
Напоминание: сеанс — это набор транзакций, определенных уникальным ключом. Например, все покупки, сделанные одновременно отдельным клиентом.
В стандартном использовании (при размере блока равном 0) все транзакции импортируются в память до генерации правил ассоциации, соответствующих параметрам модели (минимальная поддержка, минимальная достоверность, максимальная длина правила). С большими наборами данных этот метод может потребовать очень много времени и памяти. Для увеличения времени и области памяти используется опция для импорта и генерации правил из частей файла событий. В конце шага изучения эти правила объединяются и их статистика обновляется для всего набора данных.
Количество найденных правил может отличаться в зависимости от выбранного метода. Однако эти различия не существенны, если размер блока достаточно большой. Размер блока должен быть приблизительно 10% от общего количества сеансов в наборе данных (10–15 блоков в зависимости от размера набора данных). Можно начать с 10% и изменить это число для улучшения результатов. Если файл транзакций содержит менее 5000 строк, следует использовать стратегию без блока.
Однако задача разделения сеансов в блоках может быть делегирована в Automated Analytics с помощью опции Автоматически определить размер блока, которая автоматически вычислит размер блока, чтобы получить 10.
Транзакции в наборе данных событий должны быть группированы по сеансам, то есть файл событий должен быть отсортирован по сеансам.
Эта опция означает генерацию только первичных правил и пропуска производных правил. Например, указано два правила ассоциации: R1 = X => Z и R2 X,Y =>Z; R1 называется первичным правилом, а R2 производным правилом.
Перед началом процесса изучения можно выбрать, какие позиции требуется просмотреть как последователи в правилах, созданных путем определения позиций для хранения и исключения из модели. Если в обоих списках содержатся позиции, список позиций для исключения в последователе используется для модели.
Перед созданием списка необходимо знать точное значение каждой позиции, которую требуется включить или исключить.