При создании графа из двудольного графа необходимо определить проекцию для сущности этого графа (для исходного или целевого столбца).
В следующей таблице приведены доступные параметры проекции:
| Настройки | Описание |
|---|---|
| Граф для деривации | Имя двудольного графа, из которого извлечен текущий граф. |
| Сущность | Сущность, используемая в качестве узла для текущего графа. Двудольный граф создает связи между двумя типами сущностей; в стандартном графе может использоваться только одна. |
| Оставить первые N | Число спариваний высшего ранга, которые требуется сохранить. |
| Вес | Указывает, какое значение присвоить в качестве веса связей. Рекомендуется использовать коэффициент Жаккара или вероятность независимости, особенно при работе с семействами. Поддержка: число найденных ссылок для каждого узла. Коэффициент Жаккара: Измеряет сходство между наборами образцов и определяется как размер пересечения, разделенный на размер объединения наборов образцов. ![]()
Степень независимости: События A и B независимы, если вероятность возникновения обоих событий равна произведению вероятностей событий A и B. ![]() Следующая формула используется для расчета веса. ![]() Вес, равный 1, означает полностью независимые события. Чем больше вес, тем сильнее корреляция между событиями. Косинус ![]() где: a: активный пользователь; i и j: две позиции; : набор пользователей, которые приобрели i : столбец матрицы R для позиции i. ![]() |
| Максимум итераций | Максимальное число итераций, после которых должен остановиться алгоритм, если критерии Эпсилона не были достигнуты. |
| Оптимизировать потребление памяти графом | Эта опция помогает снизить объем используемой памяти. Обратите внимание: скорость обработки при этом также снизится. |
| Оптимизировать скорость вычисления графа | Эта опция помогает ускорить обработку. Обратите внимание: использование памяти при этом возрастет. |
| Минимальная поддержка | Поддержка — число общих позиций двух сущностей. Например, при извлечении графа из двудольного графа, связывающего продукты и клиентов, поддержкой связи между продуктами A и B является число клиентов, купивших оба продукта. Связи с поддержкой ниже минимальной поддержки не создаются. |