Мегахаб

Узел считается мегахабом, если его степень превышает определенный порог и, следовательно, имеет негативное влияние на глобальную модулярность графа и его потенциал кластеризации. Узлы, имеющие большое число соседних, имеют тенденцию перегруппировывать отдельные семейства в одно, скрывая таким образом фактические кластеры, лежащие в основании.

Удаление этих узлов с большим количеством соединений может значительно сократить время обработки и убрать из анализа ненужные узлы. Из-за высокой степени таких узлов они могут создавать в сети "искусственные кластеры", усложняя обнаружение семейств и скрывая фактическую структуру графа.

Подобные узлы-мегахабы могут существовать, например, в телекоммуникационных (телефоны различных служб, колл-центры, службы такси) или транзакционных сетях (продукты-бестселлеры или продукты "с длинным хвостом"). Эти узлы имеют много связей, однако семантически малозначимы.

Удаление мегахабов может иметь следующие положительные последствия:
  • улучшить итоговую модулярность;
  • сократить время обработки семейства (так как при присвоении семейства рассматриваются соседних элементы);
  • сократить время обнаружения парных узлов (так как соседние с мегахабом элементы будут иметь очень широкий вторичный круг);
  • уменьшить размер самого большого семейства (неверно подсчитанный из-за того, что некоторые узлы соединены с "множеством" узлов).