Mega-hub

Un nodo se puede considerar Mega-hub si su grado es superior a un cierto umbral y por tanto tiene una contribución negativa respecto la modularidad global del gráfico y a su potencial de agrupación en clústeres. Un nodo conectado a una gran cantidad de vecinos tiende a reagrupar distintas comunidades en una de mayor, escondiendo los clústeres subyacentes reales.

Eliminar estos nodos altamente conectados puede mejorar sustancialmente el tiempo de procesamiento, y apartar nodos irrelevantes del análisis. Debido a su alto grado, estos nodos pueden crear "clústeres artificiales" en la red, haciendo más difícil la detección de comunidades, y escondiendo la estructura real del gráfico.

Estos mega-hubs se pueden hallar en las redes de telecomunicaciones (números de servicio, centros de llamadas, taxis), redes transaccionales (best sellers, los principales productos de la cola). Estos nodos tienen un gran número de enlaces, pero semánticamente son insignificantes.

Eliminar mega-hubs puede tener un impacto positivo en:
  • aumentar la modularidad resultante
  • reducir el tiempo de procesamiento de la comunidad (ya que la asignación de la comunidad implica mirar a los vecinos)
  • reducir el tiempo de detección de emparejamiento (ya que los vecinos de mega-hubs tienen un segundo círculo muy grande)
  • reducir el tamaño de la comunidad mayor (inducido erróneamente por el hecho de que algunos nodos están conectados a "demasiados" nodos)