Los puntos clave no están disponibles para este artículo en este momento.
Definimos una comunidad en la web como un conjunto de sitios que tienen más enlaces (en cualquier dirección) hacia miembros de la comunidad que hacia no miembros. Los miembros de tal comunidad pueden ser identificados de manera eficiente en un marco de flujo máximo/corte mínimo, donde la fuente está compuesta por miembros conocidos y el sumidero consiste en no miembros bien conocidos. Un rastreador focalizado que rastrea hasta una profundidad fija puede aproximar la membresía comunitaria al aumentar el gráfico inducido por el rastreo con enlaces a un nodo de sumidero virtual. La efectividad del algoritmo de aproximación se demuestra con varios resultados de rastreo que identifican hubs, autoridades, anillos web y otras topologías de enlaces que son útiles pero no fácilmente categorizables. Las aplicaciones de nuestro enfoque incluyen rastreadores focalizados y motores de búsqueda, población automática de categorías de portal y filtrado mejorado.
Flake et al. (Martes,) estudiaron esta cuestión.