Detección de Web Spam Basada en Enlaces

Agosto 30, 2006

Detección de Web Spam Basada en Enlaces

Expositor: Dr. Carlos Castillo
Depto. de Ciencias de la Computación, Universidad de Chile

Fecha : Miércoles 30 de agosto de 2006
Hora : 12:00 horas
Lugar : Auditorio DCC, Av. Blanco Encalada 2120, 3er Piso, Santiago, Chile

Resumen

Las máquinas de búsqueda en la Web como Google, Yahoo!, MSN o Ask actúan
como mediadoras entre los navegantes de Internet y millones de páginas
con contenido. Los proveedores del contenido tienen un incentivo para
ocupar técnicas para mejorar su posición en los resultados de las
máquinas de búsqueda. Algunas de estas técnicas intentan, de hecho,
engañar a los algoritmos de ranking para obtener un lugar inmerecido.
Esto se llama “spamdexing” (spamming + indexing).

En los últimos años para los buscadores las técnicas de ranking en la
Web que utilizan análisis de enlaces, como PageRank, han tomado mayor
importancia. Debido a esto, los expertos en Web que realizan spamdexing
han comenzado a explotar debilidades en ellas para posicionar sus
sitios. Esta charla describe algoritmos para analizar rápidamente grafos
masivos en la Web, caracterizarlos estadísticamente, y detectar
anomalías estadísticas que señalan la presencia de estructuras
artificiales y maliciosas.