|
WIRE
Web Information Retrieval
|
|
Ir a la pagina de inicio del proyecto
WIRE
« Volver
|
|
|
Experimento 2
de crawling: Análisis de
bitácoras (logs)
|
Objetivo
El objetivo de este experimento es medir que
tan profundo los usuarios llegan en las
páginas de un sitio Web.
Descripción
Para este experimento, el sitio Web
será descargado sólo una vez y
analizado para generar un grafo. Estudiaremos
la correlación entre la profundidad de
cada página (su distancia con la
página principal del grafo Web), y el
número de visitas.
Requerimientos
Se requiere una bitácora de acceso
(log) del sitio Web, con al menos 1,000
páginas vistas (y no más de
10.000.000 de páginas vistas).
Ni el período de tiempo ni el
número de visitas diarias son relevantes
para este experimento, de modo que los datos
específicos sobre visitas a cada sitio
individual no serán publicados.
Cualquier servidor Web: Windows, UNIX/Linux,
etc. es compatible con este experimento, pues
solo un archivo de acceso (log) es necesario.
|
Para
Participar:
-
Prepare un archivo
con los últimos 50-100Mb de su
archivo de log.
-
De ser posible
comprímalo para ahorrar ancho de
banda.
-
Deje temporalmente
este archivo en algún directorio
con acceso FTP anónimo o
HTTP.
-
Envíe un
e-mail a ccastill@dcc.uchile.cl
con las instrucciones para descargar
este archivo.
Por su colaboración, muchas
gracias.
|
|