Buscar:   
Centro de Investigación de la Web D.C.C. - Universidad de Chile

WIRE
Web Information Retrieval

Ir a la pagina de inicio del proyecto WIRE
« Volver

Experimento 2 de crawling: Análisis de bitácoras (logs)

Objetivo
El objetivo de este experimento es medir que tan profundo los usuarios llegan en las páginas de un sitio Web.

Descripción
Para este experimento, el sitio Web será descargado sólo una vez y analizado para generar un grafo. Estudiaremos la correlación entre la profundidad de cada página (su distancia con la página principal del grafo Web), y el número de visitas.

Requerimientos
Se requiere una bitácora de acceso (log) del sitio Web, con al menos 1,000 páginas vistas (y no más de 10.000.000 de páginas vistas).

Ni el período de tiempo ni el número de visitas diarias son relevantes para este experimento, de modo que los datos específicos sobre visitas a cada sitio individual no serán publicados.

Cualquier servidor Web: Windows, UNIX/Linux, etc. es compatible con este experimento, pues solo un archivo de acceso (log) es necesario.


Para Participar:

  1. Prepare un archivo con los últimos 50-100Mb de su archivo de log.
  2. De ser posible comprímalo para ahorrar ancho de banda.
  3. Deje temporalmente este archivo en algún directorio con acceso FTP anónimo o HTTP.
  4. Envíe un e-mail a ccastill@dcc.uchile.cl con las instrucciones para descargar este archivo.

Por su colaboración, muchas gracias.

 

 

 

Departamento de Ciencias de la Computación
Universidad de Chile
Blanco Encalada #2120
Santiago, Chile

iniciativa cientifica milenio Preguntas/Comentarios: ciw@dcc.uchile.cl
Ultima modificación:
Servicios de búsqueda por: Ir a todocl.cl

El Centro de Investigación de la Web (CIW) es posible gracias al Programa Iniciativa Científica Milenio
Iniciativa Científica Milenio, Ministerio de Planificación y Cooperación - Gobierno de Chile

Valid HTML 4.01! Valid CSS!


dcc