Cómo se desarrolló el “Buscador del Estado”

May 17, 2009

Made in Chile

En el marco de la puesta en marcha de la nueva ley de Transparencia, investigadores del Centro de Investigación de la Web de la Universidad de Chile desarrollaron el Buscador que hace posible acceder de forma fácil y rápida a la información de transparencia de los distintos organismos públicos. Esta es tecnología Made in Chile.

Desde ayer miércoles está disponible en el sitio www.chileclic.gob.cl el nuevo buscador del Gobierno, proyecto desarrollado por el Centro de Investigación de la Web (CIW) del Departamento de Ciencias de la Computación de la Universidad de Chile que permite, de manera más efectiva y desde un sólo sitio, acceder a toda la información que las instituciones públicas deben dar a conocer y actualizar periódicamente en el marco del cumplimiento de la nueva Ley de Transparencia.

Su desarrollo estuvo a cargo de un equipo del CIW integrado por los académicos del DCC Ricardo Baeza–Yates (dirección general) y Claudio Gutiérrez (responsable ante el DCC); el investigador Mauricio Marín (director del proyecto), y los estudiantes de posgrado del DCC: Senén González y Víctor Sepúlveda (ingeniería del buscador), Eduardo Graells (interfaz buscador y su integración con portales de gobierno) y Mauricio Monsalve (estandarización de información de transparencia).

Y en la decisión de la Secretaría Ejecutiva de Estrategia Digital del Ministerio de Economía de confiar esta tarea a la Universidad de Chile influyó la existencia del CIW, el cual reúne a connotados especialistas en temas de buscadores para la Web, y en que en el año 2000 el mismo profesor Baeza-Yates hubiese liderado el desarrollo del primer motor de búsqueda chileno www.todocl.cl Parte de las razones, además, para instalar en el DCC el labortorio Yahoo! Research Latinoamérica que opera en Santiago desde 2006.

El profesor Claudio Gutiérrez afirma que el DCC “tiene una larga tradición de vinculación con el sector público y este es un paso más para fortalecer ese vínculo”. En tanto, en opinión del profesor Ricardo Baeza-Yates la iniciativa por parte del gobierno “revela la confianza que éste tiene en los científicos que trabajamos en la Universidad de Chile, y en la capacidad de generar tecnología en Chile, pues podríamos haber trabajado con tecnología extranjera pero eso se descartó”.

Otra potencialidad que presenta esta herramienta es, de acuerdo a Baeza-Yates, la de realizar investigación, por ejemplo, en el área científica llamada minería de datos, “sobre el comportamiento de los usuarios, claro, si el gobierno estuviera de acuerdo en ello y resguardando el total anonimato de quienes consultan”.

¿Cómo se construyó el Buscador del Estado?

Según el director del proyecto, Mauricio Marín, el desarrollo de este buscador tomó cerca de cuatro meses. Y para esto, los investigadores del CIW transformaron el software utilizado en el buscador nacional todoCL.cl y lo adaptaron a las necesidades de los sitios Web del gobierno.

Técnicamente, el software está conformado por tres módulos. Uno de ellos corresponde al “crawler”: encargado de visitar periódicamente los sitios Web respectivos y bajar su contenido. Para desarrollarlo se realizó un catastro de los nombres de dominio en los cuales se deseaba focalizar el crawling -los que constituyen las “semillas” o sitios Web que visitará el crawler- y se determinó qué tan frecuentemente serán visitados por el crawler. Entre otros aspectos fue necesario construir un filtro que evite que el crawler baje páginas Web que están fuera de su ámbito de acción. Por eso se definió tanto el nivel de profundidad con que será visitado cada sitio Web como el orden en que serán visitados, priorizando los de mayor relevancia. Asimismo se definió y configuró un sistema de archivos para almacenar las distintas colectas del crawler, y un procedimiento de administración de su contenido que, a la vez, permitirá ir almacenando información general que posteriormente se utilice para estudiar la evolución, cantidad, calidad y nivel de estandarización de la información disponible en cada sitio Web del gobierno. Además el crawler reconocerá aquellos sitios que no estén cumpliendo con la publicación de información de transparencia activa.

Los otros dos módulos de este software son el Indexador, que toma el contenido bajado por el crawler y construye un índice y base de texto necesaria para responder las consultas de usuarios en el Buscador de manera eficiente, y el Buscador mismo, que presenta la interfaz al usuario y responde sus consultas utilizando el índice y base de texto.

Mauricio Marín dice que “el buscador, al tener un diseño creado especialmente para los sitios Web de gobierno, debería ser una herramienta más útil que buscadores genéricos tales como Google. Por ejemplo, el buscador http://buscador.chileclic.gob.cl/ permite realizar búsquedas en “Sitios del Estado” (de reparticiones del Estado), en “Transparencia” (páginas donde las reparticiones publican su información de “transparencia”), “Municipios” (sitios de “transparencia” de municipalidades) y en “ChileClic” (servicio que permite a la ciudadanía informarse sobre trámites y servicios del Estado http://www.chileclic.gob.cl).

La operación y mantención del Buscador estará a cargo del grupo de investigadores del CIW por un año, período en el que se le harán ampliaciones para incluir nuevas funcionalidades con el objetivo de mejorar su utilidad. El Buscador recorre todos los sitios Web de los ministerios y otras reparticiones del Estado y como tal, explica Ricardo Baeza-Yates, puede transformarse en un “observador” de dichos sitios respecto de si estos se ajustan a estándares de calidad y si proporcionan información pertinente. Por ejemplo, las páginas Web más visitadas por los usuarios podrían estar en un lugar destacado del sitio Web de cada ministerio.


Comunicaciones
Departamento de Cs. de la Computación
Facultad de Cs. Físicas y Matemáticas
Universidad de Chile