Del mismo modo en que las páginas se agrupan en sitios, estos últimos se agrupan en dominios. Un dominio es definido como el sufijo del nombre de un sitio web. Si la dirección de un sitio es www.sitio.cl, se considera como nombre del dominio la cadena sitio.cl, siendo cl el dominio de primer nivel y sitio el dominio de segundo nivel.
En el Cuadro 4.1 se muestran algunos datos básicos sobre los dominios conocidos. En la colecta hay 190,577 dominios distintos, y llama la atención la cantidad de dominios vacíos, 2,934, que son aquellos de los cuales se tiene un registro pero que en realidad no tienen un servidor asignado.
|
|
Las Secciones de este Capítulo son las siguientes:
De los sitios estudiados, un 19, 5 % no pudo ser contactado al momento del estudio. A cada uno de los que sí se pudo contactar, se les extrajo la dirección IP, obteniendo en total 14,477 direcciones. Al agrupar las direcciones IP por dominio, se obtiene la distribución que muestra la Figura 4.1. La distribución, que se ajusta a una ley de potencias de parámetro 0, 35 en su parte inicial y a una ley de potencias de parámetro 1, 37 en su parte central, es muy sesgada, pues existen dos direcciones IP con más de 1.000 dominios distintos, mientras que más de 13.000 direcciones tienen menos de 10 dominios.
Para cada dirección IP se examinó el software utilizado por el servidor, incluyendo el sistema operativo, aunque no todas ellas entregan información. En la Figura 4.2 se observan las distribuciones de sistema operativo y de software servidor utilizado en las direcciones encontradas.
De todas las direcciones válidas, un 38, 21 % de las direcciones no entrega información sobre el software servidor que utiliza. El servidor Apache, considerando la cifra anterior, parece tener la mayor presencia, con un 43 % de participación. No se puede afirmar directamente que Apache tiene la mayor participación debido a que no se conoce la distribución de los servidores que no entregaron información. Respecto al sistema operativo, un 43, 21 % de las direcciones válidas no entrega información. Las distintas versiones de Unix y Linux suman un total de 38, 67 %, dejando a Microsoft Windows con un 18, 12 % de participación.
Un dominio tiene en promedio 1, 05 sitios, lo que quiere decir que la mayoría de los dominios (187,544 en total) se utiliza para un único sitio. En la Figura 4.3 se observa la distribución de sitios por dominios. Esta distribución se aproxima en su parte central por una ley de potencias de parámetro 0, 75. En la imagen se aprecia claramente la cantidad de dominios con un único sitio. Además, en el Cuadro 4.2 se muestran los dominios con más sitios. Para cada uno de ellos se indica el número de páginas y el número de enlaces a documentos de texto no HTML, como una medida de la cantidad de información que presentan esos dominios.
|
|
En promedio, un dominio tiene 50, 57 páginas. Además, existen 45,607 dominios con una sola página, una cifra muy similar a la cantidad de sitios con una página. La distribución del número de páginas por dominio se observa en la Figura 4.4, y se ajusta a una ley de potencias de parámetro 0, 13 en su parte inicial y a una ley de potencias de parámetro 1, 54 en su parte central.
El tamaño promedio de un dominio es cercano a los 746 KiB. La distribución del tamaño total de páginas y la fracción de los dominios se muestra en la Figura 4.5, y se ajusta a una ley de potencias con parámetros 0, 98 en su parte inicial y 1, 45 en su parte central.
En el Cuadro 4.3 se muestran los 30 dominios con más contenido. La mayoría de ellos son sitios comerciales o de subastas, siguiendo la tendencia del año anterior [6]. Las mismas anomalías que producen sitios con más contenido del que verdaderamente tienen se aplican a esta tabla.
|
|
En el Cuadro 4.4 se muestran los 30 dominios que reciben más enlaces desde otros dominios. Nuevamente, prima la cantidad de dominios distintos por sobre el total de enlaces recibidos. En la lista se encuentran dominios del gobierno, de instituciones de educación, de comerciales, de medios de comunicación, y algunos que son marcados como “otros” por el contenido que presentan. En particular, los dominios en los puestos 2, 3 y 4 son equivalentes, tienen la misma IP y muestran los mismos sitios.
|
|
Para el caso de los dominios, se desea una representación gráfica de la Web Chilena. Para esta representación se eligieron los 100 dominios más enlazados, considerando solamente aquellos que tenían sitios en la componente MAIN MAIN, con el fin de mostrar los dominios más relevantes. Esta representación1 se observa en la Figura 4.6, contiene 100 dominios representados como nodos enlazados por una línea cuyo grosor y color muestra la cantidad de enlaces entre ellos (mientras más oscuro y grueso, hay una mayor cantidad de enlaces). Los dominios se dividen en tres grupos: comerciales (rectángulos), de instituciones educacionales (elipses) y de gobierno (rombos).
|
|
La colección incluye dominios que están hospedados en IPs asignadas a Chile pero que no necesariamente corresponden al dominio nacional cl. El Cuadro 4.5 muestra como se distribuyen los dominios de primer nivel en la Web Chilena. En esta distribución se aprecia que el dominio más valorado es el dominio nacional, aunque es probable que existan otros sitios con dominios externos que estén hospedados en IPs nacionales pero de los cuales no se tenga conocimiento. Adicionalmente, en el Cuadro 4.6 se muestra la distribución de los sitios de cada componente a través de los dominios de primer nivel.
|
|
|
|
Se encontraron más de 130.000.000 de enlaces hacia páginas de sitios externos. Los 30 dominios externos de primer nivel más referenciados se muestran en el Cuadro 4.7. Además se indica el ranking de uso de ese dominio en la Web Global [17], el nombre del dominio y el porcentaje de los enlaces que le corresponde dentro del total.
|
|
La Figura 4.7 muestra la distribución de los enlaces a los dominios externos, que se ajusta a una ley de potencias de parámetros 1, 75 en su parte inicial y 5, 86 en su parte central. Una observación importante es que el gráfico continúa más allá del total de dominios válidos por la presencia de errores de tipo en los nombres de dominio.
La cantidad de enlaces externos puede ser relacionada con el intercambio comercial [4]. En la Figura 4.8 se muestra la relación entre los enlaces a dominios externos y las exportaciones e importaciones de Chile. Tal como lo muestran los diagramas, hay una relación significativa entre el número de enlaces y el intercambio comercial, en particular en las exportaciones, donde el número de enlaces y el volumen de intercambio tiene una correlación de 0, 62. Los países orientales son los que más se alejan de la recta que modela la relación, como es el caso de China, Japón, Korea y Taiwán. En general se observa que los países más alejados son aquellos que no tienen como lengua oficial el idioma inglés. Una aproximación realizada es la siguiente: para el dominio de Estados Unidos se incluyó el dominio .com, lo que no es del todo exacto ya que dicho dominio contiene sitios de una gran cantidad de naciones.