Capítulo 4
Dominios

Del mismo modo en que las páginas se agrupan en sitios, estos últimos se agrupan en dominios. Un dominio es definido como el sufijo del nombre de un sitio web. Si la dirección de un sitio es www.sitio.cl, se considera como nombre del dominio la cadena sitio.cl, siendo cl el dominio de primer nivel y sitio el dominio de segundo nivel.

En el Cuadro 4.1 se muestran algunos datos básicos sobre los dominios conocidos. En la colecta hay 190,577 dominios distintos, y llama la atención la cantidad de dominios vacíos, 2,934, que son aquellos de los cuales se tiene un registro pero que en realidad no tienen un servidor asignado.




Dominios 190.577




Promedio Contenido 764.880,47 [B]
Dominios con 1 Página 45.607
Dominios con 1 Sitio 187.544
Dominios vacíos 2.934
Promedio de Páginas 50,57
Promedio de Sitios 1,05

Cuadro 4.1: Resumen de estadísticas sobre los dominios.

Las Secciones de este Capítulo son las siguientes:

Sección 4.1, Direcciones IP y Software utilizado como servidor:
se estudia la distribución de dominios a través de las distintas direcciones IP encontradas en la colecta. Además, a cada dirección IP se le pidió información sobre el software que utiliza, en particular su sistema operativo y el software servidor.
Sección 4.2, Número de sitios por dominio:
se estudia la distribución de sitios en los dominios. Se incluye un listado de los dominios con más sitios en la colección.
Sección 4.3, Número de páginas por dominio:
se estudia la distribución de páginas en los dominios.
Sección 4.4, Tamaño de los dominios:
se estudia la distribución del contenido en los dominios, y se listan los dominios con más texto en la colección.
Sección 4.5, Enlaces entre dominios:
se estudian los enlaces entre dominios. Para ello, se enumeran los dominios que reciben más enlaces desde otros dominios, y se muestra una representación gráfica de la parte central de la componente MAIN-MAIN.
Sección 4.6, Dominios de primer nivel:
se estudia la distribución de sitios a través de los dominios de primer nivel de la Web Chilena.
Sección 4.7, Dominios externos de primer nivel:
se estudian los enlaces hacia dominios no nacionales. Esto incluye el listado de los dominios externos más enlazados y la relación entre los enlaces externos y el intercambio comercial de Chile.

4.1. Direcciones IP y Software utilizado como servidor

De los sitios estudiados, un 19, 5 % no pudo ser contactado al momento del estudio. A cada uno de los que sí se pudo contactar, se les extrajo la dirección IP, obteniendo en total 14,477 direcciones. Al agrupar las direcciones IP por dominio, se obtiene la distribución que muestra la Figura 4.1. La distribución, que se ajusta a una ley de potencias de parámetro 0, 35 en su parte inicial y a una ley de potencias de parámetro 1, 37 en su parte central, es muy sesgada, pues existen dos direcciones IP con más de 1.000 dominios distintos, mientras que más de 13.000 direcciones tienen menos de 10 dominios.


PIC

Figura 4.1: Distribución de las direcciones IP para los dominios de la web chilena.

Para cada dirección IP se examinó el software utilizado por el servidor, incluyendo el sistema operativo, aunque no todas ellas entregan información. En la Figura 4.2 se observan las distribuciones de sistema operativo y de software servidor utilizado en las direcciones encontradas.


PIC
(a) Software Servidor
PIC
(b) Sistemas Operativos
Figura 4.2: Distribuciones de generadores de páginas dinámicas, software servidor utilizado en los servidores y los sistemas operativos utilizados en ellos.

De todas las direcciones válidas, un 38, 21 % de las direcciones no entrega información sobre el software servidor que utiliza. El servidor Apache, considerando la cifra anterior, parece tener la mayor presencia, con un 43 % de participación. No se puede afirmar directamente que Apache tiene la mayor participación debido a que no se conoce la distribución de los servidores que no entregaron información. Respecto al sistema operativo, un 43, 21 % de las direcciones válidas no entrega información. Las distintas versiones de Unix y Linux suman un total de 38, 67 %, dejando a Microsoft Windows con un 18, 12 % de participación.

4.2. Número de sitios por dominio

Un dominio tiene en promedio 1, 05 sitios, lo que quiere decir que la mayoría de los dominios (187,544 en total) se utiliza para un único sitio. En la Figura 4.3 se observa la distribución de sitios por dominios. Esta distribución se aproxima en su parte central por una ley de potencias de parámetro 0, 75. En la imagen se aprecia claramente la cantidad de dominios con un único sitio. Además, en el Cuadro 4.2 se muestran los dominios con más sitios. Para cada uno de ellos se indica el número de páginas y el número de enlaces a documentos de texto no HTML, como una medida de la cantidad de información que presentan esos dominios.


PIC

Figura 4.3: Distribución de los sitios para los dominios de la web chilena.









SitiosPáginasDocumentos* Dominio Tipo














690 1.309 649 84,28 %(pdf) 15,72 %(doc)portalciudadano C
374 35.215 18.148 78,96 %(pdf) 13,00 %(xml) uchile E
352 1.977 136 37,50 %(pdf) 35,29 %(doc) scd C
342 21.590 125 100,00 %(txt) loquegustes C
267 10.868 1 100,00 %(txt) boonic C
158 28.996 6.269 78,23 %(pdf) 21,34 %(doc) gov G
124 36.974 229 99,56 %(xml) 0,44 %(doc) vivastreet C
111 710 452 99,12 %(pdf) 0,88 %(xml) co C
110 5.844 3.490 62,89 %(pdf) 24,47 %(txt) utfsm E
94 30.596 36 50,00 %(pdf) 27,78 %(xml) terra C
85 4.229 2.637 86,16 %(pdf) 8,04 %(doc) ucv E
82 12.697 5.627 87,26 %(pdf) 9,72 %(doc) puc E
81 11.117 10.236 53,43 %(doc) 46,54 %(pdf) gob G
75 4.507 5.586 90,51 %(pdf) 7,02 %(doc) utalca E
75 513 39 76,92 %(xml) 17,95 %(pdf) tie C
74 5.055 0 olx C
72 5.337 3.127 75,60 %(pdf) 21,62 %(doc) usach E
63 3.745 864 82,29 %(pdf) 9,49 %(xml) ucn E
61 8.143 83 59,04 %(xml) 38,55 %(pdf) canal13 M
56 5.116 1.998 81,23 %(pdf) 11,41 %(doc) udec E
53 6.745 0 123 C
45 6.154 3.702 92,33 %(pdf) 7,54 %(doc) uach E
40 1.554 706 65,58 %(pdf) 32,72 %(doc) ulagos E
38 77 2 100,00 %(xml) sanvicentett C
35 4.388 1.985 98,84 %(xml) 0,91 %(pdf) tvn M
32 3.297 2.575 86,60 %(pdf) 13,32 %(doc) udp E
30 1.307 256 75,78 %(pdf) 12,89 %(doc) usm E
29 1.481 2.462 95,65 %(pdf) 3,70 %(doc) ufro E
28 9.680 0 top1 C
28 2.643 0 evisos C

Cuadro 4.2: Dominios con mayor cantidad de sitios. Se detalla el número de páginas encontradas en sus sitios, los enlaces a documentos no HTML encontrados en ellos, y el tipo de dominio, donde G es de Gobierno, C de Comercial, E de Educacional y M de Medio de Comunicación. *: Se cuenta la cantidad de enlaces a documentos no HTML.

4.3. Número de páginas por dominio

En promedio, un dominio tiene 50, 57 páginas. Además, existen 45,607 dominios con una sola página, una cifra muy similar a la cantidad de sitios con una página. La distribución del número de páginas por dominio se observa en la Figura 4.4, y se ajusta a una ley de potencias de parámetro 0, 13 en su parte inicial y a una ley de potencias de parámetro 1, 54 en su parte central.


PIC

Figura 4.4: Distribución de los documentos para los dominios de la web chilena.

4.4. Tamaño de los dominios

El tamaño promedio de un dominio es cercano a los 746 KiB. La distribución del tamaño total de páginas y la fracción de los dominios se muestra en la Figura 4.5, y se ajusta a una ley de potencias con parámetros 0, 98 en su parte inicial y 1, 45 en su parte central.


PIC

Figura 4.5: Distribución del tamaño de los dominios para los dominios de la web chilena.

En el Cuadro 4.3 se muestran los 30 dominios con más contenido. La mayoría de ellos son sitios comerciales o de subastas, siguiendo la tendencia del año anterior [6]. Las mismas anomalías que producen sitios con más contenido del que verdaderamente tienen se aplican a esta tabla.





Tamaño [MiB] Dominio Tipo






3.116 turismo-viajes C
1.718 suena C
1.670 deremate C
1.586 amazon C
1.583 mercadolibre C
1.179 planetashile C
873 b2 C
863 irc C
821 lapapa C
818 hotmovies C
813 atinachile C
777 enrutators C
757 cienciaforense C
755 busch C
741 kontent C
726 vivastreet C
674 promolibros C
673 bluecompany C
669 parapentechile C
664 blogcoba C
640 gov G
630 amchamchile C
629 uchile E
626 trance C
619 sexrelatos C
617 fam C
605 shoebuy C
601 rox C
597 icoubb O
594 universitarios C

Cuadro 4.3: Dominios de mayor tamaño. Se detalla el tipo de dominio: Comercial (C), Gobierno (G), Educativo (E), Medio de Comunicación (M) u Otro (O).

4.5. Enlaces entre dominios

En el Cuadro 4.4 se muestran los 30 dominios que reciben más enlaces desde otros dominios. Nuevamente, prima la cantidad de dominios distintos por sobre el total de enlaces recibidos. En la lista se encuentran dominios del gobierno, de instituciones de educación, de comerciales, de medios de comunicación, y algunos que son marcados como “otros” por el contenido que presentan. En particular, los dominios en los puestos 2, 3 y 4 son equivalentes, tienen la misma IP y muestran los mismos sitios.






Dominios que EnlazanEnlaces Total Dominio Tipos








1.300 61.712 uchile E
906 906 nameaction O
904 904 backorder O
902 902 snapnames O
653 3.172 gov G
550 4.654 puc E
542 21.224 sii G
496 3.476 mineduc G
467 5.233 gob G
434 18.146 123 C
367 12.876 latercera M
335 2.323 meteochile G
330 1.360 bcentral G
323 1.623 udec E
293 1.263 corfo G
292 7.631 scd C
264 1.998 utfsm E
261 8.279 gobiernodechile G
257 34.471 terra C
247 1.656 sence G
232 609 conama G
214 11.073 co C
209 720 amarillas C
209 1.300 canal13 M
202 669 portalciudadano O
201 7.445 uach E
200 732 sernatur G
198 491 minsal G
197 716 ucv E
193 949 usach E

Cuadro 4.4: Dominios con mayor grado interno. Se detalla el tipo de dominio: Comercial (C), Gobierno (G), Educacional (E), Medio de Comunicación (M) u Otro (O).

Para el caso de los dominios, se desea una representación gráfica de la Web Chilena. Para esta representación se eligieron los 100 dominios más enlazados, considerando solamente aquellos que tenían sitios en la componente MAIN MAIN, con el fin de mostrar los dominios más relevantes. Esta representación1 se observa en la Figura 4.6, contiene 100 dominios representados como nodos enlazados por una línea cuyo grosor y color muestra la cantidad de enlaces entre ellos (mientras más oscuro y grueso, hay una mayor cantidad de enlaces). Los dominios se dividen en tres grupos: comerciales (rectángulos), de instituciones educacionales (elipses) y de gobierno (rombos).


PIC

Figura 4.6: Una visión gráfica de los 100 dominios más enlazados de la Web Chilena, considerando solamente aquellos dominios con sitios en la componente MAIN MAIN.

4.6. Dominios de primer nivel

La colección incluye dominios que están hospedados en IPs asignadas a Chile pero que no necesariamente corresponden al dominio nacional cl. El Cuadro 4.5 muestra como se distribuyen los dominios de primer nivel en la Web Chilena. En esta distribución se aprecia que el dominio más valorado es el dominio nacional, aunque es probable que existan otros sitios con dominios externos que estén hospedados en IPs nacionales pero de los cuales no se tenga conocimiento. Adicionalmente, en el Cuadro 4.6 se muestra la distribución de los sitios de cada componente a través de los dominios de primer nivel.







Dominio Nombre % dominios % sitios % páginas










cl comentario 99,93 % 99,64 % 97,63 %
com comentario 0,06 % 0,17 % 1,99 %
net comentario 0,01 % 0,02 % 0,01 %
org comentario 0,01 % 0,03 % 0,30 %
otro comentario 0,00 % 0,13 % 0,06 %

Cuadro 4.5: Distribución de dominios de primer nivel.









Componente Total Sitios cl com org net otro














MAIN IN 0,90 % 99,20 %0,60 %0,00 %0,20 %0,00 %
MAIN OUT 1,64 % 99,73 %0,11 %0,05 %0,00 %0,11 %
MAIN MAIN 2,21 % 99,10 %0,77 %0,04 %0,08 %0,00 %
MAIN NORM 0,90 % 99,50 %0,40 %0,00 %0,00 %0,10 %







MAIN 5,63 % 99,36 %0,49 %0,03 %0,06 %0,05 %
ISLAND 65,26 % 99,62 %0,18 %0,04 %0,02 %0,13 %
IN 9,32 % 98,70 %0,15 %0,04 %0,02 %1,09 %
OUT 10,18 % 99,11 %0,59 %0,08 %0,10 %0,12 %
TOUT 6,02 % 99,79 %0,19 %0,01 %0,00 %0,00 %
TIN 3,16 % 99,57 %0,31 %0,06 %0,00 %0,06 %
TUNNEL 0,43 % 99,58 %0,42 %0,00 %0,00 %0,00 %

Cuadro 4.6: Distribución de dominios de primer nivel por Macrocomponente

4.7. Dominios externos de primer nivel

Se encontraron más de 130.000.000 de enlaces hacia páginas de sitios externos. Los 30 dominios externos de primer nivel más referenciados se muestran en el Cuadro 4.7. Además se indica el ranking de uso de ese dominio en la Web Global [17], el nombre del dominio y el porcentaje de los enlaces que le corresponde dentro del total.







RankingRanking GlobalDominio Nombre Enlaces










1 2 com Comercial (G) 62,02 %
2 36 org Organización (G) 12,46 %
3 1 net Red (G) 3,67 %
4 7 cn China 2,99 %
5 77 info Información (G) 2,83 %
6 28 ar Argentina 2,15 %
7 4 de Alemania 1,40 %
8 12 mx México 1,25 %
9 21 es España 1,16 %
10 11 br Brazil 0,65 %
11 82 biz Negocio (G) 0,62 %
12 29 us Estados Unidos 0,61 %
13 13 uk Inglaterra 0,56 %
14 69 ve Venezuela 0,53 %
15 8 edu Educacional (G) 0,43 %
16 87 ec Ecuador 0,37 %
17 41 co Colombia 0,33 %
18 5 it Italia 0,33 %
19 63 pe Perú 0,31 %
20 60 uy Uruguay 0,29 %
21 127 pa Panamá 0,29 %
22 111 cr Costa Rica 0,27 %
23 74 do Rep. Dominicana0,26 %
24 14 pl Polonia 0,24 %
25 6 fr Francia 0,23 %
26 20 dk Dinamarca 0,20 %
27 9 nl Holanda 0,19 %
28 22 ch Suiza 0,17 %
29 18 se Suecia 0,15 %
30 19 be Bélgica 0,15 %

Cuadro 4.7: Fracción de enlaces a los 30 dominios externos más referenciados.

La Figura 4.7 muestra la distribución de los enlaces a los dominios externos, que se ajusta a una ley de potencias de parámetros 1, 75 en su parte inicial y 5, 86 en su parte central. Una observación importante es que el gráfico continúa más allá del total de dominios válidos por la presencia de errores de tipo en los nombres de dominio.


PIC

Figura 4.7: Distribución de los enlaces externos para los dominios de la web chilena.

La cantidad de enlaces externos puede ser relacionada con el intercambio comercial [4]. En la Figura 4.8 se muestra la relación entre los enlaces a dominios externos y las exportaciones e importaciones de Chile. Tal como lo muestran los diagramas, hay una relación significativa entre el número de enlaces y el intercambio comercial, en particular en las exportaciones, donde el número de enlaces y el volumen de intercambio tiene una correlación de 0, 62. Los países orientales son los que más se alejan de la recta que modela la relación, como es el caso de China, Japón, Korea y Taiwán. En general se observa que los países más alejados son aquellos que no tienen como lengua oficial el idioma inglés. Una aproximación realizada es la siguiente: para el dominio de Estados Unidos se incluyó el dominio .com, lo que no es del todo exacto ya que dicho dominio contiene sitios de una gran cantidad de naciones.


PIC
PIC

Figura 4.8: Relación entre el intercambio comercial internacional y los enlaces salientes de la Web Chilena.