Статистика по веб-страницам
Рунета
Евгений Трофименко
12 июня 2002
В июне 2002 проводилось
исследование статистики документов в
Рунете. Первоначальная выборка страниц
была получена из данных Яндекса
по запросу $anchor(www), т.е., все страницы, на
которых в тексте ссылки встречается слово www.
Всего около 18 тыс. документов.
Из этого набора случайным образом
выбрано 1783 страницы, ограничение по
размеру ответа - до 100кБ. Статистика
приводится ниже-
Всего страниц получено:
|
1783
|
Битые линки (read timeout не
включены):
|
153 (7.9%)
|
Средний размер документа (брутто):
|
17.3 кБ
|
Среднее количество текста (без
тегов, без HEAD, script):
|
6.0 кБ (36.3%)
|
Средний размер title:
|
72 символа
|
Средний размер keywords:
|
83 символа
|
Средний размер description:
|
16 символов
|
Среднее число картинок+медиа:
|
24
|
Среднее число mailto:
|
2.3
|
Среднее число внутренних
ссылок:
|
19.5
|
Среднее число исходящих
ссылок:
|
18.5
|
Внутренние ссылки на JS:
|
1.9%
|
Исходящие ссылки на JS:
|
1.3%
|
Фреймы с внутренними
документами:
|
0.9%
|
Фреймы с внешними
документами:
|
8.9%
|
Слои с внутренними
документами:
|
0.5%
|
Слои с внешними документами:
|
0.7%
|
Не все документы содержали
описания, заголовки и графику.
Непустой title:
|
96.6% документов
|
Непустой keywords:
|
27.0% документов
|
Непустой description:
|
11.2% документов
|
Есть картинки:
|
85.6% документов
|
Что интересно:
Среднее число ссылок на странице -
около 40, при этом половина ссылок -внешние.
Это очень много. Вполне возможно, что в эту
статистику внесли большой вклад страницы
различных гостевых книг (или любых
каталогов ресурсов), на которых много
внешних ссылок, записанных голым URL. Если
из выборки убрать половину страниц (с
большим количеством исходящих ссылок), то
по оставшемуся набору-
Среднее число внутренних
ссылок:
|
15.6
|
Среднее число исходящих
ссылок:
|
5.6
|
Также интересно, что средний
размер текста составляет всего 6 кБ, таким
образом, только около трети документа -
полезная информация, и 2/3 - разметка.
Источник: http://promosite.ru/
|