веб-журнал

Отслеживание просмотров веб-страниц и сайтов

Чтение веб-журналов. Общий формат журнала и комбинированный формат журнала.

Почти с того дня, как была изобретена Web сеть, люди хотели отслеживать информацию о страницах просмотров, о компьютерах и пользователях, запрашивающих информацию именно с их сайтов. Эта информация хранится на веб-сервере в одном из двух форматов:

Общий Формат

Регистрации (CLF) является довольно общей формой ведения журнала веб-сервера. Он отслеживает 7 различных элементов веб-транзакций. Каждый запрос записывается в одну строку, с различными элементами запроса через пробел (пункты в кавычках или квадратных скобках считаются одним пунктом), а также сведения, которые не отправляются — они указаны в качестве дефиса или тире (-):

На удаленном хосте:
— Хост или IP-адрес компьютера, запрашивающего веб-страницы.
— Имя пользователя клиента
— Имя пользователя на клиентском компьютере (определяется RFC 1413), предполагая, что веб-сервер отслеживает за эту информацию.
— Прошедшие проверку имя или логин пользователя

Если клиент проходит проверку подлинности, чтобы получить доступ к страницам, то имя пользователя будет записываться в журнал (но не пароль). Также будут записаны дата и время получения запроса.

Будет отображен и реальный запрос HTTP линии, как оно было отправлено с компьютера клиента.

Вы увидите и строку — Статус. Статус относится к HTTP коды статуса указывает, если запрос был успешным и так далее.
Б — число байт, которые были отправлены в ответ с сервера.
Вот как запись в журнале может выглядеть для этой веб-страницы в общий формат журнала:

10.1.1.1 — [08/Feb/2004: 5:37:49 -0800] «GET / CS / loganalysistools / / aaloganalysis.htm HTTP/1.1» 200 2758

Комбинированный формат журнала

Тем не менее, вы быстро обнаружите, что некоторые элементы отсутствуют в CLF. Но веб-разработчикам необходимо знать дополнительные параметры, чтобы обеспечить лучший сервис для своих клиентов. Комбинированный формат журнала использует общий формат журнала, но добавляет два пункта в конце:

Referrer — URL страницы, которая связана с запрашиваемым документом.
User-агент — название и версия браузера или другого клиентского программного обеспечения, делающего запрос.
Вот как запись в журнале может выглядеть запись для этой веб-страницы в комбинированном формате:

10.1.1.1 — [08/Feb/2004: 5:37:49 -0800] «GET / CS / loganalysistools / / aaloganalysis.htm HTTP/1.1» 200 2758 «http://www.d-zen.ru/» «Mozilla/7.0 (совместимый; MSIE 6.0, Windows XP, ЕПК 3.0.2)»

Использование веб-журнала

Большинство веб-серверов ведут записи веб-журналов в одном из двух упомянутых выше форматов. Это означает, что многие инструменты анализа журналов совместимы, чтобы работать в обоих форматах. Хотя вполне возможно, разработчикам веб сайтов придется настроить сервер для получения нужного формата и в том случае если они планируют использовать инструмент для анализа логов. Если вы обычный пользователь, то вы не должны ничего менять.

Добавить комментарий