access.log или журнал доступа предназначен для отображения подключений к серверу и заключает в себе функцию — статистика. Но если посмотреть на размер этого файла, который иногда создает не мало проблем, то он вызывает сомнения, а только ли статистика?
Файл access.log – это текстовый файл, в котором одна строка отображает одно подключение к серверу, например запись вида
127.0.0.1 — frank [10/Oct/2012:13:55:36 -0700] «GET /apache_pb.gif HTTP/1.0» 200 2326 «http://URL/start.html» «Mozilla/4.08 [en] (Win98; I ;Nav)»
будет свидетельствовать о том, что с IP-адреса 127.0.0.1 десятого октября (10/Oct/2012:13:55:36 -0700) с помощью GET –метода было осуществлено обращение к файлу apache_pb.gif. На первый взгляд, все очень просто и чем такая информация может быть полезна? Чтобы ответить на этот вопрос, предоставим полный формат строки
%h %l %u %t \»%r\» %>s %b \»%{Referer}i\» \»%{User-Agent}i\»
И теперь разложим по полкам
*
%h
– это хост или IP-адрес, с которого осуществлялся запрос (в данном случаи 127.0.0.1)
*
%l
– «дефис», который свидетельствует о том, что некоторая запрашиваема часть информации является недоступной
*
%u
– идентификатор запрашиваемого объекта (frank)
*
%t
– переменная, что указывает время запроса к серверу и его часовой пояс ([10/Oct/2012:13:55:36 -0700])
*
%r
—с помощью этой переменной происходит идентификация типа запроса (GET), его содержимое (apache_pb.gif) и версия (HTTP/1.0)
*
%>s
— код состояния HTTP, который свидетельствует о состоянии выполнения запроса. Как правило, такой код отображается с помощью трех цифр (о этом подробнее поговорим в материале —
Анализ кода состояния HTTP
) и если первая из них 2хх – все хорошо, запрос выполнен (200)
*
%b
— объем переданной сервером информации в байт-ах (2326)
*
%{Referer}
— URL-источник запроса (http://URL/start.html)
*
%{User-Agent}
— HTTP-заголовок, содержащий информацию о запросе (клиентское приложение, язык и т. д.)
Что делать, если размер access.log (журнала доступа) растет не по часам, а по минутам?
Ни в коем случаи не удаляйте! Иначе, если удалить этот журнал доступа может нарушится работа сайта, что в первую очередь будет вызвано нарушением ротацией логов. Чтобы этого избежать нужно произвести настройку логов, их ротации. Как это сделать? Рассмотрим на примере Хостинга 4tal, который (как и большинство) использует панель управления ISРmаnаgеr.
В панели управления ISРmаnаgеr в разделе www-дoмeны” ищем кнoпку “Рoтaция лoгoв”. Необходимо отметить, что в ISРmаnаgеr существует свой механизм poтации лoгoв — задача rоtаtе в сrоntаb пользователя rооt. Данная задача рабoтaeт eсли она запускаться c 00 дo 01 чacoв и основная задача ее заключается в формировании логов и запуске скрипта cтaтиcтики wеbstаt, файл настройки которого можно отыскать
/usr/lоcаl/isрmgr/еtс/rоtаtе.соnf
.
Если же лог по-прежнему растет как на дрожжах — обнулите его
/dеv/null /hоmе/httрd-lоgs/site-URL.еrrоr.lоg