Полная статистика посещений
Источник: www.newspc.net
Сегодня, даже далеко не все платные хостинг-компании предоставляют полную статистику посещений вашего сайта - что уж говорить о бесплатных. Разумеется, можно воспользоваться бесплатными сервисами, типа HotLog (например, счетчики чуть левее текста), однако более качественные услуги стоят дорого. Можно создать свою статистику, практически без труда, для этого нужно написать всего пару строчек кода. Ну что ж, приступим...
Доступ к лог-файлам сайта есть не везде, а хочется все-таки просмотреть логи, проблема решаема - пишем скрипт для создания своих лог-файлов. На вооружение возьмем два метода - с использованием сессий - в логе остается лишь одна запись - и без - остается запись после каждого нового хита пользователя. Для хранения мы будем использовать обчычные текстовые файлы.
Метод первый с использованием сессий:
<?php
session_start();
if(!session_is_registered('counted')){
$agent = $_SERVER['HTTP_USER_AGENT'];
$uri = $_SERVER['REQUEST_URI'];
$user = $_SERVER['PHP_AUTH_USER'];
$ip = $_SERVER['REMOTE_ADDR'];
$ref = $_SERVER['HTTP_REFERER'];
$dtime = date('r');
if($ref == ""){
$ref = "None";
}
if($user == ""){
$user = "None";
}
$entry_line = "$dtime - IP: $ip | Agent: $agent | URL: $uri
| Referrer: $ref | Username: $user n";
$fp = fopen("logs.txt", "a");
fputs($fp, $entry_line);
fclose($fp);
session_register('counted');
}
?>
Теперь давайте пройдемся по отдельным частям кода:
session_start();
Здесь мы запускаем механизм сессий, эта строчка просто необходима, ведь в представленном примере мы будем вести учет пользователей, "не учтенных" сессией.
if(!session_is_registered('counted')){
Здесь мы проверяем существует ли сессия с именем 'counted', если нет, то выполняем идущий за этой строкой код.
$agent = $_SERVER['HTTP_USER_AGENT'];
$uri = $_SERVER['REQUEST_URI'];
$user = $_SERVER['PHP_AUTH_USER'];
$ip = $_SERVER['REMOTE_ADDR'];
$ref = $_SERVER['HTTP_REFERER'];
$dtime = date('r');
А вот уже в этом куске кода мы объявляем список переменных, которые в свою очередь обращаются к глобальным переменным, пожалуй, не стоит описывать работу всех их, лишь скажу о функциях оных.
- $_SERVER['HTTP_USER_AGENT'] - расскажет нам в логе о том, каким браузером и ОС пользуется юзер.
- $_SERVER['REQUEST_URI'] - поведает о том, с какой страницы была произведена запись, можно также составить статистику наиболее популярных для входа страниц.
- $_SERVER['PHP_AUTH_USER'] - работает, только, если у вас на сайте есть регистрация и пользовательские аккуанты - запишется имя пользователя.
- $_SERVER['REMOTE_ADDR'] - ну здесь по-моему все понятно - определяется ip пользователя
- $_SERVER['HTTP_REFERER'] - очень удобная вещь - с помощью нее мы узнаем откуда пришел пользователь, и узнаем о сайтах, поместивших на нас ссылку.
- date('r') - записывается время в стандартно формате.
f(!$ref){
$ref = "Нет";
}
if(!$user){
$user = "Нет";
}
Если человек пришел на ваш сайт, просто набрав в адрестой строке браузера ваш адрес и он не зарегистрирован, то в этом случае в логе будет записано "нет".
$entry_line = "$dtime - IP: $ip | Agent: $agent | URL: $uri
| Referrer: $ref | Username: $user n";
$fp = fopen("logs.txt", "a");
fputs($fp, $entry_line);
fclose($fp);
session_register('counted');
В последнем куске кода - мы записываем соответствующую информацию в файл logs.txt. Все скрипт статистики готов!
Способ второй - без использования сессий.
Во втором способе мы не будем использовать сессии, то есть каждый хит пользователя будет заносится в ваш лог файл. Если посещаемость вашего ресурса высока - то не советую применять этот способ, хотя с помощью него вы получаете полную картину посещаемости вашего сайта.
<?php
$agent = $_SERVER['HTTP_USER_AGENT'];
$uri = $_SERVER['REQUEST_URI'];
$user = $_SERVER['PHP_AUTH_USER'];
$ip = $_SERVER['REMOTE_ADDR'];
$ref = $_SERVER['HTTP_REFERER'];
$dtime = date('r');
if($ref == ""){
$ref = "None";
}
if($user == ""){
$user = "None";
}
$entry_line = "$dtime - IP: $ip | Agent: $agent | URL: $uri
| Referrer: $ref | Username: $user n";
$fp = fopen("logs.txt", "a");
fputs($fp, $entry_line);
fclose($fp);
?>
Практически тоже самое, что и в первом способе - поэтому останавливаться на нем мы не будем.
Данный скрипт можно модернизировать таким образом, чтобы, например, каждые 24 часа - информация из него отсылалась владельцу ресурса, а сам он очищался, но это уже совсем другая история...
Оставить комментарий
Комментарии
Поле User-Agent многие подменют, особенно это касается Download менеджеров.
А даже 1 из 1000 способен изрядно попортить статистику.
я думаю, что было бы целесообразно фильтровать роботов по юзер-агенту перед включением сессии и учетом их в статистике, ну или на крайняк делать для них отдельный лог :)
по поводу формата лога:
$entry_line = "$dtime - IP: $ip | Agent: $agent | URL: $uri
| Referrer: $ref | Username: $user \\n";
если у вас " | " такой сепаратор, то я думаю следует проверить сначала его отсутсвие в переменных $agent, $uri & $ref (он может автоматически декодироваться из %HH в символы) и $user
Вот и приходится выбирать.
Вообще пример достаточно примитивный. Большу часть того что здесь написано можно получить с помощью Webalizer
ps
по моему скрипт без сессий бесполезен, его статистика не отображает реальной картины.