Статистика web-сайта, подходы и выбор.
В данной статье мы попытаемся рассмотреть задачи определенной группы владельцев сайтов. Итак, пусть это будет следующий сайт:
- небольшая или средняя суточная загрузка - до 5 тыс. хостов (примерно 15-20 тыс. загрузок страниц);
- сайт использует БД и динамическое формирование страниц (связка Apache+PHP+MySQL);
- команда обслуживания сайта 1-5 человек;
- команда обслуживания являлась разработчиком движка сайта или активно участвовала в разработке, доработке и т.д.
Ни для кого не будет секретом, что под это описание попадает не менее 80 процентов вообще всех сайтов Рунета. Если к сайту при его создании и сопровождении подходят ответственно, то перед разработчиками обязательно ставятся следующие вопросы:
- для чего делается сайт?
- для кого делается сайт?
- что будет на сайте?
Если Ваши ответы на эти вопросы будут - для галочки, для начальства, что-нибудь нароем - эта статься не для Вас. Хотя...
Если же данные вопросы будут решены по совести, то следующим вопросом будет:
- ну, как там дела?
На этот вопрос многие, и следует отметить совершенно справедливо, хотят получить ответ с помощью статистики. Вот только статистика разная бывает. Для web-сервера и для web-сайта.
Статистика для администратора web-сервера.
Бывает, например статистика работы web-сервера - это фактически логи сервера, а также различные обработчики логов помогающие узреть основные детали. Данный вариант часто предлагается хостинговыми компаниями. В качестве исходников берут логи web-сервера Apache, настраивают их посуточную архивацию (или используют ротацию для экономии места на диске) и натравливают на логи обработчик - например небезызвестный analog.
- Это решение подходит для администратора web-сервера - можно укрупнено рассматривать тенденции загрузки сервера, трафика, ошибки, при желании можно мануально докопаться до самой распоследней строчки лога и выявить, например, ошибку.
- Это решение подходит для хостинг компаний - дешево (бесплатно) и сердито (ресурсов требуется самый минимум, а сервис вроде как и предоставлен).
- Это решение подходит для построения псевдонаучных отчетов для начальства (распределения по дням недели и т.д. ну в общем вы понимаете...).
- Это решение подходило 5-10 лет назад, когда анализ загрузок файлов по каталогам в принципе мог дать картину спроса на некоторую тему (при условии, что на сайте для каждого раздела, статьи и пр. есть свой каталог).
НО! Это решение совершенно не подходит для сегодняшних реалий. Оно не дает информации об изменениях, невозможно проследить спрос к контенту, корректно отследить путь каждого пользователя и т.д. На самом деле решение обработчика лога не может дать вообще никакой информации для контент-менеджера, для тех кому интересен именно каждый посетитель и его запросы. Нужна статистика web-сайта.
Статистика для контент-менеджера web-сайта.
Для многих проблема сбора статистики посещаемости web-сайта решается очень просто - будем использовать внешний счетчик. Благо есть масса решений, платных и бесплатных, навороченных и ограниченных минимумом. На наш взгляд использование внешнего счетчика имеет только одно важное преимущество - для его внедрения в сайт не нужна высокая квалификация администратора - это просто и быстро. Все остальное у внешних счетчиков плохо. Это и цена (получается весьма дорого, например за средний сайт можно заплатить соразмерно оплате за сам хостинг), и недостаточная точность. В общем, использовать внешние счетчики можно, это как бы независимый показатель посещаемости сайта, это как бы модно, это включение в рейтинги (естественно, есть смысл попадать только на первые страницы).
Нужна своя программа получения он-лайн статистики по посетителям и контенту. Сейчас появилось несколько программ удовлетворяющих указанным вначале текста условиям. Все они функциональны и рабочие, но мы подробнее остановимся на CNStats. Легкая инсталляция, быстрый запуск в работу. Если надо считать cookie используем графический счетчик, но авторами рекомендуется использовать php include. Все отчеты генерятся на лету, на фактически любой отчет можно наложить фильтр. Например, отчет по реферерам, накладываем фильтр "Английский язык" - получаем всех рефереров у которых язык в браузере выставлен английский. Уникальный отчет страны делается по базе принадлежности IP адресов, рисуется соответственно раскрашенная карта мира. Нажимаем на IP адрес и получаем его RIPE данные, нажимаем еще раз, получаем персональный для этого IP лог - все страницы которые последовательно просмотрел пользователь. В общем, CNStats это то, что надо для анализа работы именно статистики посещений сайта и его посетителей.
Заключение
CNStats отличается от Analog как Visual C от assembler. При этом каждый выполняет свою важную задачу, главное правильно понять какая именно нужна статистика - по контенту и посетителям сайта или по работе сервера.
- Официальный сайт Analog - http://www.analog.cx/
- Пример статистики Analog - http://www.chiark.greenend.org.uk/~sret1/stats/
- Официальный сайт CNStats - http://www.cn-software.com/
- Пример статистики CNStats - http://stats.poleznoe.ru/cnstats/
Оставить комментарий
Комментарии
Также обращу внимание на начало статьи - заранее ограничивались сайты для которых собирается статистика.
Хочу добавить еще очень красивая вещь AWStat
http://awstats.sourceforge.net/
Может то же что и CNStats, кроме отправки отчетов по почте и онлайн конфигурирования.
Плность FreeWare.
WebTrends конечно покруче CNStats будет, но и дороже.
вот прочел статью и могу добавить от себя.
Занимаюсь анализом посетителей, контента и прочего с помощью программы Web Trends. Главное знать, чего от нее можно получить и как настроить, а в настройках она настолько гибкая, что не каждый может себе представить.
Минусы спросите? Конечно есть, платная она, но ломаная версия тоже присутствует, вернее с серийным номером.