Ложь, наглая ложь и статистика
Нам никогда не узнать всей правды о посетителях наших сайтов. Все, что мы имеем благодаря счетчикам - только общая картина, а не точные данные.
Идея написать пост на эту тему у меня появилась после того, как я прочитал на форуме для веб-аналитиков - не помню, каком, сорри - жалобы участника. Он все хотел выяснить, почему у него скачет показатель посещаемости и сколько на самом деле человек заходит на его сайт: 56, 78 или 44.
Увы и ах, в веб-аналитике 100% точность пока недостижима. Хотите узнать, почему? Предлагаю хит-парад самых главных причин.
Но сначала, как водится, немного теории. Веб-аналитика, даже самая мудреная, базируется на ограниченном количестве простых вещей: подсчете числа посетителей, посещений и времени, проведенном на сайте.
Все сложнейшие графики покоятся на этих трех китах. Реклама в интернете, в общем, тоже. Если вы запускаете контекстную рекламу, то платите Google, Yandex или Бегуну за визит (PPC) или за посещение определенных страниц (PPA).
Справка: PPC (Pay per Click) - плата за клик (по баннеру или тексту рекламы) и, соотвественно, загрузку посадочной страницы вашего сайта;
PPA (Pay per Action) - плата за выполнение посетителем сайта определенного действия. А что такое действие на сайте, как не посещение \ загрузка каких-то конкретных страниц?
Ошибки в статистике имеют три причины: сама природа интернет-технологий, обычное поведение человека на сайте и современный уровень развития сервисов статистики. Сегодня перечислю факторы, которые относятся к первой причине - интернет-технологиям. Поехали!
Сколько кошек в темной комнате?
Стандарты веб-метрики формирует международная организация JICWEBS. По ее правилам, уникальный посетитель сайта - это сочетание IP-адреса и данных приложения User Agent, которое определяет броузер и операционную систему визитера. В идеале, если на сайт три раза зашли с одними и теми же показателями IP, версии броузера и оперативки - то это был один и тот же человек с тремя визитами. На практике все сложнее.
Во многих компаниях сотрудники выходят в сеть с одного IP-адреса, пользуются одним и тем же броузером и оперативной системой. Все 15 дам из бухгалтерии, которые решили зайти на сайт вашего скромного магазинчика, будут засчитаны как одна, но очень настойчивая посетительница.
Зато дома многие пользуются благами динамического IP, и три посещения от одной и той же персоны будут учтены как три уникальных посетителя.
Чтобы решить проблему, сервисы статистики используют файлы cookies. Но люди часто блокируют или удаляют cookies. Например, я регулярно проверяю систему на наличие шпионских программулек, которые постоянно лезут из интернета. Вместе с ними за компанию удалаются и старые cookies.
Есть интересное наблюдение: чаще всего cookies удаляют или блокируют пользователи Unix, реже всех - Mac. Также, чем выше техническая и компьютерная грамотность посетителя, тем менее благосклонен он к cookies. Если ваш сайт привлекает именно эту аудиторию, проверьте, не слишком ли много у вас уникальных визитов, и слишком мало повторных. (:
Сказка о пропавшем времени
Если бы за статистику взялись швейцарцы, мы имели бы самые точные данные о времени, которое проводит посетитель на сайте. Но швейцарские часовщики пока радуют только оффлайн.
В недавней статье о показателе отказов я говорил, что система неспособна подсчитать время, проведенное посетителем на сайте, если он просмотрел только одну страницу, а потом ушел на другой сайт или у него отключили электричество.
Если человек посмотрел 1-2-3-4 страницы, то статистика посчитает так: 1 стр. (2 мин.) + 2 стр. (0,45 сек) + 3 стр. (15 мин.) + … все, ноль. Итого, 17 мин. 45 сек. А ведь на 4-й страничке человек мог провести остаток жизни, ведь она-то, вполне возможно, и есть та самая, заветная целевая. Ради нее он и пришел к вам.
В общем, не унывайте, если статистика усердно фиксирует малое количество времени. На моем блоге оно равняется от 2-х до 6 мин в день. Для блогов такой показатель в норме вещей: ведь люди обычно читают только последние статьи на главной странице.
На закуску такой совет:
Не пытайтесь выяснить точное количество посещений и времени на сайте. Сконцентрируйтесь на тенденции. Например, изучайте показатели раз в месяц, чтобы понять в какую сторону развивается график и с какой скоростью.
Не так уж много типов сайтов, которым полезно знать точные цифры. К таким можно отнести интернет-магазины. Вот им, действительно, полезно учитывать “проходимость”. Для блогов точность не важна: 85 или 96 посетителей серьезно картину не поменяют.
На этом все об органических недостатках интернет-технологий. Продолжение будет в следующем посте.
_________________________________
Если вам понравилась статья и вы хотите упустить продолжение, подпишитесь на обновления RSS или получайте новые статьи по электронной почте.




Add New Comment
Viewing 2 Comments
Thanks. Your comment is awaiting approval by a moderator.
Do you already have an account? Log in and claim this comment.
Do you already have an account? Log in and claim this comment.
Do you already have an account? Log in and claim this comment.
Add New Comment
Trackbacks
(Trackback URL)
5 Октябрь 2008 at 16:12
[...] Похожие статьи: 1. Где же подобрать ключи, когда нет отмычки? 2. Настольная книга для анализа сайта. 3. Веб-аналитика: вопрос ...