Behind the Screen

Маркетинг по другую сторону экрана

}

Avatar

Профессиональный блог о маркетинге, рекламе и PR в интернете.
Я разбираю важные "мелочи", которые нужны бизнесу для развития
с помощью сети. Читайте. Пробуйте. Делитесь.
Зарабатывайте.

Ложь, наглая ложь и статистика-2

Продолжаю хит-парад факторов, которые заставляют статистику наших сайтов безбожно лгать. В первой части Марлезонского балета я станцевал на тему природы интернет-технологии, которая не позволяет статистическим данным быть абсолютно точными.
Сегодня предлагаю перечень факторов, связанных с коренными недостатками программ и сервисов статистики, а также поведением посетителей.

Логи
Технически подкованные владельцы сайтов и блогов любят использовать записи логов для сбора статистики. Кто-то считает этот способ особо “продвинутым”, для знатоков.

Справка: Лог (log) - файл с записями в хронологическом порядке происходящих в системе событиях.

На самом деле статистика, собираемая с логов, отличается низким уровнем точности. Если вы опираетесь на записи в логах, то упускаете из виду часть активности на сайте. Почему?

1. Броузеры умеют сохранять в памяти (кэше) загруженные нами страницы. Когда мы нажимаем кнопку “Назад”, что предыдущая страничка загружается из кэша, т.к. сообразительный броузер не хочет снова тратить время на запрос этого содержания у сервера. Как следствие, сервер ничего не знает о повторной загрузке страницы, а в логах не отображается соответствующая запись.
Кстати в интернет-рекламе проблема кэширования также существует. Если посетитель вновь посмотрел рекламу на загруженной из кэша странице, то владелец ресурса не получит за этот показ ни копейки. Все по той же причине: сервер не зафиксировал показа. Если представить, сколько людей и сколько раз в день “пятиться назад”, можно оценить потери от неоплаченных показов.
Кстати, кэшируют не только броузеры. Оно может происходить по инициативе провайдера, или так может работать внутренняя корпоративная сеть.

2. На страничке могут находиться файлы в формате .swf (флэш). Также страничка может целиком представлять собой файл .swf. В большинстве случаев каждый просмотр флэш-элемента фиксируется как просмотр отдельной страницы. Если на вашем сайте много флэша, то вы найдете в логах сильно искаженные данные.

3. Регулярно наши сайты посещают роботы поисковых сервисов, и чем чаще это происходит, тем радостнее нам. В логах вы не сумеете разобрать, какие посещения сайта инициированы человеком (то, что нам нужно), а какие роботом (это не учитываем). Если ориентироваться на логи, то количество посещений сайта будет казаться большим, чем есть на самом деле. И чем чаще обновляется сайт, тем чаще его посещают роботы, тем заметнее искажение.
Роботы просматривают сайт со скоростью 1 стр. = 1 сек., что также отображается на статистике: снижается среднее время пребывания на сайте при увеличении среднего числа просмотренных страниц.

Сервисы статистики
Специализированные программы, такие как Google Analytics, собирают данные на основе просмотра страницы. Т.е. им все равно, пришла она от сервера, или загружена из кэша. По-моему мнению, установка кода сервиса статистики - один из первых шагов при запуске нового сайта. Он даст более подробные и точные сведения. Однако и здесь есть свои минусы.

1. Своя проблема с кнопкой “Назад” есть и у специализированных программ. Некоторые люди уходят с сайта, несколько раз нажав эту кнопку. Понятно, что загружаются старые страницы из кэша, и в логах такие недо-визиты не были бы засчитаны. Однако программа их не пропустит.
Если таких бросков назад будет несколько в день, то статистика покажет большее количество просмотренных страниц с меньшим количеством проведенного на них времени.
Если ваш сайт содержит многостраничную форму для заполнения, или многостраничный тест - то таких переходов туда-сюда будет много. Человек может вернуться назад, чтобы вспомнить предыдущий шаг или еще раз проверить правильность внесенных данных.

2. Поведение пользователя также влияет на статистику. Cookies известных сервисов отслеживания статистики некоторые антивирусы включают в списки шпионских программ (spyware). Если антивирус не заблокировал куки, то это сознательно может сделать сам пользователь. Также многие регулярно удаляют такие файлы. Я сам позвчера удалил 173 старых cookies.
Если вам очень важно оценить уровень повторных визитов, проблема с кукис исказит статистику. К первой части статьи Дмитрий Баканев оставил комментарий, в котором справедливо отметил, что кукис удаляют и блокируют очень немногие.
Но специалист по веб-аналитике не станет изучать среднюю температуру по больнице, а обязательно учтет целевую аудиторию сайта. Есть низкие группы риска (домохозяйки), есть высокие (IT-шники).

3. При клике на ссылку посетитель сайта может попасть на другую страницу, а может и нет. Либо он передумал, либо броузер “заглючил”, и страничка не открылась.
Проблема с “оборванным полетом” сказывается на рекламе, т.к. в таких случаях сервисы контекстной рекламы (тот же Google) снимут с вас деньги за совершенный клик. Состоялся визит или нет - в данном случае, их это не волнует. В статистике такое “посещение”, скорей всего, не будет учтено.

_________________________________

Если вам понравилась статья, подпишитесь на обновления RSS или получайте новые статьи по электронной почте.

_________________________________

Также советую прочитать другие статьи о веб-аналитике.



compass
Рубрики: Веб-аналитика, Программы и сервисы
compass
Ключевые слова: , , ,




Ложь, наглая ложь и статистика

Нам никогда не узнать всей правды о посетителях наших сайтов. Все, что мы имеем благодаря счетчикам - только общая картина, а не точные данные.

Идея написать пост на эту тему у меня появилась после того, как я прочитал на форуме для веб-аналитиков - не помню, каком, сорри - жалобы участника. Он все хотел выяснить, почему у него скачет показатель посещаемости и сколько на самом деле человек заходит на его сайт: 56, 78 или 44.
Увы и ах, в веб-аналитике 100% точность пока недостижима. Хотите узнать, почему? Предлагаю хит-парад самых главных причин.

Но сначала, как водится, немного теории. Веб-аналитика, даже самая мудреная, базируется на ограниченном количестве простых вещей: подсчете числа посетителей, посещений и времени, проведенном на сайте.
Все сложнейшие графики покоятся на этих трех китах. Реклама в интернете, в общем, тоже. Если вы запускаете контекстную рекламу, то платите Google, Yandex или Бегуну за визит (PPC) или за посещение определенных страниц (PPA).

Справка: PPC (Pay per Click) - плата за клик (по баннеру или тексту рекламы) и, соотвественно, загрузку посадочной страницы вашего сайта;
PPA (Pay per Action) - плата за выполнение посетителем сайта определенного действия. А что такое действие на сайте, как не посещение \ загрузка каких-то конкретных страниц?

Ошибки в статистике имеют три причины: сама природа интернет-технологий, обычное поведение человека на сайте и современный уровень развития сервисов статистики. Сегодня перечислю факторы, которые относятся к первой причине - интернет-технологиям. Поехали!

Сколько кошек в темной комнате?
Стандарты веб-метрики формирует международная организация JICWEBS. По ее правилам, уникальный посетитель сайта - это сочетание IP-адреса и данных приложения User Agent, которое определяет броузер и операционную систему визитера. В идеале, если на сайт три раза зашли с одними и теми же показателями IP, версии броузера и оперативки - то это был один и тот же человек с тремя визитами. На практике все сложнее.
Во многих компаниях сотрудники выходят в сеть с одного IP-адреса, пользуются одним и тем же броузером и оперативной системой. Все 15 дам из бухгалтерии, которые решили зайти на сайт вашего скромного магазинчика, будут засчитаны как одна, но очень настойчивая посетительница.
Зато дома многие пользуются благами динамического IP, и три посещения от одной и той же персоны будут учтены как три уникальных посетителя.

Чтобы решить проблему, сервисы статистики используют файлы cookies. Но люди часто блокируют или удаляют cookies. Например, я регулярно проверяю систему на наличие шпионских программулек, которые постоянно лезут из интернета. Вместе с ними за компанию удалаются и старые cookies.
Есть интересное наблюдение: чаще всего cookies удаляют или блокируют пользователи Unix, реже всех - Mac. Также, чем выше техническая и компьютерная грамотность посетителя, тем менее благосклонен он к cookies. Если ваш сайт привлекает именно эту аудиторию, проверьте, не слишком ли много у вас уникальных визитов, и слишком мало повторных. (:

Сказка о пропавшем времени
Если бы за статистику взялись швейцарцы, мы имели бы самые точные данные о времени, которое проводит посетитель на сайте. Но швейцарские часовщики пока радуют только оффлайн.
В недавней статье о показателе отказов я говорил, что система неспособна подсчитать время, проведенное посетителем на сайте, если он просмотрел только одну страницу, а потом ушел на другой сайт или у него отключили электричество.
Если человек посмотрел 1-2-3-4 страницы, то статистика посчитает так: 1 стр. (2 мин.) + 2 стр. (0,45 сек) + 3 стр. (15 мин.) + … все, ноль. Итого, 17 мин. 45 сек. А ведь на 4-й страничке человек мог провести остаток жизни, ведь она-то, вполне возможно, и есть та самая, заветная целевая. Ради нее он и пришел к вам.

В общем, не унывайте, если статистика усердно фиксирует малое количество времени. На моем блоге оно равняется от 2-х до 6 мин в день. Для блогов такой показатель в норме вещей: ведь люди обычно читают только последние статьи на главной странице.

На закуску такой совет:
Не пытайтесь выяснить точное количество посещений и времени на сайте. Сконцентрируйтесь на тенденции. Например, изучайте показатели раз в месяц, чтобы понять в какую сторону развивается график и с какой скоростью.
Не так уж много типов сайтов, которым полезно знать точные цифры. К таким можно отнести интернет-магазины. Вот им, действительно, полезно учитывать “проходимость”. Для блогов точность не важна: 85 или 96 посетителей серьезно картину не поменяют.

На этом все об органических недостатках интернет-технологий. Продолжение будет в следующем посте.
_________________________________

Если вам понравилась статья и вы хотите упустить продолжение, подпишитесь на обновления RSS или получайте новые статьи по электронной почте.



compass
Рубрики: Веб-аналитика, Программы и сервисы
compass
Ключевые слова: , , ,




 / 

Скачайте


Электронная книга. "Блоггинг, словарь терминов и понятий. Советы для начинающих". Формат .pdf, 332 Kb


Также скачивайте:

- Советы по созданию раздела "Для прессы" на сайте.

514 Kb, .pdf



Ставим на паузу

Фотографии из путешествий

Мюнхен. Пивная "Haufbrauhaus".