Как работают инструменты аналитики

0
225

Как работают инструменты аналитики

Мы написали уже много постов по аналитике веб сайтов, но никогда не затрагивали тему того, как работает аналитика. Думаю, пора восполнить этот пробел, поэтому сегодня я перевела статью ведущего эксперта в области цифровой аналитики Джастина Кутрони о том, как работают инструменты аналитики. Эта статья многое расставляет по полочкам и делает понятным.

Хиты, сессии, пользователи: понимание аналитики. Мы говорим о данных каждый день: сессии, визиты, конверсии, страницы, хиты и многое-многое другое, — но зачастую мы не можем понять, как все эти метрики соотносятся друг с другом, и откуда они берутся. Давайте посмотрим на то, как инструменты аналитики организуют данные.

Все данные в аналитике организованы в иерархию: хиты, сессии, пользователи. Не имеет значения, откуда взялись данные, это может быть веб-сайт, мобильное приложение или терминал. Эта модель работает и для веба, и для чего угодно.

Как работают инструменты аналитики

Важно понимать каждую часть иерархии и как они соотносятся друг с другом. Давайте начнём снизу — с хитов, и затем проложим путь к пользователям.

Хиты (Hits)

Хит — элементарная единица информации для аналитики. С помощью них инструмент аналитики посылает информацию на сервер. В действительности хит — это запрос маленького файла с изображением. Этот запрос файла — то, каким способом веб-сайт или приложение передаёт информацию на сервер.

Как работают инструменты аналитики

Существует много разновидностей хитов в зависимости от инструмента аналитики.

Просмотры страниц/экранов. Данные о просмотре страниц (или экрана, если речь идёт о мобильном приложении) обычно генерируются автоматически. Просмотр страницы — одна из фундаментальных метрик в аналитике. Она используется также для вычисления многих других метрик, например, «количество просмотренных страниц за посещение» или «среднее время, проведённое на странице».

События. События — как счётчик. Они используется, чтобы измерять, как часто пользователь взаимодействует с некоторой частью вашего контента. В отличие от просмотра страниц, данные о которых генерируются автоматически, события надо настраивать вручную. Обычно вы отмечаете как событие какое-то действие пользователя на сайте. Это может быть клик по кнопке, по ссылке, прокрутка экрана и др., то есть, пользователь взаимодействует с контентом, который находится на странице или экране приложения.

Транзакция. Информация о транзакции посылается на сервер, когда пользователь завершил транзакцию электронной коммерции. Вы должны вручную настраивать сбор данных о транзакциях в ecommerce. Вы можете посылать любые сведения о транзакциях, включая информацию о товаре (ID, цвет) и информацию о самой транзакции (доставка, налоги, способ оплаты и т.д.)

Социальный хит. Социальный хит означает, что пользователь кликнул по кнопке «твитнуть», «+1» или «Like». Если хотите знать, кликали ли посетители по этим кнопкам, используйте эту функцию, она также настраивается вручную.

Настраиваемое время пользователя. Время пользователя — простой способ измерить время между двумя взаимодействиями пользователя с сайтом. Например, вы можете измерить время от загрузки страницы до клика по кнопке. Для этого нужно использовать дополнительный код.

Хиты любого типа посылаются в Google Analytics с помощью кода отслеживания. То, какой код используется, зависит от того, что вы анализируете. Если вы анализируете веб-сайт, то используется javascript код analytics.js. Если вы анализируете мобильное приложение (не важно, на iOS или на Android), то хиты генерирует SDK.

Все хиты по сути своей одинаковы, вне зависимости от типа. Это запрос невидимого изображения, содержащий определённый параметр (например, utm метки — прим. редактора)

Для особо любознательных. Данные о хите могут посылаться через GET запрос или POST запрос. Это важно знать, потому что количество информации может быть разным. Через GET запрос можно послать только 2048 символов. POST запрос технически может быть любой длины (так на большинстве серверов), но только около 8000 символов посылается в GA.

Информация о хите трансформируется в параметры. Каждый отчёт — это параметр с соответствующими метриками, их вы постоянно просматриваете в своём аккаунте.

Как работают инструменты аналитики

Небольшая заметка о мобильных. Код SDK для аналитики мобильных приложений не посылает данные в режиме реального времени. Сначала он накапливает данные, а потом отправляет их разом. Это называется отправкой и делается по двум причинам. Во-первых, мобильные устройства не постоянно находятся в сети, поэтому система аналитики накапливает и хранит данные до тех пор, пока устройство не получит доступ к интернету. Во-вторых, отправка большого количества данных за раз уменьшает расход энергии. Можно не волноваться — это никак не влияет на подсчёт данных

Сессия (Session)

Сессия — группа хитов, относящихся к одному юзеру. По умолчанию большинство инструментов аналитики, включая GA, группируют хиты по признаку активности. Когда инструмент аналитики определяет, что посетитель больше не активен, он считает сессию законченной, и, когда пользователь вновь проявляет активность, начинает новую.

Большинство инструментов аналитики определяют сессию как законченную после 30 минут бездействия. Этот 30-минутный период называется таймаут.

GA, как и большинство других инструментов аналитики, используют время между первым и последним хитами, чтобы вычислить общее время, проведённое на сайте. Время между двумя хитами также используется для вычисления других метрик, например, время, проведённое на странице. Вы можете прочитать больше в моём обзоре «Как GA вычисляет время».

Многие инструменты аналитики позволяют вам сменить время таймаута на более подходящее для вас. Например, вы можете захотеть это сделать, если на вашем сайте много видео, особенно если они длятся больше 30 минут.
Представьте, что пользователь просматривает 60-минутное видео. Это значит, что в течение этого времени хиты на посылаются на сервер. Значит, его сессия будет закончена через 30 минут после первого хита, хотя на самом деле пользователь активен (смотрит видео). Чтобы правильно засчитать сессию, вы можете изменить таймаут.

Однако лучше продлить сессию, послав дополнительный хит во время просмотра видео. Чем больше хитов, тем больше данных о времени, проведённом пользователем на сайте. Поверьте, уделите 12 минут статье «Как GA вычисляет время».

Теперь, когда мы знаем, что хиты группируются в сессии, давайте посмотрим, как сессии объединяются друг с другом в соответствии с пользователями, к которым они относятся.

Пользователи (Users)

Здесь начинается самое интересное. Пользователь — это угаданный инструментом аналитики аноним. Пользователи идентифицируются с помощью присвоенного им анонимного номера или строчки знаков. Обычно инструменты аналитики присваивают анонимный номер-идентификатор (ID) пользователю при первом его обнаружении. Этот идентификатор сохраняется до тех пор, пока не истечёт срок его хранения или его не удалят.

Идентификатор посылается в систему аналитики вместе c хитами. Благодаря этому инструмент аналитики может комбинировать хиты и сессии, относя их к конкретному пользователю.

Как же инструменты аналитики идентифицируют пользователей?

Чтобы отличить посетителя сайта, большинство инструментов аналитики используют cookie. Cookie — это маленький текстовый файл, содержащий анонимный идентификатор. Всякий раз, когда хит посылается из браузера на сервер аналитики, вместе с ним посылается идентификатор пользователя, сохранённый в cookie.

Как работают инструменты аналитики

Давайте немного поговорим о cookie. GA использует основные cookie (first party cookie). Основные cookie связаны с доменом, который их сгенерировал. Они могут использоваться только тем доменом, который их создал.

Cookie системы Universal Analytics называются _ga и хранятся около двух лет. В предыдущих версиях Google Analytics cookie назывались _utma.

Плюс основных cookie в том, что почти все браузеры разрешают их использовать, отчего они являются надёжной технологией.

Основные cookie трудны в использовании, если ваш сайт размещён на нескольких доменах. Когда пользователь покидает ваш сайт и переходит на другой ваш сайт, соответственно, он «теряет». В большинстве случаев, если аналитика настроена некорректно, этому же пользователю будут присваиваться новые cookie.
Получается, что одному пользователю присваиваются двое разных cookie. Из-за этого система аналитики может посчитать одного пользователя дважды. Получается, то мы не знаем точное количество пользователей, и значит, не можем правильно выстроить аналитику.

Другой тип cookie, сторонние cookie (cookie сторонних сайтов, third party cookie) могут быть использованы доменом, отличным от того, который их создал. Некоторые инструменты аналитики позволяют использовать сторонние cookie.
Ценность сторонних cookie заключается в том, что система аналитики идентифицирует пользователя, несмотря на его перемещение по разным доменам. Однако большинство браузеров не поддерживают сторонние cookie, а значит, не передадут информацию.

GA не использует сторонние cookie. Вы можете прочитать об этом в документации для разработчиков. Тогда как решить эту проблему? Как правильно идентифицировать пользователя, если ваш сайт расположен на нескольких доменах? В GA мы используем Междоменное отслеживание (Cross Domain Tracking). Я не буду об этом рассказывать, вы можете прочитать это в доументации службы поддержки Google.

Пожалуй, тут можно закончить. Это довольно полный обзор того, как работает веб-аналитика.

P.S. Это статью я переводила полностью, но опустила часть об аналитике мобильных устройств и терминалов, да и редактировать их не стала. Если интересно, обращайтесь — кину ссылку на заметку с переводом в evernote.