С помощью Google Analytics и анонимизировать ИС – исследование влияния

0
233

Ключевой рекомендацией для соблюдения GDPR заключается в использовании Гугл-Аналитики, характеристика anonymizeIP, также известный как “АИП”. Как следует из названия, это простой выключатель капли последние 3 цифры из IP-адрес вашего визитера. Например, если посетитель имеет IP-адрес 215.113.40.184, то Google будет скрыть это 217.115.40. (и всех других посетителей IP-адреса) при обработке данных Гугл Аналитики. Хранимые данные IP-адрес. Это хорошо для соответствия GDPR поскольку IP-данных является ПИИ в Европе. Обратите внимание на разницу между Pi и PII в мой последний пост: GDPR – следует запросить согласие на отслеживание?

Обратите внимание, что анонимизации IP-адрес не является панацеей переключатель, чтобы заставить вас GDPR уступчивый, достаточно, полезная функция для дополнительной гарантии.

Оценка воздействия на анонимные ИС-аналитики

В Google-аналитики, IP-адреса используются для определения геолокации посетителя, т. е. то, что континента, страны, города разве они соединятся с? Вот полезная информация с точки зрения оценки свой глобальный охват, требования к их содержанию, и в маркетинговых целях – например, для измерения воздействия конкретных геолокации кампаний. Поэтому не имея IP-адреса, хранимые для ваших посетителей-это большое дело.

Так что если последние 3 цифры IP-адреса удаляются, это влияет на геолокационных данных?

Ответ: Конечно да, но как это влияет, и стоит ли беспокоиться об этом?

Чтобы установить, что мы провели детальное исследование – один был сайт с глобальным присутствием могут отправлять данные в двух одинаково настроить Google Analytics веб-свойства: один со стандартным IP-адрес (АИП=off), а где находится anonymizeIP (АИП=о). Затем мы сравнили данных в сервис BigQuery, чтобы измерить разницу геолокации.

На самом деле это было первоначально сделано на малом масштабе (2,267 сессии) Huiyan Ван преобразования работает, на основе УК ориентированной аудитории. Поэтому я хотел работать с Huiyan, чтобы повторить и проверить ее результаты с помощью гораздо большего набора данных на 1 млн. сессий и один с гораздо более широкий охват международных посетителей.

Полный текст исследования, проведенного для посетителей в течение месяца мая 2018 года можно ознакомиться на следующей странице: анонимные ИС анализа оценки воздействия (полный веб-странице отчета).

Резюме результатов

Нет заметная разница в точности на уровне страны. Однако, если вы уверены на 80%+ точность на уровне города, то метод anonimizeIP может повлиять на вашу производительность.

Using Google Analytics Anonymize IP – An Impact Study

  • В Целом Неувязка
    • Разница в Континенте и стране в целом незначительна, с AIP=о показывает 99.5%+ такие же результаты, как при полном ИС используется. Следовательно, эта оставшаяся резюме основан только на различиях.
    • Различия становятся значимыми на уровне города в среднем на 76,7% точности. Однако позволяющие за 50км запас, точность улучшается до 87,0%. Позволяя маржа 200км точность возрастает до 93.0%
  • Расхождение от устройства (мобильный в рабочем столе)
    • Такая же тенденция наблюдается и для мобильного трафика с мобильных устройств, показав увеличение на 5,9% в точности города. Такая точность уменьшает величины, так как маржа увеличилась до 50 и 200км.
  • Несоответствие суб-континента
    • В целом, менее экономически развитых суб-континентов мира шоу Лучший город уровень точности, чем более развитых стран. Например, из диаграммы ниже, Восточной Европы темнее (более точный), чем в других частях Европы. Та же история наблюдается и для других регионов мира.
    • Хотя поначалу удивляет, я отношу это к странам ранней – то есть, ранние доступ в интернет, таких как США, Великобритания, ЕС, уделяя мало внимания на географической управления информации о местоположении IP в первые дни роста сети. Принимая во внимание, что среднее последователи извлекли уроки из ошибок стран-первопроходцев и внедрена улучшенная система учета ИС геолокациями. Кроме того, менее развитые страны могут оказать более широкое использование мобильных устройств для доступа в Интернет, которые являются более точными гео.

Методология Ноты

Сайт: собранные данные из европейской штаб-квартиры мирового бренда, попавшие в “спортивных” вертикаль. Получив около 3М сессий в месяц в течение периода исследования, могут/июнь 2018 года.

Сессии данных: собранные в двух экземплярах через ГТМ. То есть, одна данных, нажмите отправлены в стандартную (полную-ИС) свойстве Google Analytics и идентичный нажмите отправили в anonymizedIP (АИП=1) имущество с одного аккаунта га.

Гугл Аналитика конфигурации: все имущество и вид конфигурации идентичны, в частности: “разрешить пользователям метрики в отчетности” (свойства уровня); – фильтра и их порядок (уровень); роботы исключены при помощи Гугла автоматической блокировки способ (вид).

Аномалии:

  • Потери пользователей и сессий. С anonymizedIP, произошел необъяснимый небольшая потеря пользователей (-0.10%) и небольшой рост рассчитывать сессии (+0.07%). Это может быть связано с тегом “изгой” в полной интеллектуальной собственностью, которые не были заданы в AIP=1 собственность (счета Джорджия, содержащиеся 63 теги ГТМ на момент исследования).
  • Показатель Отказов. Существует значительная разница в заявленных отказов от полного ИС и AIP=1 свойства, 22.84% против 35.07% соответственно. Я связываю это с влиянием параметра “исключить все хиты от известных ботов и пауков” для каждого вида. То есть, хотя метод, используемый Google для достижения этого неизвестна, вероятно, метод машинного обучения, когда исторические данные оказывают существенное влияние при определении сеанса, если от робота или паука. Во время этого исследования, полного ИС-7 лет, в то время как АИП=1 отеля составляет менее 1 месяца. Следовательно, моя гипотеза, что свойство возраста является причиной этого. Это было проверено путем создания нового ИС- ” CC ” (копия) собственность и сравнивая со старшим фулл-ИС, где же несоответствие, и направлении, не наблюдалось.

Почему anonymizeIP не по умолчанию?

Хороший вопрос, я бы предпочел, если Google аналитики сделали это по умолчанию с самого начала. Однако, чтобы обезличить необходимо активировать функцию, которая может быть выполнена одним из следующих способов:

  1. При развертывании га отслеживать через ГТМ, набор АИП в вашей ГТМ тег
  2. Если вы развертываете отслеживания в вашей страницы:
    • для analytics.js
      Джорджия(‘множество’, ‘anonymizeIp’, истина);
    • для gtag.js
      gtag(‘конфиг’, ‘<GA_TRACKING_ID>’, { ‘anonymize_ip’: правда });
  3. Если вы используете протокол измерений, т. е. отправляющая сторона просмотров данных на сервере, добавьте к URL-адресу:
    АИП=1
    Обратите внимание, что любое значение для АИП будет установлен этот параметр, т. е. просто его присутствие в хит-данные будут активировать функцию. Поэтому убедитесь, что АИП не присутствует в URL-адрес, если вы не хотите использовать эту функцию.

Важно: при активации anonymizeIP необходимо изменить любой вид фильтров, которые используют IP-адреса в качестве частичным IP будет не совпадать. Просто удалите последние 3 цифры вашего IP-фильтр (и всегда проверяйте изменения перед развертыванием в производственной среде!)

Кредит, где кредит должен

Это исследование было сотрудничество с Huiyan Ван преобразования произведения, которые делали тяжелую работу для этого исследование и подготовил полный отчет…

Кстати, если вы не заинтересованы в том, что я строю в этом пространстве – автоматизированная Джорджия данных аудита инструмент – посетите verified-data.com.