Название: Google Analytics для googлят: Практическое руководство по веб-аналитике
Автор: Яков Осипенков
Издательство: ЛитРес: Самиздат
Жанр: Маркетинг, PR, реклама
isbn:
isbn:
Отчеты
Обработанную информацию Google предоставляет нам в виде красивых отчетов в интерфейсе Analytics. Однако мы также можем выгружать данные из аккаунтов Google Analytics с помощью Core Reporting API.
Выборка данных в Google Analytics
При достижении лимита в 500 тыс. сеансов на уровне ресурса для выбранного диапазона дат Google Analytics начинает работать с данными несколько по-другому. Он их сэмплирует.
Сэмплирование (англ. Sampling) – метод выбора подмножества наблюдаемых величин из данного множества, с целью выделения неких свойств исходного множества. Иными словами, Google берет некоторую выборку данных, например, 10%, умножает ее на 10 и говорит нам, что так вели бы себя все 100%.
При работе с большими объемами данных все отчеты строятся быстро, нет никаких проблем с их загрузкой и отображением. А теперь представьте, что под такую выборку попала статистика по вашим рекламным кампаниям. В отчете на основе сэмплированных данных может быть показан доход 100 000 руб., а на самом деле за этот период он составил 150 000 руб. Или система взяла выборку на основании социально-демографических характеристик, что в дальнейшем привело к неправильному определению портрета целевой аудитории нашего сайта.
Желтый значок в Google Analytics рядом с названием отчета говорит нам о том, что к нему было применено сэмплирование:
Рис. 78. Неполная выборка
Зеленый значок свидетельствует о том, что он построен на 100% выборке данных.
Рис. 79. Выборка данных на основе анализа 100% сеансов
Google и Яндекс применяют сэмплирование для снижения нагрузки на свои сервера. Отчет строится гораздо быстрее, но может вводить веб-аналитика в заблуждение.
Преодолеть порог в 500 тыс. сеансов для посадочной страницы или небольшого интернет-магазина конечно сложно, но не невозможно. Чтобы на основе сэмплированных данных можно было делать выводы о всей совокупности значений, в выборке не должно быть никаких критических изменений, скачков и провалов.
Рис. 80. Скачок в статистике
Есть несколько способов борьбы с сэмплированием данных в Google Analytics:
• уменьшить временной диапазон;
Рис. 81. Сокращение временного интервала
Уменьшая диапазон дат, вы уменьшаете и количество данных, которое придется обработать системе. Можно разбить временной интервал на небольшие интервалы (например, по месяцам), а потом вручную собрать их в том же Excel.
• увеличить точность выборки;
Точность выборки задается в настройках GA при формировании отчета. Доступно два варианта:
1. Быстрая обработка – небольшая выборка для оперативного получения результатов, большая погрешность;
2. Более точные результаты – используется выборка максимального размера, обеспечивающая высокую репрезентативность данных.