В OWOX BI есть два способа сбора данных о сессиях: на основе API Google Analytics и на основе сырых данных о хитах с помощью алгоритма OWOX BI.
Для чего нужен алгоритм OWOX BI
Алгоритм OWOX BI для сбора данных о сессиях позволяет собирать полные и точные данные о поведении пользователей на сайте. Вот его главные преимущества:
- Алгоритм OWOX BI не зависит от Google Analytics Core Reporting API и собирает данные о сессиях на основе сырых несемплированных данных о хитах.
- Сбор сессионной таблицы никогда не прервется из-за превышения лимитов Google Analytics Core Reporting API или отсутствием доступа к Google Analytics. Не будет задержек из-за долгого импорта сессионных полей из Google Analytics.
- У алгоритма OWOX BI нет ограничений на объемы собираемых данных. Нет лимитов на 500 тыс. сессий в сутки, 10 млн. хитов в сутки и 500 хитов на сессию — все ваши данные попадут в таблицы Google BigQuery.
С помощью нового алгоритма вы также можете:
- Отследить, был ли прямой переход действительно прямым, а не протянутым с прошлого платного перехода — с алгоритмом OWOX BI это можно сделать с помощью поля
trafficSource.isTrueDirect
. Таким образом, вы сможете атрибутировать источники сессий одновременно по двум моделям: Last Non-Direct Click и Last Click. - Объединить аудитории разных сайтов с помощью единого идентификатора OWOX User ID и анализировать их пересечение.
Когда стоит включить сбор сессий на основе алгоритма OWOX BI
- Количество сессий на вашем сайте — больше 200 тыс. в сутки или приближается к этому числу;
- Вы часто сталкиваетесь с семплированием данных в Google Analytics;
- Вы часто сталкиваетесь с лимитами в 500 хитов на сессию;
- Вам важно отслеживать истинный прямой источник сессии с помощью поля
trafficSource.isTrueDirect
, которое в Google Analytics доступно только при использовании функции BigQuery Export для GA360; - Вы хотите объединить аудитории разных сайтов с помощью единого идентификатора OWOX User ID и анализировать их пересечение.
Отличия в структуре таблиц
Таблицы, собранные алгоритмом OWOX BI имеют такую же структуру. Отличаются только значения некоторых полей, а именно:
- В полях
totals.*
ранее находилось количество хитов, собранное в Google Analytics. Теперь в поляхtotals.*
дублируются значения полейtotalsStreaming.*
— количество хитов, собранное в OWOX BI. - Добавлены поля
customDimensions
,customMetrics
,customGroups
, однако пока не распределены по области действия — сейчас у всех область действия на уровне хитов. Разные области действия пользовательских переменных будут добавлены в следующих обновлениях. - Добавлено поле
isTrueDirect
, благодаря которому вы можете определить, был ли переход прямым (значение true) или его source/medium протянут с прошлого платного перехода. - Присутствует поле
userOwoxId
(как в таблицах с данными о хитах).
Изменение настроек для включения нового алгоритма
- Если до этого был настроен сбор сессий на основе алгоритма Google Analytics, необходимо модифицировать код отслеживания. Сделайте это сразу после настройки сбора данных о сессиях.
- В случае использования авторазметки в Google Ads: с помощью нативной интеграции Google Data Transfer необходимо включить выгрузку сырых отчетов Google Ads в BigQuery для получения данных по авторазметке (с gclid) и указать путь к набору данных BigQuery с этими отчётами в настройках сессионного стриминга. Если используется только ручная разметка (utm-метки), то пропустите этот пункт.
- Поле
user.id
формируется непосредственно на основании параметра userId (&uid), при этом custom dimension не используется. Потому, если на сайте не настроено отслеживание и сбор &uid, настройте его стандартным способом.
Отличия в сборе данных
Стадия | На основе Google Analytics | На основе алгоритма OWOX BI |
Формирование сессий |
Из Google Analytics API загружаются значения Session ID (custom dimension уровня сессии), источники трафика, геоданные, данные об устройствах. Таким образом, начало/окончание сессии и источник трафика определяются логикой Google Analytics.
|
Алгоритм OWOX BI формирует сессии в BigQuery на основе полностью сырых данных о хитах. Триггеры начала и окончания сессий такие же, как в Google Analytics. |
Формирование сессий при отправке данных через Measurement Protocol |
Если значение параметра &qt, отправленного через Measurement Protocol превышает 4 часа, то событие пропадет и не попадет ни в одну сессию. Если параметр &qt отправлен без значений, то для события автоматически создается отдельная сессия. |
Хиты, отправленные через Measurement Protocol со значением параметра В таблицу с данными о хитах (streaming) события попадут независимо от параметра |
Определение источников трафика |
Источник сессии формируется в Google Analytics по модели Last Non-Direct Click (последнее непрямое взаимодействие). То есть всем прямым переходам присваивается канал из последнего непрямого взаимодействия за последние 6 месяцев. Нет возможности отследить был ли переход действительно прямым. |
Источники сессий определяются по той же модели, что и в Google Analytics — Last Non-Direct Click. Для отслеживания истинного источника перехода, мы добавили значения для поля trafficSource.isTrueDirect, которое указывает, началась ли сессия с прямого визита на сайт или же следует за сессией из платного источника. |
Определение utm-меток по авторазметке Google Ads (gclid) |
Определяется благодаря использованию Google Analytics API, который имеет нативную интеграцию с Google Ads. |
Для определения необходимы отчеты с сырыми данными Google Ads в BigQuery. Настраиваются в один клик с помощью нативной интеграции Google Data Transfer. |
Структура таблиц |
Таблицы разделены по дням во временной зоне представления Google Analytics. Каждая сессия представлена отдельной строкой с вложенными полям — сырыми данными о входящих в неё хитах. |
Структура и набор полей не отличается. |
Время начала сбора таблиц за прошедшие сутки (по временной зоне представления Google Analytics) |
5:00 утра (5am), поскольку данные в Google Analytics API становятся доступны с 4:00 утра. |
1:00 ночи (1am) |
Фильтрация данных | Используются отфильтрованные сессии из Google Analytics, согласно фильтрам представления | Данные о сессиях без какой-либо фильтрации |
0 Комментарии