Структура таблицы с результатами расчета модели атрибуции

Результаты расчета атрибуции сохраняются в набор данных Google BigQuery:

Attribution_tables_in_BigQuery.png

По умолчанию в наборе данных создаются промежуточные таблицы actions_probabilities_ и purchases_, а также результирующая партиционная таблица values. До 1 августа 2018 данные values дублируются также в непратиционированные таблицы values_.

К названию непартиционных таблиц добавляется префикс с датой окончания транзакционного окна, выбранного при расчете модели, в формате «ГГГГММДД». Например, actions_20160601. Если вы сделаете несколько расчетов за период с одинаковой крайней датой транзакционного окна, то данные перезапишутся — в BigQuery будет хранится информация только о последнем расчете.

Таблица values содержит информацию о сессиях, которые при расчете получили ценность и информацию о распределении ценности по месяцам за которые появились данные в результате расчетов.

Таблица аctions_ содержит информацию о всех сессиях и взаимодействиях пользователей с сайтом. probabilities_ строится на основании таблицы actions_ и содержит информацию о рассчитанных вероятностях прохождения каждого из шагов воронки. purchases_ — содержит информацию о транзакциях. Данные в этих промежуточных таблицах — служебные и необходимы лишь для расчета модели атрибуции.

Структура таблицы values

Пример таблицы values в Google BigQuery

Название поля Тип данных Описание
_PARTITIONTIME TIMESTAMP Эта псевдоколонка содержит timestamp в формате UTC начала дня, в который данные были загружены. Для партиции YYYYMMDD эта псевдоколонка будет содержать значение типа TIMESTAMP ('YYYY-MM-DD').
session_id STRING Идентификатор сессии
time INTEGER Время взаимодействия в миллисекундах
ts TIMESTAMP Время взаимодействия в формате TIMESTAMP
user_id STRING User ID
transaction_id STRING Идентификатор тразакции
transaction_time INTEGER Время транзакции
value FLOAT Ценность, присвоенная взаимодействию
revenue FLOAT Доход от транзакции
source STRING Источник кампании
medium STRING Канал кампании
campaign STRING Название кампании
keyword STRING Ключевое слово кампании
adContent STRING Содержание кампании
active_step INTEGER Номер последнего шага воронки, куда дошел пользователь в сессии
lag_active_step INTEGER Порядковый номер шага пользователя в воронке, в котором произошло предыдущее взаимодействие. Получит значение «0», если пользователь не совершил ни одного действия в воронке.
user_type  STRING Тип покупателя: новый или вернувшийся. Определяется по заказам в течении последнего года.
device  STRING Тип устройства пользователя: только desktop, только tablet, только mobile или cross device. Определяется по использованным устройствам в течении последнего года.
region  STRING Регион пользователя
value_from_sid STRING Идентификатор сессии, которая была отфильтрована с помощью переноса ценности источников трафика в настройках модели атрибуции
data_source STRING Источник данных о сессии: данные, собранные OWOX BI, экспорт Google Analytics в BigQuery или таблица с транзакциями
date STRING Последняя дата в рамках периода расчета модели в формате «YYYYMMDD». Обратите внимание, что это не время взаимодействия. Время взаимодействия — в поле time.

Структура таблицы probabilities

Название поля Тип данных Описание
device STRING Тип устройства пользователя
region STRING Регион 
user_type STRING Тип пользователя 
lag_active_step INTEGER Номер предпоследнего шага пользователя в воронке. Получит значение «-1», если пользователь не совершил ни одного действия в воронке.
active_step INTEGER Номер последнего шага воронки, куда дошел пользователь в сессии
probability FLOAT Вероятность шага, использованная в расчете
reg_usr_dev_conf_interval FLOAT Доверительный интервал вероятности в сегменте по всем параметрам: «Тип устройства», «Тип пользователя» и «Регион»
reg_usr_dev_probability FLOAT Вероятность в сегменте по всем параметрам
reg_usr_dev_lag_actions INTEGER Количество действий на предыдущем шаге в сегменте по всем параметрам
reg_usr_dev_actions INTEGER Количество действий на шаге в сегменте по всем параметрам
user_dev_conf_interval FLOAT Доверительный интервал в сегменте по параметрам «Тип устройства» и «Тип пользователя» 
user_dev_lag_actions INTEGER Количество действий на предыдущем шаге в сегменте по параметрам «Тип устройства» и «Тип пользователя» 
user_dev_actions INTEGER Количество действий на шаге в сегменте по параметрам «Тип устройства» и «Тип пользователя» 
user_dev_probability FLOAT Вероятность в сегменте по параметрам «Тип устройства» и «Тип пользователя»
dev_conf_interval FLOAT Доверительный интервал
dev_lag_actions INTEGER Количество действий на предыдущем шаге
dev_actions INTEGER Количество действий на шаге
dev_probability FLOAT Вероятность в сегменте по параметру «Тип устройства»
global_actions INTEGER Общая сумма действий на шаге
global_lag_actions INTEGER Сумма действий на предыдущем шаге 
global_probability FLOAT Вероятность без сегментации

Структура таблицы actions

Название поля Тип данных Описание
session_id STRING Идентификатор сессии
active_step INTEGER Порядковый Номер последнего шага воронки, куда дошел пользователь в сессии
user_id STRING User ID
transaction_id STRING Идентификатор транзакции
time INTEGER Время взаимодействия в миллисекундах
date STRING Дата взаимодействия в вашей временной зоне в формате YYYYMMDD
is_attributed BOOLEAN Попала ли сессия под правило переноса ценности из настроек модели.
False — если ценность перешла другому источнику
device STRING Тип устройства пользователя
region STRING Регион
user_type STRING Тип пользователя
data_source STRING Источник данных о сессии: OWOX BI Pipeline, экспорт Google Analytics в BigQuery или таблица с транзакциями
lag_active_step INTEGER Порядковый номер шага пользователя в воронке, в котором произошло предыдущее взаимодействие. Получит значение «0», если пользователь не совершил ни одного действия в воронке.
Была ли эта статья полезной?
Пользователи, считающие этот материал полезным: 0 из 0
Еще есть вопросы? Отправить запрос

0 Комментарии

Войдите в службу, чтобы оставить комментарий.