Структура таблицы с результатами расчета модели атрибуции

Результаты расчета атрибуции сохраняются в набор данных Google BigQuery:

Attribution_tables_in_BigQuery.png

По умолчанию в наборе данных создаются промежуточные таблицы actions_probabilities_ и purchases_, а также результирующая партиционированная таблица values. До 1 августа 2018 данные values дублируются также в непратиционированные таблицы values_.

К названию непартиционированных таблиц добавляется префикс с датой окончания транзакционного окна, выбранного при расчете модели, в формате «ГГГГММДД». Например, actions_20160601. Если вы сделаете несколько расчетов за период с одинаковой крайней датой транзакционного окна, то данные перезапишутся — в BigQuery будет хранится информация только о последнем расчете.

Таблица values содержит информацию о сессиях, которые при расчете получили ценность и информацию о распределении ценности по месяцам за которые появились данные в результате расчетов.

Таблица аctions_ содержит информацию о всех сессиях и взаимодействиях пользователей с сайтом. probabilities_ строится на основании таблицы actions_ и содержит информацию о рассчитанных вероятностях прохождения каждого из шагов воронки. purchases_ — содержит информацию о транзакциях. Данные в этих промежуточных таблицах — служебные и необходимы лишь для расчета модели атрибуции.

Структура таблицы values

Пример таблицы в Google BigQuery

Название поля Тип данных Описание
session_id STRING Идентификатор сессии
value_from_sid STRING  
source STRING Источник кампании
medium STRING Канал кампании
campaign STRING Название кампании
keyword STRING Ключевое слово кампании
adContent STRING Содержание кампании
date STRING Последняя дата анализируемого периода в формате «ГГГГММДД». Обратите внимание, что это не время сессии. Время сессии — в поле time
user_id STRING User ID
active_step INTEGER Номер последнего шага воронки, куда дошел пользователь в сессии
product_id STRING Идентификатор товара (если атрибутируется ценность товара, а не транзакции)
transaction_id STRING Идентификатор тразакции
time INTEGER Время сессии в формате unix time с микросекундами
value FLOAT Суммарная ценность сессии
revenue FLOAT Доход от товара
data_source  STRING Источник данных о сессии: OWOX BI Pipeline, экспорт Google Analytics в BigQuery или таблица с транзакциями
user_type  STRING Тип покупателя: новый или вернувшийся. Определяется по заказам в течении последнего года.
device  STRING Тип устройства пользователя: только desktop, только tablet, только mobile или cross device. Определяется по использованным устройствам в течении последнего года.
region  STRING Регион пользователя
lag_active_step INTEGER Номер предпоследнего шага пользователя в воронке. Получит значение «-1», если пользователь не совершил ни одного действия в воронке.

Структура таблицы probabilities

Название поля Тип данных Описание
device STRING Тип устройства пользователя
region STRING Регион 
user_type STRING Тип пользователя 
lag_active_step INTEGER Номер предпоследнего шага пользователя в воронке. Получит значение «-1», если пользователь не совершил ни одного действия в воронке.
active_step INTEGER Номер последнего шага воронки, куда дошел пользователь в сессии
probability FLOAT Вероятность шага, использованная в расчете
reg_usr_dev_conf_interval FLOAT Доверительный интервал вероятности в сегменте по всем параметрам: «Тип устройства», «Тип пользователя» и «Регион»
reg_usr_dev_probability FLOAT Вероятность в сегменте по всем параметрам
reg_usr_dev_lag_actions INTEGER Количество действий на предыдущем шаге в сегменте по всем параметрам
reg_usr_dev_actions INTEGER Количество действий на шаге в сегменте по всем параметрам
user_dev_conf_interval FLOAT Доверительный интервал в сегменте по параметрам «Тип устройства» и «Тип пользователя» 
user_dev_lag_actions INTEGER Количество действий на предыдущем шаге в сегменте по параметрам «Тип устройства» и «Тип пользователя» 
user_dev_actions INTEGER Количество действий на шаге в сегменте по параметрам «Тип устройства» и «Тип пользователя» 
user_dev_probability FLOAT Вероятность в сегменте по параметрам «Тип устройства» и «Тип пользователя»
dev_conf_interval FLOAT Доверительный интервал
dev_lag_actions INTEGER Количество действий на предыдущем шаге
dev_actions INTEGER Количество действий на шаге
dev_probability FLOAT Вероятность в сегменте по параметру «Тип устройства»
global_actions INTEGER Общая сумма действий на шаге
global_lag_actions INTEGER Сумма действий на предыдущем шаге 
global_probability FLOAT Вероятность без сегментации

Структура таблицы actions

Название поля Тип данных Описание
session_id STRING Идентификатор сессии
active_step INTEGER Номер последнего шага воронки, куда дошел пользователь в сессии
user_id STRING User ID
transaction_id STRING Идентификатор транзакции
time INTEGER Время начала сессии в формате unix time с микросекундами
date STRING Дата записи в формате «ГГГГ-ММ-ДД»
is_attributed BOOLEAN Попала ли сессия под правило переноса ценности из настроек модели.
False — если ценность перешла другому источнику
device STRING Тип устройства пользователя
region STRING Регион
user_type STRING Тип пользователя
data_source STRING Источник данных о сессии: OWOX BI Pipeline, экспорт Google Analytics в BigQuery или таблица с транзакциями
lag_active_step INTEGER Номер предпоследнего шага пользователя в воронке. Получит значение «-1», если пользователь не совершил ни одного действия в воронке.
Была ли эта статья полезной?
Пользователи, считающие этот материал полезным: 0 из 0
Еще есть вопросы? Отправить запрос

0 Комментарии

Войдите в службу, чтобы оставить комментарий.