2022.11.24 コラム
GTM × GA4 × BigQuery|BigQueryMLを活用した貢献度分析
● はじめに
本記事は、マーケティング業務に従事している方であれば一度は聞いた事や触れた事のある、Google Analytics(GA)とGoogle BigQueryを活用したデータ分析事例についてご紹介しております。
DataCurrentでは、クッキーレス対策のひとつとして、Googleソリューションを活用したマーケティング基盤の構築支援を提供しています。クッキーレスに対応したデータ取得方法のみならず、そのデータを活用した機械学習、ダッシュボード開発、分析支援などをサポートします。
本記事では、分析支援についてご紹介致します。
● こんな方におすすめ
- 自社のデータだけでも深掘りできる環境を持ちたい
- 管理画面だけでは施策に活かしづらい
- 他データと突合させた分析を行いたい
● 従来とGA4の違い
① BigQueryの連携が可能
BigQueryとはGoogle Cloud Platform 内で提供されるサービスで、大規模なクエリによるデータ解析をすることが出来る、データウェアハウスのことを指します。
BigQueryの連携はこれまでのUAの場合、有料版のGA360の契約をする必要がありました。
しかしGA4では無料アカウントでもBigQueryと連携することができ、これまで以上に大規模かつ柔軟な分析が可能になりました。
②GTMのサーバーサイドcookieの活用も可能に!
GTM側でBigQueryエクスポート設定を行うことで、サーバーサイドcookieをGA4ログと一緒にBigQueryに格納し、活用することが可能になりました。
●BigQueryMLについて
- BigQueryで専門知識がなくても機械学習を、実施することが可能
- SQLの知識があればできる(Python不要)
- 線形回帰、ロジスティック回帰、クラスタリング等さまざまな種類の学習ができる
●BigQueryMLで貢献度分析!
今回は、GA4ログのサイト来訪データを活用して、GTM×GA4×GCP資料請求をした人と相関が高い、
コンテンツ記事を分析していきます。
貢献度分析をすることで、web接客の強化ポイントを深堀りすることが出来ます。
貢献度分析手順
- BigQuery上に入力データを用意
- 入力データをもとに学習し、回帰モデル作成
- モデルの精度を確認
- コンテンツカテゴリごとの、資料請求に対する貢献度を算出
1.BigQuery上に入力データを用意
まずは、BigQueryMLを用いて、機械学習を回せる状態にデータを用意する必要がございます。
- 分析対象者:GTM×GA4×GCP資料請求者
- 日付:月単位
- 目的変数:資料請求数(cv)
- 説明変数:サイトコンテンツ記事の各カテゴリ(pv)
↓下記のようなイメージのテーブルを使用します。
2.入力データをもとに学習し、回帰モデル作成
用意したデータを使って、学習モデルを実行します。
OPTIONSでmodel_typeを‘linear_reg’(線形回帰)を指定して、
input_label_colsには予測したい項目である資料請求数(cv)を指定します。
【トレーニング】実行クエリ
今回、BigQueryコンソール上で以下のSQLクエリを実行しました。
CREATE OR REPLACE MODEL `model` OPTIONS( model_type='linear_reg', input_label_cols=['cv'], DATA_SPLIT_METHOD = 'NO_SPLIT', OPTIMIZE_STRATEGY = 'NORMAL_EQUATION' ) AS SELECT cv,tech,API,CDP,tips,adtech,privacy,CMP,ML,oneID,GA FROM `table1`
3.モデルの精度を確認
モデルの精度はRMSE(二乗平均平方根誤差)で確認します!
①ベンチマークの精度:データセットの資料請求平均値より算出します。
②予測値の精度:実際の回帰モデルで予測された、資料請求数の値より算出します。
→ベンチマークと予測値の差を確認することで、モデルの精度を確認することが可能です。
--ベンチマークの精度 WITH A AS( SELECT AVG(cv) AS predict, cv AS label FROM `table1` ), C AS( SELECT SQRT(AVG( POWER(B.label - A.predict, 2) ) ) AS rmse_benchmark, FROM A) --予測値の精度 SELECT SQRT(mean_squared_error) AS rmse,rmse_benchmark FROM ML.EVALUATE(MODEL `model`,(SELECT * FROM `table1` )) CROSS JOIN C
出力結果
一般的に、RMSEはベンチマークより”0″に近いほうが良いとされます。
予測値の精度(rmse):0.52
ベンチマークの精度(rmse_benchmark):26.47
→予測値の精度が、ベンチマークの精度より、0に近いので良いといえます!
4.コンテンツカテゴリごとの、資料請求に対する貢献度を算出
2.で作成した線形回帰のモデルを使用して、相関度や貢献度を出力することが可能です。
・相関度算出:数値が高い方が資料請求への影響度が高いことを表しています。(0~1で表現)
・施策ボリューム対効果:数値が高い方が、各変数ボリュームに対する資料請求への影響度が高かった
・施策ごとの貢献度:数値が高い方が、資料請求貢献度が高かったという結果を表しています。
→詳細:【機械学習】BigQuery MLで広告施策の貢献度を分析してみた
BigQueryでの出力結果
BigQuery上での出力結果だけでは、全体像が把握し辛いので
BIツールで可視化し、より貢献度の高いコンテンツ記事を確認することが可能です。
・相関度
GA / CMP / 機械学習(ML)コンテンツの、影響度が高いことが分かりました。
・施策ボリューム対効果
GAは、1pv数で資料請求への影響度が最も高かったと言えます。
また、データtipsも1pv数あたりの、影響度が高い傾向がありました。
・施策ごとの貢献度
カテゴリ毎のpvボリュームを加味した結果、GA / CDP / データtipsは
貢献度が高いことが分かりました。
BigQueryMLを活用した、貢献度分析結果
- GA / CDP / データtipsコンテンツが、資料請求への貢献が高いことが分かりました。
<施策への活用>
GA / CDP / データtipsコンテンツ閲覧時に、
GTM×GA4×GCP資料請求ページへの遷移をレコメンド
今回、GTM×GA4×BigQueryによって、機械学習をBigQueryMLで柔軟かつ、素早く行えました!
また、BIツールで可視化することで、GA4の管理画面を見たり自社ダッシュボードを見たりなどの
手間がなく、データを一元管理することも可能です。
● ご紹介まとめ
■本日ご紹介した事例の関連サポート
・GA4導入サポート
・GTMタグ設置サポート
・BigQueryエクスポート設定サポート
・BigQueryのデータを活用したSQL分析サポート
・BigQuery機械学習サポート
※BQ以外にも、弊社自社開発機械学習ツールなども活用可能
・BIツールを用いた可視化サポート
・GCP認定パートナー、リセール可能
⇒ニーズに合わせた分析と可視化、施策提案までサポート可能です
その他にも、下記コラム記事でGA4についてご紹介しているので是非ご覧ください!
▼GA関連コラム記事
⇒Googleアナリティクス4(GA4)とは?導入とそのポイントについて<前編>
⇒Googleアナリティクス4(GA4)とは?移行とそのポイントについて<後編>
▼GTM×GA4×BigQuery関連コラム記事
⇒GTM×GA4×BigQuery|サーバーサイドcookie単位でUB集計してみた
⇒GTM×GA4×BigQuery|バスケット分析による鉄板コンテンツ
⇒GTM×GA4×BigQuery |データ統合の基本!マッピングテーブル構築
⇒GTM×GA4×BigQuery |サーバーサイドcookieを活用したn1解析
⇒GTM×GA4×BigQuery |BigQueryMLを活用した、クラスタ分析
▼GA関連サービス
》「GA4×Google Cloud×GTMを活用したクッキーレス対策」の詳細はこちら
※DC社では、他にもGA4の導入、導入後の活用施策、データを活用した機械学習をご提案させていただいております。ご興味がある方は下記問い合わせ先にご連絡ください。
本件に関するお問い合わせは下記にて承ります。
株式会社DataCurrent
info@datacurrent.co.jp