2023.04.18 コラム
【CDP活用】機械学習活用に向けた第一歩 ~集計・加工時のポイント~
● はじめに
企業のデジタルマーケティング活動において欠かせないものとなりつつあるCDP(Customer Data Platform)。
統合されたデータを基にした顧客セグメントの設計から、CRM/MAなどをはじめとしたコミュニケーションツール、分析ダッシュボードの構築が可能となるBIツールなど、あらゆるツールと連携することで様々なマーケティング施策に活用することができ、今後も企業での導入が進んでいくことが予想されます。
そんな多岐にわたるCDP活用の中でも、今回は「【CDP活用】機械学習活用に向けた第一歩 ~集計・加工時のポイント~」と題して、機械学習活用に向けたデータ集計・加工を行う上で必要なポイントをご紹介して参ります。
● データ集計・加工時のポイント
CDPにてあらゆるデータの統合が出来たからとはいえ直ぐに分析を実行することは難しく、前処理として分析用のデータセットを作成することが必要になってきます。
用いる手法などによっても異なりますが、例えばCDP内に有している広告出稿やPOSのデータを用いて広告施策と売上の相関性を分析することを想定した場合、以下のような観点がデータ集計・加工時のポイントとして挙げられます。
- 集計粒度
集計期間や集計粒度は、分析の精度や有用性に影響を与える可能性があります。
1日あたりの売上データでは、データのばらつきが大きくなり分析の信頼性が低くなるという懸念もある一方で、年次など粒度が大きくなりすぎると、短期的な傾向を見落とす可能性もありますので、分析の目的などに応じた選択が必要です。
- 共線性・多重共線性の問題
共線性はデータセットに高い相関がある説明変数が含まれている場合に発生する現象で、結果の精度に影響を与える可能性があります。
高い相関が見られる説明変数の片方を除外する方法や説明変数を合成する方法が対策として挙げられます。
- 季節性の問題
季節性は、特定の季節に商品の需要が高まるといったように、時間とともに変動する要因で、分析結果で偽りの相関を示す可能性があります。
データの平均値を求めることで、季節性の影響を平滑化する移動平均法やデータを特定の季節期間で平均化し、その期間の季節性の指数を求める季節指数法などが対策として挙げられます。
「思うような分析結果が得られない」「誤った結果の解釈をしてしまう」などのケースを避け、効果的なCDPデータの活用を行っていくためには、こういった観点から分析データの前処理を行うことは非常に大切です。
また、日次・週次など定常的な検証・評価を行う場合は、シームレスなCDP活用を実現する為、上記のような観点を抑えた上でSQLの作成やCDPから分析実行環境への出力をスケジュール化・自動連携設定していくことを推奨いたします。
● おすすめコラム記事
弊社では他にもCDP活用に関するコラム記事も多く執筆しております。
こちらも併せてご覧になってみてください。
》【機械学習】BigQuery MLで広告施策の貢献度を分析してみた
》【統計・AI・機械学習】「ねぎ」の家計支出と市場での出荷量の影響度を機械学習アシストツール「viz」で予測分析してみた!
● さいごに
今回は「機械学習活用に向けた第一歩 ~集計・加工時のポイント~」についてご紹介いたしましたが、いかがでしたでしょうか。
今後のCDP活用における一助となれば幸いです。
弊社ではCDPの活用のみならず、CDP構築〜施策実行〜効果測定まで、フルスタックでご支援いたしております。
データマーケティングにおける課題やお悩み等、ぜひお気軽にご相談くださいませ。
》【ダウンロード資料】CDP総合支援サービス ~構想・構築・活用~
本件に関するお問い合わせは下記にて承ります。
株式会社DataCurrent
info@datacurrent.co.jp