2022.02.28 事例
CDP活用事例 機械学習による休眠予測 <前編>
はじめに
私は普段、CDPを活用したデータ分析及び、施策立案の支援に従事しています。
クライアントの業態や業種によって、抱えている課題は様々あり、CDPを活用した分析・活用パターンも多岐にわたります。
今回はそんなCDPの活用事例の一つとして「CDPを使って休眠ユーザーの予測を行った事例」をご紹介したいと思います。
▽この記事はこんな方におススメ
- CDPの導入を検討しているけど、どんなことが出来るのか情報収集をしている
- CDPを導入したけど、うまく施策に活かせていない
- CDPを使って機械学習をしてみたい
目次
- CDPとは
- CDPの活用イメージ
- CDP活用事例~休眠ユーザーの予測~
- クライアントの課題
- CDPを活用した機械学習
- CDPを活用した機械学習全体の流れ
- CDPを活用した機械学習を施策に応用する
CDPとは
事例の紹介前にまず、CDPについての概要を簡単に説明したいと思います。
CDPとはCustomer Data Platformの略称で、自社に蓄積している顧客のデータや外部のデータを統合管理して、マーケティング等に活用するための基盤のことを指します。
サイトやアプリ、CRMなど様々なデータソースからデータを取得し、CDPに蓄積・統合することで分析を行うことが出来ます。
また、広告やメルマガといった外部プラットフォーム、ツールに連携することでデータを活用したコミュニケーション施策も行うことができます。
デジタルトランスフォーメーションを推進するうえで欠かせないツールとして近年多くの企業から注目を集めるツールとなっています。
CDPの施策活用イメージ
CDPの施策活用例は企業により様々だと言いましたが、一般的には3つのパターンが想定されます。
- CRM/MAとの連携
CDP上で、集計/分析したデータを基にCRMやMAに連携。ユーザーごとに適切なコミュニケーションの設計が可能となる。
- 広告プラットフォームとの連携
CDP上で、集計/分析したデータを基に広告プラットフォームに連携。ユーザーごとに広告クリエイティブを出し分けることで、配信の効率化などが可能となる
- BIツールとの連携
CDP上で、集計/分析したデータを基にBIツールに連携。データを可視化することで社内の人間にスピーディーかつダイナミックに共有でき、ビジネス上の意思決定に活用することが可能になる。
ユーザーとのコミュニケーションの最適化や広告配信の効率化、ビジネス上の意思決定に活用できるものの、どの施策を行うにしてもCDP上での集計/分析が肝となります。
CDP活用事例 休眠の予測
前述の通り、CDPを使って施策に活かすためには、CDP上でのデータの集計/分析が最大の肝となります。これまで社内にバラバラになっていたデータをCDPで集約し、基礎的な集計/分析をするだけでも大きなインパクトはありますが、今回は「CDPを使って機械学習を行った」事例をご紹介します。
● クライアントの課題
とあるクライアントでは、ユーザーの会員サイトを新たに開始したのですが、会員の休眠化に課題を持っていました。会員化させるために、登録時にインセンティブを与えるキャンペーンを行っていたのですが、登録後に休眠化してしまうユーザーが多発している状況でした。
休眠を事前に防ごうと、休眠しやすいユーザーの特徴を分析しようとしたのですが、変数が多すぎるため中々ユーザーの特徴を捉えきれない状態でした。
● CDPで機械学習
上記のような課題の場合、機械学習(ロジスティック回帰)により「休眠」に資する説明変数ごとの重要度を測ることが可能です。また、モデルを作ることにより、今後新規に登録したユーザーが「休眠する or 休眠しない」といった予測をすることが可能になります。
しかし、機械学習をするためにはPython等のプログラミングスキルが必要、もしくは高価なGUIツールを導入する必要があります。今回のクライアントではそのようなリソースや予算はなかったのでCDP(Treasure Data)に内蔵されているHivemallを使いSQLだけで機械学習(ロジスティック回帰)を行いました。
● CDPを使った機械学習全体の流れ
大きな流れとしては以下の3つとなります。
- データの選定/データ整形
- 予測モデルの作成/評価
- 予測モデルを用いた分類
まず1.データの選定/データ整形のフェーズでは、予測に必要な説明変数の選定を行います。この工程が最も大切な工程であり、時間のかかる工程となります。
次に2.予測モデルの作成/評価のフェーズでは実際にCDP上でSQLを書きます。Hivemallというライブラリを呼び出すことで機械学習の予測モデルを作成することが可能になっています。予測モデルを作りながら、精度を評価し、精度によってはもう一度説明変数の選定/データ整形のフェーズを繰り返します。
※詳細は次記事にて説明いたします
最後に出来上がったモデルを基に3.予測モデルを用いた分類を行います。事前に学習した項目を基にユーザーごとに「休眠するor休眠しない」を予測していくれるので、ユーザーが休眠をしてしまう前にアクションを行うことが出来るでしょう。
CDP機械学習の施策への応用
CDPによって予測モデルが出来たらあとは施策に応用していきます。
休眠予測モデルを使った施策案としては「コンテンツの出し分け」が考えられます。例えば、休眠すると予測されたユーザーに対しては継続的に利用してくれるようなコンテンツやキャンペーンを届けます。KPIとしては休眠抑止数が考えられるでしょう。また、休眠しないと予測されたユーザーには、アップセルやクロスセルなどを行います。KPIとしてはアップセル/クロスセル商材のCV数などが考えられるでしょう。
このように、休眠予測されたユーザーだけにアプローチするのではなく、予測モデルによって分類出来たユーザーそれぞれに対して最適なコンテンツとKPIの設計をすることで最適な施策と評価を行うことが出来ます。
またCDP上で予測モデルを作ることで、シームレスに各ソリューションと連携して、ユーザーにアプローチする事が可能になります。
まとめ
いかがだったでしょうか?今回はCDPを使い機械学習を行い、休眠ユーザーの予測を行った事例をご紹介しました。
次回は、今回の事例をもう少し詳細にご紹介いたします。「データ集計/分析時のコツ」や「予測モデルの精度の評価」についても説明いたしますので是非ご覧ください。
また、本記事を読んで、弊社にCDPについて話を聞いてみたい方は以下よりお問い合わせください。
本件に関するお問い合わせは下記にて承ります。
株式会社DataCurrent
info@datacurrent.co.jp