Column

コラム

  • 【CDP活用】行動アクセスログを活用した分析事例...

【CDP活用】行動アクセスログを活用した分析事例

● はじめに

CDP活用として取り組まれることが多い分析。

分析手法として顧客分析や購買分析など様々ありますが、CDPならではの分析として行動アクセスログ分析を紹介します。

今回の分析目的

今回の分析目的は弊社の売上拡大に向けた優良リードの獲得とします。
弊社セミナーの参加者のリードを優良リードと定義し、そのリードを増やすためにはどういった情報発信がセミナー参加に寄与するのかを調査します。

セミナーページ来訪数総数を目的変数とし、セミナーページ含む弊社各種コンテンツをフラグ立てし、アクセス数を説明変数として集計、機械学習にて予測を行います。

セミナーページ来訪者はどのようなコンテンツに興味があるかを可視化、確認します。

分析結果サマリ

  • DC社のコンテンツにおいてはLTVスコアに関係なく、全般的にCDP(GCP)の閲覧がされている。
  • 高LTVスコアのユーザーはCDP(GCP)の閲覧とともに、機械学習(viz)のコンテンツの
    閲覧もしている傾向

施策案

  • CDP(GCP)に関するコラムやセミナーイベントの強化。
  • CDP(GCP)コンテンツ閲覧、機械学習(viz)コンテンツ非閲覧者をセグメント化。
    上記に対してメルマガやWeb接客ツールを活用し、機械学習(viz)コンテンツ、セミナーの
    案内促進。
  • CDP(GCP)×機械学習(viz)のコンテンツ、セミナーの強化。

●行動アクセスログ分析方法

今回は弊社DataCurrentサイトのアクセスログを利用します。
分析にあたり、サイトのコンテンツマスタを用意し、分析を実施します。
実施するためのSTEPは下記になります。

  1. コンテンツマスタ作成
  2. コンテンツマスタに顧客データを紐づけて整形
  3. 機械学習
  4. 予測結果の可視化
  5. 高LTVユーザーのN1分析

[STEP1]コンテンツマスタ作成

分析に向けての準備としてコンテンツマスタを作成します。
今回は弊社サービスをコンテンツ軸に持ち、各サービスに紐づけるキーワードをまとめた
マスタを用意しました。

コンテンツマスタイメージ

[STEP2]コンテンツマスタに顧客データを紐づけて整形

分析に利用するアクセスログは下記条件で集計を実施しました。

 ・データ集計期間 2022/07/01~2022/09/30
・ 対象集計期間のアクセスログのうち、セミナーページ来訪者※データを抽出。
     ※セミナ―ページ来訪≒セミナー参加と定義

 ・社内のアクセスを除外する目的で、会社の企業IPアドレスを除外。

 集計期間中にセミナーページに来訪した社内IPアドレスではない人を集計し、分析対象者を集計。
 SQL例は下記。

with a as(		
SELECT td_ssc_id,count(*) as kpi		
from access_log		
where td_url like '%seminar-events%'		
and TD_TIME_RANGE(time,'2022-07-01','2022-10-01','JST')		
group by 1		
		
),		
b as(		
SELECT td_ssc_id,'1'as flg		
FROM `IP判定済み顧客データテーブル`	
),		
c as(		
select a.td_ssc_id,a.kpi, COALESCE(b.flg,'0') as flg		
from a		
left join b on a.td_ssc_id = b.td_ssc_id		
)		
select td_ssc_id,kpi,flg		
from c		
where flg ='0'		
order by 2 desc	

分析対象者にに集計期間のアクセスログを紐づけて、①のコンテンツマスタへの紐づけをします。
紐づけ前にコンテンツ名のSQLでの対応表を整理しておくと便利です。

比較表

アクセスログにコンテンツマスタを紐づけて、機械学習用にデータ整形します。
使用したSQLは下記。

with a as(
select *
from `分析対象顧客アクセスログテーブル`
where td_ssc_id IS NOT NULL
),
b as(
select
td_ssc_id,
max(case flg when 'TOPページ' then amount else 0 end) as toppage,
max(case flg when '会社概要' then amount else 0 end) as office,
max(case flg when 'サービス' then amount else 0 end) as service,
max(case flg when 'テックコラム' then amount else 0 end) as tech,
max(case flg when 'CMP/プライバシー' then amount else 0 end) as cmp,
max(case flg when '機械学習(viz)' then amount else 0 end) as viz,
max(case flg when 'BI/ダッシュボード' then amount else 0 end) as bi,
max(case flg when 'CDP(GCP)' then amount else 0 end) as gcp,
max(case flg when 'CDP(全般)' then amount else 0 end) as cdp,
max(case flg when 'その他' then amount else 0 end) as other
from a
GROUP by 1
)
select t1.td_ssc_id,t1.kpi,
COALESCE(toppage,0) as toppage,
COALESCE(office,0) as office,
COALESCE(service,0) as service,
COALESCE(tech,0) as tech,
COALESCE(cmp,0) as cmp,
COALESCE(viz,0) as viz,
COALESCE(bi,0) as bi,
COALESCE(gcp,0) as gcp,
COALESCE(cdp,0) as cdp,
COALESCE(other,0) as other
from `機械学習用フラグ集計テーブル` as t1
left join b on t1.td_ssc_id = b.td_ssc_id

集計の結果、下記のテーブルを作成します。
顧客毎に目的変数(KPI)と目的変数(各コンテンツ)をどの程度来訪しているか集計したデータです。

機械学習用データセット

[STEP3]機械学習の実施

STEP2で作成したデータで機械学習を実行します。
今回の機械学習は弊社の機械学習ツール「viz」を利用します。

  • 分析対象者:セミナーページ来訪者
  • ユーザー識別子:ユーザーID(td_ssc_id)
  • 説明変数:サイト来訪ページの各カテゴリで分類

作成したデータを「viz」に取t込、分析をすると分析結果が画面上で確認できます。

上部では、分析したユーザーの中でスコアが高い(=セミナーページ訪問数が多い可能性が高いと予測された)上位10IDと予測した訪問回数とそのスコアの分布が表示されています。

 下部の「特徴量ごとの重要度」では、セミナーページの訪問数が多いユーザーと判断する際に重要度の高かった項目が重要度の高い順に表示されています。

今回のvizによる分析結果からは、gcp(=CDP(GCP))、CMP(=CMP/プライバシー))、viz(=機械学習(viz))のコンテンツの閲覧数がセミナーページ訪問数が多いユーザーの予測材料として有効である可能性がわかりました。  

  

[STEP4]予測結果の可視化

「viz」の分析結果は画面上での確認のほか、データ出力可能です。
出力したデータをBIツールで可視化してみます。 

・スコア毎のコンテンツ訪問傾向

viz結果1

・スコアとユーザーID分布

  • GCPのコンテンツはスコアに関係なく、閲覧されている傾向がみられます。
  • CMPのコンテンツは低スコアに閲覧されている傾向です。
  • vizのコンテンツはスコアに関係なく、閲覧されている傾向がみられます。

[STEP5]高LTVユーザーのN1分析

STEP4でスコア毎の傾向が確認できましたが、ユーザーの単位に掘り下げて行動傾向を確認するため、
対象ユーザーを限定しN1分析を実施します。
今回はスコアの高いユーザーをピックアップしました。


スコア10ユーザー

 機械学習(viz)コンテンツ接触後、CDP(全般)、CDP(GCP)にも接触、機械学習(viz)とCDP(全般・GCP)のコンテンツを中心に接触している傾向。 

スコア9ユーザー

機械学習(viz)コンテンツ接触後、CDP(全般)、CDP(GCP)機械学習(viz)を中心にコンテンツに接触している傾向。

スコア7ユーザー 

機械学習(viz)コンテンツ接触後、CDP(GCP)と機械学習(viz)のコンテンツ接触が多い傾向。

●結果まとめ


  • 可視化・確認したい内容
    セミナーページ来訪者はどのようなコンテンツに興味があるか
  • 分析結果
    ①DC社のコンテンツにおいてはLTVスコアに関係なく、全般的にCDP(GCP)の閲覧が
    されている。
    ②高LTVスコアのユーザーはCDP(GCP)の閲覧とともに、機械学習(viz)のコンテンツの
    閲覧もしている傾向
  • 分析結果を元にした施策検討
    ①CDP(GCP)に関するコラムやセミナーイベントの強化。
    ②CDP(GCP)コンテンツ閲覧、機械学習(viz)コンテンツ非閲覧者をセグメント化。
     上記に対してメルマガやWeb接客ツールを活用し、機械学習(viz)コンテンツ、
     セミナーの案内促進。
    ③CDP(GCP)×機械学習(viz)のコンテンツ、セミナーの強化。

● まとめ


今回は「行動アクセスログ分析」についてご共有いたしました。

 弊社では、定点的なリサーチやデータ分析、BIによる可視化などをおこなっています。性別や年代等の属性分析や検索トレンドのダッシュボード提供等様々なパッケージをご用意しておりますので、お気軽にお問い合わせください。

≫CDP構築/活用支援のサービス資料


またコラム内に登場しますCDP(GCP)に該当しますサービスも用意しております。

▼CDP(GCP)サービス
》「GA4×Google Cloud×GTMを活用したクッキーレス対策」の詳細はこちら

クッキーレス対策資料

※DC社では、他にもGA4の導入、導入後の活用施策、データを活用した機械学習をご提案させていただいております。ご興味がある方は下記フォームにてお問合せいただければと思います。

本件に関するお問い合わせは下記にて承ります。
株式会社DataCurrent
info@datacurrent.co.jp

人気のコラムランキング

PICK UP

【データプライバシーコラム】電気通信事業法改正の解説(2022年7月時点)

CMPPICK UP コラムデータプライバシーデータプライバシーコラム個人情報保護

CMP導入時の注意点

CMPPICK UP コラムデータプライバシーデータプライバシーコラム個人情報保護

Treasure Data CDPを活用したOneID(統合ID)構築4 日付の落とし穴

CDPCDP活用ID統合PICK UP コラム

今、CMPは導入するべきか?

CMPPICK UP コラムデータプライバシーデータプライバシーコラム個人情報保護

TOPへ
戻る