2022.03.15 コラム
【アドテクコラム】CV数を機械学習アシストツール「viz」で予測分析してみた!
●サマリー
- サイト来訪ユーザーのCV予測が可能
- サイト来訪ユーザーをCVする可能性に応じて10段階でスコア化(≒クラスタ分け)することが可能
- CVに影響を与える特徴量(要素)は何かあたりをつけることができる
●機械学習アシストツール「viz」の特徴3つ
- csvアップロードで簡単機械学習(csvアップロードで簡単分析)
- データもよるが、1分程度で結果を出力 ※縦 約5300レコード、横50列 容量500KBの場合
- 「簡単×早い」からこそいろんな粒度で何度でも分析/深掘りすることができる
詳細はこちら 》
●検証方法
■予測したいもの
ECでの商品購買数(=CV数)
■予測につかうデータ
ECサイトのアクセスログ
∟予測したい項目:ECサイトでのCV数
∟予測に使う情報(特徴量):コンテンツ毎のPV数
■予測方法
機械学習アシストツール「viz」ターゲット抽出機能 連続値予測
■検証手順
<ステップ1>
- 予測につかうデータを手配
下記のようなデータを手配します。(今回のファイル:レコード数 縦 約5300行、横50列、ファイル容量500KB)
一番左にユーザーを識別するID(user_id)、その隣に予測したい項目(今回はECサイトでのCV数)、以降予測に使う情報(特徴量)を並べます

<ステップ2>
- csvをディスクトップから参照
<ステップ3>
- 予測したい項目/分析のタイプ/顧客を識別する項目をプルダウンやラジオボタンで簡単選択
∟予測したい項目=購入数
∟分析のタイプ=連続値予測
∟顧客を識別する項目=ユーザーID

<ステップ4>
- 分析中
今回はこの画面は1分で結果がでました。

<ステップ5>
- 分析結果を出力
■検証結果
今回大きな特徴として飛びぬけているユーザー(はずれ値といったりもします)が1ユーザーいたので、このユーザーを除外して もう一度分析をしてみたいと思います。

■検証結果
先ほどとは違う結果がでました。
スコアの出現頻度は1にプロットされているユーザーが多いが、3~4のプロットされるユーザーが出現しました。
特徴量においては28は前回と同じく上位に表示されました。

今回の一連のながれですが、5分程度で深掘りできました。
●さいごに
これまでは弊社内でも機械学習での分析に取り組む場合、エンジニアをアサインし、プロジェクトを組んで実行、エンジニアをアサインするための起案、プロジェクトのキックオフ、分析の実行とかなりの時間を要しておりました。
こちらのvizをつかうことで、分析までの工数を大幅に削減でき、スピーディーに分析と深掘りができました。
機械学習アシストツールvizに興味ある方は是非お声がけくださいませ。
■関連記事/資料
本件に関するお問い合わせは下記にて承ります。
株式会社DataCurrent
info@datacurrent.co.jp