コラム

2021.09.30

機械学習|「viz」×「DataCurrentセグメント」にて、性別を予測してみた

● はじめに

 「機械学習」と聞くとハードルの高い領域に感じる方もいるかもしれませんが、弊社の 機械学習ツール「viz」 を使えば、シンプルな操作で素早く機械学習による分析が可能です。

 今回はvizの機能の一つ「ターゲット抽出」を用いて実際に分析をしてみます。この機能は、顧客データなどのユーザー情報にスコアリングし、ユーザー行動の予測など行うことができます。

 この機能で、弊社が保有するWebサイト来訪者のデモグラフィック属性・サイト閲覧嗜好性から、ユーザーの性別が男性であるかどうかを予測してみたいと思います。

● 目次

・分析用データの作成
・分析実行結果
・さらに細かく見てみた
・さいごに

● 分析用データの作成

 まず、分析にかけるデータを作成します。今回分析に必要なデータの要素は下記の三点になります。

・ユーザー識別子
・目的変数(予測したい情報)
・説明変数(予測の材料となる情報)

今回の分析ではユーザー識別子をCookieID、目的変数を男性属性、説明変数をサイト閲覧嗜好性として、下図のようなデータを作成しました。
0はその属性を持っていない、1はその属性もしくは嗜好性を持っているという表記です。

この図は一部抜粋となりますが、実際にはこの横に車関心、美容関心など、20種類ほどのサイト閲覧嗜好性を示すカテゴリが紐づけられています。

● 分析実行結果

 データの作成が完了したら、早速vizにデータを取り込み分析を実行します。

 vizの管理画面で作成したデータを選択しアップロード。目的変数と分析のタイプ、顧客を識別する項目をデータの中から選択し実行します。今回アップしたデータは100万行×20列の80MB程のデータになります。

 5分ほど待ったのち、分析結果が表示されました!

 上部の「予測結果とスコア」では、ユーザーの中でスコアが高い(=男性である可能性が高いと予測された)上位10IDと、スコアの分布が表示されています。

 下部の「特徴量ごとの重要度」では、ユーザーを男性と判断する際に重要度の高かった項目(=男性セグメントに親和性の高いサイト閲覧嗜好性のカテゴリ)が表示されています。

 今回の分析結果から、金融系・自動車系・ゲーム系(interest_finance・interest_car・interest_game)などのサイトを閲覧していることが男性と判別する材料として比較的有効であるということがわかりました。

 また、結果をエクセルでダウンロードして詳細をみてみると、各ユーザーにそれぞれスコアが付与され、どのユーザーが男性である可能性が高いかを確認することができました。

● さらに細かく見てみた

 今度はさらに詳細な嗜好性でみてみるため、上位の金融系関心を貯蓄関心・投資関心の二種類に、自動車系関心をエコカー関心・バイク関心・国産車関心・中古車関心・外国車関心の五種類に細分化して再度実行してみます。

 再度実行した結果が下図です。

 今回の分析では、エコカー関心や外国車関心、貯蓄系の重要度が高いという結果が得られました。

● さいごに

 vizでは本件のように、予測結果を数分で出力することが可能です。そのため、分析結果を用いてさらに詳細な分析もスピーディーに実行することができます。

 弊社では、新規データソースの連携方法の整理や実際の連携作業、開発といったことから、既に連携しているデータのトラブル、ご相談まで幅広くサポートしています。お困りごとございましたらお気軽にご相談ください。

 またvizについてもっと知りたい方は、詳細資料を公開しております。デモを用いてご説明することも可能ですので是非お問い合わせください。

》vizサービスサイトはこちら
》詳細資料・お問い合わせはこちら

vizバナー

本件に関するお問い合わせは下記にて承ります。
株式会社DataCurrent
info@datacurrent.co.jp