Column

コラム

  • Treasure Data CDPを活用したOneID(統合...
  • CDP
  • CDP活用
  • ID統合
  • PICK UP コラム

Treasure Data CDPを活用したOneID(統合ID)構築3 姓名突合での落とし穴

● はじめに

 本シリーズでは、Treasure Data CDPを用いて様々なデータソースに点在する企業保有の顧客データを統合し共通のIDで管理する「OneID(統合ID)構築」の取り組みについてご紹介させていただきます。

 第三回目となる本記事では、OneID構築をするうえで、ユーザー同士を紐づける際に、突合情報として顧客の姓名を利用する場合の落とし穴、注意点についてご共有させていただきます。

 〇第一回目の記事はこちら
  https://www.datacurrent.co.jp/column/cdp_one_id_20220225/
 〇第二回目の記事はこちら
  https://www.datacurrent.co.jp/column/cdp_one_id_20220331/

● 目次

・OneID構築における突合キー
・姓名突合の落とし穴1:姓名の文字の表記ゆれ
・姓名突合の落とし穴2:姓と名の区切り方
・まとめ

● OneID構築における突合キー

 システムをまたいで同一の顧客を判別し共通のIDを発行する「OneID構築」の取り組みでは、複数のシステムの顧客情報で共通する要素を見つけ出し、紐づけの材料とする必要がありますが、その際よく使われるものとして顧客の姓名や生年月日、電話番号などがあります。

 特に顧客の姓名は基本的に不変のものであり、同一人物を特定する情報として多く用いられるものになりますが、情報を突合するうえでデータの保持状態などを正しく考慮しなければ、OneIDとして管理する際に不都合が生じてしまうことがあります。

 今回はそうした不都合が生じてしまう「落とし穴」を、二つご紹介いたします。

● 姓名突合の落とし穴1:姓名の文字の表記ゆれ

 顧客の姓名によって顧客情報を突合する場合に、まず気を付けなければならないのは「表記ゆれがないかどうか」になります。漢字表記での姓名を突合情報として用いる場合、同一人物であっても「齋藤」さんと「斉藤」さんのように漢字表記が異なっているために突合できないという可能性が考えられるためです。

 接客した担当者ごとに都度情報を手入力している、など、システムへのデータの入り方によっては頻発しうる問題でもあり、この表記ゆれがないかどうかの確認は単純ながらOneIDを構築するうえでは非常に重要な注意点となります。

表記ゆれ対策前

 もしも表記ゆれが発生しており、漢字の姓名で同一人物と判別できないデータが多くみられるようなデータの場合は、漢字ではなくカタカナ表記での姓名を突合に用いるなど、より表記ゆれの少ない姓名情報の利用を検討する必要があります

表記ゆれ対策後

 また、カナでの姓名突合においても、全角表記か半角表記かというように、システムでのデータ保持方法によっては表記ゆれが発生している場合もあるため、全角半角をどちらかに変換して統一するなどケアする必要がある点にも注意が必要です。

表記ゆれカタカナ対策

● 姓名突合の落とし穴2:姓と名の区切り方

 姓名の表記の違いとしては、文字の違いだけでなく、データの入り方の違いも考えられます。

 たとえば、HPのお問い合わせフォームに記入された顧客情報を集積するシステムで、一部の顧客が苗字の部分にフルネームを入れてしまっているために、姓名が分かれている場合と分かれていない場合が混在してしまっているような場合です。

姓名区切り対策前

 対処方法として、例えばフルネームが入っている部分を姓名の間のスペースで分割し、姓と名で分かれた状態に統一するなど、データの前処理を行う方法が考えられます。

姓名区切り対策後

 本例の他にも、たとえば顧客が夫婦連名で入っている(例:齋藤 ○○・××)、姓名が一続きになっている(例:齋藤○○)など、データの入り方はシステムによってさまざまなパターンが考えられます。

 データ取得時に統一した形で蓄積するように制御するというような、データ管理の視点からの工夫も重要ですが、すでに入っているデータの状況やパターンを洗い出し、突合できるような形式で統一されているかを確認することもOneIDを構築するうえで大きな注意点となります。

● まとめ

 今回はOneID構築において姓名突合を用いる場合の注意点についてご共有いたしました。

 弊社では、新規データソースの連携方法の整理や実際の連携作業、開発といったことから、既に連携しているデータのトラブル、ご相談まで幅広くサポートしています。お困りごとございましたらお気軽にご相談ください。

 〇第一回目の記事はこちら
  https://www.datacurrent.co.jp/column/cdp_one_id_20220225/
 〇第二回目の記事はこちら
  https://www.datacurrent.co.jp/column/cdp_one_id_20220331/

●関連サービス

》CDP構築/活用支援のサービス資料はこちら

本件に関するお問い合わせは下記にて承ります。
株式会社DataCurrent
info@datacurrent.co.jp

人気のコラムランキング

PICK UP

今、CMPは導入するべきか?

コラム

Treasure Data CDPを活用したOneID(統合ID)構築3 姓名突合での落とし穴

コラム

機械学習 | 「viz」×焼肉のたれの売上を肉の売上でシミュレーションしてみた

コラム

CMPツールの導入手順について

コラム

TOPへ
戻る