» ビッグデータ活用におけるマスタデータマネジメント

株式会社データ総研 データ総研のオンサイト教育
製品案内 DMBOK ITコンサルティングサービス ITコンサルティング事例 紹介セミナー 教育コース 技術情報 DRIブログ 会社概要
ビッグデータ活用におけるマスタデータマネジメント

「ビッグデータを活用すると良いことがありそうだ」というメッセージをいたるところで目にするようになりました。最近は、ITの専門雑誌のみならず、一般の雑誌や新聞でも「ビッグデータ」という言葉を見つけることができます。「ビッグかスモールかに関わらず、わが社でも情報活用をもっと推進すべきだ」とおっしゃっている経営者が増えたと実感しています。

ところで、典型的なビッグデータを保持するFacebookやツイッター(twitter)は、主に個人や企業の情報発信で使われます。そのときどきに興味をもったこと、感動したこと、不思議に思ったことなどを自分の言葉で写真で表現します。たとえば、他人が自分の昼食について知りたがっているかどうかなど気にせずに、メッセージを発信したいと思えば、Facebookにコメントと昼食の写真をアップします。それを見た人たちは、興味がなければ読み飛ばしますし、興味があれば、何らかの反応を返します。

さて、この種のデータを企業がマーケティングやリレーションシップマネジメントの目的で活用する場合、メッセージを発信している人や対象の品物、あるいは場所を特定したいと考えます。ところが、コメントや写真に人・品物を特定するID(識別子)が見つかることは期待できません。従って、これらのデータを普段業務で使っているデータと統合しようと思っても、すぐにはできないのです。ここがビッグデータ活用の難しさの1つです。

一般に、企業は人や品物などのマスタデータを特定するために、全社的な広さでIDを発番管理しています。さまざまなトランザクションデータにこれらのIDが含まれていることで、ID単位の売上集計や利益貢献度の比較が可能となるからです。マスタデータマネジメントは、この種の情報要求に応えるための重要な業務です。

仮に、マーケティングでビッグデータを活用したいのであれば、個人を特定する必要があります。自社で発番したIDを持たないFacebookやツイッター(twitter)のデータに対して、何らかの手段で人のIDを関連付けなければなりません。これがまさに、ビッグデータ活用におけるマスタデータマネジメントの中心課題です。関連づけに手間がかかることが最大の難関ですが、それ以外にも個人情報保護も留意すべきことです。

そういえば、先日、JR東日本がSuicaの乗降客情報を販売する話が、個人情報を使っているのではないかと心配されました。実際には個人名が特定できるデータを販売しているわけではなかったのですが、センシティブなテーマであることが確認された出来事でした。

マーケティングでは、どういうタイプの人が、どういうタイプの商品を買う傾向があるか、理解できれば良いという考え方もあります。しかし、この情報を得るためには、一旦個人を特定したデータをつくってから、各個人のプロファイル情報すなわち性別、年齢、職業、趣味などを把握したのち、個人名が特定されない情報に変換することになります。いずれにしても、最初に個人が特定できるデータを作成しなければなりません。

マスタデータマネジメントは企業の情報活用に大きく貢献しています。ビッグデータを使う領域が新たに追加され、ますますその重要性を増すことになるでしょう。

データ総研 コンサルタント