» レコメンデーションロジック

株式会社データ総研 データ総研のオンサイト教育
製品案内 DMBOK ITコンサルティングサービス ITコンサルティング事例 紹介セミナー 教育コース 技術情報 DRIブログ 会社概要
レコメンデーションロジック

最近は、ネット上の店舗から書籍・電気製品・旅行などさまざまな商品やサービスを購入できます。これらのネットビジネスでは、会員に対してさらなる購入を促すべく、魅力的な案内を送ります。

たとえば、
・この本を買った人は他にもこんな本を買っています
・あなたの好きな作家の最新本が発売されます
・本日は近所の○○スーパーでビールの特売があります
・一クラス上の旅館をあなただけに格安でご案内します
など

当然のことですが、会員一人一人の購入履歴を担当者が読み解いて、推奨対象の商品やサービスを選んでいるわけではありません。レコメンド対象を自動的に選択するためのアプリケーションが存在します。

この種のアプリケーションが利用するレコメンデーションロジックには、主に2つの方法が存在します。協調フィルタリングとコンテンツベースフィルタリングです。

協調フィルタリングとは、同じものを購入する人は好みが似ているはずだからその人たちの購入履歴を分析して、推奨商品やサービスを決定しようとする方法です。

たとえば、各人の購入履歴で書籍名が次のように並んでいたとします。
鈴木さん→EA実践・アジャイル開発・Hadoop入門・Webサービス・Web_AP
佐藤さん→アジャイル開発・Hadoop入門・NoSQL・EA実践
田中さん→京都旅行・京都の古刹・仏像の見方・手軽に作れるランチ

類似度を計算すると鈴木さんと佐藤さんが近しいので、鈴木さんには佐藤さんの購入履歴にあって、鈴木さんがまだ購入していない書籍(NoSQL)を推薦してみようと判断します。

一方、コンテンツベースフィルタリングはどのように推奨するのでしょうか。上記の例で言えば、EA実践・アジャイル開発・Hadoop入門などの書籍を書籍分類:IT関連などと分類します。そして、その分類の中での売れ筋1位とか、新刊などを推奨するのです。この場合のポイントは「どのような視点でこの分類を準備しておくか」です。同じ作家の小説を好んで購入する人もいれば、広い分野にわたってベストセラーを購入する人もいます。

協調フィルタリングとコンテンツベースフィルタリングはそれぞれ一長一短あります。協調フィルタリングは面倒な分類の設定をしなくても、購入履歴を統計的に処理すれば推奨商品が見つかるという長所があります。ただし、購入履歴が少ない人には有効な推奨商品を見つけられないという短所もあります。

また、次のような人の購入履歴
黒澤→EA実践・アジャイル開発・Hadoop入門・Webサービス・競馬の極意
と鈴木さんの購入履歴
鈴木→EA実践・アジャイル開発・Hadoop入門・Webサービス・Web_AP
が非常に似ていたとしても、鈴木さんに競馬の極意を推奨したところでフィットするとは限りません。コンテンツベースフィルタリングのように一旦IT関連で分類されていれば競馬の極意は推奨対象からはずれることになります。最近のレコメンデーションロジックはこの2つを組み合わせたものや、会員がアップしたテキスト文を解析するものなど、高度化しています。

年に数回ですが、アメリカのAmazon.comから書籍の推奨メールが来ますが、私がほんとうに読んでみたくなるようなEA・データマネジメントに関するものだけに絞られています。レコメンデーションロジックが日々洗練されていると感じます。

データ総研 コンサルタント