13
Webサービスによるユーザ嗜好に適応した お薦めシステムに関する基礎研究 北海道大学 工学部 情報工学科4複雑系工学講座 調和系工学研究室 山下晃弘 A Study on User-Adaptive Recommender System Based on Web Service

yamashita b

Embed Size (px)

Citation preview

Page 1: yamashita b

Webサービスによるユーザ嗜好に適応した

お薦めシステムに関する基礎研究

北海道大学 工学部 情報工学科4年

複雑系工学講座 調和系工学研究室

山下晃弘

A Study on User-Adaptive Recommender System

Based on Web Service

Page 2: yamashita b

2006/2/8 卒業論文発表練習 1

・飲食店の評価

・好みのジャンル

etc...

背景

近年、Web上の情報資源は増加し、利用形態も多様化している

利用者の趣味・嗜好を考慮した、お薦めシステムが注目されている

キーワード検索

適切なキーワードを考える必要がある

お薦めシステム

趣味嗜好という感覚的側面を判断

例: 喫茶店○○の住所が知りたい

例: どこか美味しいお店を知りたい

個人の嗜好情報を収集 嗜好の近いユーザを探す

飲食店情報 ユーザ情報

・コンテンツベースフィルタリング

・協調フィルタリング

・相関係数法 [Resnick 1994]

・逐次的二項関係学習法 [Nakamura, Abe 1998]

・なんとなく協調フィルタリング [Kamishima 2003]

関連技術

嗜好の近いユーザの評価を基に飲食店を提示

飲食店情報サイト

Page 3: yamashita b

2006/2/8 卒業論文発表練習 2

問題点

・ ベンダーの提供するシステムは、導入時の経済的コストが大きい

お薦め機能を導入しているのは、大部分が大手商用サイトである

※出典: Webパーソナライゼーション 日経BP社 2002

個人や中小企業のサイトではお薦め機能の導入が難しい

Awareness Net システム(NTT東日本)

アイジェント (Silver Egg Technology)

・ フリーのお薦めエンジンを利用するためにはプログラミング技術が必要

日本のベンダーによる一般的なサービス価格 500万円~3000万円※

代表例

Page 4: yamashita b

2006/2/8 卒業論文発表練習 3

目的

誰でも無償で利用できるシステムをオープンな技術で構築し公開する

実際にお薦めシステムを運用し、その実用性を検証する

Webサービス技術を利用することにより、プラットフォームに依存せず多様なニーズに対応可能

Page 5: yamashita b

2006/2/8 卒業論文発表練習 4

Webサービス型汎用お薦めシステム

• ユーザ管理

• コンテンツ管理

• 推薦アルゴリズム

• アルゴリズムのデータ管理

• ユーザインタフェース

お薦めプロバイダ

映画情報

飲食店情報

blog

モジュール

モジュール

モジュール

お薦め情報一般ユーザ Webサービスとして

お薦め機能を提供

お薦めリクエスタ

必要な機能 お薦めシステムのWebサービス化

システム構築時の方針

• 出来る限りフリーで利用可能な技術を利用する

• 計算速度や通信速度より言語や環境に依存しない一般性を重視する

• 開発のしやすい方法で、拡張性の高さやメンテナンスの容易さを考慮する

Page 6: yamashita b

2006/2/8 卒業論文発表練習 5

Webサービスによるシステム構築

• XOOPSのモジュールとして実装

– お薦めモジュールのインストールが容易

– PHPにより、Webコンテンツを簡単に構成可能

– 外部モジュールの利用により簡単に機能が追加できる

– ユーザ管理コンテンツ管理など、お薦めシステムとして利用可能な機能が充実

プロバイダとリクエスタ間の通信にはSOAPを使用

・ W3Cの勧告であり、Webサービスの標準技術である

・ XMLにより通信を行うため、言語やプラットフォームに依存しない

お薦めプロバイダ

お薦めリクエスタ

• Javaによる実装

– アプリケーションサーバやSOAPライブラリが充実

– WebアプリケーションやWebサービスのサーバとして構築例が豊富

Page 7: yamashita b

2006/2/8 卒業論文発表練習 6

システム構成

基本モジュール 拡張モジュール

お薦めリクエスタ お薦めプロバイダ

XOOPSシステム(CMS) お薦めシステムWebサービス

ユーザ管理

コンテンツ管理

コミュニティ

XOOPSコア部分 XOOPSライブラリ

HTTPサーバ PHPDB

(MySQL)HTTPサーバ JavaVM

DB(MySQL)

データ管理

お薦めアルゴリズム通信

インタフェース通信

インタフェース

ユーザインタフェース

SOAP通信

Axisサーブレット

サーブレットコンテナ(Tomcat)

お薦めモジュール

今回新たに構築した部分

Page 8: yamashita b

2006/2/8 卒業論文発表練習 7

協調フィルタリング - 相関係数法 ー

ααの評価推定値が未知のコンテンツユーザ

の類似度とユーザユーザ

集合が評価したコンテンツユーザ

を評価したユーザ集合コンテンツ

に対する評価のコンテンツユーザ

 コンテンツ集合ユーザ集合 

ii

jiji

ii

ii

ijji

mn

ecu

uusimuu

Cu

Uc

ecu

ccCuuU

ˆ:

),(:

:

:

:

},,{:},,{: 11

jiji

ji

CCa

jja

CCa

iia

CCa

jjaiia

ji

eeee

eeee

uusim22 )()(

))((

),(

ji CCa

iai ee

α

α

α

α

Uj

ji

Uj

jjji

iiuusim

eeuusim

ee),(

))(,(~ˆ

i

Ca

ia

iC

e

e i

~

評価済み

コンテンツ集合

ユーザが既知の

コンテンツ集合

全コンテンツ集合

iCjCji CC

を計算),( ji uusim

)ˆ(maxarg: αα

推薦するコンテンツ ie

類似度小

類似度大 高評価

コンテンツ

Page 9: yamashita b

2006/2/8 卒業論文発表練習 8

システムの運用

対象コンテンツ 映画

ユーザ数 25名程度

コンテンツ数 100タイトル

お薦めアルゴリズム 協調フィルタリング(相関係数法)+レビュア評価

・ レビュー 5段階評価+レビューコメント投稿

・ レビュア評価 5段階評価

お薦め表示 評価が高いと推測された上位3つのコンテンツを表示

レビュー: ユーザがコンテンツに対して行う評価やコメント

レビュア: 1回以上レビューを行ったユーザ

・ 趣味や嗜好が強く反映されるコンテンツで実際にシステムを運用する

・ 推薦されるコンテンツがそのユーザに適応しているかを観察する

・ ユーザの嗜好を反映するためには多くのレビューが必要

Page 10: yamashita b

2006/2/8 卒業論文発表練習 9

Page 11: yamashita b

2006/2/8 卒業論文発表練習 10

運用した結果得られたデータ例

12

3

4

5

6

7

8

9

10

11

12

14

15

16

17

13

ノード:レビュア

エッジ:ユーザ間の類似度

赤:正の相関

青:負の相関

太:強い相関

細:弱い相関

ユーザ間の嗜好の類似度グラフ

得られた総レビュー数:210

レビュア:17名

Page 12: yamashita b

2006/2/8 卒業論文発表練習 11

お薦めシステム構築方法の比較

Apache、PHP、MySQL、

XOOPSのインストール ベンダーに依頼

構築するシステムについて

ベンダーと相談

Apache等HTTPサーバ、

DBMSのインストール

開発環境の構築

お薦めモジュールの

インストール

フリーのモジュールを

Webサイトに組み込む

(プログラミング)

お薦めシステムの運用

モジュールの仕様に沿って

システムを設計する

ベンダーに依頼する場合 フリーモジュールを利用する場合 提案する方法の場合

Page 13: yamashita b

2006/2/8 卒業論文発表練習 12

まとめと今後の課題

• 一般ユーザでも簡単に低コストで導入可能なお薦めシステムの基盤を構築した

• 実際にシステムをテスト運用し、システムの有効性を検証することができた

• あるレビューが他の人の推薦にどの程度影響を与えてるかを可視化する方法はあるか

• レビュアの人気ランキングを表示することで評価するインセンティブに繋がる

• 興味の無い映画が推薦された場合にシステムに知らせる方法があると良い

• コンテンツの新規登録では、映画のタイトルから他の属性は自動入力できないか

• 監督、俳優、ジャンルの繋がりを考慮した推薦は可能であるか

まとめ

ユーザからの意見や要望