29
修士論文 個人の感性モデルを推定する インタラクティブな商品推薦システム Interactive recommender system to estimate personal user’s Kansei models 同志社大学大学院 工学研究科 情報工学専攻 博士前期課程 2011 年度 736 宮地 正大 指導教授 三木 光範教授 2013 1 25

個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

 

修士論文

個人の感性モデルを推定するインタラクティブな商品推薦システム

Interactive recommender system to estimate personal user’s Kansei models

同志社大学大学院 工学研究科 情報工学専攻博士前期課程 2011年度 736番

宮地 正大

指導教授 三木 光範教授

2013年 1月 25日

Page 2: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

Abstract

A personalized recommender system is implemented to change recommendation items

into each user on the online shopping services. In generally, collaborative filtering using

large-scale user information is used in these systems. However, this method is not reflected

individual user’s taste or Kansei, because it searches the user that has similar tastes in

large-scale user information. In this paper, I proposed the recommendation method using

the user’s Kansei model that expected by interactive Genetic Algorithm. In the proposed

method, it defined the similarity between words by the Kansei network in the Kansei

model as the neighborhood. Therefore, it can apply to genetic operations. Indicate the

possibility of keyword items on the subject of the simulation, similar to the results by this

method appears recommendation.

Page 3: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

目 次1 序論 1

2 推薦システム 2

2.1 協調フィルタリング . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

2.2 内容ベースフィルタリング . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

2.3 推薦システムおける個人化手法の先行研究 . . . . . . . . . . . . . . . . . . . . . . . . 2

3 対話型遺伝的アルゴリズムと感性モデル 3

3.1 概要 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

3.2 遺伝的操作 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

3.3 感性モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

4 提案推薦システム 5

4.1 概要 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

4.2 特徴単語の重みの決定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

4.3 感性語ネットワーク . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

4.4 感性パラメータの推定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

5 システム評価実験 7

5.1 実験目的 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

5.2 実験内容 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

5.3 結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

5.4 考察 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

6 結論 10

i

Page 4: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

1 序論情報化技術の発展により,Web上に膨大な量の情報が溢れている.これらの大規模なデータから情報を閲覧するユーザが求めるコンテンツを的確に得ることは難しい.そのため,一部のオンラインショッピングサイトやニュースサイトなどではユーザ個別に推薦内容を変化させるパーソナライズされた推薦システムが組み込まれている1,2).推薦システムは大きく分けて協調フィルタリングと内容ベースフィルタリングの二つに分類される.前者はユーザ全体の行動履歴を用いてコンテンツ間の関連度を求めることで推薦コンテンツを決定する手法である.他のユーザとの好みの類似性を基本としたアルゴリズムであるため,ユーザが未知の商品が推薦される場合がある3).後者は対象となるコンテンツに含まれるメタ情報(著者・出版社・内容など)を特徴ベクトルとして保存することで,ユーザの好みとするコンテンツを予測する手法である4).大規模なシステムでは主に,前者の協調フィルタリングが用いられている.しかし,手法の特徴として大規模なユーザの中から対象ユーザと類似する嗜好を持つパターンを識別する手法であるため,真に個人の嗜好や感性といった情報を用いた推薦がされているとは言えない.推薦システムのパーソナライズ手法の一つとして ,個人の感性をモデル化することで利用者個別の嗜好に合わせた推薦が可能であると考えられており,様々な研究が行われている5).本研究では,コンテンツの特徴ベクトルを設計変数とした対話型遺伝的アルゴリズム6)

の要素を取り入れることで,ユーザの感性に沿った推薦システムを構築する.例えば,異なる二種類のドメインに興味のあるユーザに対して,それぞれの特徴に類似する推薦を行うのではなく,それらの持つ特徴同士から感覚(感性)的に連想される中間の概念からも推薦することで,利用者に新しい気付きを与えるシステムの構築を目指す.従来の遺伝的アルゴリズムを用いた推薦手法では,コンテンツの持つ特徴量すべてを設計変数とし,それらの重みをユーザの行動履歴から遺伝的操作により最適化することで,ユーザの求めるパラメータを推定する手法を用いている7,8).しかしこの手法では,設計変数の数が膨大になるため,解探索の精度が悪化することが考えられている.その理由として,この制約条件下では異なる設計変数同士には互いに関連の定義がされていないために遺伝的操作を行うことができず,すべての特徴量を別次元として扱う必要がある.単純にコンテンツの持つ特徴量ベクトルの要素を部分的に入れ替える交叉手法も考案されているが,親子個体の持つ特徴量をそのまま受け継ぐため,近傍の探索が十分に行われていない8).そのため,推薦結果として親個体に類似したコンテンツは現れるが,親同士を概念上で結ぶような推薦結果を得ることは難しい.そこで本研究では,感性語ネットワークという単語間に関連を持たせたグラフ関係を特徴語の近傍定義とすることで,異なる次元間での遺伝的操作を可能とする手法を提案する.これにより,親個体の持つ特徴量から新たに類似する概念を生成した上で推薦を行うため,多様かつ感性的な繋がりを持つコンテンツの提示が期待される.また,設計変数としてすべての特徴量を保持する必要がなくなるため,解探索精度および計算効率の向上が見込まれる.提案推薦システムの有用性を検証するため,対象問題としてオンラインショッピングサイト (楽天市場1)の書籍商品情報を用いたシミュレーション実験を行った.その結果,従来の手法では現れなかった概念を持つコンテンツが推薦結果に現れることを確認した.

1http://www.rakuten.com

1

Page 5: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

2 推薦システム2.1 協調フィルタリング

多数のユーザの中から行動履歴の類似したユーザを抽出することで,そのユーザの参照したコンテンツを推薦し合うユーザベース方式や,類似したコンテンツを上記の手法で抽出するアイテムベース方式がある.他のユーザとの好みの類似性を基本としたアルゴリズムであるため,ユーザが未知の商品が推薦される場合がある.協調フィルタリングは推薦・予測にコンテンツ自体の先験情報が必要ないため手軽に導入が可能であり,多分野のコンテンツが入り交じるシステムでの利用が可能である.しかし,システムの条件としてすべてのコンテンツをユーザが評価する必要があるため,ユーザが多数いることが必要となる.そのため,誰も評価していないコンテンツは推薦される可能性が低くなり,推薦されるコンテンツが集中する問題点もある.大規模なシステムに導入されることが多く,Google

や Amazonなどで用いられている1,2).Fig. 1にアイテムベースの協調フィルタリング概要を示す.Fig. 1左表では,ユーザ [A-C]がアイテム [a-d]を購入したかどうかのデータが示されている.この情報によってアイテム同士のセットで購入される確率を導き出す事ができる.ユーザに対してこの確率に基づいてコンテンツを提示することで,有用な推薦結果を得ることができる.

2.2 内容ベースフィルタリング

ユーザの行動履歴とコンテンツに含まれる著者・出版社・内容などのメタ情報を特徴ベクトルとしてマッチングさせる手法である.推薦システムがユーザ評価を必要としないため,全コンテンツを公平に推薦対象とすることができ,小規模なシステムへの導入が可能である.単純にコンテンツが持つ情報を含む別の類似コンテンツを推薦する手法では,提示されるコンテンツが偏る問題がある.そのため,類似する概念を含むコンテンツを提示するファジィ手法を用いる場合がある9).

2.3 推薦システムおける個人化手法の先行研究

ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考えられる4).ユーザの嗜好に応じてパーソナライズされた推薦を行うためには,ユーザの嗜好を表す感性モデルを何らかの方法で学習・予測する必要がある10).代表的な手法としては,確率推論に基づく手法であるベイジアンネットワーク11)や隠れマルコフモデル12),ユーザの求める要素のパラメータを推定・最適化する手法である対話型遺伝的アルゴリズムなどが挙げられる.

2

Page 6: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

3 対話型遺伝的アルゴリズムと感性モデル3.1 概要

対話型遺伝的アルゴリズム (interactive Genetic Algorithm: iGA)は,多点探索の最適化アルゴリズムである遺伝的アルゴリズム(Genetic Algorithm: GA)をベースとした対話型最適化手法である.人間の感性のモデルを設計変数空間のランドスケープ(勾配)として捉え,その空間における最良点,もしくは最良域を探索する.Fig. 2に対話型遺伝的アルゴリズムの流れを示す.

iGAを実装したシステムは,ユーザに対して多数の候補解を提示し,ユーザは感性や好みに基づいてそれらを評価し,その評価値を用いてシステムは遺伝的操作を適用する.遺伝的操作によってユーザが高い評価を与えた個体の形質を受け継いだ子個体を生成し,その個体をユーザに再提示する.これらの操作を繰り返すことで,集団全体をユーザの好むものへと変化させる.

iGAは感性による評価を必要とするアプリケーションに利用されている.例えば,3DCGのライティングデザイン13)や補聴器フィッティングの設計14),Tシャツのデザイン支援15,16),浴衣のデザイン設計17)といった対象問題に適用され,成果を上げている.

3.2 遺伝的操作

iGAでは,他の最適化問題と同様に最適化の対象とする候補解を設計変数として表現する.例えば,服飾デザイン支援システムであればデザインする服の形状や色,装飾などが設計変数として定義され,各解はその設計変数のベクトルによって構成される.最適化を行う遺伝的操作のフェーズでは,さらにこの設計変数を 01のビット列や遺伝子の型と実数値などの染色体に修正して用いる.Fig. 3

に遺伝的操作の流れを示す.まず,試行の最初に,染色体を多数含む母集団を初期化する.そして,この染色体一つ一つに対してユーザが評価を行う.評価値の高い染色体を親個体として選択し,情報を組み替える交叉を与えることで,より高い評価が期待される子個体を生成する.また,探索途中に局所解に陥ることを防ぐために確率的に突然変異を行う.これらの選択,交叉,突然変異を一連の流れを 1世代の操作とする.何世代か繰り返すことで,徐々に評価の高い集団へと進化させていく.

iGAでは対象となる評価モデルの構築は行わないため,対象問題に合わせて定義する必要がある.

3.3 感性モデル

本論文で扱う感性モデルとは,人間の持つ心理的な好みのモデルである.感性モデルは個々人によって異なっており,対象の設計変数となる感性パラメータを入力として,心理的な適合度を出力する.その個々人の持つ評価関数を最大化するために,感性パラメータの組み合わせ及び重みを最適化する必要がある.設計変数となる感性パラメータと適合度によって構成される勾配を感性ランドスケープと呼び,感性に合う領域と合わない領域の識別や,感性に合う領域の広さなどから,そのユーザの特性を把握することができる.Fig. 4に T-シャツの色及び形の設計問題における感性ランドスケープの例を示す.このユーザのランドスケープから,赤色/白色のシャツではゆったり目,黒色のシャツでは細目が

3

Page 7: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

好みであることを読み取ることができる.一般に人間の感性ランドスケープは多峰性を持つ傾向があるため18),複数の設計変数における値のバランスをとる必要がある.本稿における対象問題は商品推薦であるため,設計変数は各コンテンツの持つ特徴量を用いる.例えば,商品の説明文中に含まれる単語を設計変数にした場合は,すべての商品説明文中に含まれる単語の種類であるため数万規模になる.そのため,従来の設計変数で作られた感性ランドスケープでは探索空間が広大になり,最適なパラメータを求めることが困難である.

4

Page 8: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

4 提案推薦システム4.1 概要

本章では iGAに基づく提案推薦システムについて述べる.iGAにより,ユーザの感性パラメータを予測することで,ユーザの感性に近い推薦を行うことを目標としている.提案手法の流れを以下に示す.

(1)推薦対象のコンテンツを特徴ベクトルとなる単語列に分解

(2)ユーザの利用履歴から感性パラメータ候補を生成

(3)感性パラメータ候補に類似するコンテンツの提示

(4)手順 2,3を繰り返す

手順 1はシステム導入前に行うデータ処理フェーズ,2,3は実際に利用者とシステムが対話する最適化フェーズである.

Fig. 5に提案システムの利用シーケンスを示す.コンテンツ評価フェーズでは,コンテンツのタイトルおよび画像がユーザに推薦コンテンツとして提示されるため,提示されたすべてのコンテンツの詳細情報を閲覧せずにユーザに評価してもらうことは難しい.そのため,提案手法では提示されたコンテンツタイトルの中からユーザが次に遷移・閲覧したコンテンツを,遺伝的操作における評価とする.コンテンツの特徴ベクトルの定義には先行研究で多く用いられている手法と同様に,コンテンツに付加されている説明文に出現する単語を特徴ベクトルとし,重み付けはTF・IDF法を用いる4,19).本研究においては,それらの組み合わせ及びパラメータをユーザの感性パラメータの候補とする.しかし出現単語数が膨大な数になることから,解探索に悪影響を及ぼすことが予想される.そのため,膨大な量の設計変数を扱いやすい形に変形することで,解探索の性能を向上させる研究が行われている.その手法として,設計変数を主成分分析により,別の主成分へと写像することで次元数を削減する手法20,21)や,初期個体の生成時に予め SVM

によるユーザ嗜好の学習を行わせることで個体の収束を早める手法22)などが考案されている.本研究では,設計変数間に重みとは異なる関連度を定義することで,別次元同士の設計変数での遺伝的操作を可能とする手法を用いる.それにより,遺伝子として全種類の設計変数を保持する必要がなくなる.コンテンツに含まれる単語間の関係性を数値で表す感性語ネットワークを作成し,それらの組み合わせ及びパラメータを最適化対象とする.感性語ネットワークについては 4.3で詳細を述べる.

4.2 特徴単語の重みの決定

本手法を問題に適用する際に,データ処理フェーズとしてコンテンツの持つ特徴ベクトル(特徴語の種類及び重みで構成される集合)を決定する必要がある.特徴の種類として,商品タイトル,著者,ジャンル,説明文中に使われている単語などが考えられる.著者やジャンルなどは明確に分類分けが可能な項目であるが,ほとんどのコンテンツに画一的に割り当てられるため,同じ項目中で特徴に差

5

Page 9: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

をつけ難い.そこで説明文中で使われている単語を特徴ベクトルとして用いることで,より柔軟なコンテンツの特徴解析ができると考える.文章中からの特徴語抽出手法として,TF・IDF法を用いる23).TF・IDF法とは,単語の出現頻度 (Term Frequency: TF)及び逆文書頻度(Inverse Document

Frequency: IDF)を用いた文書内での単語の重要度を表す指標であり,それぞれ式 (4.1)∼式 (4.3)として表される.

tf(i, j) =ni,j∑k nk,j

(4.1)

idf(i) = 1 + log2

|D||{d : d 3 ti}|

(4.2)

tfidf = tf × idf (4.3)

ni,j は単語 iの文書 j における出現回数,|D|は総ドキュメント数,|{d : d 3 ti}|は単語 iを含むドキュメント数である.同一ドキュメント中で頻出な単語はTF値が高くなり,多くのドキュメントで用いられている単語は IDF値が低くなる.

4.3 感性語ネットワーク

本稿で用いる単語間の関連を表したグラフを感性語ネットワークと呼ぶ.感性語ネットワークは単語同士の関連を人間ができる限り自然と感じる形で定義することを目的としている.感性語ネットワークの例を Fig. 6に示す.例えば,’SVM’と’fNIRS’は語の持つ意味や属性としては大きく離れているが,’BMI’などの技術ではパターン認識技術の 1つとして用いられることもあるため,関係性を表すことができる.こういった語の関連度を表したシソーラスなどの語彙体系としては学術利用目的で公開されているものや,様々な自動構築手法が提案されている24–26).本研究ではコンテンツデータの持つ属性情報から,出現単語の共起確率を用いて作成する.

4.4 感性パラメータの推定

4.4.1 提案手法における交叉

Fig. 7に交叉処理の例を示す.Fig. 7の親単語’SVM’, ’fNIRS’の交叉では感性語ネットワーク上での最短経路を探索する.この例では’SVM’ → ’Pattern recognition’ → ’BMI’ → ’fNIRS’といった経路が最短経路として抽出される.その経路上からルーレット選択によって子個体のノードを決定する.この時の重みは親個体同士の持つ重みが線形になるように,経路上のノードにも選択確率を割り振る.

4.4.2 提案手法における突然変異

Fig. 8に突然変異処理の例を示す.

Fig. 7の例では,感性パラメータの一つである’Pattern recognition’を’OCR’という別のノードにランダムに変化させている.この突然変異処理を加えることによって,探索領域の偏りを防ぎ,他の領域へ探索範囲を広げることでユーザにとって新たな気づきを誘発する可能性がある.

6

Page 10: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

5 システム評価実験5.1 実験目的

本システムによってユーザの履歴から嗜好を学習し,類似するキーワードを主題とするコンテンツが推薦結果に現れることを明らかにする.実験は楽天市場における商品データ (以下,楽天公開データ)を用いた.楽天公開データの詳細を Table 1に示す.楽天公開データの内,すべてのデータを同一に扱うと商品のドメインを横断した推薦がされるため,ある程度ジャンルによる絞込みを行う必要があると考える.本稿の検証実験では,これらのデータの内,書籍データを対象に行う.

5.2 実験内容

本システム構築の過程で行う感性語ネットワークを作成するデータ処理実験と,推薦コンテンツの傾向を示すための被験者実験を行った.それぞれの詳細を以下に示す.

5.2.1 データ処理実験

本実験では,Table 1に示す商品に付属する商品説明項目の内,商品名,商品説明文,販売方法別説明文,ジャンル IDを用いてデータ処理を行う.データ処理方法として,ジャンル IDによって書籍データのみに絞込みを行った後,4.2節で述べた

TF・IDF法による特徴語抽出および共起確率に基づくネットワーク作成を行う.またネットワーク作成時のパラメータとして,

• 制限なし

• 共起頻度が 100以上のエッジを採用する制限を加えたもの

• すべてのノードで関連度が高いエッジ 2本をエッジとして採用する制限を加えたもの

三種類のネットワークを作成した.この制限はエッジ数が過剰になることにより,すべてのノード同士が繋がる状態を防ぐためである.

5.2.2 被験者実験

本システムによるユーザのパラメータ推定を加えた手法と,コンテンツの持つ主キーワードのみを特徴量として用いる手法を比較する.実験に用いたシステムのインターフェースを Fig. 9に示す.タブレット端末画面に複数の書籍のタイトル,表紙画像が表示してあり,提示される書籍の中から,自分が興味あるコンテンツをクリックするよう教示を与えた.被験者数 1,突然変異率 0,世代数 3,学習に用いる感性パラメータ数は 10,一度に提示する推薦コンテンツ数は 8とした.

5.3 結果

5.3.1 データ処理実験

Table 2に楽天データを解析した結果得られたデータの数値を示す.Fig. 10に得られた制限なし感性語ネットワークの概形を示す.

7

Page 11: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

20余りのハブとなるノードがあり,ほとんどのノードがそれらと接続されていることが確認できる.得られた感性語ネットワークの特徴として,制限なしの状態ではエッジ数がノード(単語)数より約 100倍あることから密なグラフであるといえる.そのため,次項で述べる被験者実験では制限を加えた二種類の感性語ネットワークを用いる.

Table 3に解析した商品データの例を示す.内容抽出における解析結果の正しさを証明するためには,感覚的な部分が大きく関わるため,数値的に表すことが難しい.そのため評価は目視で行った.Table 3の例では,書籍の著者や登場人物に高い値が与えられており,商品を表す特徴語として概ね正しく抽出が行われていると言える.

5.3.2 被験者実験

Fig. 11に従来手法,Fig. 12にエッジ数 100以上制限を加えた感性語ネットワークを用いた提案手法 (制限内容 1)で得られた最終選択コンテンツの関連レポートを,Fig. 13にすべてのノードにエッジ 2本以上を張る制限を加えた提案手法 (制限内容 2)で得られた最終選択コンテンツの関連レポートを示す.

Fig. 12および Fig. 13では,過去に選択したコンテンツの著者の作品が現れていることから,今までの選択履歴の特徴を反映した推薦が行われたことを確認した.

Table 4,Table 5にそれぞれ制限内容 1,2での実験において被験者が選択したコンテンツの履歴を示す.両実験とも,同じ商品を選択している.また,実験中に選択されたコンテンツの持つパラメータは前述 Table 3の通りである.

Table 4,Table 5で得られた推薦コンテンツの主な違いとして,Table 4では,過去に選択したコンテンツの特徴がそのまま受け継がれており,Table 5では,過去履歴の特徴の他に’小説’や’月’といった親個体の持たない概念が現れていることを確認した.

5.4 考察

感性パラメータの学習システムを組み込むことによって,推薦結果に違いが見られたが,その要因となっている感性パラメータの生成について考察する.本手法による学習とは,現在閲覧中の商品のキーワードと,過去に推定された感性パラメータとなるキーワードを概念語ネットワーク上で最短経路となる単語の一つに,次世代の感性パラメータを遷移することを指す.しかし,Table 4で示した制限内容 1の実験結果からは,それぞれの間の概念となる単語がほとんど生成されておらず,どちらかの親の形質を受け継いだ子個体が生成されている.Table 5で示した制限内容 2の実験結果からは過去履歴の特徴の他に親個体の特徴を反映した新しい概念が見られた.その原因は用いた感性語ネットワークにあると考える.提案システムにおいて異なる単語間で交叉を行った場合,ネットワーク上での最短経路をたどり,それらからルーレット選択が行われる.そのため,両親間が 1ステップでつながる経路が最短である場合,もしくはたどり着くことができず両親のどちらかから選ばれた場合が考えられる.実験で用いた感性語ネットワークは共起確率に基づいて自動生成しているが,制限内容 1ではメインのグラフが密なネットワークとして形成されている.そして,それ以外のノードが共起頻度 100以下のエッジを削除しているため,ネットワーク上で孤立している.Fig. 14に,制限なし感性語ネットワークのエッジ頻度ヒストグラムを示す.横軸はエッジ

8

Page 12: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

の共起頻度,縦軸はその頻度を持つエッジの個数である.総エッジ数が 2,211,288であり,100以上の共起頻度を持つエッジが 25,751存在する.そのため,制限内容 1では 98.835%のエッジが削除されている.これにより,孤立ノードが増加してしまい,交叉時に片親を選択する状況が頻出した.孤立していないメインネットワーク部に関しては,密なネットワークが形成されているため,ほとんどのノード間にエッジが存在するため,最短経路が固定されてしまう.反対にどのノードからも 2以上のエッジを採用する制限内容 2では,ネットワーク上で孤立する場合が少なくなるため,最短経路として多様な間の概念を生成した.その結果,選択履歴の持つ特徴だけでなく,それらの間となる概念を用いた推薦が行われている.

1商品画像は楽天市場 (http://www.rakuten.com)より引用

9

Page 13: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

6 結論本稿では,人間の感性に基づく推薦を行うために,対話型遺伝的アルゴリズムを用いた推薦システムを提案した.従来の遺伝的アルゴリズムを用いたコンテンツ推薦システムで問題となっていた設計変数の多さによる解探索精度の悪化を解決するために,感性語ネットワークという単語間に関連を持たせたグラフを近傍の定義として用いることで,異次元間の交叉を可能にしたシステムを構築した.これにより,親個体の持つ特徴量から新たに類似する概念を生成した上で推薦を行うため,多様かつ感性的な繋がりを持つ概念が推薦コンテンツとしてあらわれることを確認した.しかし,推定されるパラメータが感性語ネットワークの精度に大きく依存することも確認した.感性語ネットワークの自動構築手法として,エッジの共起頻度 100以上のみを残す制限を加えた作成手法では,孤立点となるノードが頻出した.そのノード間での遺伝的操作における交叉フェーズでは両親の内どちらか一方が子個体として採用される.そのため,親個体の特徴は受け継いでいるものの,概念上で間となるような推薦結果は得られなかった.すべてのノードから関係性の高い上位 2本のエッジのみを採用する制限を用いて作成したネットワークでは,孤立点が少なくなるため多様な概念が生成される.結果,選択履歴の持つ特徴だけでなく,それらの関係性を考慮した推薦結果が得られることを確認した.

10

Page 14: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

謝辞本研究を遂行するにあたり,ご指導頂きました同志社大学生命医科学部の廣安知之教授,横内久猛教授および同志社大学工学部の三木光範教授に心より感謝申し上げます.廣安知之教授は私が知的システムデザイン研究室に配属されて以来,現在まで 4年間に渡り研究の真摯なご指導の他,国内学会,Super Computing11(SC11)など貴重な機会を多数与えて頂きました.横内久猛教授は専攻分野が異なる私に対して,様々な視点から的確な指摘,助言,議論をして下さいました.三木光範教授は研究への助言に加えて,研究室生活を送る上で素晴らしい環境を与えて下さいました.研究遂行にあたっては,同じ研究グループ学生の田中美里さん,上堀聖史くん,國貞壮司くん,松浦秀行くんには日頃から議論を頂きました.研究グループの仲間や同輩に恵まれ,すばらしい研究生活を送る事ができました.本論文の執筆に際して,指導・チェックして頂いた上堀聖史くん,福島亜梨花さんありがとうございました.お二人のおかげで論文を執筆することができました.最後に,知的システムデザイン研究室のみなさま,医療情報システム研究室のみなさまには,数多くの貴重な意見を頂きました.また,みなさまのおかげで充実した研究室生活をおくることができました.この場を借りて感謝申し上げます.ありがとうございました.

11

Page 15: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

参考文献1) A. Das, M. Datar, A. Garg, and S. Rajaram, “Google news personalization: scalable online

collaborative filtering,” in Proceedings of the 16th IEEE, 2007, pp. 271–280.

2) G. Linden, B. Smith, and J. York, “Amazon.com recommendations: item-to-item collaborative

filtering,” Internet Computing, IEEE, vol. 7, no. 1, pp. 76–80, 2003.

3) J. Herlocker, J. Konstan, and J. Riedl, “Explaining collaborative filtering recommendations,”

in Proceedings of the 2000 ACM conference on Computer supported cooperative work, 2000, pp.

241–250.

4) M. Pazzani and D. Billsus, Content-Based Recommendation Systems, ser. Lecture Notes in

Computer Science, P. Brusilovsky, A. Kobsa, and W. Nejdl, Eds. Springer Berlin Heidelberg,

2007, vol. 4321.

5) M. Balabanovic, “Exploring versus exploiting when learning user models for text recommen-

dation,” User Modeling and User-Adapted Interaction, vol. 8, no. 1, pp. 71–102, 1998.

6) 高木英行, 畝見達夫, and 寺野隆雄, インタラクティブ進化計算,遺伝的アルゴリズム 4. 産業図書, 2000.

7) B. Sheth and P. Maes, “Evolving agents for personalized information filtering,” in Proceedings

of the 1993 Artificial Intelligence for Applications on Ninth Conference, Mar. 1993, pp. 345–

352.

8) M. Atsumi, “Extraction of User’s Interests from Web Pages based on Genetic Algorithm,” in

Proceedings of Information Processing Society of Japan, The Special Interest Groups Notes,

1997, pp. 13–18.

9) Y. Cao and Y. Li, “An intelligent fuzzy-based recommendation system for consumer electronic

products,” Expert Systems with Applications, vol. 33, no. 1, pp. 230–240, 2007.

10) A. Goy, L. Ardissono, and G. Petrone, “The adaptive web,” P. Brusilovsky, A. Kobsa, and

W. Nejdl, Eds. Berlin, Heidelberg: Springer Berlin Heidelberg, 2007, ch. Personalization in

e-commerce applications, pp. 485–520.

11) Y. Zhang and J. Koren, “Efficient bayesian hierarchical user modeling for recommendation

system,” in Proceedings of the 30th annual international ACM SIGIR conference on Research

and development in information retrieval, 2007, pp. 47–54.

12) I. Zukerman and D. W. Albrecht, “Predictive Statistical Models for User Modeling,” User

Modeling and User-Adapted Interaction, pp. 5–18, 2001.

12

Page 16: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

13) H. Takagi, K. Aoki, and N. Fujimura, “Interactive ga-based design support system for lighting

design in computer graphics.” Int’l Conf. on foft ComputingIizuka, Fukuoka, Japan, 1996,

pp. 533–536.

14) M. Ohsaki and H. Takagi, “Improvement of presenting interface by predicting the evaluation

order to reduce the burden of human interactive ec operations,” in IEEE Int’l Conf. on System,

Man, Cybernetics (SMC’98),San Diego,CA,USA,, 1998.

15) H.-S. Kim and S.-B. Cho, “Application of interactive genetic algorithm to fashion design,”

Engineering Applications of Artificial Intelligence, vol. 13, no. 6, pp. 635 – 644, 2000.

16) S.-B. Cho, “Towards creative evolutionary systems with interactive genetic algorithm,” Applied

Intelligence, vol. 16, no. 2, pp. 129–138, 2002.

17) M. Sugahara, M. Miki, and T. Hiroyasu, “Design of japanese kimono using interactive genetic

algorithm,” in 2008 IEEE International Conference on Systems, Man and Cybernetics. IEEE,

Oct. 2008, pp. 185–190.

18) F. Ito, T. Hiroyasu, M. Miki, and H. Yokouchi, “Discussion of offspring generation method

for interactive genetic algorithms with consideration of multimodal preference,” in Simulated

Evolution and Learning, ser. Lecture Notes in Computer Science, vol. 5361, 2008, pp. 349–359.

19) G. Salton, A. Wong, and C. S. Yang, “A vector space model for automatic indexing,” Commun.

ACM, vol. 18, no. 11, pp. 613–620, Nov. 1975.

20) M. Tanaka, T. Hiroyasu, M. Miki, and H. Yokouchi, “Extraction of design variables using

collaborative filtering for interactive genetic algorithms,” 2009 IEEE International Conference

on Fuzzy Systems Proceedings, August 2009.

21) M. Tanaka, T. Hiroyasu, M. Miki, S. Yasunari, and M. Yoshimi, “Automatic generation method

to derive for the design variable spaces for interactive genetic algorithms,” in 2010 IEEE World

Congress on Computational Intelligence (WCCI 2010), July 2010.

22) A. Amamiya, M. Miki, and T. Hiroyasu, “Interactive Genetic Algorithm using Initial Individ-

uals Produced by Support Vector Machine,” The Science and Engineering Review of Doshisha

University, vol. 50, no. 1, pp. 34–45, 2009.

23) 中川裕志,森辰則, and湯本紘彰, “出現頻度と連接頻度に基づく専門用語抽出,” Journal of natural

language processing, vol. 10, no. 1, pp. 27–46, 2003.

24) H. Fujii, Atsushi and Tokunaga, Takenobu and Tanaka, “A Hybrid Approach for Measur-

ing Word Similarity,” IEICE technical report. Natural language understanding and models of

communication, vol. 97, no. 69, pp. 53–58, Jul. 1997.

13

Page 17: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

25) 渡部広一, 奥村紀之, and 河岡司, “概念の意味属性と共起情報を用いた関連度計算方式,” Journal

of natural language processing, vol. 13, no. 1, pp. 53–74, 2005.

26) 加藤誠, 大島裕明, and 小山聡, “共起に基づくwebからの類似関係のブートストラップ抽出,” 日本データベース学会論文誌, vol. 8, no. 1, pp. 11–16, Jun. 2009.

14

Page 18: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

付 図1 Collaborative filtering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

2 Flow of iGA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

3 Flow of GA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

4 Mapped Kansei landscape . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

5 Sequence of proposed system . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

6 Kansei network . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

7 Crossover . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

8 Mutation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

9 Interface used in the experiment (displays initial individuals) 1 . . . . . . . . . . . . 4

10 Outline of Kansei network . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

11 Conventional method: Recommended items that is related on final selection item 1 . 6

12 Recommended items using proposed system (Constraint-1) 1 . . . . . . . . . . . . . 7

13 Recommended items using proposed system (Constraint-2) 1 . . . . . . . . . . . . . 8

14 The edge of the Kansei network frequency histogram . . . . . . . . . . . . . . . . . . 9

付 表1 Details of Rakuten public data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2 Details of after analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

3 Examples of analytics for item . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

4 Histories of user selection with proposed system (Constraint-1) . . . . . . . . . . . . 11

5 Histories of user selection with proposed system (Constraint-2) . . . . . . . . . . . . 11

i

Page 19: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

a b c d

A 1 1 1

B 1 1

C 1 1

D 1 1

a b c d

a - 2 1 1

b 2 - 0 2

c 1 0 - 2

d 1 2 2 -

a b c d

a 0.0 0.5 0.33 0.2

b 0.5 0.0 0.0 0.4

c 0.25 0.0 0.0 0.4

d 0.25 0.5 0.66 0.0

Sum 1 1 1 1

Items:

Use

rs:

e.g.) User ‘A’ bought item ‘a’, ‘c’ and ‘d’. Normarized

Fig. 1 Collaborative filtering

User evaluates the individuals

which suit user’s preference.

User

iGA System

Genetic Operation

- Selection

- Crossover

- Mutation

System presents the individuals

reflected in user’s preference.

Generate new individuals

by genetic operation.

Fig. 2 Flow of iGA

1

Page 20: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

Evaluation

Initialize

Termination

conditions

Selection

Crossover

Mutation

Start

EndYes

No

Fig. 3 Flow of GA

User

Kan

sei

Fit

tnes

s

Kansei

Lan

dscape

Color

Shape

I like them!

I don’t like...

Fig. 4 Mapped Kansei landscape

2

Page 21: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

User System Stocks

access to systemget items randomly

search items similar tothe selected item

return items

return items

search items similar tothe ‘Kansei’ paramaters which are generated by genetic operations

return items

presenting items

presenting items

presenting items

click favorite item

click favorite item

loop

Fig. 5 Sequence of proposed system

Pattern recognition

BMIHMM LDA SVM fMRI

fNIRSMEG EEGOCR

Fig. 6 Kansei network

3

Page 22: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

Pattern recognition

BMIHMM LDA SVM fMRI

fNIRSMEG EEGOCR

Pattern recognition

BMIHMM LDA SVM fMRI

fNIRSMEG EEGOCR

: Children

: Shortest path between parents

: Parent

Fig. 7 Crossover

: A node that generated by mutation

Pattern recognition

BMIHMM LDA SVM fMRI

fNIRSMEG EEGOCR

Pattern recognition

BMIHMM LDA SVM fMRI

fNIRSMEG EEGOCR

: A node that is one of parameters

Fig. 8 Mutation

Fig. 9 Interface used in the experiment (displays initial individuals) 1

4

Page 23: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

Fig. 10 Outline of Kansei network

5

Page 24: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

Fig. 11 Conventional method: Recommended items that is related on final selection item 1

6

Page 25: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

Fig. 12 Recommended items using proposed system (Constraint-1) 1

7

Page 26: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

Fig. 13 Recommended items using proposed system (Constraint-2) 1

8

Page 27: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

1.0E+00

1.0E+01

1.0E+02

1.0E+03

1.0E+04

1.0E+05

1.0E+06

1.0E+00 1.0E+01 1.0E+02 1.0E+03 1.0E+04 1.0E+05

Cou

nt

The number of edge

Edge Frequency

Fig. 14 The edge of the Kansei network frequency histogram

9

Page 28: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

Table 1 Details of Rakuten public data全登録商品数 60,123,534件書籍データ登録数 3,555,750件商品説明項目 商品コード, 商品名,商品説明文, 販売方法別説明文,

商品URL, レビュー件数, レビュー平均, 商品画像URL,

商品価格, 店舗コード, ジャンル ID, 登録年月日

Table 2 Details of after analysis書籍データ登録数 3,555,750件商品説明文中における出現単語数 221,970単語制限なし感性語ネットワークのエッジ数 2,211,288本エッジ数 100以上制限を加えた感性語ネットワークのエッジ数 322,716本すべてのノードにエッジ 2本以上を張る制限を加えた感性語ネットワークのエッジ数 437,704本

Table 3 Examples of analytics for item

商品タイトル パラメータ(TF・IDF値)永遠を旅する者 重松 (0.60), 清 (0.42), データロストオデッセイ (0.33), ファンタジー (0.28), シゲマツキヨシ (0.23),

博信 (0.22), バガボンド (0.21), エイジ (0.20), 書き手 (0.20), 雄彦 (0.19)

Freedom(2) カズマ (0.43), タケル (0.41), 地球 (0.31), ドーム (0.25), エデン (0.23), 古川 (0.22),

耕 (0.21), データフットマークデイズガガガ (0.19), 脚本 (0.19), フューチャーストーリー (0.18)

10

Page 29: 個人の感性モデルを推定する インタラクティブな商 …...2.3 推薦システムおける個人化手法の先行研究 ユーザ個人の感性をモデリングする手法として前述の内容ベースフィルタリングが有用であると考

Table 4 Histories of user selection with proposed system (Constraint-1)

世代 選択タイトル 推定した感性パラメータ:選択された個体(TF・IDF値)1 永遠を旅する者 重松 (0.60), 清 (0.42), データロストオデッセイ (0.33), ファンタジー (0.28), シゲマツキヨシ (0.23),

博信 (0.22), バガボンド (0.21), エイジ (0.20), 書き手 (0.20), 雄彦 (0.19)

2 Freedom(2) カズマ (0.60), タケル (0.42), データロストオデッセイ (0.31), ドーム (0.28), シゲマツキヨシ (0.23),

博信 (0.22), バガボンド (0.21), エイジ (0.19), 脚本 (0.20), フューチャーストーリー (0.20)

3 Freedom(2) カズマ (0.48), タケル (0.46), 地球 (0.34), ファンタジー (0.29), エデン (0.26), 博信 (0.24),

耕 (0.24), データフットマークデイズガガガ (0.22), 脚本 (0.22), フューチャーストーリー (0.22)

Table 5 Histories of user selection with proposed system (Constraint-2)

世代 選択タイトル 推定した感性パラメータ:選択された個体(TF・IDF値)1 永遠を旅する者 重松 (0.60), 清 (0.42), データロストオデッセイ (0.33), ファンタジー (0.28), シゲマツキヨシ (0.23),

博信 (0.22), バガボンド (0.21), エイジ (0.20), 書き手 (0.20), 雄彦 (0.19)

2 Freedom(2) カズマ (0.60), 小説 (0.42), ゲーム (0.32), ファンタジー (0.26), エッセイ (0.23),

数 (0.22), 月 (0.21), フューチャーストーリー (0.20), 商品 (0.20), エイジ (0.19)

3 Freedom(2) カズマ (0.55), 月 (0.44), 小説 (0.33), 小説 (0.27), 小説 (0.24),

数 (0.23), 耕 (0.23), 新着 (0.21), データフットマークデイズガガガ (0.20), 商品 (0.20)

11