Upload
wyatt-garner
View
137
Download
13
Embed Size (px)
DESCRIPTION
対話型遺伝的アルゴリズムにおける ユーザ負担軽減と多様性維持の検討. 工学研究科 知識工学専攻 知的システムデザイン研究室 2006 年度 745 番 山川 望. 研究背景. 多くの人がインターネットショッピングを利用 商品提供者は数多くの商品を販売 ユーザは自由に商品を検索,購入. 研究背景. 多くの人がインターネットショッピングを利用 商品提供者は数多くの商品を販売 ユーザは自由に商品を検索,購入 ショッピングサイトにおける商品の提示方法 - PowerPoint PPT Presentation
Citation preview
研究背景
多くの人がインターネットショッピングを利用商品提供者は数多くの商品を販売ユーザは自由に商品を検索,購入
ショッピングサイトにおける商品の提示方法商品提供者 → 提示できる商品の数の制限たくさんの商品を販売することができるが,ユーザに対してすべての商品を提示することは困難ユーザ → 比較操作による疲労ページ遷移を繰り返すことにより,商品を比較,購入するかを検討する
商品のリコメンデーション方法の問題点
商品選択時のユーザの嗜好を商品提示に反映できていない主にユーザの検索・購入履歴を用いて商品を提示商品選択時のユーザの選択操作により,ユーザの嗜好を学習するしくみを利用していない
研究目的商品選択時のユーザの嗜好を商品提示に反映できていない
ユーザの選択操作から商品選択時のユーザの嗜好を学習し,ユーザの嗜好に合った商品提示を行うシステムの構築
選択を繰り返す
ユーザの嗜好を反映した提示
ユーザの嗜好を判断・学習
ユーザの嗜好を判断・学習
対話型遺伝的アルゴリズム (iGA)
遺伝的アルゴリズム (GA) の評価部分を人間の主観的評価によって行う人間の好みや印象といった数式化できないものの解析に利用様々な分野へ適用されている
CGグラフィックス音楽服飾デザイン補聴器フィッティング
iGA を用いる際に検討すべきこと
多様性の維持iGA は単一目的のための最適化手法であるため,探索終盤では収束する可能性がある
提示個体 1つ 1つに点数付けを行うのではなく,嗜好に合った個体を選ぶ
ユーザ負担の軽減入力インタフェースの改善収束の高速化評価値予測
商品選択時のユーザの嗜好ユーザの嗜好が 1つの場合 ユーザの嗜好が複数の場合
赤色,あるいは青色どちらかの Tシャツに収束し, 同じ Tシャツを複数提示する可能性がある
iGA は 1つの解を求めることが目的
ショッピングサイトにおける商品提示
iGA を用いた場合ユーザの嗜好に合うものは提示できるが収束する
初期個体 6 世代目
ランダムに個体を生成し,提示する突然変異率を高くする
多様性は維持できるが嗜好に合った提示は困難
クラスタリング
データマイニングの手法の 1つ
類似したデータをグループ化し,データ中の価値ある情報を抽出する方法
K-means法クラスタ数の決定に多目的クラスタリング (MOCK) の最適クラスタ数自動決定アルゴリズムを利用
評価実験
目的クラスタリングを用いた個体生成を行うことにより人の嗜好の多峰性に対応した個体を提示できているかを検証する被験者
20歳代の男女 20名教示
ショッピングサイトで好きな Tシャツを探す実験に用いるシステム
クラスタリングを行うシステム (提案システム )クラスタリングを行わないシステム (従来システム )
20世代の評価を行い,アンケートを実施
実験に用いたシステム
提案システムユーザは提示された 20 枚の Tシャツから嗜好に合った Tシャツを 10 以下の任意の数選択する10 世代目にクラスタリングを行い,個体を生成し,提示する
従来システムユーザが行う操作は提案システムと同様クラスタリングは行わず,遺伝的操作のみを行う
多様性に関する考察
提案システムの方が多様性を維持した個体を提示したと回答した被験者のクラスタリング後の提示個体
多様性を維持し,ユーザの嗜好に合った個体を提示することができている
従来システム 提案システム
まとめ
iGA において多様性を維持する方法→ クラスタリングを用いた個体生成
クラスタリングを用いた個体生成が多様性維持に有効であるかを検証する評価実験→提示個体の多様性を維持し,人の嗜好の多峰性に 対応した個体を生成し,提示することができた
発表論文一覧山川望,廣安知之,三木光範「 Web上での商品選択のインタフェースの検討 〜対話型遺伝的アルゴリズムを用いたデザイン支援システムの構築〜」人工知能学会 第 20回人工知能学会全国大会,タワーホール船堀 (2006.6)山川望,廣安知之,三木光範「対話型遺伝的アルゴリズムを用いたデザイン支援システムの構築」日本機械学会 第 19回計算力学講演会,名古屋大学 (2006.11)山川望,廣安知之,三木光範「 Web上での商品選択のインタフェースの検討」情報処理学会 インタラクション 2007,学術総合センター (2007.3)山川望,廣安知之,三木光範「対話型遺伝的アルゴリズムを用いたデザイン支援システムにおける ユーザの嗜好情報の抽出と利用」人工知能学会 第 21回人工知能学会全国大会,ワールドコンベンションセンターサミット(2007.6)山川望,廣安知之,三木光範「対話型遺伝的アルゴリズムの評価操作におけるユーザの負担軽減の検討」日本機械学会 第 20回計算力学講演会,同志社大学 (2007.11)山川望,廣安知之,三木光範「対話型遺伝的アルゴリズムにおける多様性維持の検討」情報処理学会 第 67回数理モデル化と問題解決研究会, 産業総合技術研究所 (2007.12)廣安知之,山川望,伊藤冬子,三木光範,佐々木康成「対話型遺伝的アルゴリズムにおける評価方法と個体生成方法の検討」情報処理学会 第 68回数理モデル化と問題解決研究会, 道後温泉(2008.3,発表・論文投稿予定 )
ユーザの嗜好が複数ある場合
人の嗜好は多峰性であるため,人の嗜好の多峰性に対応した提示が重要
ex.) ユーザが赤色と青色が好きな場合iGAは単一目的のための最適化手法→ 赤色、あるいは青色どちらかの Tシャツに収束し, 同じものばかりを提示する可能性がある
システムによる評価・選択 (2/2)
距離による評価ユーザが選択した個体と提示されている個体とユークリッド距離を求め,距離の小さい個体から親個体として選択する
xi :ユーザが選択した個体 (i = 0, 1, ・・・, 10)yj: 提示されている個体 (j = 0, 1, ・・・ ,20)xh,yh,:色相の値 xs,ys,:彩度の値xb,yb,: 明度の値 xsl,ysl: 袖の長さの値xc,yc,:襟の形の値 ( それぞれの値は正規化した値 )
データに加える処理データの最大値と最小値の差が 0.5以上の場合のみ処理を加える隣り合うデータの差が最大となるとき,小さい値に差の 1/2を加えた値をデータをシフトする基準値とする
差の 1/2
差が最大
基準値
データに加える処理データの最大値と最小値の差が 0.5以上の場合のみ処理を加える隣り合うデータの差が最大となるとき,小さい値に差の 1/2を加えた値をデータをシフトする基準値とする
差の 1/2
差が最大
基準値
多目的クラスタリングアルゴリズム
MOCK: Multiobjective clustering with automatic k-determination
J.Handl, J.Knowlesが 2004 年に提唱多くのテストデータおよび実データを用いた実験により他手法と比較して高いクラスタリング性能が示されている
特徴多目的最適化の概念を用いる接続性: Connectivityコンパクト性: Overall Deviation
幅広いクラスタ数を持つ複数の解(解集合)を導出最適クラスタ数自動決定メカニズムを持つ他の多くのクラスタリングアルゴリズムはクラスタ数決定機能を持たない
2つの目的関数
Connectivity (最小化)接続性を評価する目的関数近傍のデータ同士が異なるクラスタに属する場合ペナルティを与えるペナルティ関数
Overall Deviation (最小化)コンパクト性を評価する目的関数クラスタ中心と各データの間の距離の総和
MOCKで得られる解集合解集合の特徴幅広いクラスタ数を持つ解を含むそれぞれのクラスタ数では高精度のクラスタ境界が得られている
クラスタ数に着目して最終解を決定→ 最適なクラスタ数を決定できる→ 最適な分割方法も既に決定している
クラスタ数少
クラスタ数多
GAP 統計を用いてクラスタ数を自動決定
コンパクト性
接続性
GAP 統計ベースのクラスタ数自動決定
クラスタが存在しないという帰無仮説に基づいたクラスタリング結果と,実際のクラスタリング結果との差異を計測することにより,最適クラスタ数を持つクラスタソリューションが存在する場合に両者の差異が最大となるという予測を用いて最適クラスタ数を決定する.
GAP 統計:クラスタ数を決定するための統計手法
MOCKの利点
高いクラスタリング性能を持つ実験により K-means法や凝集法など多くのクラスタリングアルゴリズムと比較して高いクラスタリング性能が示されている
最適クラスタ数自動決定メカニズムを持つ他の多くのクラスタリングアルゴリズムは最適クラスタ数の決定機能を持たない(ex. K-means法,群平均法,最短距離法)
適切なクラスタ数・クラスタ境界の双方を一度の探索で発見可能
今後の課題クラスタリングに関する検討
クラスタリングを行う世代数,回数クラスタリングの対象とする設計変数
多様性を維持した提示によるユーザ負担への影響提示個体が収束し,ユーザが選択できる個体が類似した個体ばかりになるとユーザ負担につながる