65
1 本本本本本本本6/15 ~) 本本本本本本本本本本 () 本本本 本本本本本本本本 本本本本本本本 () 本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本本 本本本本本本本本 本本本本本本本 本本本 本本 本 本本本本本本本本本本 、()、 本本本本本本本本本本本本本本 本本本本本本本本本本本本本本本本本本本本

本日のメニュー( 6/10~17 )

Embed Size (px)

DESCRIPTION

本日のメニュー( 6/10~17 ). 「考える」ということ 理性的・合理的な思考とはどういうことか それを形式的・客観的な手法で記述・定式化できるか  ⇒ 論理学 それを機械によって実現できるか  ⇒ 人工知能 人工知能は何を実現しえたか、人間の認知研究とどのような関わりを持つか。(次回も). 1. 論理学・記号論理 数学基礎論 形式体系 チューリングマシン チャーチ・チューリングの提唱 形式体系の限界 記号処理. チューリングテスト 人工知能 ダートマス会議 (人工知能関係のキーワードは次回資料). 本日のキーワード. はじめに. - PowerPoint PPT Presentation

Citation preview

11

本日のメニュー( 6/15 ~)• (前回資料の続き部分)

• 人間が(あるいは人間も)行う知的処理をコンピュータ上で実現しようという研究としての人工知能について考える。

• 人工知能は:– 何を目指すか– 何を実現しえたか– どのような原理、方法(論)、技術に基づいている

か– どういう困難や問題点があるか– 人間の認知研究とどのような関わりを持つか

(前回資料への補足)

• 「天使悪魔問題」について– 以下の URL には前回内容の詳述がある

• http://suseum.jp/gq/question/416 及び 417• Raymond Smullyan の著書等も参照

• 論理でできること• 論理に関わる「パラドックス」

– 「ウソつきのパラドックス」– 「ヘンペルのカラス」– 「ラッセルのパラドックス」– 「リシャールのパラドックス」 2

3

本日のキーワード• 人工知能( AI )• ヒューリスティック

ス• 記号主義・

記号処理パラダイム• 計算論的認知観• 人工知能の研究手法• 表象主義• (エージェント)• Marr の視覚理論

• 自然言語理解ELIZA と SHRDLU最近の動向

• エキスパートシステムDENDRAL, MYCIN, AM, Eurisko, Cyc

• 事例: ゲーム等Deep Blue, あから 2010 、将棋電王戦、 WATSON 等

• 人工知能批判• 強い AI と弱い AI• フレーム問題

次回予定

4

人工知能の現状(1)• 直接的な意味での「人間の知能」の実現には

至っていない。– ヒューマノイド・ロボット(鉄腕アトム、...)– HAL 9000 (「 2001 年宇宙の旅」)– “AI”  (「攻殻機動隊」)– 人間社会で暮らす人工知能– 参考: ロボットスーツ(ガンダム)そもそもそれが研究目的にはなっていない?

• しかし個別には様々な重要な成果がある。

• 知能観のジレンマ:「人工知能は逃げ水?」– 実現されてしまった機能は、もはや「知的」、「知

能の実現」とはみなされなくなる傾向がある。

5

人工知能の現状(2)• そもそも何をもって「人工知能」とするか

は、人によっても時代によっても様々。

• AI という研究分野自体が「拡散的」– 研究面においても、当初は AI 研究として開始さ

れたものが、解決手法の研究が進む、特にアルゴリズム的な扱いが可能になると AI とはみなされなくなる( AI から独立する)。

– AI 研究の過程で生まれた様々な理論・言語・ツール・技術が、 spin-off として情報処理技術全般に広範に使われる。

– ある意味では、この面に AI の最大の成果があるかもしれない。

6

人工知能の現状(3)

• 人工知能研究が社会的に認知され、アカデミズムとしても確立される反面、「人工知能」としての自立性・アイデンティティ(あるいはその必要性)が弱まっている。

• 研究内容についても、大規模コーパスが容易に利用できるようになったことも背景にして、 HMM (Hidden Markov Model) のような確率モデル的手法、統計的なパラメタ調整・学習手法によるアプローチ( SVM 等)が全盛になっている。

7

人工知能の現状(4)

• 人工知能の弱い面– 常識的な判断・推論  (⇒後述)– 自然言語処理: 日常的な会話の実現– 社会的文脈、他者との関係・協力・共同作業– 感性、感情・情動

• これらは認知科学の他部門との最大の接点であり、こういった面での研究が(他に比べて)進展しないことは、人工知能さらにはコンピュータ科学一般と、認知科学一般との関係が希薄になってきていることにつながっている。

人工知能の現状(5)

• 近年の様々なイベントは、人工知能に耳目を集め、また復権・再認識させるきっかけとなっている。– ゲーム: チェス、将棋、オセロ、 ...– WATSON (IBM) – 各種ロボットの開発・発展– 「感性情報処理」– 脳波、筋電等の生体データの直接利用

• 課題– どこまで「理解」しているか?– どこまで人間に近づいているか?近づく必要はあるか?– “Technological Singularity” 、 “General AI”

実現するか? どのように? いつごろ?8

9

人工知能の要:  Heuristics(1)

• Heuristics (発見的手法) ⇔ algorithm• アルゴリズム

– 問題解決のための機械的に実行可能な処理手順がある。

– その手順には十分な一般性がある。問題のパラメタを変えることで、他の場合にも適用できる。

– 処理のための時間・手間を問わなければ、有限時間内で必ず解決できることが保証されている(「解がない」ことが示される場合も含む)。

10

人工知能の要:  Heuristics(2)

• ヒューリスティックス(発見的手法)– 問題に応じて個別的に「発見」、開発されるような

解決手法。– いつでもうまくいく保証は(必ずしも)ない。– アルゴリズムが存在しない場合(知られていない場合)、存在しても実用的な価値がない場合などに適用される。

– 問題の解決法自体を探し出すことを含んで言う場合もある(メタ解決)。

• 人間の場合: 思いつき、発想、ひらめき等々

11

人工知能の成果(1): ゲーム• ゲーム(知能ゲーム、特に2人ゼロ和有限確定完全情報ゲーム)– チェッカーズ世界チャンピオンクラス、ゲームそのものがほぼ「解決」( Chinook: 2007 )

– オセロ世界チャンピオンクラス( Logistello 1997 )

– チェス世界チャンピオンクラス( DeepBlue, 1996-7 )

– 将棋プロレベルに追いついた (!)  →あから 2010 、将棋電王戦詰将棋は専門家レベル(以上?)

– 囲碁アマ初段~有段程度 (モンテカルロ法により急進)

12

ゲームの複雑さゲーム 盤面数 ゲーム木

チェッカーズ 1018 1031

オセロ 1028 1058

チェス 1050 10123

将棋 1071 10226

囲碁 10172 10360

Victor Allis (1994). Searching for Solutions in Games and Artificial Intelligence. Ph.D. Thesis, University of Limburg, Maastricht, The Netherlands. ISBN 9090074880.   他

13

14

人工知能の成果(2): 数学• 数式処理(計算機代数)

– Slagle の SAINT (大学初年級の積分)

          

• この当時では AI 研究の代表例だったが、アルゴリズムベースの数式処理研究が進み、 AI とは一線を画する。

• 現在では Macsyma, Reduce, Mathematica, Maple などのシステムは科学技術領域における不可欠のツールになっている。 例:Mathematica Integrator

15

人工知能の成果(3): 応用(1)• カーナビ、道案内システム

– 状態空間探索の典型的問題–一般には探索空間が巨大なため、全探索

(最適解)は不可能–ほとんどの場合、実用的には十分高い水準

にある。

• 情報検索( Web ページ検索等)– テキストの検索手法、索引語抽出手法、検索結果の順位付け、類似語の推定など

16

人工知能の成果(4):視覚・聴覚• 視覚・聴覚関係

–文字認識• 初期の重要な成果は郵便番号読み取り機• 現在では Windows の IME パッドをはじめ、標準的なツールになっている。

–音声認識–画像理解・解析

–音声合成• 自然な発話・発音

–音楽認知・分析、作成

17

人工知能の成果(5):自然言語• 機械翻訳

– 1960 年代後半の ALPAC レポート(それまでの研究成果への批判的報告)で一時頓挫する。

– 現在最近では Systran ベースの Yahoo! / Babelfish、 Google 翻訳など、実用(に供される)レベルの翻訳サービスも存在する。が、現在( 2014 )では統計的手法を用いたものが主流

• 内容を理解していなくても、かなりの部分は機械的な言語置換え作業で間に合う。

• (自然言語理解については後述)

18

人工知能の成果(6):応用(2)• 科学技術関係

– エキスパートシステム DENDRAL による化合物についての新発見など、様々な成果がある。

• Spin-off 技術– プログラミング言語( Lisp, Prolog, ... )– プログラミングパラダイム(関数型・論理型プログラミング、オブジェクト指向、エージェントプログラミング、 ... )

– TSS システム(時分割処理システム)、対話型処理

19

人工知能の成果(7):認知モデル• 人間の認知について何がわかったか

– ある意味、「最大の成果」は、人間の認知がいかに複雑な情報処理過程であるかを(再)認識させられたこと。

• 認知アーキテクチャ(認知過程の計算的モデル)– EPAM (Feigenbaum), GPS (Newell & Simon), ACT

(Anderson), SOAR (Newell), ...– 多くの認知モデルが作成されているが、人間が実際に行っている処理過程をそのまま反映している保証はない。 ⇒ 「メタファ」としてのモデル

20

人工知能の成果(8):一般知識• 常識推論、一般的な質疑応答システム

– Cyc, OpenCyc (1984 ~ )– Open Mind Common Sense, ConceptNet    (1999

~ )– ….

• WATSON http://www-03.ibm.com/innovation/us/watson/

– 2011 年、クイズ番組 Jeopardy! で人間のクイズ王と対戦し、総合優勝した。

21

人工知能の成果(9): 学習• 記号的な学習・類推

– 記号的に表された知識構造や概念の帰納的な学習・獲得。

– 初期の例:  Evans の類推プログラム、 Winston の学習研究など。

• パラメタ学習(機械学習)– 状態を表す数値的なパラメタを操作して学習・最適化

を行う。– パーセプトロン、ニューラルネットワーク– 最近では数値的な機械学習手法が基礎技術として広範

に応用されている。(データ検索、マイニング、自然言語処理、パターン認識、ゲーム等々)

22

人工知能の成果(10): 適応• Subsumption Architecture (Brooks, 1986 ~ )• 虫や小動物の行動などを例に、認知的行動は

トップダウンの、合目的的な行動計画によってではなく、動作単位(モジュール)の適応的動作によりボトムアップに形成されるという立場。

• ロボットの行動形成などで成果を上げた。(参考: 掃除機ロボット)

• 認知一般にまで適用しうるかについては難しそう。

23

人工知能の成果(11): 日本の例• カナ漢字変換は日本の人工知能研究の重要な

成果と評価されている(「第 5世代レポート」等)。

• コンピュータ将棋– あから 2010  (特集解説も参照(授業 Web

ページ))– 将棋電王戦( 2011-14 )

• ロボット関連諸技術( 2 足歩行ロボット等)

• 歌唱分析・合成– Vocaloid  (初音ミクシリーズ等)

研究のアプローチ・手法• 時代に応じて中心となる(あるいは現

実的な)研究手法が変わっていく– 状態と探索– 「小さな世界」(「積木の世界」等)– 知識と推論(エキスパートシステム等)– 現実世界への対応–学習と適応化–大規模データの利用

• 詳細については資料・文献参照24

25

人工知能(主流派)

• エキスパートシステムに見られるように、知識表現と推論手法が研究の主対象。

• 推論については汎用の手法で十分強力でありうるという立場。

• さらに、知識は記号的に表現され、人間にとっても意味や推論過程が理解できることが重視される。

26

表象主義( Representationalism )• 人間の持っている知識は、外界の事実を忠実

に反映した「表象(表現)」であり、その表象を操作することにより思考が行われるという考え方。

• もっと極端には、外界の事物の認識は、表象を通じてのみ行われる(可能である)という考え方。

• (主流派)人工知能は事実上、この立場に立つ。

• 問題点: 的確な判断を行うために必要な表象がすべて入手可能か、適切な表現手法は何か、等々。     参考: フレーム問題  [Frame]

27

記号主義・記号処理パラダイム• 知識は「記号的」に表現され、知識の操作・推論は記号処理過程として扱える、という立場。

• 形式的体系(記号論理、チューリングマシンとしてのコンピュータ)と親和性が高い。

• 一方で、人工知能に対する批判は主として記号主義的立場に向けられた。

• 1980 年代になると、人工知能内でも記号主義の問題点が強く意識されるようになる。

28

参考: Marr の視覚理論

• David Marr (1945-1980)– “Vision: A Computational Investigation into the

Human Representation and Processing of Visual Information” (Freeman, 1982)乾・安藤(訳):「ビジョン ー 視覚の計算理論と脳内表現」(産業図書、 1987 )

– “Artificial Intelligence: A Personal View”, Artificial Intelligence, vol.9, no.1 (1977), pp.37-48

29

Marr の視覚理論(2)

• Levels of Analysis– Computational level

システムは何をするか(どのような問題を解くか)、なぜそのような機能を有するか

– Algorithmic levelその機能をどのように実現するか、どのような知識表現を用い、どのようなプロセスで処理するか

– Implementational levelシステムは物理的にどのように実現されているか

30

Marr の視覚理論(3)

• Stages of Vision– Primal Sketch

情景から抽出される線・領域等の属性– 2.5D Sketch

Primal Sketch から構成される、テクスチャや奥行き感を含む描像。ステレオ視、オプティカルフロー、視差などと関連

– 3D Model情景を表す3次元モデル

31

記号主義と対立する立場

• 知識は記号で表わされるような「集中表現」ではなく、分散的に表現される。

• 学習・知識獲得こそが重要である。• 推論などの処理も推論エンジンなどで集中的に行われるのでなく、分散処理される。 ⇒ エージェント ( Agent )

• 1980 年代のニューラルネットワーク研究の台頭。

32

記号主義と対立する立場(2)• 知能は孤立して存在するのではなく、外界・環境との関係(外界からの情報獲得や外界への働きかけ、他者との関係)の中に存在している。– 現象学・解釈学的立場( Heidegger,

Gadamar )– 「生態学的アプローチ」( J. J. Gibson, 佐々木)

– Subsumption Architecture (R. Brooks, 1986)–共同・協調作業とそれへのコンピュータ支援

34

本日の課題

• 人工知能における基本概念・用語、研究の動向を理解する。

• 典型的・代表的な研究例について、原論文などを含めて内容を調べる。

• パズルなどの問題について、自分で解いてみてその解き方を観察・考察する。

35

36

付録: ゲームプログラムの基本• 以下は本文で取り上げた将棋プログラ

ムの基本事項についてまとめたものです。

37

38

基本事項: 状態空間

• 状態: 問題解決途中の場面・状況。それを表すデータ表現(知識表現)– 初期状態: 問題で与えられた最初の状態。– 目標状態: 問題が「解決された」状態。一般には1つとは限らない。• 複数の解がある• 解がない

• 操作: 1つの状態から別の状態に移動するための処理

39

状態空間(2)• 制約・ルール

状態や操作についての制限。– 可能な状態、不可能な(違法な)状態– 可能な操作

• 状態空間: 状態をノード、操作(による移動)をリンクで表したグラフ構造。

• 問題解決: 状態空間中で、初期状態から出発して目標状態に至る経路を示すこと。– 目標状態が複数ある場合:

解を1つ求めればよい、すべての解を求める– 目標状態が存在しない場合

40

状態空間探索• 基本 (前方探索 forward search )

初期状態から出発し、可能なリンクをたどって目標状態に至る経路を見出す。

• 同じ状態を何度も調べないことが重要。

• 後方探索 (backward search )目標状態から出発して初期状態に至る。

• 発見的探索 (heuristic search)ムダな探索経路をできるだけ探さないで済ませる。

41

例題:川渡り問題• 問題

旅人 (T) 、狼 (W) 、ヤギ (G) 、キャベツ (C) が旅をしていて川に行き着いた。川には渡し舟が 1艘あり、一度に乗れるのは TWGC のうちの2つまでで、操船は T にしかできない(つまり T は必ず舟に乗らなければならない)。全員が川を渡るにはどうすればいいか。

• 制約: 旅人 T がいないとき、– 狼、ヤギ( W, G )だけだと狼がヤギを食べてし

まう。– ヤギ、キャベツ( G, C ) だけだとヤギがキャベ

ツを食べてしまう。– (したがって無事なのは W, C の組み合わせだけ)

42

川渡り問題の状態表現(1)

• 川の左岸・右岸に TWGC のどれがいるかが状態になる。

• (渡っている途中の状態(船上にあるとき)は考えなくてよい。)

• 実際には左岸・右岸の一方だけでよい。

• 初期状態:     目標状態:

• 最初に TG が渡った後: W

C

T

G

TWGC

TWGC

43

川渡り問題の状態表現(2)• 状態の総数:  T, W, G, C が左右どち

らかの岸にあるから、 24 = 16 通り• 禁止状態:  T のいない側に WG, GC

の組み合わせがある。これが右の6通り

• 可能な状態数:16 – 6 = 10 通り

WGC

T

TW

GC

TWGC

T

C

WG

GC

TWW

G

T

C

44

WG

T

C

GC

TW

WGC

T

W

C

T

G

×

×

×

TWGC

初期状態

45

W

C

T

G

TWGC

初期状態TW

CG

46

TW

CG

W

C

T

G

TWGC

初期状態 C

TWG

G

TW

C

T

GC

W

T

GW

C

TWGC

WT

GC

TWG

C

目標状態

47

各種の探索• 現実的な問題では全探索はできない• 局所評価(評価関数)と「山登り法」 • 最良優先探索

– 複数の「探索前線」の保持– (Genetic Algorithm)

• 深さ限定探索

• AND/OR 木• ゲーム木• 制約伝播法

48

ゲーム木

• 「2人完全情報ゼロ和ゲーム」チェス、碁、将棋、オセロ、三目並べ、…– 2人の対戦、有利・不利が相反的関係にあ

る– ゲームの各状態(盤面)における情報が、両者にすべて共有されている。

• 全探索は不可能であることが前提⇒ 評価関数が中心的な役割を果たす。

49

ゲーム木(2)

• 評価関数:  max: 先手有利、 min: 後手有利

• Mini-max tree– 一方の有利な状況 = 他方の不利な状況– 1手ごとに、探索目標が入れ替わる。

• 1手目: 先手にとって最も有利な手を選ぶ• 2手目: 後手にとって最も有利(先手にとって最も不利)な手を選ぶ。

• …

• mini-max 探索• α-β pruning

50

評価関数の利用

• 評価関数ある状態における探索状況の良し悪し(解までの距離、得られる解の良し悪し等)を、探索を行わずに、少ないコストで計算する関数。

• 「山登り法」  (Hill Climbing)– 評価値の良い状態から順に探索していく– local peak, plateau

• 最良優先探索レベル間にわたる複数の「探索前線」から評価値の高いものを優先して探索する。

51

mini-max 探索 A

B C

GE

I K L N O Q

max

max

min

min

H

P

F

MJ

D

6 4 8 5 7 3 1 6 9評価関数値

52

mini-max 探索

6 4 8 5 7 3 1 6 9

6 8 7 3 9

6 3

6A

B C

GE

I K L N O Q

max

max

min

(min)

H

P

F

MJ

D

α ー β pruning (枝刈り)• 基本の mini-max 探索は、あるレベルでの評価関数値がすべて算定されていることが前提。

• しかし評価関数の計算にはコストがかかる。

• 実際には計算しなくてもいい(探索に影響しない)ものもある。

• α ー β pruning は探索範囲を一定の割合で減らすが、指数オーダーを改善するわけではない。

(肩付きの数: 値が決定する順番。× は計算の必要がない部分)

α ー β pruning A

B C

GE

I K L N O Q

max

max

min

(min)

H

P

F

MJ

D

61 42 84 × 75 37 18 × ×

63>=84 >=75 39 ×

66 <=39

610

55

ゲーム木(3)

• その他の探索テクニック– 各種の発見的探索– 選択的深化 (selective deepening)

• 特定の有望そうな枝だけを重点的に探索する– 事前探索

• 局面・手順データベース(終盤データベース、「定石」)

• 評価関数の良否• 盤面が急激に変わる状況

「水平線効果」

ゲームプログラムを強くする

• 「仕込み」:あらかじめ調べた結果をデータベース化する。–終盤データベース、定石データベース等– 過去の対戦記録(特に上級者の)

• 機械学習手法の発展とその利用– 自分自身、あるいは他のソフトと対戦する

など• 新規な手法・アルゴリズムの開発

–囲碁におけるモンテカルロ法の適用など 56

コンピュータ将棋について

• 基本は評価関数を用いたゲーム木探索• しかしコンピュータの高性能化、多重並列化などにより性能そのものが大幅アップ–第 3 回電王戦5局の GPS 将棋は 700 近いマシ

ンによる並列処理• 定跡的な手順のデータベース化• またプロ棋士の棋譜等による学習を本格的

に利用–譜例が少ないと役に立たない(入玉戦など)

57

コンピュータ将棋(2)

• プロ棋士(女流棋士)との公式対戦– あから 2010対清水(女流棋士):コンピュータ勝利

– 将棋電王戦(1)  2012対米長(元名人:引退棋士):コンピュータ勝利

– 将棋電王戦(2)  20135戦の「団体戦」:コンピュータ側の3勝1敗1分

– 将棋電王戦(3)  2014コンピュータ側の4勝1敗

– 将棋電王戦(4)  2015コンピュータ側の2勝3敗 58

コンピュータ将棋(3)

(第2回電王戦)• 観戦記などによれば、人間側の優劣判断とコ

ンピュータ側の優劣判断とは食い違っている。– プロ棋譜データに基づいているにも関わらず、なぜ違いが生じたのか?

– コンピュータは新しい「戦略」を見出している?• 疲労・思いこみなどの「人間的」要因• 第4戦の引き分けは、コンピュータ必勝の状況を入玉戦に持ち込まれたため。

59

コンピュータ将棋(4)• 第 3 回電王戦( 2014 )

– クラスタを使用せず、同一スペックのマシンで対戦– それでもコンピュータ側が 4勝 1敗

• 電王戦 FINAL ( 2015 )– 人間側が 3勝 2敗と勝ち越し

• 今後はどうなる?– 現在の形の電王戦は終了、別棋戦が開始予定– コンピュータがプロレベルに達しているのは間違いない。– 人間を超えたか?

• 現時点ではまだ断定はできない。• 人間側の「巻き返し」、新しいタイプの戦略・作戦の登場?

– 人間に学べることは? 60

61

62

事例: 自然言語理解

• 1960 年代に、機械翻訳プロジェクトが推進されるが、期待された成果が得られなかった( ALPAC 報告)。

• SHRDLU– Winograd による自然言語理解システム( 1970 )– 対象領域についての知識の重要性を強調し、質問応答を行う。

• 以後、自然言語理解研究は着実に進められるが、 90 年代以降は事例ベース、確率モデルを用いる手法などが(実用的目的から)中心となる。

63

特異な事例:  ELIZA• (Weizenbaum 1966)   [ELIZA 1, 2]

パターン照合ベースの自然言語「応答」システム– Weizenbaum: Computer Power & Human Reason– Winograd & Flores: Understanding Computers and

Cognition– ⇔Winograd, Terry: Understanding Natural Language

(1972): SHRDLU

• まともな構文解析はしない• 文中からキーワードを拾ってきて、それに対

して定型的パターンの中から応答を組み立てる。

64

ELIZA (続き)• 例: 文中に mother があれば「家族の話」と

解して、” tell me more about your family” のような応答文を組み立てる。

• プログラムと本気で応答を始める人が出てきてしまった(!?)

• ( Rogers 学派精神分析の応用)– DOCTOR: 精神分析医のような応答を行なうプログ

ラム– PARRY: 精神分裂症的症状の応答を行なうプログラ

ム– DOCTOR vs. PARRY

最近の自然言語処理(機械翻訳)• 前述のように、現在では統計的手法に基づく確率モデル、機械学習を用いる手法が主流となっている。

• ある意味では 60 年代の手法に逆戻り。しかし ...... 違うのは:– 大規模なコーパス– マシン性能の飛躍的向上– モデル化手法・理論の進歩

• 「理解」はしているか?  cf. 「中国語の部屋」65