Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
人工知能技術の最新人工知能技術の最新動向動向〜〜 人工人工知能技術の現状とビジネスへの応用の可能性と知能技術の現状とビジネスへの応用の可能性と課題〜課題〜
人工知能技術の最新人工知能技術の最新動向動向〜〜 人工人工知能技術の現状とビジネスへの応用の可能性と知能技術の現状とビジネスへの応用の可能性と課題〜課題〜
宇野宇野宇野宇野宇野宇野宇野宇野毅明毅明毅明毅明毅明毅明毅明毅明 (国立情報学研究所(国立情報学研究所(国立情報学研究所(国立情報学研究所
2016年年年年 12月月月月6日日日日 人工知能ビジネス創出協会人工知能ビジネス創出協会人工知能ビジネス創出協会人工知能ビジネス創出協会 設立記念フォーラム設立記念フォーラム設立記念フォーラム設立記念フォーラム
宇野宇野宇野宇野宇野宇野宇野宇野毅明毅明毅明毅明毅明毅明毅明毅明 (国立情報学研究所(国立情報学研究所(国立情報学研究所(国立情報学研究所
&総合研究大学院大学)&総合研究大学院大学)&総合研究大学院大学)&総合研究大学院大学)
http://research.nii.ac.jp/~uno/index-j.htmle-mail: [email protected]
知能とは知能とは知能とは知能とは
••知能 ≠ 頭脳知能は優れた「考える力」、頭脳は「考える機能」
••知能にもいろいろな側面がある記憶、計算、整理、、、
推理、推論、関連づけ、判断、、、
認知、認識、類別、判別、、、
理解、読解、想像、経験、、、
感情、創造性、愛、感覚、直感、笑い、、、
••一緒くたに人工知能といっても、出来ること出来ないことがある
東ロボプロジェクト東ロボプロジェクト東ロボプロジェクト東ロボプロジェクト
•• 2011年に始まったプロジェクト(ワトソンとは独立。模倣ではない)
••現在の自動証明、自然言語処理、データベース検索、物理シミュレーション、画像認識などの処理を使って、どこまで人間の知
性に迫れるか、という基本問題に対する問いかけ性に迫れるか、という基本問題に対する問いかけ
••具体的な挑戦は、解きやすいものから行いたい��������入試問題は、回答が明確に定まっており、課題として非常に
良い。問題例もビッグデータのように沢山ある
課題設定︓⼊⼒の設定課題設定︓⼊⼒の設定課題設定︓⼊⼒の設定課題設定︓⼊⼒の設定••現在は、テキストと画像を入力して、回答を導くような問題設定で挑戦を行っている
++++++++数学は、(図として与えられた)数式の解釈自体が難しい
そこを与えてしまうと、意外と問題は易しい
++++++++物理や英語のイラスト的な絵は、記号化できるレベルである
が、それを読み解くことは難しく、それを与えてしまうと問題は易
しくなる
••最終的には、ロボットに、実際に東大に受験に行って欲しい
��������赤門をくぐり、受験票を見て講義室に入って自分の席に座り、
問題分をめくって内容をスキャンし、、、
東ロボ君、現在の学⼒東ロボ君、現在の学⼒東ロボ君、現在の学⼒東ロボ君、現在の学⼒
•• 2014年、代々木ゼミナールの公開模試を受験しました
結果は、平均よりもちょっといい、という感じ
��������かなりがんばっている!!
400校の私大に合格率80%以上(A判定)が出ました
•• 2016年、偏差値57.1、 535の大学にA判定問題文の手入力もせず、全部自動
DENSOさんが、東ロボ手くんを作ってくれました!
• • でも東大は断念。ちょいと届きませんで。今後は産業応用です
東ロボ⼿くん︕東ロボ⼿くん︕東ロボ⼿くん︕東ロボ⼿くん︕
東ロボ君、現在の学⼒東ロボ君、現在の学⼒東ロボ君、現在の学⼒東ロボ君、現在の学⼒
得点得点得点得点 全国平均全国平均全国平均全国平均 偏差値偏差値偏差値偏差値
英語(筆記) 95(80) 92.9 50.5(48.4)
英語(リスニング) 14(16) 26.3 36.2(40.5)
国語(現代文+古文) 96(90) 96.8 49.7(45.1)
数学IA 70(75) 54.4 57.8(64)
数学ⅡB 59(77) 46.5 55.5(65.8)
●●●● 大学入試センター試験の模試(マーク式)大学入試センター試験の模試(マーク式)大学入試センター試験の模試(マーク式)大学入試センター試験の模試(マーク式)
世界史B 77(76) 44.8 66.3(66.5)
日本史B 52(55) 47.3 52.9(54.8)
物理 62(42) 45.8 59.0(46.5)
合計=950点満点 525(511) 437.8 57.1(57.8)
得点得点得点得点 全国平均全国平均全国平均全国平均 偏差値偏差値偏差値偏差値
地理歴史(世界史) 16 14.5 51.8
数学(文系) 46 19.9 68.1
数学(理系) 80 30.8 76.2
●●●● 2次試験の模試(論述式)2次試験の模試(論述式)2次試験の模試(論述式)2次試験の模試(論述式)
社会の時間社会の時間社会の時間社会の時間
基本的にどのような問題か基本的にどのような問題か基本的にどのような問題か基本的にどのような問題か•• A は B である、というような、事実を答える問題が多い
++++++++徳川幕府7代目の将軍の名前を答えよ
++++++++日本一りんごの収穫量が大きい市はどこか
•• 「ファクトアンサー」と呼ばれる問題基本的に、自然言語解析+データベース技術に収まる問題
�������� 「何を聞かれているか」を自然言語解析で取得
それを、データベースで検索し、最も近いものを出力
••歴史は時間、地理は地域を数量的に扱うので、その獲得も必要
•• 「ワトソン」は、いくつかの種類の問題に対して、ファクトアンサーを解いている
含意関係含意関係含意関係含意関係••回答が名詞ではないとき、特に、次の中から正しい文章を選べ、というような場合、含意関係問題を解く必要がある
++++++++徳川幕府7代目の将軍は、徳川家家である
++++++++徳川幕府は15代続いた++++++++関ヶ原の戦いに西軍が勝っていたら、豊臣幕府が誕生
したかも知れない
••含意関係とは、A の文章の主張が B の文章(複数)から導けるかどうかを判定する問題
AA:::::::: AIは発展したBB:::::::: 近年、AI技術開発により試験問題が解けるようになってきた
含意関係の解き方含意関係の解き方含意関係の解き方含意関係の解き方••含意は意外と難しい
AA:::::::: AI技術は発展した
�������� ○○は技術である、のコーパスが必要
�������� 発展したことに対応する言い回しのコーパスも必要�������� 発展したことに対応する言い回しのコーパスも必要
BB:::::::: 近年、AI技術開発により試験問題が解けるようになってきた
�������� こちらも同じように意味を変形できる
Aを変形してBが得られるか、という問題とも捉えられる
••係り受け解析で構文構造を得て、それを変形する探索問題
コーパス作りコーパス作りコーパス作りコーパス作り• • 辞書を作るには 「人力」が一つの手。でも、これは大変
•• Webテキストや国語辞書などから、コーパスを自動作成する++++++++単語辞書:
Webテキストを、頻度が急激に変化する位置で切る
++++++++品詞辞書:++++++++品詞辞書:
各単語の次に来る言葉、前に来る言葉の統計情報で判定
++++++++係り受け辞書:
「AのB」「AなB」などの使われ方を収集して構築
• • 細かい例外などがあり、単純にがつんと作れるわけではない
難しい問題難しい問題難しい問題難しい問題••写真から読み解く問題
++++++++図の中で、北国の暮らしに典型的なものを述べよ
++++++++図のAのエリアではどのような作物を育てると良いか
© Wikipedia© 十日町市
英語の時間英語の時間英語の時間英語の時間
どういう問題を解くかどういう問題を解くかどういう問題を解くかどういう問題を解くか••用例を問う問題は、Web検索で十分
例)例)例)例)例)例)例)例) arrive □ Tokyo university��������□のところに at や on や to を入れて検索して、一番多かったものを選ぶ
••言語はそもそもそういうものなので、これが正しいアプローチ••言語はそもそもそういうものなので、これが正しいアプローチ
••翻訳は、google 翻訳にお任せ��������実は、上記のことを、英語対日本語で行っているだけ
対訳コーパスの文章たちに当てはまりが良くなるよう
単語のならびの尤度を最大化
••文章題は、含意関係なので社会と同じアプローチ
対応関係を調べる対応関係を調べる対応関係を調べる対応関係を調べる••当てはまりの良さを調べるのに、対訳の例文集を使う(あるいは、日本語英語両方で記述された、要約など)
例)例)例)例)例)例)例)例) 「知能」を含む文の英訳文に、どの単語が含まれるか?
人工知能ならどうか。2つの単語からなる熟語が出てくるだろう
••翻訳したい文に近い文を集め、その対訳や慣用句などと、なるべくつじつまが合うよう
単語を並べる
Intelligence artificial wisdom you this the
難しい問題難しい問題難しい問題難しい問題••絵の中身を読み解く問題絵の中身を読み解く問題絵の中身を読み解く問題絵の中身を読み解く問題
●●●●●●●●以下の文章は、スミスさん一家のある一日を表している。この
文章が表している絵は次のどれか
++++++++弟は野球に行って、試合に勝った
++++++++母はカーペットを買ってきた
++++++++父は家で夕食を食べた
ディープラーニングディープラーニングディープラーニングディープラーニング
••ニューラルネットは、「ここに論理構造がありそうだ」というところを狙って、ネットワークを設計しなければならない
そこが、汎用化や高精度化を難しくしている
••ディープラーニングは、そこの自動化を、多階層化で、図る
・・・
局所的な構造の獲得局所的な構造の獲得局所的な構造の獲得局所的な構造の獲得
第1階層の各ノードは、局所的なパターンが現れたら発火、の意味
第2階層は、より抽象度の高いパターンが現れたら、発火
細かいパターンの組合せとして、大きな構造の概念を獲得する
強みと弱み強みと弱み強みと弱み強みと弱み
••ディープラーニングは、いわば巨大な自由度を持つニューラルネット。決めなければならないパラメータが大量にある
��������大量のデータがないと、パラメータが定まらない
��������計算コストが巨大
• • ネットワークの詳細構造が与えられなくても自動的にできる
(画像など、大量に教師データがあれば、自動学習できる)
• • ネットワークの概念的な骨格がないと、うまくいかない
(音声のセグメント、画像のメッシュなど)
�グラフや、ゲノムの属性などでは、構造が作りにくい
機械と人間の認識の違い機械と人間の認識の違い機械と人間の認識の違い機械と人間の認識の違い
•• コンピュータは、人間とはまったく違うルールで画像を認識する
人間は、心霊写真のように、顔ではないものを顔っぽく見てしま
うことがある
ディープラーニングにもそれはあるが、人間にはまったく似てい
るように見えない!
右のパンダの画像は、機械には「テナガザルそのもの」に見える
© http://karpathy.github.io/2015/03/30/breaking-convnets/
数学の時間数学の時間数学の時間数学の時間
基本的なアプローチ基本的なアプローチ基本的なアプローチ基本的なアプローチ
••数学の証明は、与えられた条件から、ゴールとなる条件を導けるかどうかの問題
••自動定理証明システムに突っ込むと、意外と上手に解いてくれる
••文章を読み解いて、数式に変換するところが一番大変••文章を読み解いて、数式に変換するところが一番大変
••数式になってしまえば、あとはソルバーがけっこう解いてくれる��������自動証明技術の研究開発は長く、そこそこ優秀
(数式OCR、なんてのも最近あります。けっこう良くできてる!)
難しい問題難しい問題難しい問題難しい問題••統計の問題
●●●●●●●●この町の子供達の勉強時間を、地区ごとに集計した
ところ表のようになった
++++++++ A のところに入る数字は何か++++++++ A のところに入る数字は何か++++++++ B のところが何以上になると、分散が10以上になるか++++++++ C地区に、3人の子供が引っ越してきたところ、平均が○○になった。ところが何以上になると、分散が10以上になるか
物理の時間物理の時間物理の時間物理の時間
基本的な問題パターン基本的な問題パターン基本的な問題パターン基本的な問題パターン••物理物理物理物理の問題は、基本的には数学的な問題が多い(数式の証明、あるいは値の計算)
••文章から式を導ける物もあるが、多くのものは図がついている(数式になれば、あとは数学と同じ)
••絵から、実際の空間上にどのように配置されているのかを
読み解くのは、以外と大変
••文章も、正確に理解するのは大変
• • 配置がわかれば、後は物理シミュレーションで何がおきるかわかる © http://schoolbutsuri.blogspot.jp/
2013/01/blog-post.html
文章が示す意味の揺らぎ文章が示す意味の揺らぎ文章が示す意味の揺らぎ文章が示す意味の揺らぎ••言葉は、常識を取り去ると非常に揺らぎが大きい言葉は、常識を取り去ると非常に揺らぎが大きい言葉は、常識を取り去ると非常に揺らぎが大きい言葉は、常識を取り去ると非常に揺らぎが大きい
例)例)例)例)例)例)例)例) 机の上にある四角い板の上にひもで繋がれたボールがある
全部作ってしまえ全部作ってしまえ全部作ってしまえ全部作ってしまえ••揺らぎに背景知識を当てはめて絞り込むのが王道だが、それで完全に正しい状況を得ることは難しい
��������ならばすべての可能性を列挙してしまえ。
全てのモデルで物理シミュレーションを行って、
うまくいくものを求める
•• •• ••
全ての組合せ全ての組合せ全ての組合せ全ての組合せ••問題文から、どのような物体があるかはわかる�ボール、机、板、ひも
••それらの接続関係、位置関係、力のかかり具合などに違いがある
• • 接している、でも、どこで接しているか、あるいは動いているような• • 接している、でも、どこで接しているか、あるいは動いているような状況もある
• • しかし、高々5個の物体が4通りの位置関係の可能性を持つ程度なら、45 = 1024通りの組合せにしかならない
• • 10個の物体が10通りの位置関係の可能性を持つ、くらいになると厳しい
難しい問題難しい問題難しい問題難しい問題••社会的な、あるいは現実世界の常識を利用する問題は難しい
++++++++ここに、ピーという音が来ると前に進み、プーという音が聞こ
える後ろに進むロボットがあります。図のAとBのスイッチを同時に入れて音を出したとき、ロボットはどちらに進むでしょうか
化学の時間化学の時間化学の時間化学の時間
基本的なアプローチ基本的なアプローチ基本的なアプローチ基本的なアプローチ
••化学の問題には、数学的な問題と物理学的な問題と知識を問う問題がある
••知識を問う問題へのアプローチは、社会と同じ
••••数学的な問題、物理的な問題は、基本はだいたい同じなのだが、両者のソルバーを転用することはできない
化学式ソルバー化学式ソルバー化学式ソルバー化学式ソルバー••化学の式は、数学には出てこないタイプの変形がある
++++++++原子が分子になる
++++++++エネルギーが出る、あるいは吸収する
++++++++触媒や温度など、外部要因がある
2H2H22 + O+ O22 �������� 2H2H22O + eO + e (約分できない、等式は成り立たない)CC66HH1212+ HCOOH + HCOOH �������� CC66HH11 11 COOH COOH (C はいっしょにしちゃだめ)
••代数とは異なる公理系であり、状態の変化というものがある••つまり、専門のソルバーが必要。技術的には簡単だが、労力は途方もない
化学系シミュレーション化学系シミュレーション化学系シミュレーション化学系シミュレーション••物理と同じようだが、やはり異なるポイントがいくつもある
++++++++固体・液体・気体の状態変化がある
++++++++化学反応を起こして熱を出す
++++++++気体、液体同士が混ざる
++++++++熱が伝わる++++++++熱が伝わる
++++++++膨張・収縮する、融ける、曲がる
••通常の物理シミュレーションとは異なることが起きる
••ただし、気体にしても液体にしても、記号化しても大丈夫な程度の抽象度を持っており、実現は困難ではない
道徳の時間道徳の時間道徳の時間道徳の時間
どこが深化したのかどこが深化したのかどこが深化したのかどこが深化したのか
••知能にもいろいろな側面がある記憶、計算、整理記憶、計算、整理記憶、計算、整理記憶、計算、整理、、、、、、、、、、、、
推理、推論、関連づけ、判断推理、推論、関連づけ、判断推理、推論、関連づけ、判断推理、推論、関連づけ、判断、、、、、、、、、、、、
認知、認識、類別、判別認知、認識、類別、判別認知、認識、類別、判別認知、認識、類別、判別、、、、、、、、、、、、
理解、読解、想像、経験、、、理解、読解、想像、経験、、、
感情、創造性、愛、感覚、直感、笑い、、、
••大幅に深化した。試験もかなりとけるようになった。つまり、世の多くの問題は、理解する必要はない
••シンギュラリティには来そうですか?
仕事を奪われる人は︖仕事を奪われる人は︖仕事を奪われる人は︖仕事を奪われる人は︖
••多くの仕事が、「AIに奪われる」と言われている本当でしょうか? 考えてみましょう
接客接客接客接客接客接客接客接客:
いわゆる「タッチパネル端末」でできることが、AIでできる
できないことは、
雑談、仲良くなる、笑顔、「このお酒持ち込んでいいかな」
「そばに離乳食売ってるところないですか」「どういう服が
似合うでしょうか」「心配しなくても大丈夫ですよ」
••言語インターフェースと含意検索により、「今日のおすすめ」「最新のファッション」など、多少端末以上のことができるようになる
事務職事務職事務職事務職
営業営業営業営業営業営業営業営業:お客の質問に「ファクトアンサー」はできる
できないことは、
関係を作る、相手のポイントを理解し、適切な提案を作ること
経理・総務経理・総務経理・総務経理・総務経理・総務経理・総務経理・総務経理・総務:書類の自動作成はできる
できないことは、できないことは、
事例に適切な解釈を与えること、例がいい対応すること、業務
体系の問題点を明らかにして、改善案を作る
人事人事人事人事人事人事人事人事:いい雰囲気を作る。問題人物に対処する。人物評価!
・・・ 難しいと言わざるを得ない
士業士業士業士業
弁護士、弁理士、税理士など弁護士、弁理士、税理士など弁護士、弁理士、税理士など弁護士、弁理士、税理士など弁護士、弁理士、税理士など弁護士、弁理士、税理士など弁護士、弁理士、税理士など弁護士、弁理士、税理士など
知識を問うだけなら簡単。そもそもWeb検索で十分
顧客の状況が、法律や条件と当てはめるとどうなるのか、重要な
ポイント探しや要約、論旨展開などが求められる
芸術家、音楽家芸術家、音楽家芸術家、音楽家芸術家、音楽家芸術家、音楽家芸術家、音楽家芸術家、音楽家芸術家、音楽家
絵や音楽の自動生成方法が出てきたけど、、、
それなりにいいけれども、やはりストーリーがないものには、大
きな価値は見いだしづらいのでは?スマホのチープなゲームの
音楽くらいならなんとかなりそう
結局、今までの「作業が楽になる」ことはあっても、
「奪われる」ほどではない
AIAIで未来予測で未来予測AIAIで未来予測で未来予測•• AIで未来予測を、と言われますが。。。
••未来が予測できるのは、未来に起こることの予兆が現在確認できる場合だけ、です
•• しかも、なんでもいいから予兆を見つける、はできませんある程度の仮説が必要で、対象が絞り込まれないとできませんある程度の仮説が必要で、対象が絞り込まれないとできません
××××××××地震の予兆をなんでもいいから見つけてくれ
○○○○○○○○地震の直前におかしな雲が出てないか (自動で) 調べよう
××××××××この商品を買う、あるいは買いそうな客の予兆を見つけてくれ
○○○○○○○○商品を買う前には、どこかのサイトを見たり、商品のページを
長い間見たり、生活パターンが変わったりするだろう。その様子を
調べることはできないか
総合の時間総合の時間総合の時間総合の時間
ビジネスでビジネスでAIAIを使うには︖を使うには︖ビジネスでビジネスでAIAIを使うには︖を使うには︖•• AI、と言ってもほんとの人工知能というモノはないわけで��������自動的に何かしてくれるもの、がAI と見られているんです
•• AIより、「最近進化した情報技術」のほうが見通しがいいです
++++++++近年のAIの進化は、ビッグデータの利用から来てますまず、データを上手に使って利得を得ることを考えましょうまず、データを上手に使って利得を得ることを考えましょう
++++++++画像認識が進化しました。カメラ+物体認識、を、
センサーの一種と考えて良いでしょう
++++++++自然言語処理が高度になりました。翻訳、含意検索を
音声認識と一緒に使えば、様々なことが出来ます
実際には使うところは実際には使うところは実際には使うところは実際には使うところは••技術的に人工知能が突出しているのは、推論と囲碁将棋、自然言語、画像と音声、の3つ
++++++++囲碁将棋のようなゲームの深読みは、普通は不必要
++++++++画像・音声認識の場合、考えることは、環境を整備すること
大量のデータが手に入るか、大量のデータが手に入るか、
ノイズ消したり、ものだけ真ん中に写るようにできるか
誤認識しそうなほどたくさん現れているものはないか
たくさんのカメラやマイクをおいて、認識精度を上げられるか
++++++++自然言語の場合、意味理解を伴わないでできるか、が重要
現れる単語の数、自動翻訳の利用、同じことに対して、
異なる表現が使われるか、など
自分でトライアルしてみる自分でトライアルしてみる自分でトライアルしてみる自分でトライアルしてみる••自然言語や画像解析の結果から、自動分類や、推論、予測をしたいときには、それが人間にできるものなのか、試せばいい
��������人間にできない推論は、コンピュータにもできない
機械が強いところは、規模とミスのなさだけ
++++++++購買予測をしたいなら、購買した人のデータを数件、
じっくり見てみる。なんか、共通の予兆はあるかじっくり見てみる。なんか、共通の予兆はあるか
++++++++特許や会計、法律や医療などで、自動判断(適法か、新規性
があるか、病気か、など)をしたいなら、
実際のデータ(判例、症状、明細書など)だけを使って判断でき
るかどうか、試してみる。
一般常識や善悪、感覚、経験、意味理解しての推論などが入っ
ていたら、それはAIには難しいと言うこと。 なしでできるか?
小売店での思考実験小売店での思考実験小売店での思考実験小売店での思考実験••アパレルなどの小売店での活用を考えてみるまず、なんのデータを、何に使えそうなのか?
++++++++ビデオで顧客の表情を見て、タイプ分けや興味を測るか?
データを集めるのが大変そう。人間の判断もフィーリングだから、
機械に学ばせるのも難しそう
着ている服の感じならわかるかも。値段とか雰囲気とか
勧める服は、データから選ぶか、それともクリエイターが決めるか
++++++++メンバーズカードや売り上げデータ
過去にどういう服を買ったか、でお勧めできるものはありそうだ
今までの傾向に沿うか、変化をつけるか、という戦略が必要
住所や購入日などからライフスタイルを推測できるか
++++++++Webデータ:評判や、どういうサイトに行ってる人が興味あるか、などがわかる
まとめまとめまとめまとめ
••人工知能が大学入試を受ける意味理解を伴わず、推論や認識だけでできることはたくさんある
••意味理解ができるようにならないと、シンギュラリティはこない
••ビジネスでは、最近進化した部分を使うのが重要••ビジネスでは、最近進化した部分を使うのが重要
アブストラクトアブストラクトアブストラクトアブストラクト
近年のAIの難しさは、まずは見通しの悪さにあると考えている。自分のビジネス・活動に対して、AIは助けになるのか、AIを使って新しいビジネスが始められるのか。ライバル、関連業界がAIを使い、自分が取り残されることはないのか。これらの疑問は、す
べてAIに対する見通しの悪さが原因である。もっとわかりやすい技術、たとえば自動車エンジンの技術であれば、いくらエンジン
が発達しても、花屋は自分のビジネスには直接役に立たないだが発達しても、花屋は自分のビジネスには直接役に立たないだ
ろうと思うわけだし、床屋は、それで自分がライバルに取り残され
るとは思わない。新しいビジネスを始めるときに、どう使えばい
いのか、ということもわかりやすい。しかしAIの場合は、こういった直感が働かない。本公演では、AIの「機能と特性」をかいつまんでお話しし、どんなことに使うとどの程度の効果が得られるの
か、を解説し、AIのビジネスでの利用に対して直感的な理解ができ、将来の動きがなんとなくイメージできるようにする。