1
Deep neural networkを用いたヒューマノイドロボットの適応的行動選択 Adaptive Behavior Selection of a Humanoid Robot using Deep Neural Network 研究目的 感覚運動統合学習システム 実験設定 まとめ 参考文献 [1] G. E. Hinton and R. R. Salakhutdinov, “Reducing the dimensionality of data with neural networks,” Science, vol. 313, no. 5786, pp. 504-7, 2006. [2] K. Lang, A. Waibel, and G. Hinton, “A Time-Delay Neural Network Architecture for Isolated Word Recognition,” Neural networks, vol. 3, pp. 23-43, 1990. [3] J. Martens, “Deep Learning via Hessian-free Optimization,” In Proceedings of the 27th International Conference on Machine Learning (ICML), 2010. Ball li& Ball rolling Bell ring R Bell ring L Ball rolling on a plate Ropeway Deep learningを応用し,ロボットの物体操作行 動に関する感覚運動統合学習を行った 画像,運動情報の間で双方向に記憶連想が実現 時系列予測により,実ロボットを用いて操作対 象物体の切り替えに応じた行動選択が実現 6種類の物体操作行動を直接教示により生成 1モーションあたり150180ステップ(56秒) 学習器として画像特徴学習,感覚運動統合共に12階層Deep autoencoderを使用 CUBLASを用いたGPGPUによる最適化計算 特徴抽出,時系列学習:CPU実装比5の計算速度 6種類の物体 操作行動の 記憶学習 Deep neural network [1]を用いたロボットの感覚運動統合学習 実環境下での多次元,大量のデータを学習可能 未知のノイズに頑健な認識,行動生成 ヒューマノイドロボットの環境変化に適応的な行動選択の実現 クロスモーダル記憶連想 時系列予測 TRAIN TEST I/O ENCODER DIMS Image Feat. 8444 948 900 1000-500-250-150-80-30 Temp. Seq. 20548 776 1200 1000-500-250-150-80-30 学習に用いたデータと学習器の規模 野田 邦昭 有江 浩明 菅 佑樹 尾形 哲也(早稲田大学) Kuniaki Noda Hiroaki Arie Yuki Suga Tetsuya Ogata(Waseda University) Deep autoencoderによる画像特徴量の自己組織化 特徴量から元の情報を復元可能 タスク依存の特徴抽出メカニズムが不要 Time-delay型ネットワーク[2]による時系列学習 複数モーダルを統合し,抽象化空間を構造化 学習器の汎化能力により,クロスモーダルな 記憶連想や時系列予測が可能 実験結果 50 100 150 0 0.5 1 Scaled angles Ball lift 50 100 150 0 0.5 1 Scaled angles 50 100 150 0 0.5 1 Ball roll 50 100 150 0 0.5 1 50 100 0 0.5 1 Bell ring L 50 100 0 0.5 1 正解 想起 元の動作パターンの特徴を再現 提示した物体に応じた動作パターンを生成 最適化にHessian-free optimization [3]を採用 学習を2次最適化問題として定式化 ニュートン法がベースなので,収束が早い 映像から運動の想起 運動から映像の想起 ③ 環境変化に適応的な行動選択 再現性の高い画像を想起 Ball lift Ball roll Bell ring L 正解 想起 GPGPU実装との 高い親和性 Reconstructed sequence Multimodal feature space (30 dim) RGB image (900 dim) Joint angles (10 dim) Image feature (30 dim) ・・・ ・・・ ... ... ... ... Reconstructed image Central hidden layer 1200 dim Multimodal input sequence (30 steps) Joint angles Image feature u t T + 1 u t 1 u t ˆ u t T + 1 ˆ u t 1 ˆ u t a t T + 1 a t 1 a t ˆ a t T + 1 ˆ a t 1 ˆ a t

Deep neural networkを用いたヒューマノイドロボットの適応 …on-demand.gputechconf.com/gtc/2014/jp/sessions/8001.pdfDeep autoencoderによる画像特徴量の自己組織化

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Deep neural networkを用いたヒューマノイドロボットの適応 …on-demand.gputechconf.com/gtc/2014/jp/sessions/8001.pdfDeep autoencoderによる画像特徴量の自己組織化

Deep neural networkを用いたヒューマノイドロボットの適応的行動選択 Adaptive Behavior Selection of a Humanoid Robot using Deep Neural Network

研究目的

感覚運動統合学習システム

実験設定 まとめ

参考文献 [1] G. E. Hinton and R. R. Salakhutdinov, “Reducing the dimensionality of data with neural networks,” Science, vol. 313, no. 5786, pp. 504-7, 2006. [2] K. Lang, A. Waibel, and G. Hinton, “A Time-Delay Neural Network Architecture for Isolated Word Recognition,” Neural networks, vol. 3, pp. 23-43, 1990. [3] J. Martens, “Deep Learning via Hessian-free Optimization,” In Proceedings of the 27th International Conference on Machine Learning (ICML), 2010.

Ball$li&� Ball$rolling� Bell$ring$R�

Bell$ring$L� Ball$rolling$on$a$plate� Ropeway�

l Deep learningを応用し,ロボットの物体操作行動に関する感覚運動統合学習を行った

l 画像,運動情報の間で双方向に記憶連想が実現 l 時系列予測により,実ロボットを用いて操作対象物体の切り替えに応じた行動選択が実現

l  6種類の物体操作行動を直接教示により生成 l  1モーションあたり150〜180ステップ(5〜6秒)

l  学習器として画像特徴学習,感覚運動統合共に12階層のDeep autoencoderを使用

l  CUBLASを用いたGPGPUによる 適化計算 l  特徴抽出,時系列学習:CPU実装比約5倍の計算速度

6種類の物体操作行動の記憶学習

l  Deep neural network [1]を用いたロボットの感覚運動統合学習 l  実環境下での多次元,大量のデータを学習可能 l  未知のノイズに頑健な認識,行動生成

l  ヒューマノイドロボットの環境変化に適応的な行動選択の実現 l  クロスモーダル記憶連想 l  時系列予測

TRAIN TEST I/O ENCODER DIMS Image Feat. 8444 948 900 1000-500-250-150-80-30 Temp. Seq. 20548 776 1200 1000-500-250-150-80-30

学習に用いたデータと学習器の規模

野田 邦昭 有江 浩明 菅 佑樹 尾形 哲也(早稲田大学) Kuniaki Noda Hiroaki Arie Yuki Suga Tetsuya Ogata(Waseda University)

l  Deep autoencoderによる画像特徴量の自己組織化 l  特徴量から元の情報を復元可能 l  タスク依存の特徴抽出メカニズムが不要

l  Time-delay型ネットワーク[2]による時系列学習 l  複数モーダルを統合し,抽象化空間を構造化 l  学習器の汎化能力により,クロスモーダルな記憶連想や時系列予測が可能

実験結果

50 100 1500

0.5

1

Sca

led

an

gle

s

Ball lift

50 100 1500

0.5

1

Sca

led

an

gle

s

50 100 1500

0.5

1

Steps

Sca

led

an

gle

s

50 100 1500

0.5

1

Ball roll

50 100 1500

0.5

1

50 100 1500

0.5

1

Steps

50 1000

0.5

1

Bell ring L

50 1000

0.5

1

50 1000

0.5

1

Steps

50 1000

0.5

1

Bell ring R

50 1000

0.5

1

50 1000

0.5

1

Steps

50 1000

0.5

1

Ball roll on a plate

50 1000

0.5

1

50 1000

0.5

1

Steps

50 100 1500

0.5

1

Ropeway

50 100 1500

0.5

1

50 100 1500

0.5

1

Steps

(a)�

(b)�

(c)�

正解

想起

元の動作パターンの特徴を再現

提示した物体に応じた動作パターンを生成

l  適化にHessian-free optimization [3]を採用 l  学習を2次 適化問題として定式化 l  ニュートン法がベースなので,収束が早い

② 映像から運動の想起

① 運動から映像の想起

③ 環境変化に適応的な行動選択

再現性の高い画像を想起

Ball lift Ball roll Bell ring L Bell ring R Ball roll on a plate Ropeway

(a)�

(b)�

正解

想起

GPGPU実装との高い親和性

Reconstructed sequence

Multimodal feature space (30 dim)

RGB image (900 dim)

Joint angles (10 dim)

Image feature (30 dim)

・・・

・・・

... ...

... ...

Reconstructed image

Central hidden layer

1200 dim

Multimodal input sequence (30 steps)

Joint angles Image feature

ut−T+1 ut−1 ut

ut−T+1 ut−1 ut

at−T+1 at−1 at

at−T+1 at−1 at