深層学習ライブラリのプログラミングモデル

2015-12-19 @Chainer Meetup

今日の内容• 自己紹介

• プログラミングモデル

• ただ結局…

自己紹介

自己紹介• バクフー株式会社柏野雄太 (かしのゆうた)

• Zope3の開発

• Python 13年

• いくつかの本

• バックグラウンドは宇宙物理学

• 深層学習ライブラリウオッチャー

自己紹介• バクフー株式会社柏野雄太 (かしのゆうた)

• 大規模リアルタイムデータのプラットフォーム

http://socio.bakfoo.com/socio@bakfoo.com

Closed Beta

プログラミングモデル

汎用高機能DLライブラリ• Theano

• Torch

• Chainer

• neon

• TensorFlow+ / Cloud Vision API

• MXNet

DL lib 機能差・競争優位

theano torch chainer neon TF MXNet

single speed ○ ○ ○*

multi gpu ○ ○ ○ ○ ○ ○

multi machine ○* ○

model zoo ○ ○ ○ ○

community ○ ○ ○

DLライブラリの共通点• 神経回路網の数理表現をモデルとする

• 有向非巡回グラフ(DAG): 計算グラフ

b(1)W (1)

x1 x2 xd

(1)(x)

(2)(x)

(3)(x)

(2)(x)

(1)(x)

f(x) = h

(3)(x)

b(1)W (1)

数理表現の実装に差がある

• 手続き的: Torch, Chainer, neon

• シンボル的: Theano, TensorFlow

• 手続きかつシンボル: MXNet

_ **2 B

A2 +B + 1

モデル実装の差

_ **2 B

A2 +B + 1

手続き的モデリング• ノードにデータ(とgrad)が格納される

_ **2 B

A2 +B + 1

ノードに格納されるとは• Chainerのカスタム関数

手続きは柔軟で動的

• 全ノードに値とgradが格納されているのでデバグが容易

• forなどの制御が容易

• Chainerのように実行しながら，計算グラフを組み替えることもできる

シンボル的モデリング• 変数ノードはシンボル

• 計算グラフをコンパイル・実行して結果を得る

A2 +B + 1

_ **2 B

シンボルはメモリを再利用する• 結果が欲しいだけなら入力と最後だけメモリにあればいい：メモリの再利用

• A, B: 120byte

• 手続き: 5*120 = 600 byte

• シンボル：3*120 = 360 byte

_ **2 B

シンボルは計算グラフを効率化• 計算グラフの畳みこみ

_ **2 B

op = A ⇤ ⇤2 +B + 1

シンボル：資源分散を体系化

• TFのデバイス間計算，マシン分散機能

手続き vs シンボル• 手続きは柔軟で動的

• デバグが容易でモデリングの開発効率がいい

• モデルに制御構文，計算グラフを動的にも

• シンボルは効率的

• メモリの再利用

• 計算グラフの構造を畳みこみできる

• 計算資源の分散に体系的に対応できる参考：http://mxnet.readthedocs.org/en/latest/program_model.html

ただ結局…

TF開発エコシステム• TensorDebugger (TDB) https://github.com/ericjang/tdb

TF開発エコシステム• skflow https://github.com/google/skflow

• Pretty Tensor https://github.com/google/prettytensor

• Keras http://keras.io/backend/

• Deep Learning Robot https://www.autonomous.ai/deep-learning-robot

結局，七難隠すのは…

開発エコシステムの大きさ

Chainerコミュニティはどこ？

http://jrvis.com/red-dwarf/?user=pfnet&repo=chainer

Rubyの成功に学ぼう• まずは日本で開発エコシステムのコアを育てる

• 本体コード外のコミュニティ開発者の養成

• 正式ドキュメントに日本語

• 日本語による頻繁なミートアップ・年一回のChainerカンファレンス

• 日本語のQAコミュニティ

ご質問・ご意見

kashino@bakfoo.com

@yutakashino

DL学習リソース

動画講義 (全力でオススメ)

• Deep Learning Summer School 2015

• Hugo Larochelle (Twitter/U of Sherbrooke)

• Nando de Freitas (Oxford)

• CS231n: CNN for Visual Recognition

• CS224d: DL for Natural Language Processing

http://videolectures.net/deeplearning2015_montreal/

http://cs231n.stanford.edu/

http://cs224d.stanford.edu/index.html

https://www.cs.ox.ac.uk/people/nando.defreitas/machinelearning/

https://goo.gl/UWtRWT

書籍• 古典: Bengio et.al. 2015 DLBook

• Theano Tutorial

• Neural Networks and Deep Learning

• 岡谷貴之著深層学習 (機械学習プロ)

• 神嶌敏弘編深層学習: Deep Learning

http://www.iro.umontreal.ca/~bengioy/dlbook/

http://neuralnetworksanddeeplearning.com/

http://deeplearning.net/tutorial/deeplearning.pdf

例：手続きback prop

• 手続きだと簡単実装

深層学習ライブラリのプログラミングモデル

Software

C++11 概要ライブラリ編

eureka go ライブラリの話

HPOpenVMS HPC ランタイム・ライブラリ・

深層学習ライブラリの環境問題Chainer Meetup2016 07-02

My ライブラリ」サービスのご案内 · 2018. 12. 14. · 「My ライブラリ」サービスのご案内～インターネット・メールサービス～「My ライブラリ」とは・・・

Spartan-3E ライブラリガイド ... - japan.xilinx.com

jQuery 対応ライブラリと TypeScript

CPLD ライブラリガイド - Xilinx

セマンティック・セグメンテーションの基礎...12 畳み込みニューラルネットとは？227 x 227 層正規化層層み層正規化層層層層み層

SharePoint Onlineのライブラリ

ポストムーア時代に向けたプログラミングモデルと実装技術 · 2015. 12. 28. · ポストムーア時代に向けたプログラミングモデルと実装技術

第2部自作ライブラリ紹介

新世代ファイリングソフトウェア楽2ライブラリ …PFU Tech. Rev., 24, 1, (05,2013) 19新世代ファイリングソフトウェア楽2ライブラリSmart with

震源断層地表地震断層活断層roko.eng.hokudai.ac.jp/studentadm/chiba_data/aesj...2016/07/05 · 1 活断層、震源断層、地表地震断層活断層データベース

RL78/G13 フラッシュ・データ・ライブラリ Type04RL78/G13 フラッシュ・データ・ライブラリ Type04 R01AN1362JJ0120 Rev. 1.20 Page 4 of 70 2016.06.01 1. 仕様

MGC3030/3130 GestIC ライブラリインターフェイスユーザ …ww1.microchip.com/downloads/jp/DeviceDoc/40001718E_JP.pdfMGC3030/3130 GestIC®ライブラリインターフェイス

SDSoC ユーザーガイド : プラットフォームおよびライブラリ … · 2019-10-27 · SDSoC環境ユーザーガイドプラットフォームおよびライブラリ

RL78 ファミリデータ・フラッシュ・ライブラリ …...RL78 ファミリデータ・フラッシュ・ライブラリ Type04 日本リリース版インストーラ名：RENESAS_RL78_FDL_T04_xVxx

サイボウズデヂエ 8 ライブラリ管理マニュアル › ... › pdf › manual_dz8_library.pdf目次ライブラリ管理マニュアル目次 8 ライブラリ管理マニュアル

Camomile - OCaml用Unicodeライブラリ