54
来栖川電算認識技術ラジオ体操で鍛えられるわけがない。 有限会社 来栖川電算 山口陽平 名古屋IT飲み会 2013.9.27

nagoya IT nomikai 20130927

Embed Size (px)

DESCRIPTION

名古屋IT飲み会2013.9.27の発表で使う資料です。 「来栖川電算の認識技術がラジオ体操で鍛えられるわけがない。」というへんてこなタイトルですが、要するにラジオ体操アプリ「毎朝体操」の宣伝を兼ねた弊社の取り組みの紹介です。

Citation preview

Page 1: nagoya IT nomikai 20130927

来栖川電算の認識技術が

ラジオ体操で鍛えられるわけがない。

有限会社 来栖川電算 山口陽平

名古屋IT飲み会 2013.9.27

Page 2: nagoya IT nomikai 20130927

「毎朝体操」知ってる? 今すぐダウンロード ⇒ http://maiasa.jp

いつでもどこでもラジオ体操できるアプリ

Page 3: nagoya IT nomikai 20130927

• GooglePlay: 健康&フィットネス 60位

• Facebook: 7384いいね!

人気上昇中! もうすぐ10000ダウンロード突破!!!

Page 4: nagoya IT nomikai 20130927

• 中高年に人気(若者カモン) – 夏休みが終わっても減らない。むしろ増えた。ドワンゴさん?

• 朝と夜に使われることが多い – 放送時刻でなくてもできる!

各地で使われてる 都会だけじゃない!離島でも!海外でも!

Page 5: nagoya IT nomikai 20130927

かるく実演 • スマホを持ってラ

ジオ体操⇒採点!

• 認識したモーションがアニメに

• 統計が見られる

• ラジオ体操第2も

ダウンロードして発表の終わりを待て! http://maiasa.jp

Page 6: nagoya IT nomikai 20130927

自己紹介&会社紹介 要するに技術力で開拓するタイプ

Page 7: nagoya IT nomikai 20130927

• 必要なら何でも徹底的にやる研究者

– プログラミング言語・データベース分散

– アルゴリズム・機械学習・CV・自然言語

– 名古屋工業大学出身・未踏ソフトウェア経験

– 世界を美しく記述することを夢見る35歳

• 人を驚かせるのが好き

– ハードリアルタイムJavaVM

– 1000台越え構成のペタバイト分散DB

– 秒間1000万クエリ処理できるKVS

– 超多クラス対応の超高速物体認識エンジン

山 口 陽 平 @melleo1978

※あくまでもイメージです。 実物に髪の毛はありません。

Page 8: nagoya IT nomikai 20130927

• 概要:10周年! – 名古屋工業大学発ベンチャー(2003年)

• 目的:ロボの頭脳を作る – 知的インターフェイスによる社会の変革

– ソフトウェアの品質・生産性の向上

• スタッフ:30人 – 役員3人,正社員10人,見習い10人

– データ作成6人,家政婦1人

– IPA未踏ソフトウェア経験者多数

• 社風:難しことを楽しく – 職人,挑戦,自由,昼食・夕食・飲み会は無料

来栖川電算 http://kurusugawa.jp/

弊社が目指すロボ ※写真はあくまでもイメージです。

Page 9: nagoya IT nomikai 20130927

事業戦略 • 知的インターフェイスでユーザの近くへ

SI・コンサルティング

コンシューマサービス ライセンス提供

技術研究・データ作成 大規模インフラ構築

拡大中

Page 10: nagoya IT nomikai 20130927

情景画像文字認識技術 来栖川電算の

Page 11: nagoya IT nomikai 20130927

情景画像文字認識とは?

Page 12: nagoya IT nomikai 20130927

情景画像文字認識とは?

Page 13: nagoya IT nomikai 20130927

情景画像文字認識とは?

• 従来のOCRとは戦場が違う

–悪環境下での文字認識

• 手書き・様々な書体・かすれ・点描・きついパース・統一性のない並び・逆光・陰・影・グラデーション・モアレなど

SF世界の技術

Page 14: nagoya IT nomikai 20130927

洗練された仕組 • 深いパイプライン

–各フェーズで機械学習によるノイズ除去

• 統計的な特徴選択

–大量のデータで大量の特徴を自動的に選択

• 高度なアルゴリズム

–コンパクトなメモリ表現・近似的な探索

平滑化

断片抽出

行抽出

断片抽出

文字抽出

文字認識

行認識

単語認識

Page 15: nagoya IT nomikai 20130927

緻密で膨大なデータ • 文字レベルの教師

–文字・位置・形・歪みなどの様々な情報

–内製ツールによる高度な入力支援により実現

• 人海戦術によるゴリ押し

–大規模サービスから収集した画像に対して、東北の方たちが毎日教師作成

Page 16: nagoya IT nomikai 20130927

事例:タンゴチュウ • 写真をつぶやくと文字認識するサービス

葛の葉宛(@tcfox)につぶやこう!

Page 17: nagoya IT nomikai 20130927

事例:モバイル版 • evernoteへ写真をアップロードするつい

でに文字認識するアプリ(Android)

Page 18: nagoya IT nomikai 20130927

物体認識技術 来栖川電算の

Page 19: nagoya IT nomikai 20130927

物体認識とは?

①画像に写る物体の名称・姿勢を推定する

Page 20: nagoya IT nomikai 20130927

物体認識とは?

②物体が写った画像をたくさん覚えさせる

Page 21: nagoya IT nomikai 20130927

競合とココが違う! • 広い適用範囲

照明・姿勢の変化に強く、様々な撮影環境に対応

• 驚異的な認識精度 – 数十万種類の物体をほぼ完ぺきに識別

• 圧倒的な処理速度 – たった1台のPCで百万種類を瞬時に識別 – 台数を増やせばリニアにスケールアウト

• 簡単な操作 – 画像と教師をアップロードするだけ

Page 22: nagoya IT nomikai 20130927

事例:ShotSearch • 表紙を撮影して発売日や口コミなどを

チェックできるアプリ(Android/iOS)

Page 23: nagoya IT nomikai 20130927

事例:ShotSearch • 絵柄や構図がよく似ていてもイケル!

Page 24: nagoya IT nomikai 20130927

事例:1000sors.com • 誰でも簡単に物体認識アプリが作れる

–様々な企業で活躍中!!!

Page 25: nagoya IT nomikai 20130927

その他の事例 • かなりいろいろな場面で使える

工場内で箱の仕分け

体験や評判の調査

ワインラベルで情報検索

AR付箋

集めて応募キャンペーン

ARフィギュア

Page 26: nagoya IT nomikai 20130927

モーション認識技術 活動量推定技術

来栖川電算の

Page 27: nagoya IT nomikai 20130927

モーション認識とは?

• 各種センサーから動作の種類を推定する

–(例)ライフログ・体操採点・危険検知

Page 28: nagoya IT nomikai 20130927

活動量推定とは?

• 各種センサーから活動量を推定する

– (例)心拍数,カロリー,歩数

Page 29: nagoya IT nomikai 20130927

洗練された仕組 • 統計的な特徴選択

–大量のデータで大量の特徴を自動的に選択

–加速度センサーだけでも非常に高精度

• 高度なアルゴリズム

–スマホ内で動作するレベル

• 自動的な教師収集

–勝手に賢くなる

Page 30: nagoya IT nomikai 20130927

事例:毎朝体操 • スマホを手に持ってラジオ体操すると採

点し、レポート化してくれるアプリ

– Android 2.3.3以降

Page 31: nagoya IT nomikai 20130927

データマイニング技術 来栖川電算の

Page 32: nagoya IT nomikai 20130927

事例:大学病院 • Hadoopによる冗長化で高アベイラビリティ

• Pig+UDFにより手軽で自由な分析をサポート

Page 33: nagoya IT nomikai 20130927

事例:広告企業 • 最新手法で分析し、ニーズ・施策を発掘

• 分析期間・分析対象は何十倍にも増える予定

Page 34: nagoya IT nomikai 20130927

事例:組込企業 • 並列計算に対応した最新の手法を活用

• クラウドをスポットで活用して経費節約

Page 35: nagoya IT nomikai 20130927

事例:ECサイト • Hadoopによる冗長化で高アベイラビリティ • Pig・hBase・MapReduceによるリアルタ

イム集計

Page 36: nagoya IT nomikai 20130927

事例:大規模試験 • クラウドをスポットで活用し、期間と経

費を大幅削減

Page 37: nagoya IT nomikai 20130927

事例:大規模学習 • 文字認識のための大規模機械学習

– 30タスク(8段) – 4~5日/回(普通のcore i7マシン) – cc2.8xlargeのSPOTで節約(時間:1/4,費用:1/2)

• ※1時間以内にセーブポイントまで進める工夫が必要

Page 38: nagoya IT nomikai 20130927

来栖川電算の認識技術がラジオ体操で鍛えられるわけがない。

来栖川電算内で行っているトレーニング

Page 39: nagoya IT nomikai 20130927

目次 • データ分析が仕事になるケース

• 機械学習

• だからトレーニング

• トレーニング:応用

• トレーニング:風景

• トレーニング:結果

Page 40: nagoya IT nomikai 20130927

データ分析が仕事になるケース

• 直感でパッと判断できない – データが多い,データの粒度が細かい,データの並びに意味がある,データから意味を取り出す方法が分かっていない

• こういうのを依頼される – 行動履歴からのユーザ属性の推定

– 音声からのテキスト認識

– 画像からの文字認識

– 動画からの物体認識・物体追跡

– 加速度からのモーション認識

Page 41: nagoya IT nomikai 20130927

機械学習 • データに隠された法則を取り出す技

–職人技を明文化

–データでプログラミング

• データを効率的に処理する技

–複雑な計算を単純な計算の組み合わせで近似

–良く似たデータを同一視

Page 42: nagoya IT nomikai 20130927

だからトレーニング • 基礎:座学

–機械学習に関する基礎知識の習得

–学習アルゴリズムを実装し、実験

• 応用:モーション認識

–データ採取アプリを実装し、データを採取

–データを分析し、特徴を実装

–実装した特徴を使って性能測定

–結果を分析し、対策をうち、性能を改善

Page 43: nagoya IT nomikai 20130927

トレーニング:応用 • データに関する包括的な取り組みから

様々なことを学ぶ

データ採取 ・偏り・ノイズ 知識表現&アルゴリズム ・データ量 ・組み合わせ数 評価方法 ・観点・尺度

Page 44: nagoya IT nomikai 20130927

トレーニング:風景 • オフィスや公園や駅で、スマホを持って

–止まる、歩く、走る、スキップ、ジャンプ、階段、自転車、バス、電車、ラジオ体操など

• 不審者ではないので通報しないで!!

Page 45: nagoya IT nomikai 20130927

トレーニング:結果 • そして毎朝体操が生まれた!

–呼び水となり行動推定の依頼急増

• 大手キャリア・大手メーカーなどと既に開始

Page 46: nagoya IT nomikai 20130927

トレーニング:結果 • そして毎朝体操が生まれた!

–呼び水となり行動推定の依頼急増

• 大手キャリア・大手メーカーなどと既に開始

準備はいいですか?

Page 47: nagoya IT nomikai 20130927

宣伝 時間があれば

Page 48: nagoya IT nomikai 20130927

• ビッグデータに関するアンカンファレンスするよ!

• 名古屋からも多数参加!(来栖川電算の名前が!)

JAWS FESTA Kansai 2013

Page 49: nagoya IT nomikai 20130927

• 使いたい人は問い合わせてね!

物体認識クラウドサービス

1000sors.com

Page 50: nagoya IT nomikai 20130927

• 気軽にオフィスへ遊びに来てね!

–連絡があれば、見学できて、ご飯も食べれて、泊まれる。

スタッフ募集中! UI・UXが分かる人、今すぐ来て!

名古屋本社(2013年フロア増設)

イオン千種・名大病院・名工大の近く

上野支社(2012年開設)

入谷駅・鶯谷駅・上野駅の近く

Page 51: nagoya IT nomikai 20130927

参考文献 リンクとか

Page 52: nagoya IT nomikai 20130927

• 来栖川電算 – http://kurusugawa.jp/

• タンゴチュウ(情景画像文字認識)のキャラ – http://tangochu.jp/

• 1000sors.com(物体認識)

– http://1000sors.com/

• 毎朝体操(モーション認識)

– https://play.google.com/store/apps/details?id=jp.kurusugawa.teamR.maiasa

• 株式会社簡保生命保険 – http://www.jp-life.japanpost.jp/

参考文献

Page 53: nagoya IT nomikai 20130927

• 天候アイコン – http://wunderground.com/

• 変ゼミのロゴジェネレータ – http://bkaclub.web.fc2.com/henzemi_gen

.html

• ICON HOIHOI – http://iconhoihoi.oops.jp/

素材たち 使わせて頂き、ありがとうございます!

Page 54: nagoya IT nomikai 20130927

ご清聴ありがとうございました