Upload
youhei-yamaguchi
View
1.255
Download
2
Embed Size (px)
DESCRIPTION
名古屋IT飲み会2013.9.27の発表で使う資料です。 「来栖川電算の認識技術がラジオ体操で鍛えられるわけがない。」というへんてこなタイトルですが、要するにラジオ体操アプリ「毎朝体操」の宣伝を兼ねた弊社の取り組みの紹介です。
Citation preview
来栖川電算の認識技術が
ラジオ体操で鍛えられるわけがない。
有限会社 来栖川電算 山口陽平
名古屋IT飲み会 2013.9.27
「毎朝体操」知ってる? 今すぐダウンロード ⇒ http://maiasa.jp
いつでもどこでもラジオ体操できるアプリ
• GooglePlay: 健康&フィットネス 60位
• Facebook: 7384いいね!
人気上昇中! もうすぐ10000ダウンロード突破!!!
• 中高年に人気(若者カモン) – 夏休みが終わっても減らない。むしろ増えた。ドワンゴさん?
• 朝と夜に使われることが多い – 放送時刻でなくてもできる!
各地で使われてる 都会だけじゃない!離島でも!海外でも!
かるく実演 • スマホを持ってラ
ジオ体操⇒採点!
• 認識したモーションがアニメに
• 統計が見られる
• ラジオ体操第2も
ダウンロードして発表の終わりを待て! http://maiasa.jp
自己紹介&会社紹介 要するに技術力で開拓するタイプ
• 必要なら何でも徹底的にやる研究者
– プログラミング言語・データベース分散
– アルゴリズム・機械学習・CV・自然言語
– 名古屋工業大学出身・未踏ソフトウェア経験
– 世界を美しく記述することを夢見る35歳
• 人を驚かせるのが好き
– ハードリアルタイムJavaVM
– 1000台越え構成のペタバイト分散DB
– 秒間1000万クエリ処理できるKVS
– 超多クラス対応の超高速物体認識エンジン
山 口 陽 平 @melleo1978
※あくまでもイメージです。 実物に髪の毛はありません。
• 概要:10周年! – 名古屋工業大学発ベンチャー(2003年)
• 目的:ロボの頭脳を作る – 知的インターフェイスによる社会の変革
– ソフトウェアの品質・生産性の向上
• スタッフ:30人 – 役員3人,正社員10人,見習い10人
– データ作成6人,家政婦1人
– IPA未踏ソフトウェア経験者多数
• 社風:難しことを楽しく – 職人,挑戦,自由,昼食・夕食・飲み会は無料
来栖川電算 http://kurusugawa.jp/
弊社が目指すロボ ※写真はあくまでもイメージです。
事業戦略 • 知的インターフェイスでユーザの近くへ
SI・コンサルティング
コンシューマサービス ライセンス提供
技術研究・データ作成 大規模インフラ構築
拡大中
情景画像文字認識技術 来栖川電算の
情景画像文字認識とは?
情景画像文字認識とは?
情景画像文字認識とは?
• 従来のOCRとは戦場が違う
–悪環境下での文字認識
• 手書き・様々な書体・かすれ・点描・きついパース・統一性のない並び・逆光・陰・影・グラデーション・モアレなど
SF世界の技術
洗練された仕組 • 深いパイプライン
–各フェーズで機械学習によるノイズ除去
• 統計的な特徴選択
–大量のデータで大量の特徴を自動的に選択
• 高度なアルゴリズム
–コンパクトなメモリ表現・近似的な探索
平滑化
断片抽出
行抽出
断片抽出
文字抽出
文字認識
行認識
単語認識
緻密で膨大なデータ • 文字レベルの教師
–文字・位置・形・歪みなどの様々な情報
–内製ツールによる高度な入力支援により実現
• 人海戦術によるゴリ押し
–大規模サービスから収集した画像に対して、東北の方たちが毎日教師作成
事例:タンゴチュウ • 写真をつぶやくと文字認識するサービス
葛の葉宛(@tcfox)につぶやこう!
事例:モバイル版 • evernoteへ写真をアップロードするつい
でに文字認識するアプリ(Android)
物体認識技術 来栖川電算の
物体認識とは?
①画像に写る物体の名称・姿勢を推定する
物体認識とは?
②物体が写った画像をたくさん覚えさせる
競合とココが違う! • 広い適用範囲
照明・姿勢の変化に強く、様々な撮影環境に対応
• 驚異的な認識精度 – 数十万種類の物体をほぼ完ぺきに識別
• 圧倒的な処理速度 – たった1台のPCで百万種類を瞬時に識別 – 台数を増やせばリニアにスケールアウト
• 簡単な操作 – 画像と教師をアップロードするだけ
事例:ShotSearch • 表紙を撮影して発売日や口コミなどを
チェックできるアプリ(Android/iOS)
事例:ShotSearch • 絵柄や構図がよく似ていてもイケル!
事例:1000sors.com • 誰でも簡単に物体認識アプリが作れる
–様々な企業で活躍中!!!
その他の事例 • かなりいろいろな場面で使える
工場内で箱の仕分け
体験や評判の調査
ワインラベルで情報検索
AR付箋
集めて応募キャンペーン
ARフィギュア
モーション認識技術 活動量推定技術
来栖川電算の
モーション認識とは?
• 各種センサーから動作の種類を推定する
–(例)ライフログ・体操採点・危険検知
活動量推定とは?
• 各種センサーから活動量を推定する
– (例)心拍数,カロリー,歩数
洗練された仕組 • 統計的な特徴選択
–大量のデータで大量の特徴を自動的に選択
–加速度センサーだけでも非常に高精度
• 高度なアルゴリズム
–スマホ内で動作するレベル
• 自動的な教師収集
–勝手に賢くなる
事例:毎朝体操 • スマホを手に持ってラジオ体操すると採
点し、レポート化してくれるアプリ
– Android 2.3.3以降
データマイニング技術 来栖川電算の
事例:大学病院 • Hadoopによる冗長化で高アベイラビリティ
• Pig+UDFにより手軽で自由な分析をサポート
事例:広告企業 • 最新手法で分析し、ニーズ・施策を発掘
• 分析期間・分析対象は何十倍にも増える予定
事例:組込企業 • 並列計算に対応した最新の手法を活用
• クラウドをスポットで活用して経費節約
事例:ECサイト • Hadoopによる冗長化で高アベイラビリティ • Pig・hBase・MapReduceによるリアルタ
イム集計
事例:大規模試験 • クラウドをスポットで活用し、期間と経
費を大幅削減
事例:大規模学習 • 文字認識のための大規模機械学習
– 30タスク(8段) – 4~5日/回(普通のcore i7マシン) – cc2.8xlargeのSPOTで節約(時間:1/4,費用:1/2)
• ※1時間以内にセーブポイントまで進める工夫が必要
来栖川電算の認識技術がラジオ体操で鍛えられるわけがない。
来栖川電算内で行っているトレーニング
目次 • データ分析が仕事になるケース
• 機械学習
• だからトレーニング
• トレーニング:応用
• トレーニング:風景
• トレーニング:結果
データ分析が仕事になるケース
• 直感でパッと判断できない – データが多い,データの粒度が細かい,データの並びに意味がある,データから意味を取り出す方法が分かっていない
• こういうのを依頼される – 行動履歴からのユーザ属性の推定
– 音声からのテキスト認識
– 画像からの文字認識
– 動画からの物体認識・物体追跡
– 加速度からのモーション認識
機械学習 • データに隠された法則を取り出す技
–職人技を明文化
–データでプログラミング
• データを効率的に処理する技
–複雑な計算を単純な計算の組み合わせで近似
–良く似たデータを同一視
だからトレーニング • 基礎:座学
–機械学習に関する基礎知識の習得
–学習アルゴリズムを実装し、実験
• 応用:モーション認識
–データ採取アプリを実装し、データを採取
–データを分析し、特徴を実装
–実装した特徴を使って性能測定
–結果を分析し、対策をうち、性能を改善
トレーニング:応用 • データに関する包括的な取り組みから
様々なことを学ぶ
データ採取 ・偏り・ノイズ 知識表現&アルゴリズム ・データ量 ・組み合わせ数 評価方法 ・観点・尺度
トレーニング:風景 • オフィスや公園や駅で、スマホを持って
–止まる、歩く、走る、スキップ、ジャンプ、階段、自転車、バス、電車、ラジオ体操など
• 不審者ではないので通報しないで!!
トレーニング:結果 • そして毎朝体操が生まれた!
–呼び水となり行動推定の依頼急増
• 大手キャリア・大手メーカーなどと既に開始
トレーニング:結果 • そして毎朝体操が生まれた!
–呼び水となり行動推定の依頼急増
• 大手キャリア・大手メーカーなどと既に開始
準備はいいですか?
宣伝 時間があれば
• ビッグデータに関するアンカンファレンスするよ!
• 名古屋からも多数参加!(来栖川電算の名前が!)
JAWS FESTA Kansai 2013
• 使いたい人は問い合わせてね!
物体認識クラウドサービス
1000sors.com
• 気軽にオフィスへ遊びに来てね!
–連絡があれば、見学できて、ご飯も食べれて、泊まれる。
スタッフ募集中! UI・UXが分かる人、今すぐ来て!
名古屋本社(2013年フロア増設)
イオン千種・名大病院・名工大の近く
上野支社(2012年開設)
入谷駅・鶯谷駅・上野駅の近く
参考文献 リンクとか
• 来栖川電算 – http://kurusugawa.jp/
• タンゴチュウ(情景画像文字認識)のキャラ – http://tangochu.jp/
• 1000sors.com(物体認識)
– http://1000sors.com/
• 毎朝体操(モーション認識)
– https://play.google.com/store/apps/details?id=jp.kurusugawa.teamR.maiasa
• 株式会社簡保生命保険 – http://www.jp-life.japanpost.jp/
参考文献
• 天候アイコン – http://wunderground.com/
• 変ゼミのロゴジェネレータ – http://bkaclub.web.fc2.com/henzemi_gen
.html
• ICON HOIHOI – http://iconhoihoi.oops.jp/
素材たち 使わせて頂き、ありがとうございます!
ご清聴ありがとうございました