2014/06/13...

Preview:

Citation preview

博士課程の新卒エンジニアがデータ分析環境を作った話

株式会社サイバード

データアナリスト大曽根 圭輔

交流会ということで自己紹介

ABOUT:ME

•大曽根圭輔博士(工学) 茨城県出身

•現在データ分析チーム

•趣味 たくさん- 観る: 野球観戦、ライブ- やる: 6/21にビッグバンドのライブやります- Youtubeで7万再生突破 (黒歴史

絶賛CM放映中!!

具体的な業務 - モニタリングツール構築- ユーザの行動分析- 広告効果測定- ユーザテスト- アンケートなど

本日の話題

(ほぼ)ゼロからデータ分析環境を作るまで

サービス

Webサーバ

DB

各種API

この環境ができるまで

2013年某日

当時の業務アプリ制作

(WEB、ネイティブ)博士課程在籍時

計算知能、HAIなどの研究統計学も少し

偉い人

会社のゲームも軌道に乗ってきたので、データ分析に力を入れたい。君の経験を買ってデータアナリストになって欲しい

偉い人

会社のゲームも軌道に乗ってきたので、データ分析に力を入れたい。君の経験を買ってデータアナリストになって欲しい

私まかせて下さい!

分析開始

エンジニア

このデータを調べれば離脱要因がわかる。このSQLをたたいていいですか?

スロークエリ投げられたら困るので。。

私。。。

エンジニア

成長度も含めてクラスタリングをしたいから、ユーザレベルの変遷を知りたい

レベルはアップデートされるから残ってません。。

私。。。

他にもモニタリングツールが未整備-> 可視化はEXCELで-> 数字だけ見てもわかりづらい

レポーティングに手間がかかる

手元にある(スモール)データである程度分析できる!- コホート分析- 施策の効果測定(時系列)- KPIシミュレーションなど

しかし、やはり機械学習などの知識を使いたい!

効率化も行いたい!

•機械学習 (NN、SVM、SOMなど)

•多変量解析 (重回帰分析、主成分分析など)

•統計学

•可視化

自分が持っているデータ分析に役立つ(はずの)スキル

というわけで直訴

上司

アップデートしなくて自由に触れるデータをためる場所作りたいです!

たしかにメリットも多いのでやってみる価値はある

上司

かくかくしかじかで。。。

今後のために必要だな

偉い人

上司

定常作業効率化のためにモニタリングツール作りたいんです

たしかにメリットも多いのでやってみる価値はある

上司

かくかくしかじかで。。。

今後のために必要だな

偉い人

結果

サービス

Webサーバ

DB

各種API

•機械学習 (NN、SVM、SOMなど)

•多変量解析 (重回帰分析、主成分分析など)

•統計学 (検定など)

•可視化

自分が持っているデータ分析に役立つ(はずの)スキル

•機械学習 (NN、SVM、SOMなど)

•多変量解析 (重回帰分析、主成分分析など)

•統計学 (検定など)

•可視化

自分が持っているデータ分析に役立つスキル

•機械学習 (NN、SVM、SOM、決定木など)-> イベント参加予測、継続要因特定

•多変量解析 (重回帰分析、主成分分析など)

-> ユーザの分類

•統計学

-> キャンペーンの効果測定

•微分積分レベル毎のDAUの予測

大事な事周りを巻き込んでやりたいことを創る!

モニタリング指標の自動生成特徴点の自動抽出

可視化レポーティング自動化

今後の展望

ご清聴ありがとうございました!

Recommended