20141101 TokyoR LT これからのRとデータの話をしよう

Preview:

DESCRIPTION

20141101 TokyoR LT これからのRとデータの話をしよう

Citation preview

これからの「Rとデータ」の話をしよう

2014年11月1日 第44回TokyoR @Nifty

2014年11月1日土曜日

自己紹介

名前:伊藤 徹郎(@tetsuroito)

近況:恵比寿を開拓中

マイブーム:クッキング

冬が待ち遠しい今日この頃

2014年11月1日土曜日

みんな大好きirisデータ言わずと知れたデータ分析界隈の有名データセット

2014年11月1日土曜日

Rに標準装備のデータ他にもたくさんのデータセットがあります!

ability.cov beavers discoveries freeny

airmiles BJsales DNase freeny.x

AirPassengers BJsales.lead esoph freeny.y

airquality BOD euro HairEyeColor

anscombe cars euro.cross Harman23.cor

attenu ChickWeight eurodist Harman74.cor

attitude chickwts EuStockMarkets Indometh

austres CO2 faithful infert

beaver1 co2 fdeaths InsectSprays

beaver2 crimtab Formaldehyde iris3

などなど‥2014年11月1日土曜日

その他パッケージにもデータが搭載されてます

2014年11月1日土曜日

そう。データは本当に充実しています。

2014年11月1日土曜日

Rの出番ですよね前処理を実施する          (dplyr,tidyr,carret,magritter)やその他関数

機械学習パッケージや統計モデルを計算     (glm,SVM,NN,クラスタリング,RF)などのパッケージ

結果を可視化する                (ggplot2,rCharts,ggviz)などの可視化パッケージ

2014年11月1日土曜日

MCMCが流行りましたWinBUGS,JUGS,stan,MCMCpackなど

様々なサンプラーを用いてシミュレーション(人工データの生成)

2014年11月1日土曜日

しかし、ちょっと考えてみよう

2014年11月1日土曜日

そのデータ価値あります?

幻滅期に移行中

ガートナー ハイプサイクル2014

2014年11月1日土曜日

データの価値とは?私が考える価値の高いデータ

情報量が多い/1レコード例えばアクセスログや購買データ

アクセスログ < 購買データ

2014年11月1日土曜日

プライバシー問題価値の高いデータを使おうとすると避けられない

研究者もちゃんといます

2014年11月1日土曜日

セマンティックWeb

オントロジー

Linked Data

再び機運が高まりつつある!

2014年11月1日土曜日

ウェアラブルデバイス

新しいデータの取得方法も充実してきた

2014年11月1日土曜日

言いたい事Rのような充実した統計パッケージがあるんだから

価値の高いデータを適切なタスクで処理し、

社会に役立てよう!

2014年11月1日土曜日

Recommended!

http://www.slideshare.net/pfi/ss-40627009

2014年11月1日土曜日

そしてJapan.Rへ‥

2014年11月1日土曜日

ご清聴ありがとうございました!

2014年11月1日土曜日