View
4.989
Download
6
Category
Preview:
DESCRIPTION
Citation preview
Copyright copy2014 Treasure Data All Rights Reserved
Tableau が魅せるData Visualization の世界
201409Takahiro Inoue (Chief Data Scientist)
takatreasure-‐‑‒datacom
Copyright copy2014 Treasure Data All Rights Reserved
自己紹介
bull 井上emsp 敬浩 (Twitter doryokujin )
bull チーフデータサイエンティスト
bull 慶應大学院数学科統計専攻
bull トレジャーデータ公式ブログオーサー
bull MongoDBマスター
213
httptreasure-‐‑‒datahateblojp
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
313
参考文献(Tableau公式)httpwwwtableausoftwarecomlearnwhitepapersdownload 参考文献(Class Method)httpdevclassmethodjp
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server
5 Tableau times Treasure Data
6 Tableau テクニック集
413
この 10 項目のトレンドに将来性がある
これらのトレンドは顧客が現在何をしていて将来のためにどこに投資しているかについて顧客と話すことで見えてきます良い知らせは先手を打って失敗した挫折感ではなくさらに確実な先手を打つ意欲によって推進されている投資が最も多いことですおそらく過去数年間の新しいテクノロジーと投資がついに成果を上げ始めているのです2013 年にはビジネス インテリジェンスの大きな変化を必ず期待できます
wwwtableausoftwarecomdesktop
Tableau Software はお客様がデータを見て理解するのをお手伝いします世界中の 10000 を超える組織で使用されている Tableau は迅速な分析視覚化および超高速処理ビジネスインテリジェンスを提供しています
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒1 誰もがデータサイエンスを武器にできる時代に
513
bull データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますbull データ分析に関する知識識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビ ジネスマンにも必要な知識識になり
始めていますデータに基づいて決定を行行う企業が競争力力を高めデータを活用しない企業が競争力力を弱めています詳細はThe Economist の「Fostering a Data-Driven Culture (データ主導型の文化を育成)」 をご覧ください
データサイエンティストの消滅 データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますデータ分析に関する知識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビジネスマンにも必要な知識になり始めていますデータに基づいて決定を行う企業が競争力を高めデータを活用しない企業が競争力を弱めています
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒2 ビッグデータBI は共にクラウドへ
613
bull データ分析の導入を速めたい企業はクラウドベースのビジネスインテリジェンスの採用を推進していますbull 顧客との連携やモバイルアクセスなどの新たなシナリオもクラウドビジネスインテリジェンスの導入を加速しています
bull Treasure Data のクラウド データ ウェアハウスにより数カ月かかるデータウェアハウスの構築を数日で実現することができます
bull これによりラピッド プロトタイピングが可能になり以前とは比較にならない柔軟性をもたらします
詳細はホワイトペーパー「Business Analytics in the Cloud (クラウドのビジネス分析)」をご覧ください
クラウド ビジネス インテリジェンスが主流になる データ分析の導入を速めたい企業はクラウド ベースのビジネス インテリジェンスの採用を推進しています顧客との連携やファイアウォール外のモバイル アクセスなどの新たなシナリオもクラウド ビジネス インテリジェンスの導入を加速していますまたクラウド サービスが成熟することで IT 部門によるビジネス インテリジェンスのクラウド化への懸念が弱まっています
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒3 ストーリーテリングの重要性
713
bull 人々はコンテクストのないダッシュボードが増えても役立立たないことを理理解してきましたbull ストーリーテリングではデータを利利用してアイデアや洞洞察を効果的に伝えることができます
bull また大容量量の異異種データが持つ意味を汲み取ることもできます詳細はホワイトペーパー「5 Best Practices for Telling Great Stories (優れたストリーを伝える 5 つのベスト プラクティス)」をご覧ください
ストリーテリングの重要性 人々はコンテクストのないダッシュボードが増えても役立たないことを理解してきましたストリーテリングではデータを利用してアイデアや洞察を効果的に伝えることができますまた大容量の異種データが持つ意味を汲み取ることもできます
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒4 モバイルBIが主流流に
813
bull 最先端の企業にとってモバイル ビジネスインテリジェンス は主流流となり 特別な場合のみに使用するものではなくなっていますbull ビジネス ユーザーはオフィスだけではなく日常業務の流流れでどんな時でも情報にアクセスする必要性に 迫られています
最先端の企業にとってモバイル ビジネス インテリジェンスは主流となり 特別なときに使用するものではなくなっていますビジネス ユーザーはオフィスだけではなく日常業務の流れでどんな時でも情報にアクセスする必要性に迫られています
事例についてはホワイトペーパー「How Mobile Business Intelligence Drives Efficiency and Transformation for Supervalue (モバイル ビジネス インテリジェンスが Supervalue の効率と変革を促進)」をご覧ください
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒5 データストアの急増
913
bull その昔組織には様々ななタイプのデータがありましたbull CRMデータ販売時点データ電子メールなど組織の経営
陣は多大な努力力を払いすべてのデータを1つの自社の高速なデータウェアハウスに保存していました
bull 2014年年にはこれがおとぎ話となりますすべてのデータはFluentd ベースの Treasure Agent を通じて一元的に収集管理理できまたトレジャーストレージはあらゆるデータの共存を容易易に実現しています
bull トレジャーを初めとするデータや作業負荷に適したデータストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります データ ストアの急増その昔組織にはさまざまなタイプのデータがありましたCRM データ販売時点データ電子メールなど組織の経営陣は多大な努力を払いすべてのデータを 1 つの高速なデータ ウェアハウスに保存していました
2013 年にはこれがおとぎ話となりますすべてのデータを 1 か所に保管する組織はもはや存在しませんさらに1 か所に保管する理由もなくなります大量のデータは Teradata や Hadoop などの場所に保管できます取引データは Oracle や SQL Server に保管できますデータや作業負荷に適したデータ ストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒6 自立性が新しいセルフサービスに
1013
bull セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です
bull 自立立性はこの概念念の時代の到来ですこれはndash ビジネス ユーザーが適切切なデータにアクセスできること
ndash そのデータが 使用可能な形式と場所にあること
ndash またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること
を意味します
bull これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒7 コラボレーションは機能でなく現実に
1113
bull ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります
bull コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません
bull ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです
bull 2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
1213
a Tableau Desktopb Tableau Readerc Tableau Serverd Tableau Public
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題
1 上層部から分析を要求されているndash 幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない
2 大量量のレポートの要求を受け続けているndash 終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である
ndash 優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります
3 レポートを提出することでさらに必要なレポートが増えていくndash レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません
ndash あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です
4 データが古いことにフラストレーションを感じているndash レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1
つにデータが最新でなくなるという点があります
ndash ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません
1313
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題5 マッシュアップしたデータを要求される
ndash 実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか
ndash 複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません
6 視覚的分析を求めているndash 人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます
ndash まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです
ndash それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります
7 すでに一部で使用しているndash 全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています
ndash 才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています
ndash その結果独自のセルフサービスBIを採用するケースが多く見見られます
ndash ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です
1413
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い1 複雑すぎるスタート
ndash 野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です
ndash 「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します
2 誰も理理解できない指標を使用するndash あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか
ndash あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません
ndash 指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります
3 重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします
ndash こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください
4 複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash 従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト
が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください
1513
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い
5 ダッシュボードの作成と維持のための時間とリソースを過小評価するndash ダッシュボードの展開は1回で終わる作業ではありません
ndash 指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください
6 指標と目標が一致しないndash ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない
ダッシュボードを作成してしまうことのないようにします
7 効果的でないデザインの悪いグラフやチャートを使うndash グラフやチャートをデザインする際は気をつける必要があります
ndash たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません
ndash 優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください
1613
Copyright copy2014 Treasure Data All Rights Reserved
2 Tableauの特徴
1713
p4
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に
同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました
特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります
次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか
bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか
bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか
bull BI ソリューションは綿密なスケジュールやシステムの
パフォーマンス低下の場合の回避策に依存していますか
bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか
bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか
bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか
これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます
超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選
図 1 データ ワークフローのあらゆる段階で高速化
これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の
分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は
10 ~ 100 倍高速です
Install Access Analyze Publish Share
10 X 100 TIMES FASTER
p14
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI
Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます
VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です
ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo
China Eastern Airlines 社ネットワーキングおよび収益部門上級管理
者James Pu 氏
しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か
して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます
Databases Cubes Spreadsheets Hadoop amp More
In-Memory Data Live Connection
PC Browser iPad AndroidDesktop
図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する
ためにインメモリとライブ接続という 2 つの方法が用意されて
います
最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒a Tableau Desktop
bull 考える速さで分析するndash データに接続しコードを1行行も書かずにクエリを実行行できます
ndash ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ
れています
ndash Windows Macemsp 両対応(ver 82)
ndash Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます
1813
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒b Tableau Reader
bull Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです
bull Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です
bull 作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です
bull 作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です
bull Window Mac 両対応
1913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
自己紹介
bull 井上emsp 敬浩 (Twitter doryokujin )
bull チーフデータサイエンティスト
bull 慶應大学院数学科統計専攻
bull トレジャーデータ公式ブログオーサー
bull MongoDBマスター
213
httptreasure-‐‑‒datahateblojp
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
313
参考文献(Tableau公式)httpwwwtableausoftwarecomlearnwhitepapersdownload 参考文献(Class Method)httpdevclassmethodjp
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server
5 Tableau times Treasure Data
6 Tableau テクニック集
413
この 10 項目のトレンドに将来性がある
これらのトレンドは顧客が現在何をしていて将来のためにどこに投資しているかについて顧客と話すことで見えてきます良い知らせは先手を打って失敗した挫折感ではなくさらに確実な先手を打つ意欲によって推進されている投資が最も多いことですおそらく過去数年間の新しいテクノロジーと投資がついに成果を上げ始めているのです2013 年にはビジネス インテリジェンスの大きな変化を必ず期待できます
wwwtableausoftwarecomdesktop
Tableau Software はお客様がデータを見て理解するのをお手伝いします世界中の 10000 を超える組織で使用されている Tableau は迅速な分析視覚化および超高速処理ビジネスインテリジェンスを提供しています
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒1 誰もがデータサイエンスを武器にできる時代に
513
bull データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますbull データ分析に関する知識識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビ ジネスマンにも必要な知識識になり
始めていますデータに基づいて決定を行行う企業が競争力力を高めデータを活用しない企業が競争力力を弱めています詳細はThe Economist の「Fostering a Data-Driven Culture (データ主導型の文化を育成)」 をご覧ください
データサイエンティストの消滅 データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますデータ分析に関する知識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビジネスマンにも必要な知識になり始めていますデータに基づいて決定を行う企業が競争力を高めデータを活用しない企業が競争力を弱めています
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒2 ビッグデータBI は共にクラウドへ
613
bull データ分析の導入を速めたい企業はクラウドベースのビジネスインテリジェンスの採用を推進していますbull 顧客との連携やモバイルアクセスなどの新たなシナリオもクラウドビジネスインテリジェンスの導入を加速しています
bull Treasure Data のクラウド データ ウェアハウスにより数カ月かかるデータウェアハウスの構築を数日で実現することができます
bull これによりラピッド プロトタイピングが可能になり以前とは比較にならない柔軟性をもたらします
詳細はホワイトペーパー「Business Analytics in the Cloud (クラウドのビジネス分析)」をご覧ください
クラウド ビジネス インテリジェンスが主流になる データ分析の導入を速めたい企業はクラウド ベースのビジネス インテリジェンスの採用を推進しています顧客との連携やファイアウォール外のモバイル アクセスなどの新たなシナリオもクラウド ビジネス インテリジェンスの導入を加速していますまたクラウド サービスが成熟することで IT 部門によるビジネス インテリジェンスのクラウド化への懸念が弱まっています
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒3 ストーリーテリングの重要性
713
bull 人々はコンテクストのないダッシュボードが増えても役立立たないことを理理解してきましたbull ストーリーテリングではデータを利利用してアイデアや洞洞察を効果的に伝えることができます
bull また大容量量の異異種データが持つ意味を汲み取ることもできます詳細はホワイトペーパー「5 Best Practices for Telling Great Stories (優れたストリーを伝える 5 つのベスト プラクティス)」をご覧ください
ストリーテリングの重要性 人々はコンテクストのないダッシュボードが増えても役立たないことを理解してきましたストリーテリングではデータを利用してアイデアや洞察を効果的に伝えることができますまた大容量の異種データが持つ意味を汲み取ることもできます
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒4 モバイルBIが主流流に
813
bull 最先端の企業にとってモバイル ビジネスインテリジェンス は主流流となり 特別な場合のみに使用するものではなくなっていますbull ビジネス ユーザーはオフィスだけではなく日常業務の流流れでどんな時でも情報にアクセスする必要性に 迫られています
最先端の企業にとってモバイル ビジネス インテリジェンスは主流となり 特別なときに使用するものではなくなっていますビジネス ユーザーはオフィスだけではなく日常業務の流れでどんな時でも情報にアクセスする必要性に迫られています
事例についてはホワイトペーパー「How Mobile Business Intelligence Drives Efficiency and Transformation for Supervalue (モバイル ビジネス インテリジェンスが Supervalue の効率と変革を促進)」をご覧ください
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒5 データストアの急増
913
bull その昔組織には様々ななタイプのデータがありましたbull CRMデータ販売時点データ電子メールなど組織の経営
陣は多大な努力力を払いすべてのデータを1つの自社の高速なデータウェアハウスに保存していました
bull 2014年年にはこれがおとぎ話となりますすべてのデータはFluentd ベースの Treasure Agent を通じて一元的に収集管理理できまたトレジャーストレージはあらゆるデータの共存を容易易に実現しています
bull トレジャーを初めとするデータや作業負荷に適したデータストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります データ ストアの急増その昔組織にはさまざまなタイプのデータがありましたCRM データ販売時点データ電子メールなど組織の経営陣は多大な努力を払いすべてのデータを 1 つの高速なデータ ウェアハウスに保存していました
2013 年にはこれがおとぎ話となりますすべてのデータを 1 か所に保管する組織はもはや存在しませんさらに1 か所に保管する理由もなくなります大量のデータは Teradata や Hadoop などの場所に保管できます取引データは Oracle や SQL Server に保管できますデータや作業負荷に適したデータ ストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒6 自立性が新しいセルフサービスに
1013
bull セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です
bull 自立立性はこの概念念の時代の到来ですこれはndash ビジネス ユーザーが適切切なデータにアクセスできること
ndash そのデータが 使用可能な形式と場所にあること
ndash またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること
を意味します
bull これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒7 コラボレーションは機能でなく現実に
1113
bull ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります
bull コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません
bull ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです
bull 2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
1213
a Tableau Desktopb Tableau Readerc Tableau Serverd Tableau Public
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題
1 上層部から分析を要求されているndash 幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない
2 大量量のレポートの要求を受け続けているndash 終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である
ndash 優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります
3 レポートを提出することでさらに必要なレポートが増えていくndash レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません
ndash あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です
4 データが古いことにフラストレーションを感じているndash レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1
つにデータが最新でなくなるという点があります
ndash ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません
1313
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題5 マッシュアップしたデータを要求される
ndash 実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか
ndash 複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません
6 視覚的分析を求めているndash 人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます
ndash まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです
ndash それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります
7 すでに一部で使用しているndash 全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています
ndash 才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています
ndash その結果独自のセルフサービスBIを採用するケースが多く見見られます
ndash ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です
1413
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い1 複雑すぎるスタート
ndash 野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です
ndash 「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します
2 誰も理理解できない指標を使用するndash あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか
ndash あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません
ndash 指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります
3 重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします
ndash こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください
4 複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash 従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト
が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください
1513
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い
5 ダッシュボードの作成と維持のための時間とリソースを過小評価するndash ダッシュボードの展開は1回で終わる作業ではありません
ndash 指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください
6 指標と目標が一致しないndash ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない
ダッシュボードを作成してしまうことのないようにします
7 効果的でないデザインの悪いグラフやチャートを使うndash グラフやチャートをデザインする際は気をつける必要があります
ndash たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません
ndash 優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください
1613
Copyright copy2014 Treasure Data All Rights Reserved
2 Tableauの特徴
1713
p4
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に
同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました
特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります
次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか
bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか
bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか
bull BI ソリューションは綿密なスケジュールやシステムの
パフォーマンス低下の場合の回避策に依存していますか
bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか
bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか
bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか
これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます
超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選
図 1 データ ワークフローのあらゆる段階で高速化
これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の
分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は
10 ~ 100 倍高速です
Install Access Analyze Publish Share
10 X 100 TIMES FASTER
p14
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI
Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます
VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です
ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo
China Eastern Airlines 社ネットワーキングおよび収益部門上級管理
者James Pu 氏
しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か
して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます
Databases Cubes Spreadsheets Hadoop amp More
In-Memory Data Live Connection
PC Browser iPad AndroidDesktop
図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する
ためにインメモリとライブ接続という 2 つの方法が用意されて
います
最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒a Tableau Desktop
bull 考える速さで分析するndash データに接続しコードを1行行も書かずにクエリを実行行できます
ndash ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ
れています
ndash Windows Macemsp 両対応(ver 82)
ndash Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます
1813
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒b Tableau Reader
bull Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです
bull Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です
bull 作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です
bull 作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です
bull Window Mac 両対応
1913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
313
参考文献(Tableau公式)httpwwwtableausoftwarecomlearnwhitepapersdownload 参考文献(Class Method)httpdevclassmethodjp
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server
5 Tableau times Treasure Data
6 Tableau テクニック集
413
この 10 項目のトレンドに将来性がある
これらのトレンドは顧客が現在何をしていて将来のためにどこに投資しているかについて顧客と話すことで見えてきます良い知らせは先手を打って失敗した挫折感ではなくさらに確実な先手を打つ意欲によって推進されている投資が最も多いことですおそらく過去数年間の新しいテクノロジーと投資がついに成果を上げ始めているのです2013 年にはビジネス インテリジェンスの大きな変化を必ず期待できます
wwwtableausoftwarecomdesktop
Tableau Software はお客様がデータを見て理解するのをお手伝いします世界中の 10000 を超える組織で使用されている Tableau は迅速な分析視覚化および超高速処理ビジネスインテリジェンスを提供しています
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒1 誰もがデータサイエンスを武器にできる時代に
513
bull データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますbull データ分析に関する知識識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビ ジネスマンにも必要な知識識になり
始めていますデータに基づいて決定を行行う企業が競争力力を高めデータを活用しない企業が競争力力を弱めています詳細はThe Economist の「Fostering a Data-Driven Culture (データ主導型の文化を育成)」 をご覧ください
データサイエンティストの消滅 データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますデータ分析に関する知識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビジネスマンにも必要な知識になり始めていますデータに基づいて決定を行う企業が競争力を高めデータを活用しない企業が競争力を弱めています
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒2 ビッグデータBI は共にクラウドへ
613
bull データ分析の導入を速めたい企業はクラウドベースのビジネスインテリジェンスの採用を推進していますbull 顧客との連携やモバイルアクセスなどの新たなシナリオもクラウドビジネスインテリジェンスの導入を加速しています
bull Treasure Data のクラウド データ ウェアハウスにより数カ月かかるデータウェアハウスの構築を数日で実現することができます
bull これによりラピッド プロトタイピングが可能になり以前とは比較にならない柔軟性をもたらします
詳細はホワイトペーパー「Business Analytics in the Cloud (クラウドのビジネス分析)」をご覧ください
クラウド ビジネス インテリジェンスが主流になる データ分析の導入を速めたい企業はクラウド ベースのビジネス インテリジェンスの採用を推進しています顧客との連携やファイアウォール外のモバイル アクセスなどの新たなシナリオもクラウド ビジネス インテリジェンスの導入を加速していますまたクラウド サービスが成熟することで IT 部門によるビジネス インテリジェンスのクラウド化への懸念が弱まっています
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒3 ストーリーテリングの重要性
713
bull 人々はコンテクストのないダッシュボードが増えても役立立たないことを理理解してきましたbull ストーリーテリングではデータを利利用してアイデアや洞洞察を効果的に伝えることができます
bull また大容量量の異異種データが持つ意味を汲み取ることもできます詳細はホワイトペーパー「5 Best Practices for Telling Great Stories (優れたストリーを伝える 5 つのベスト プラクティス)」をご覧ください
ストリーテリングの重要性 人々はコンテクストのないダッシュボードが増えても役立たないことを理解してきましたストリーテリングではデータを利用してアイデアや洞察を効果的に伝えることができますまた大容量の異種データが持つ意味を汲み取ることもできます
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒4 モバイルBIが主流流に
813
bull 最先端の企業にとってモバイル ビジネスインテリジェンス は主流流となり 特別な場合のみに使用するものではなくなっていますbull ビジネス ユーザーはオフィスだけではなく日常業務の流流れでどんな時でも情報にアクセスする必要性に 迫られています
最先端の企業にとってモバイル ビジネス インテリジェンスは主流となり 特別なときに使用するものではなくなっていますビジネス ユーザーはオフィスだけではなく日常業務の流れでどんな時でも情報にアクセスする必要性に迫られています
事例についてはホワイトペーパー「How Mobile Business Intelligence Drives Efficiency and Transformation for Supervalue (モバイル ビジネス インテリジェンスが Supervalue の効率と変革を促進)」をご覧ください
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒5 データストアの急増
913
bull その昔組織には様々ななタイプのデータがありましたbull CRMデータ販売時点データ電子メールなど組織の経営
陣は多大な努力力を払いすべてのデータを1つの自社の高速なデータウェアハウスに保存していました
bull 2014年年にはこれがおとぎ話となりますすべてのデータはFluentd ベースの Treasure Agent を通じて一元的に収集管理理できまたトレジャーストレージはあらゆるデータの共存を容易易に実現しています
bull トレジャーを初めとするデータや作業負荷に適したデータストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります データ ストアの急増その昔組織にはさまざまなタイプのデータがありましたCRM データ販売時点データ電子メールなど組織の経営陣は多大な努力を払いすべてのデータを 1 つの高速なデータ ウェアハウスに保存していました
2013 年にはこれがおとぎ話となりますすべてのデータを 1 か所に保管する組織はもはや存在しませんさらに1 か所に保管する理由もなくなります大量のデータは Teradata や Hadoop などの場所に保管できます取引データは Oracle や SQL Server に保管できますデータや作業負荷に適したデータ ストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒6 自立性が新しいセルフサービスに
1013
bull セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です
bull 自立立性はこの概念念の時代の到来ですこれはndash ビジネス ユーザーが適切切なデータにアクセスできること
ndash そのデータが 使用可能な形式と場所にあること
ndash またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること
を意味します
bull これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒7 コラボレーションは機能でなく現実に
1113
bull ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります
bull コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません
bull ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです
bull 2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
1213
a Tableau Desktopb Tableau Readerc Tableau Serverd Tableau Public
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題
1 上層部から分析を要求されているndash 幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない
2 大量量のレポートの要求を受け続けているndash 終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である
ndash 優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります
3 レポートを提出することでさらに必要なレポートが増えていくndash レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません
ndash あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です
4 データが古いことにフラストレーションを感じているndash レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1
つにデータが最新でなくなるという点があります
ndash ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません
1313
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題5 マッシュアップしたデータを要求される
ndash 実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか
ndash 複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません
6 視覚的分析を求めているndash 人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます
ndash まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです
ndash それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります
7 すでに一部で使用しているndash 全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています
ndash 才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています
ndash その結果独自のセルフサービスBIを採用するケースが多く見見られます
ndash ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です
1413
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い1 複雑すぎるスタート
ndash 野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です
ndash 「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します
2 誰も理理解できない指標を使用するndash あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか
ndash あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません
ndash 指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります
3 重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします
ndash こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください
4 複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash 従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト
が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください
1513
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い
5 ダッシュボードの作成と維持のための時間とリソースを過小評価するndash ダッシュボードの展開は1回で終わる作業ではありません
ndash 指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください
6 指標と目標が一致しないndash ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない
ダッシュボードを作成してしまうことのないようにします
7 効果的でないデザインの悪いグラフやチャートを使うndash グラフやチャートをデザインする際は気をつける必要があります
ndash たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません
ndash 優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください
1613
Copyright copy2014 Treasure Data All Rights Reserved
2 Tableauの特徴
1713
p4
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に
同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました
特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります
次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか
bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか
bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか
bull BI ソリューションは綿密なスケジュールやシステムの
パフォーマンス低下の場合の回避策に依存していますか
bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか
bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか
bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか
これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます
超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選
図 1 データ ワークフローのあらゆる段階で高速化
これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の
分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は
10 ~ 100 倍高速です
Install Access Analyze Publish Share
10 X 100 TIMES FASTER
p14
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI
Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます
VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です
ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo
China Eastern Airlines 社ネットワーキングおよび収益部門上級管理
者James Pu 氏
しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か
して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます
Databases Cubes Spreadsheets Hadoop amp More
In-Memory Data Live Connection
PC Browser iPad AndroidDesktop
図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する
ためにインメモリとライブ接続という 2 つの方法が用意されて
います
最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒a Tableau Desktop
bull 考える速さで分析するndash データに接続しコードを1行行も書かずにクエリを実行行できます
ndash ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ
れています
ndash Windows Macemsp 両対応(ver 82)
ndash Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます
1813
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒b Tableau Reader
bull Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです
bull Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です
bull 作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です
bull 作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です
bull Window Mac 両対応
1913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server
5 Tableau times Treasure Data
6 Tableau テクニック集
413
この 10 項目のトレンドに将来性がある
これらのトレンドは顧客が現在何をしていて将来のためにどこに投資しているかについて顧客と話すことで見えてきます良い知らせは先手を打って失敗した挫折感ではなくさらに確実な先手を打つ意欲によって推進されている投資が最も多いことですおそらく過去数年間の新しいテクノロジーと投資がついに成果を上げ始めているのです2013 年にはビジネス インテリジェンスの大きな変化を必ず期待できます
wwwtableausoftwarecomdesktop
Tableau Software はお客様がデータを見て理解するのをお手伝いします世界中の 10000 を超える組織で使用されている Tableau は迅速な分析視覚化および超高速処理ビジネスインテリジェンスを提供しています
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒1 誰もがデータサイエンスを武器にできる時代に
513
bull データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますbull データ分析に関する知識識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビ ジネスマンにも必要な知識識になり
始めていますデータに基づいて決定を行行う企業が競争力力を高めデータを活用しない企業が競争力力を弱めています詳細はThe Economist の「Fostering a Data-Driven Culture (データ主導型の文化を育成)」 をご覧ください
データサイエンティストの消滅 データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますデータ分析に関する知識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビジネスマンにも必要な知識になり始めていますデータに基づいて決定を行う企業が競争力を高めデータを活用しない企業が競争力を弱めています
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒2 ビッグデータBI は共にクラウドへ
613
bull データ分析の導入を速めたい企業はクラウドベースのビジネスインテリジェンスの採用を推進していますbull 顧客との連携やモバイルアクセスなどの新たなシナリオもクラウドビジネスインテリジェンスの導入を加速しています
bull Treasure Data のクラウド データ ウェアハウスにより数カ月かかるデータウェアハウスの構築を数日で実現することができます
bull これによりラピッド プロトタイピングが可能になり以前とは比較にならない柔軟性をもたらします
詳細はホワイトペーパー「Business Analytics in the Cloud (クラウドのビジネス分析)」をご覧ください
クラウド ビジネス インテリジェンスが主流になる データ分析の導入を速めたい企業はクラウド ベースのビジネス インテリジェンスの採用を推進しています顧客との連携やファイアウォール外のモバイル アクセスなどの新たなシナリオもクラウド ビジネス インテリジェンスの導入を加速していますまたクラウド サービスが成熟することで IT 部門によるビジネス インテリジェンスのクラウド化への懸念が弱まっています
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒3 ストーリーテリングの重要性
713
bull 人々はコンテクストのないダッシュボードが増えても役立立たないことを理理解してきましたbull ストーリーテリングではデータを利利用してアイデアや洞洞察を効果的に伝えることができます
bull また大容量量の異異種データが持つ意味を汲み取ることもできます詳細はホワイトペーパー「5 Best Practices for Telling Great Stories (優れたストリーを伝える 5 つのベスト プラクティス)」をご覧ください
ストリーテリングの重要性 人々はコンテクストのないダッシュボードが増えても役立たないことを理解してきましたストリーテリングではデータを利用してアイデアや洞察を効果的に伝えることができますまた大容量の異種データが持つ意味を汲み取ることもできます
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒4 モバイルBIが主流流に
813
bull 最先端の企業にとってモバイル ビジネスインテリジェンス は主流流となり 特別な場合のみに使用するものではなくなっていますbull ビジネス ユーザーはオフィスだけではなく日常業務の流流れでどんな時でも情報にアクセスする必要性に 迫られています
最先端の企業にとってモバイル ビジネス インテリジェンスは主流となり 特別なときに使用するものではなくなっていますビジネス ユーザーはオフィスだけではなく日常業務の流れでどんな時でも情報にアクセスする必要性に迫られています
事例についてはホワイトペーパー「How Mobile Business Intelligence Drives Efficiency and Transformation for Supervalue (モバイル ビジネス インテリジェンスが Supervalue の効率と変革を促進)」をご覧ください
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒5 データストアの急増
913
bull その昔組織には様々ななタイプのデータがありましたbull CRMデータ販売時点データ電子メールなど組織の経営
陣は多大な努力力を払いすべてのデータを1つの自社の高速なデータウェアハウスに保存していました
bull 2014年年にはこれがおとぎ話となりますすべてのデータはFluentd ベースの Treasure Agent を通じて一元的に収集管理理できまたトレジャーストレージはあらゆるデータの共存を容易易に実現しています
bull トレジャーを初めとするデータや作業負荷に適したデータストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります データ ストアの急増その昔組織にはさまざまなタイプのデータがありましたCRM データ販売時点データ電子メールなど組織の経営陣は多大な努力を払いすべてのデータを 1 つの高速なデータ ウェアハウスに保存していました
2013 年にはこれがおとぎ話となりますすべてのデータを 1 か所に保管する組織はもはや存在しませんさらに1 か所に保管する理由もなくなります大量のデータは Teradata や Hadoop などの場所に保管できます取引データは Oracle や SQL Server に保管できますデータや作業負荷に適したデータ ストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒6 自立性が新しいセルフサービスに
1013
bull セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です
bull 自立立性はこの概念念の時代の到来ですこれはndash ビジネス ユーザーが適切切なデータにアクセスできること
ndash そのデータが 使用可能な形式と場所にあること
ndash またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること
を意味します
bull これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒7 コラボレーションは機能でなく現実に
1113
bull ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります
bull コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません
bull ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです
bull 2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
1213
a Tableau Desktopb Tableau Readerc Tableau Serverd Tableau Public
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題
1 上層部から分析を要求されているndash 幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない
2 大量量のレポートの要求を受け続けているndash 終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である
ndash 優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります
3 レポートを提出することでさらに必要なレポートが増えていくndash レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません
ndash あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です
4 データが古いことにフラストレーションを感じているndash レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1
つにデータが最新でなくなるという点があります
ndash ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません
1313
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題5 マッシュアップしたデータを要求される
ndash 実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか
ndash 複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません
6 視覚的分析を求めているndash 人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます
ndash まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです
ndash それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります
7 すでに一部で使用しているndash 全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています
ndash 才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています
ndash その結果独自のセルフサービスBIを採用するケースが多く見見られます
ndash ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です
1413
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い1 複雑すぎるスタート
ndash 野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です
ndash 「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します
2 誰も理理解できない指標を使用するndash あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか
ndash あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません
ndash 指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります
3 重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします
ndash こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください
4 複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash 従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト
が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください
1513
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い
5 ダッシュボードの作成と維持のための時間とリソースを過小評価するndash ダッシュボードの展開は1回で終わる作業ではありません
ndash 指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください
6 指標と目標が一致しないndash ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない
ダッシュボードを作成してしまうことのないようにします
7 効果的でないデザインの悪いグラフやチャートを使うndash グラフやチャートをデザインする際は気をつける必要があります
ndash たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません
ndash 優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください
1613
Copyright copy2014 Treasure Data All Rights Reserved
2 Tableauの特徴
1713
p4
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に
同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました
特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります
次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか
bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか
bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか
bull BI ソリューションは綿密なスケジュールやシステムの
パフォーマンス低下の場合の回避策に依存していますか
bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか
bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか
bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか
これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます
超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選
図 1 データ ワークフローのあらゆる段階で高速化
これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の
分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は
10 ~ 100 倍高速です
Install Access Analyze Publish Share
10 X 100 TIMES FASTER
p14
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI
Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます
VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です
ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo
China Eastern Airlines 社ネットワーキングおよび収益部門上級管理
者James Pu 氏
しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か
して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます
Databases Cubes Spreadsheets Hadoop amp More
In-Memory Data Live Connection
PC Browser iPad AndroidDesktop
図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する
ためにインメモリとライブ接続という 2 つの方法が用意されて
います
最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒a Tableau Desktop
bull 考える速さで分析するndash データに接続しコードを1行行も書かずにクエリを実行行できます
ndash ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ
れています
ndash Windows Macemsp 両対応(ver 82)
ndash Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます
1813
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒b Tableau Reader
bull Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです
bull Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です
bull 作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です
bull 作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です
bull Window Mac 両対応
1913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒1 誰もがデータサイエンスを武器にできる時代に
513
bull データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますbull データ分析に関する知識識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビ ジネスマンにも必要な知識識になり
始めていますデータに基づいて決定を行行う企業が競争力力を高めデータを活用しない企業が競争力力を弱めています詳細はThe Economist の「Fostering a Data-Driven Culture (データ主導型の文化を育成)」 をご覧ください
データサイエンティストの消滅 データサイエンスは専門家だけでなく一般のビジネスマンが扱うものになりつつありますデータ分析に関する知識は肩書きに「アナリスト」が付くような専門家だけではなく一般のビジネスマンにも必要な知識になり始めていますデータに基づいて決定を行う企業が競争力を高めデータを活用しない企業が競争力を弱めています
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒2 ビッグデータBI は共にクラウドへ
613
bull データ分析の導入を速めたい企業はクラウドベースのビジネスインテリジェンスの採用を推進していますbull 顧客との連携やモバイルアクセスなどの新たなシナリオもクラウドビジネスインテリジェンスの導入を加速しています
bull Treasure Data のクラウド データ ウェアハウスにより数カ月かかるデータウェアハウスの構築を数日で実現することができます
bull これによりラピッド プロトタイピングが可能になり以前とは比較にならない柔軟性をもたらします
詳細はホワイトペーパー「Business Analytics in the Cloud (クラウドのビジネス分析)」をご覧ください
クラウド ビジネス インテリジェンスが主流になる データ分析の導入を速めたい企業はクラウド ベースのビジネス インテリジェンスの採用を推進しています顧客との連携やファイアウォール外のモバイル アクセスなどの新たなシナリオもクラウド ビジネス インテリジェンスの導入を加速していますまたクラウド サービスが成熟することで IT 部門によるビジネス インテリジェンスのクラウド化への懸念が弱まっています
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒3 ストーリーテリングの重要性
713
bull 人々はコンテクストのないダッシュボードが増えても役立立たないことを理理解してきましたbull ストーリーテリングではデータを利利用してアイデアや洞洞察を効果的に伝えることができます
bull また大容量量の異異種データが持つ意味を汲み取ることもできます詳細はホワイトペーパー「5 Best Practices for Telling Great Stories (優れたストリーを伝える 5 つのベスト プラクティス)」をご覧ください
ストリーテリングの重要性 人々はコンテクストのないダッシュボードが増えても役立たないことを理解してきましたストリーテリングではデータを利用してアイデアや洞察を効果的に伝えることができますまた大容量の異種データが持つ意味を汲み取ることもできます
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒4 モバイルBIが主流流に
813
bull 最先端の企業にとってモバイル ビジネスインテリジェンス は主流流となり 特別な場合のみに使用するものではなくなっていますbull ビジネス ユーザーはオフィスだけではなく日常業務の流流れでどんな時でも情報にアクセスする必要性に 迫られています
最先端の企業にとってモバイル ビジネス インテリジェンスは主流となり 特別なときに使用するものではなくなっていますビジネス ユーザーはオフィスだけではなく日常業務の流れでどんな時でも情報にアクセスする必要性に迫られています
事例についてはホワイトペーパー「How Mobile Business Intelligence Drives Efficiency and Transformation for Supervalue (モバイル ビジネス インテリジェンスが Supervalue の効率と変革を促進)」をご覧ください
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒5 データストアの急増
913
bull その昔組織には様々ななタイプのデータがありましたbull CRMデータ販売時点データ電子メールなど組織の経営
陣は多大な努力力を払いすべてのデータを1つの自社の高速なデータウェアハウスに保存していました
bull 2014年年にはこれがおとぎ話となりますすべてのデータはFluentd ベースの Treasure Agent を通じて一元的に収集管理理できまたトレジャーストレージはあらゆるデータの共存を容易易に実現しています
bull トレジャーを初めとするデータや作業負荷に適したデータストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります データ ストアの急増その昔組織にはさまざまなタイプのデータがありましたCRM データ販売時点データ電子メールなど組織の経営陣は多大な努力を払いすべてのデータを 1 つの高速なデータ ウェアハウスに保存していました
2013 年にはこれがおとぎ話となりますすべてのデータを 1 か所に保管する組織はもはや存在しませんさらに1 か所に保管する理由もなくなります大量のデータは Teradata や Hadoop などの場所に保管できます取引データは Oracle や SQL Server に保管できますデータや作業負荷に適したデータ ストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒6 自立性が新しいセルフサービスに
1013
bull セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です
bull 自立立性はこの概念念の時代の到来ですこれはndash ビジネス ユーザーが適切切なデータにアクセスできること
ndash そのデータが 使用可能な形式と場所にあること
ndash またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること
を意味します
bull これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒7 コラボレーションは機能でなく現実に
1113
bull ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります
bull コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません
bull ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです
bull 2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
1213
a Tableau Desktopb Tableau Readerc Tableau Serverd Tableau Public
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題
1 上層部から分析を要求されているndash 幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない
2 大量量のレポートの要求を受け続けているndash 終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である
ndash 優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります
3 レポートを提出することでさらに必要なレポートが増えていくndash レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません
ndash あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です
4 データが古いことにフラストレーションを感じているndash レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1
つにデータが最新でなくなるという点があります
ndash ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません
1313
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題5 マッシュアップしたデータを要求される
ndash 実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか
ndash 複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません
6 視覚的分析を求めているndash 人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます
ndash まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです
ndash それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります
7 すでに一部で使用しているndash 全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています
ndash 才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています
ndash その結果独自のセルフサービスBIを採用するケースが多く見見られます
ndash ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です
1413
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い1 複雑すぎるスタート
ndash 野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です
ndash 「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します
2 誰も理理解できない指標を使用するndash あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか
ndash あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません
ndash 指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります
3 重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします
ndash こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください
4 複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash 従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト
が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください
1513
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い
5 ダッシュボードの作成と維持のための時間とリソースを過小評価するndash ダッシュボードの展開は1回で終わる作業ではありません
ndash 指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください
6 指標と目標が一致しないndash ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない
ダッシュボードを作成してしまうことのないようにします
7 効果的でないデザインの悪いグラフやチャートを使うndash グラフやチャートをデザインする際は気をつける必要があります
ndash たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません
ndash 優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください
1613
Copyright copy2014 Treasure Data All Rights Reserved
2 Tableauの特徴
1713
p4
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に
同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました
特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります
次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか
bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか
bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか
bull BI ソリューションは綿密なスケジュールやシステムの
パフォーマンス低下の場合の回避策に依存していますか
bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか
bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか
bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか
これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます
超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選
図 1 データ ワークフローのあらゆる段階で高速化
これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の
分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は
10 ~ 100 倍高速です
Install Access Analyze Publish Share
10 X 100 TIMES FASTER
p14
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI
Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます
VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です
ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo
China Eastern Airlines 社ネットワーキングおよび収益部門上級管理
者James Pu 氏
しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か
して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます
Databases Cubes Spreadsheets Hadoop amp More
In-Memory Data Live Connection
PC Browser iPad AndroidDesktop
図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する
ためにインメモリとライブ接続という 2 つの方法が用意されて
います
最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒a Tableau Desktop
bull 考える速さで分析するndash データに接続しコードを1行行も書かずにクエリを実行行できます
ndash ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ
れています
ndash Windows Macemsp 両対応(ver 82)
ndash Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます
1813
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒b Tableau Reader
bull Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです
bull Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です
bull 作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です
bull 作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です
bull Window Mac 両対応
1913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒2 ビッグデータBI は共にクラウドへ
613
bull データ分析の導入を速めたい企業はクラウドベースのビジネスインテリジェンスの採用を推進していますbull 顧客との連携やモバイルアクセスなどの新たなシナリオもクラウドビジネスインテリジェンスの導入を加速しています
bull Treasure Data のクラウド データ ウェアハウスにより数カ月かかるデータウェアハウスの構築を数日で実現することができます
bull これによりラピッド プロトタイピングが可能になり以前とは比較にならない柔軟性をもたらします
詳細はホワイトペーパー「Business Analytics in the Cloud (クラウドのビジネス分析)」をご覧ください
クラウド ビジネス インテリジェンスが主流になる データ分析の導入を速めたい企業はクラウド ベースのビジネス インテリジェンスの採用を推進しています顧客との連携やファイアウォール外のモバイル アクセスなどの新たなシナリオもクラウド ビジネス インテリジェンスの導入を加速していますまたクラウド サービスが成熟することで IT 部門によるビジネス インテリジェンスのクラウド化への懸念が弱まっています
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒3 ストーリーテリングの重要性
713
bull 人々はコンテクストのないダッシュボードが増えても役立立たないことを理理解してきましたbull ストーリーテリングではデータを利利用してアイデアや洞洞察を効果的に伝えることができます
bull また大容量量の異異種データが持つ意味を汲み取ることもできます詳細はホワイトペーパー「5 Best Practices for Telling Great Stories (優れたストリーを伝える 5 つのベスト プラクティス)」をご覧ください
ストリーテリングの重要性 人々はコンテクストのないダッシュボードが増えても役立たないことを理解してきましたストリーテリングではデータを利用してアイデアや洞察を効果的に伝えることができますまた大容量の異種データが持つ意味を汲み取ることもできます
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒4 モバイルBIが主流流に
813
bull 最先端の企業にとってモバイル ビジネスインテリジェンス は主流流となり 特別な場合のみに使用するものではなくなっていますbull ビジネス ユーザーはオフィスだけではなく日常業務の流流れでどんな時でも情報にアクセスする必要性に 迫られています
最先端の企業にとってモバイル ビジネス インテリジェンスは主流となり 特別なときに使用するものではなくなっていますビジネス ユーザーはオフィスだけではなく日常業務の流れでどんな時でも情報にアクセスする必要性に迫られています
事例についてはホワイトペーパー「How Mobile Business Intelligence Drives Efficiency and Transformation for Supervalue (モバイル ビジネス インテリジェンスが Supervalue の効率と変革を促進)」をご覧ください
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒5 データストアの急増
913
bull その昔組織には様々ななタイプのデータがありましたbull CRMデータ販売時点データ電子メールなど組織の経営
陣は多大な努力力を払いすべてのデータを1つの自社の高速なデータウェアハウスに保存していました
bull 2014年年にはこれがおとぎ話となりますすべてのデータはFluentd ベースの Treasure Agent を通じて一元的に収集管理理できまたトレジャーストレージはあらゆるデータの共存を容易易に実現しています
bull トレジャーを初めとするデータや作業負荷に適したデータストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります データ ストアの急増その昔組織にはさまざまなタイプのデータがありましたCRM データ販売時点データ電子メールなど組織の経営陣は多大な努力を払いすべてのデータを 1 つの高速なデータ ウェアハウスに保存していました
2013 年にはこれがおとぎ話となりますすべてのデータを 1 か所に保管する組織はもはや存在しませんさらに1 か所に保管する理由もなくなります大量のデータは Teradata や Hadoop などの場所に保管できます取引データは Oracle や SQL Server に保管できますデータや作業負荷に適したデータ ストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒6 自立性が新しいセルフサービスに
1013
bull セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です
bull 自立立性はこの概念念の時代の到来ですこれはndash ビジネス ユーザーが適切切なデータにアクセスできること
ndash そのデータが 使用可能な形式と場所にあること
ndash またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること
を意味します
bull これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒7 コラボレーションは機能でなく現実に
1113
bull ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります
bull コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません
bull ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです
bull 2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
1213
a Tableau Desktopb Tableau Readerc Tableau Serverd Tableau Public
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題
1 上層部から分析を要求されているndash 幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない
2 大量量のレポートの要求を受け続けているndash 終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である
ndash 優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります
3 レポートを提出することでさらに必要なレポートが増えていくndash レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません
ndash あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です
4 データが古いことにフラストレーションを感じているndash レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1
つにデータが最新でなくなるという点があります
ndash ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません
1313
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題5 マッシュアップしたデータを要求される
ndash 実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか
ndash 複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません
6 視覚的分析を求めているndash 人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます
ndash まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです
ndash それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります
7 すでに一部で使用しているndash 全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています
ndash 才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています
ndash その結果独自のセルフサービスBIを採用するケースが多く見見られます
ndash ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です
1413
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い1 複雑すぎるスタート
ndash 野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です
ndash 「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します
2 誰も理理解できない指標を使用するndash あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか
ndash あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません
ndash 指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります
3 重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします
ndash こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください
4 複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash 従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト
が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください
1513
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い
5 ダッシュボードの作成と維持のための時間とリソースを過小評価するndash ダッシュボードの展開は1回で終わる作業ではありません
ndash 指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください
6 指標と目標が一致しないndash ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない
ダッシュボードを作成してしまうことのないようにします
7 効果的でないデザインの悪いグラフやチャートを使うndash グラフやチャートをデザインする際は気をつける必要があります
ndash たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません
ndash 優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください
1613
Copyright copy2014 Treasure Data All Rights Reserved
2 Tableauの特徴
1713
p4
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に
同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました
特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります
次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか
bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか
bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか
bull BI ソリューションは綿密なスケジュールやシステムの
パフォーマンス低下の場合の回避策に依存していますか
bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか
bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか
bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか
これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます
超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選
図 1 データ ワークフローのあらゆる段階で高速化
これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の
分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は
10 ~ 100 倍高速です
Install Access Analyze Publish Share
10 X 100 TIMES FASTER
p14
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI
Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます
VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です
ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo
China Eastern Airlines 社ネットワーキングおよび収益部門上級管理
者James Pu 氏
しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か
して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます
Databases Cubes Spreadsheets Hadoop amp More
In-Memory Data Live Connection
PC Browser iPad AndroidDesktop
図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する
ためにインメモリとライブ接続という 2 つの方法が用意されて
います
最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒a Tableau Desktop
bull 考える速さで分析するndash データに接続しコードを1行行も書かずにクエリを実行行できます
ndash ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ
れています
ndash Windows Macemsp 両対応(ver 82)
ndash Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます
1813
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒b Tableau Reader
bull Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです
bull Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です
bull 作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です
bull 作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です
bull Window Mac 両対応
1913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒3 ストーリーテリングの重要性
713
bull 人々はコンテクストのないダッシュボードが増えても役立立たないことを理理解してきましたbull ストーリーテリングではデータを利利用してアイデアや洞洞察を効果的に伝えることができます
bull また大容量量の異異種データが持つ意味を汲み取ることもできます詳細はホワイトペーパー「5 Best Practices for Telling Great Stories (優れたストリーを伝える 5 つのベスト プラクティス)」をご覧ください
ストリーテリングの重要性 人々はコンテクストのないダッシュボードが増えても役立たないことを理解してきましたストリーテリングではデータを利用してアイデアや洞察を効果的に伝えることができますまた大容量の異種データが持つ意味を汲み取ることもできます
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒4 モバイルBIが主流流に
813
bull 最先端の企業にとってモバイル ビジネスインテリジェンス は主流流となり 特別な場合のみに使用するものではなくなっていますbull ビジネス ユーザーはオフィスだけではなく日常業務の流流れでどんな時でも情報にアクセスする必要性に 迫られています
最先端の企業にとってモバイル ビジネス インテリジェンスは主流となり 特別なときに使用するものではなくなっていますビジネス ユーザーはオフィスだけではなく日常業務の流れでどんな時でも情報にアクセスする必要性に迫られています
事例についてはホワイトペーパー「How Mobile Business Intelligence Drives Efficiency and Transformation for Supervalue (モバイル ビジネス インテリジェンスが Supervalue の効率と変革を促進)」をご覧ください
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒5 データストアの急増
913
bull その昔組織には様々ななタイプのデータがありましたbull CRMデータ販売時点データ電子メールなど組織の経営
陣は多大な努力力を払いすべてのデータを1つの自社の高速なデータウェアハウスに保存していました
bull 2014年年にはこれがおとぎ話となりますすべてのデータはFluentd ベースの Treasure Agent を通じて一元的に収集管理理できまたトレジャーストレージはあらゆるデータの共存を容易易に実現しています
bull トレジャーを初めとするデータや作業負荷に適したデータストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります データ ストアの急増その昔組織にはさまざまなタイプのデータがありましたCRM データ販売時点データ電子メールなど組織の経営陣は多大な努力を払いすべてのデータを 1 つの高速なデータ ウェアハウスに保存していました
2013 年にはこれがおとぎ話となりますすべてのデータを 1 か所に保管する組織はもはや存在しませんさらに1 か所に保管する理由もなくなります大量のデータは Teradata や Hadoop などの場所に保管できます取引データは Oracle や SQL Server に保管できますデータや作業負荷に適したデータ ストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒6 自立性が新しいセルフサービスに
1013
bull セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です
bull 自立立性はこの概念念の時代の到来ですこれはndash ビジネス ユーザーが適切切なデータにアクセスできること
ndash そのデータが 使用可能な形式と場所にあること
ndash またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること
を意味します
bull これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒7 コラボレーションは機能でなく現実に
1113
bull ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります
bull コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません
bull ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです
bull 2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
1213
a Tableau Desktopb Tableau Readerc Tableau Serverd Tableau Public
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題
1 上層部から分析を要求されているndash 幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない
2 大量量のレポートの要求を受け続けているndash 終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である
ndash 優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります
3 レポートを提出することでさらに必要なレポートが増えていくndash レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません
ndash あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です
4 データが古いことにフラストレーションを感じているndash レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1
つにデータが最新でなくなるという点があります
ndash ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません
1313
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題5 マッシュアップしたデータを要求される
ndash 実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか
ndash 複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません
6 視覚的分析を求めているndash 人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます
ndash まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです
ndash それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります
7 すでに一部で使用しているndash 全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています
ndash 才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています
ndash その結果独自のセルフサービスBIを採用するケースが多く見見られます
ndash ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です
1413
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い1 複雑すぎるスタート
ndash 野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です
ndash 「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します
2 誰も理理解できない指標を使用するndash あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか
ndash あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません
ndash 指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります
3 重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします
ndash こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください
4 複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash 従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト
が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください
1513
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い
5 ダッシュボードの作成と維持のための時間とリソースを過小評価するndash ダッシュボードの展開は1回で終わる作業ではありません
ndash 指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください
6 指標と目標が一致しないndash ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない
ダッシュボードを作成してしまうことのないようにします
7 効果的でないデザインの悪いグラフやチャートを使うndash グラフやチャートをデザインする際は気をつける必要があります
ndash たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません
ndash 優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください
1613
Copyright copy2014 Treasure Data All Rights Reserved
2 Tableauの特徴
1713
p4
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に
同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました
特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります
次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか
bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか
bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか
bull BI ソリューションは綿密なスケジュールやシステムの
パフォーマンス低下の場合の回避策に依存していますか
bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか
bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか
bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか
これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます
超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選
図 1 データ ワークフローのあらゆる段階で高速化
これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の
分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は
10 ~ 100 倍高速です
Install Access Analyze Publish Share
10 X 100 TIMES FASTER
p14
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI
Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます
VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です
ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo
China Eastern Airlines 社ネットワーキングおよび収益部門上級管理
者James Pu 氏
しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か
して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます
Databases Cubes Spreadsheets Hadoop amp More
In-Memory Data Live Connection
PC Browser iPad AndroidDesktop
図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する
ためにインメモリとライブ接続という 2 つの方法が用意されて
います
最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒a Tableau Desktop
bull 考える速さで分析するndash データに接続しコードを1行行も書かずにクエリを実行行できます
ndash ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ
れています
ndash Windows Macemsp 両対応(ver 82)
ndash Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます
1813
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒b Tableau Reader
bull Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです
bull Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です
bull 作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です
bull 作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です
bull Window Mac 両対応
1913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒4 モバイルBIが主流流に
813
bull 最先端の企業にとってモバイル ビジネスインテリジェンス は主流流となり 特別な場合のみに使用するものではなくなっていますbull ビジネス ユーザーはオフィスだけではなく日常業務の流流れでどんな時でも情報にアクセスする必要性に 迫られています
最先端の企業にとってモバイル ビジネス インテリジェンスは主流となり 特別なときに使用するものではなくなっていますビジネス ユーザーはオフィスだけではなく日常業務の流れでどんな時でも情報にアクセスする必要性に迫られています
事例についてはホワイトペーパー「How Mobile Business Intelligence Drives Efficiency and Transformation for Supervalue (モバイル ビジネス インテリジェンスが Supervalue の効率と変革を促進)」をご覧ください
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒5 データストアの急増
913
bull その昔組織には様々ななタイプのデータがありましたbull CRMデータ販売時点データ電子メールなど組織の経営
陣は多大な努力力を払いすべてのデータを1つの自社の高速なデータウェアハウスに保存していました
bull 2014年年にはこれがおとぎ話となりますすべてのデータはFluentd ベースの Treasure Agent を通じて一元的に収集管理理できまたトレジャーストレージはあらゆるデータの共存を容易易に実現しています
bull トレジャーを初めとするデータや作業負荷に適したデータストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります データ ストアの急増その昔組織にはさまざまなタイプのデータがありましたCRM データ販売時点データ電子メールなど組織の経営陣は多大な努力を払いすべてのデータを 1 つの高速なデータ ウェアハウスに保存していました
2013 年にはこれがおとぎ話となりますすべてのデータを 1 か所に保管する組織はもはや存在しませんさらに1 か所に保管する理由もなくなります大量のデータは Teradata や Hadoop などの場所に保管できます取引データは Oracle や SQL Server に保管できますデータや作業負荷に適したデータ ストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒6 自立性が新しいセルフサービスに
1013
bull セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です
bull 自立立性はこの概念念の時代の到来ですこれはndash ビジネス ユーザーが適切切なデータにアクセスできること
ndash そのデータが 使用可能な形式と場所にあること
ndash またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること
を意味します
bull これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒7 コラボレーションは機能でなく現実に
1113
bull ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります
bull コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません
bull ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです
bull 2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
1213
a Tableau Desktopb Tableau Readerc Tableau Serverd Tableau Public
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題
1 上層部から分析を要求されているndash 幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない
2 大量量のレポートの要求を受け続けているndash 終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である
ndash 優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります
3 レポートを提出することでさらに必要なレポートが増えていくndash レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません
ndash あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です
4 データが古いことにフラストレーションを感じているndash レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1
つにデータが最新でなくなるという点があります
ndash ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません
1313
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題5 マッシュアップしたデータを要求される
ndash 実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか
ndash 複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません
6 視覚的分析を求めているndash 人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます
ndash まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです
ndash それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります
7 すでに一部で使用しているndash 全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています
ndash 才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています
ndash その結果独自のセルフサービスBIを採用するケースが多く見見られます
ndash ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です
1413
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い1 複雑すぎるスタート
ndash 野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です
ndash 「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します
2 誰も理理解できない指標を使用するndash あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか
ndash あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません
ndash 指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります
3 重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします
ndash こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください
4 複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash 従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト
が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください
1513
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い
5 ダッシュボードの作成と維持のための時間とリソースを過小評価するndash ダッシュボードの展開は1回で終わる作業ではありません
ndash 指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください
6 指標と目標が一致しないndash ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない
ダッシュボードを作成してしまうことのないようにします
7 効果的でないデザインの悪いグラフやチャートを使うndash グラフやチャートをデザインする際は気をつける必要があります
ndash たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません
ndash 優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください
1613
Copyright copy2014 Treasure Data All Rights Reserved
2 Tableauの特徴
1713
p4
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に
同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました
特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります
次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか
bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか
bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか
bull BI ソリューションは綿密なスケジュールやシステムの
パフォーマンス低下の場合の回避策に依存していますか
bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか
bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか
bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか
これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます
超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選
図 1 データ ワークフローのあらゆる段階で高速化
これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の
分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は
10 ~ 100 倍高速です
Install Access Analyze Publish Share
10 X 100 TIMES FASTER
p14
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI
Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます
VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です
ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo
China Eastern Airlines 社ネットワーキングおよび収益部門上級管理
者James Pu 氏
しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か
して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます
Databases Cubes Spreadsheets Hadoop amp More
In-Memory Data Live Connection
PC Browser iPad AndroidDesktop
図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する
ためにインメモリとライブ接続という 2 つの方法が用意されて
います
最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒a Tableau Desktop
bull 考える速さで分析するndash データに接続しコードを1行行も書かずにクエリを実行行できます
ndash ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ
れています
ndash Windows Macemsp 両対応(ver 82)
ndash Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます
1813
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒b Tableau Reader
bull Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです
bull Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です
bull 作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です
bull 作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です
bull Window Mac 両対応
1913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒5 データストアの急増
913
bull その昔組織には様々ななタイプのデータがありましたbull CRMデータ販売時点データ電子メールなど組織の経営
陣は多大な努力力を払いすべてのデータを1つの自社の高速なデータウェアハウスに保存していました
bull 2014年年にはこれがおとぎ話となりますすべてのデータはFluentd ベースの Treasure Agent を通じて一元的に収集管理理できまたトレジャーストレージはあらゆるデータの共存を容易易に実現しています
bull トレジャーを初めとするデータや作業負荷に適したデータストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります データ ストアの急増その昔組織にはさまざまなタイプのデータがありましたCRM データ販売時点データ電子メールなど組織の経営陣は多大な努力を払いすべてのデータを 1 つの高速なデータ ウェアハウスに保存していました
2013 年にはこれがおとぎ話となりますすべてのデータを 1 か所に保管する組織はもはや存在しませんさらに1 か所に保管する理由もなくなります大量のデータは Teradata や Hadoop などの場所に保管できます取引データは Oracle や SQL Server に保管できますデータや作業負荷に適したデータ ストアは解決すべき問題ではなく優れた IT 組織の特徴の 1 つとなります
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒6 自立性が新しいセルフサービスに
1013
bull セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です
bull 自立立性はこの概念念の時代の到来ですこれはndash ビジネス ユーザーが適切切なデータにアクセスできること
ndash そのデータが 使用可能な形式と場所にあること
ndash またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること
を意味します
bull これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒7 コラボレーションは機能でなく現実に
1113
bull ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります
bull コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません
bull ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです
bull 2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
1213
a Tableau Desktopb Tableau Readerc Tableau Serverd Tableau Public
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題
1 上層部から分析を要求されているndash 幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない
2 大量量のレポートの要求を受け続けているndash 終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である
ndash 優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります
3 レポートを提出することでさらに必要なレポートが増えていくndash レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません
ndash あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です
4 データが古いことにフラストレーションを感じているndash レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1
つにデータが最新でなくなるという点があります
ndash ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません
1313
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題5 マッシュアップしたデータを要求される
ndash 実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか
ndash 複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません
6 視覚的分析を求めているndash 人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます
ndash まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです
ndash それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります
7 すでに一部で使用しているndash 全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています
ndash 才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています
ndash その結果独自のセルフサービスBIを採用するケースが多く見見られます
ndash ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です
1413
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い1 複雑すぎるスタート
ndash 野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です
ndash 「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します
2 誰も理理解できない指標を使用するndash あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか
ndash あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません
ndash 指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります
3 重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします
ndash こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください
4 複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash 従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト
が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください
1513
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い
5 ダッシュボードの作成と維持のための時間とリソースを過小評価するndash ダッシュボードの展開は1回で終わる作業ではありません
ndash 指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください
6 指標と目標が一致しないndash ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない
ダッシュボードを作成してしまうことのないようにします
7 効果的でないデザインの悪いグラフやチャートを使うndash グラフやチャートをデザインする際は気をつける必要があります
ndash たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません
ndash 優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください
1613
Copyright copy2014 Treasure Data All Rights Reserved
2 Tableauの特徴
1713
p4
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に
同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました
特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります
次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか
bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか
bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか
bull BI ソリューションは綿密なスケジュールやシステムの
パフォーマンス低下の場合の回避策に依存していますか
bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか
bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか
bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか
これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます
超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選
図 1 データ ワークフローのあらゆる段階で高速化
これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の
分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は
10 ~ 100 倍高速です
Install Access Analyze Publish Share
10 X 100 TIMES FASTER
p14
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI
Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます
VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です
ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo
China Eastern Airlines 社ネットワーキングおよび収益部門上級管理
者James Pu 氏
しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か
して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます
Databases Cubes Spreadsheets Hadoop amp More
In-Memory Data Live Connection
PC Browser iPad AndroidDesktop
図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する
ためにインメモリとライブ接続という 2 つの方法が用意されて
います
最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒a Tableau Desktop
bull 考える速さで分析するndash データに接続しコードを1行行も書かずにクエリを実行行できます
ndash ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ
れています
ndash Windows Macemsp 両対応(ver 82)
ndash Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます
1813
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒b Tableau Reader
bull Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです
bull Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です
bull 作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です
bull 作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です
bull Window Mac 両対応
1913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒6 自立性が新しいセルフサービスに
1013
bull セルフ サービス BI はビジネス ユーザーがより優れた決定を行行うために必要なデータを分析できるようにするという考え方です
bull 自立立性はこの概念念の時代の到来ですこれはndash ビジネス ユーザーが適切切なデータにアクセスできること
ndash そのデータが 使用可能な形式と場所にあること
ndash またビジネス ユーザーにセルフサービス分析が可能なソリューションがあること
を意味します
bull これらすべてが実現できればビジネス ユーザーはビジネス上の問題に自分で対応できIT は安全なデータとそれにア クセスするためのソリューションの提供に集中することができます
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒7 コラボレーションは機能でなく現実に
1113
bull ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります
bull コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません
bull ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです
bull 2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
1213
a Tableau Desktopb Tableau Readerc Tableau Serverd Tableau Public
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題
1 上層部から分析を要求されているndash 幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない
2 大量量のレポートの要求を受け続けているndash 終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である
ndash 優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります
3 レポートを提出することでさらに必要なレポートが増えていくndash レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません
ndash あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です
4 データが古いことにフラストレーションを感じているndash レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1
つにデータが最新でなくなるという点があります
ndash ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません
1313
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題5 マッシュアップしたデータを要求される
ndash 実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか
ndash 複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません
6 視覚的分析を求めているndash 人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます
ndash まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです
ndash それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります
7 すでに一部で使用しているndash 全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています
ndash 才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています
ndash その結果独自のセルフサービスBIを採用するケースが多く見見られます
ndash ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です
1413
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い1 複雑すぎるスタート
ndash 野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です
ndash 「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します
2 誰も理理解できない指標を使用するndash あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか
ndash あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません
ndash 指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります
3 重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします
ndash こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください
4 複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash 従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト
が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください
1513
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い
5 ダッシュボードの作成と維持のための時間とリソースを過小評価するndash ダッシュボードの展開は1回で終わる作業ではありません
ndash 指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください
6 指標と目標が一致しないndash ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない
ダッシュボードを作成してしまうことのないようにします
7 効果的でないデザインの悪いグラフやチャートを使うndash グラフやチャートをデザインする際は気をつける必要があります
ndash たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません
ndash 優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください
1613
Copyright copy2014 Treasure Data All Rights Reserved
2 Tableauの特徴
1713
p4
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に
同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました
特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります
次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか
bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか
bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか
bull BI ソリューションは綿密なスケジュールやシステムの
パフォーマンス低下の場合の回避策に依存していますか
bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか
bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか
bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか
これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます
超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選
図 1 データ ワークフローのあらゆる段階で高速化
これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の
分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は
10 ~ 100 倍高速です
Install Access Analyze Publish Share
10 X 100 TIMES FASTER
p14
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI
Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます
VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です
ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo
China Eastern Airlines 社ネットワーキングおよび収益部門上級管理
者James Pu 氏
しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か
して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます
Databases Cubes Spreadsheets Hadoop amp More
In-Memory Data Live Connection
PC Browser iPad AndroidDesktop
図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する
ためにインメモリとライブ接続という 2 つの方法が用意されて
います
最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒a Tableau Desktop
bull 考える速さで分析するndash データに接続しコードを1行行も書かずにクエリを実行行できます
ndash ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ
れています
ndash Windows Macemsp 両対応(ver 82)
ndash Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます
1813
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒b Tableau Reader
bull Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです
bull Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です
bull 作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です
bull 作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です
bull Window Mac 両対応
1913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
1-‐‑‒7 コラボレーションは機能でなく現実に
1113
bull ビジネスインテリジェンスソリューションではよくコラボレーション機能が盛んに宣伝されてきましたが2014年年にはそれだけでは十分でなくなります
bull コラボレーションはビジネス インテリジェンスの導入の本質でなければなりません
bull ビジネ スに関する質問のやり取りといった共有体験なくしてビジネスインテリジェンスは存在し得ないためです
bull 2014 年年には企業は問題の理理解と解決に向けた共同作業に組織全体の人を関与させるための方法を追求するようになります
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
1213
a Tableau Desktopb Tableau Readerc Tableau Serverd Tableau Public
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題
1 上層部から分析を要求されているndash 幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない
2 大量量のレポートの要求を受け続けているndash 終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である
ndash 優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります
3 レポートを提出することでさらに必要なレポートが増えていくndash レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません
ndash あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です
4 データが古いことにフラストレーションを感じているndash レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1
つにデータが最新でなくなるという点があります
ndash ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません
1313
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題5 マッシュアップしたデータを要求される
ndash 実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか
ndash 複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません
6 視覚的分析を求めているndash 人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます
ndash まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです
ndash それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります
7 すでに一部で使用しているndash 全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています
ndash 才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています
ndash その結果独自のセルフサービスBIを採用するケースが多く見見られます
ndash ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です
1413
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い1 複雑すぎるスタート
ndash 野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です
ndash 「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します
2 誰も理理解できない指標を使用するndash あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか
ndash あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません
ndash 指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります
3 重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします
ndash こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください
4 複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash 従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト
が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください
1513
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い
5 ダッシュボードの作成と維持のための時間とリソースを過小評価するndash ダッシュボードの展開は1回で終わる作業ではありません
ndash 指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください
6 指標と目標が一致しないndash ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない
ダッシュボードを作成してしまうことのないようにします
7 効果的でないデザインの悪いグラフやチャートを使うndash グラフやチャートをデザインする際は気をつける必要があります
ndash たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません
ndash 優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください
1613
Copyright copy2014 Treasure Data All Rights Reserved
2 Tableauの特徴
1713
p4
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に
同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました
特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります
次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか
bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか
bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか
bull BI ソリューションは綿密なスケジュールやシステムの
パフォーマンス低下の場合の回避策に依存していますか
bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか
bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか
bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか
これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます
超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選
図 1 データ ワークフローのあらゆる段階で高速化
これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の
分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は
10 ~ 100 倍高速です
Install Access Analyze Publish Share
10 X 100 TIMES FASTER
p14
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI
Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます
VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です
ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo
China Eastern Airlines 社ネットワーキングおよび収益部門上級管理
者James Pu 氏
しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か
して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます
Databases Cubes Spreadsheets Hadoop amp More
In-Memory Data Live Connection
PC Browser iPad AndroidDesktop
図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する
ためにインメモリとライブ接続という 2 つの方法が用意されて
います
最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒a Tableau Desktop
bull 考える速さで分析するndash データに接続しコードを1行行も書かずにクエリを実行行できます
ndash ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ
れています
ndash Windows Macemsp 両対応(ver 82)
ndash Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます
1813
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒b Tableau Reader
bull Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです
bull Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です
bull 作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です
bull 作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です
bull Window Mac 両対応
1913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
1213
a Tableau Desktopb Tableau Readerc Tableau Serverd Tableau Public
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題
1 上層部から分析を要求されているndash 幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない
2 大量量のレポートの要求を受け続けているndash 終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である
ndash 優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります
3 レポートを提出することでさらに必要なレポートが増えていくndash レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません
ndash あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です
4 データが古いことにフラストレーションを感じているndash レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1
つにデータが最新でなくなるという点があります
ndash ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません
1313
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題5 マッシュアップしたデータを要求される
ndash 実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか
ndash 複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません
6 視覚的分析を求めているndash 人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます
ndash まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです
ndash それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります
7 すでに一部で使用しているndash 全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています
ndash 才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています
ndash その結果独自のセルフサービスBIを採用するケースが多く見見られます
ndash ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です
1413
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い1 複雑すぎるスタート
ndash 野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です
ndash 「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します
2 誰も理理解できない指標を使用するndash あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか
ndash あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません
ndash 指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります
3 重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします
ndash こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください
4 複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash 従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト
が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください
1513
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い
5 ダッシュボードの作成と維持のための時間とリソースを過小評価するndash ダッシュボードの展開は1回で終わる作業ではありません
ndash 指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください
6 指標と目標が一致しないndash ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない
ダッシュボードを作成してしまうことのないようにします
7 効果的でないデザインの悪いグラフやチャートを使うndash グラフやチャートをデザインする際は気をつける必要があります
ndash たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません
ndash 優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください
1613
Copyright copy2014 Treasure Data All Rights Reserved
2 Tableauの特徴
1713
p4
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に
同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました
特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります
次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか
bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか
bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか
bull BI ソリューションは綿密なスケジュールやシステムの
パフォーマンス低下の場合の回避策に依存していますか
bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか
bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか
bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか
これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます
超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選
図 1 データ ワークフローのあらゆる段階で高速化
これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の
分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は
10 ~ 100 倍高速です
Install Access Analyze Publish Share
10 X 100 TIMES FASTER
p14
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI
Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます
VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です
ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo
China Eastern Airlines 社ネットワーキングおよび収益部門上級管理
者James Pu 氏
しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か
して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます
Databases Cubes Spreadsheets Hadoop amp More
In-Memory Data Live Connection
PC Browser iPad AndroidDesktop
図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する
ためにインメモリとライブ接続という 2 つの方法が用意されて
います
最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒a Tableau Desktop
bull 考える速さで分析するndash データに接続しコードを1行行も書かずにクエリを実行行できます
ndash ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ
れています
ndash Windows Macemsp 両対応(ver 82)
ndash Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます
1813
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒b Tableau Reader
bull Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです
bull Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です
bull 作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です
bull 作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です
bull Window Mac 両対応
1913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題
1 上層部から分析を要求されているndash 幹部チームからもっとデータ主導型企業になるよう要求されているけれども具体的な施策が見つからない
2 大量量のレポートの要求を受け続けているndash 終わらないまま毎日増え続けるリストにうんざりしお手上げ状態である
ndash 優秀な分析チームも最善を尽くし少なくともリクエストに優先順位を付けて作業することは可能ですがその場合は優先度度の高いものだけが処理理されその他のものは手つかずに終わる可能性があります
3 レポートを提出することでさらに必要なレポートが増えていくndash レポートの作成前に必要な内容をすべて確認したにもかかわらずフォローアップの質問は途切切れることがありません
ndash あなたのレポート内容に人々が惹きつけられたということでもありますがその後の度度重なる質問に回答するため再度度チーム内に聞いて回っていては 非効率率率的です
4 データが古いことにフラストレーションを感じているndash レポートを要求しレポートを待ちそのレポートに 関する質問を投げかけるというサイクルで避けられない問題の 1
つにデータが最新でなくなるという点があります
ndash ビジネスにおいてもプライベートにおいても現代の世界では「すぐに満足感を得たい」という風潮がありますこのように待ち時間が多くてはその期待には応えられません
1313
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題5 マッシュアップしたデータを要求される
ndash 実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか
ndash 複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません
6 視覚的分析を求めているndash 人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます
ndash まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです
ndash それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります
7 すでに一部で使用しているndash 全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています
ndash 才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています
ndash その結果独自のセルフサービスBIを採用するケースが多く見見られます
ndash ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です
1413
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い1 複雑すぎるスタート
ndash 野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です
ndash 「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します
2 誰も理理解できない指標を使用するndash あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか
ndash あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません
ndash 指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります
3 重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします
ndash こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください
4 複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash 従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト
が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください
1513
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い
5 ダッシュボードの作成と維持のための時間とリソースを過小評価するndash ダッシュボードの展開は1回で終わる作業ではありません
ndash 指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください
6 指標と目標が一致しないndash ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない
ダッシュボードを作成してしまうことのないようにします
7 効果的でないデザインの悪いグラフやチャートを使うndash グラフやチャートをデザインする際は気をつける必要があります
ndash たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません
ndash 優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください
1613
Copyright copy2014 Treasure Data All Rights Reserved
2 Tableauの特徴
1713
p4
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に
同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました
特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります
次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか
bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか
bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか
bull BI ソリューションは綿密なスケジュールやシステムの
パフォーマンス低下の場合の回避策に依存していますか
bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか
bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか
bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか
これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます
超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選
図 1 データ ワークフローのあらゆる段階で高速化
これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の
分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は
10 ~ 100 倍高速です
Install Access Analyze Publish Share
10 X 100 TIMES FASTER
p14
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI
Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます
VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です
ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo
China Eastern Airlines 社ネットワーキングおよび収益部門上級管理
者James Pu 氏
しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か
して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます
Databases Cubes Spreadsheets Hadoop amp More
In-Memory Data Live Connection
PC Browser iPad AndroidDesktop
図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する
ためにインメモリとライブ接続という 2 つの方法が用意されて
います
最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒a Tableau Desktop
bull 考える速さで分析するndash データに接続しコードを1行行も書かずにクエリを実行行できます
ndash ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ
れています
ndash Windows Macemsp 両対応(ver 82)
ndash Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます
1813
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒b Tableau Reader
bull Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです
bull Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です
bull 作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です
bull 作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です
bull Window Mac 両対応
1913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
2 ビジネスが抱える課題5 マッシュアップしたデータを要求される
ndash 実際に「マッシュアップ」という単語が使われていないかもしれませんが「サードパーティのデータも追加してくれないか」 「Excel ファイルに大量量のデータがあるがそれがこれとどう関係しているのかが見見たい」など要求されていませんか
ndash 複数のデータソースを組み合わせることの有用性は分かっていても一元管理理された BI チームでこのような調整を行行うのは容易易ではありません
6 視覚的分析を求めているndash 人間は行行や列列表を見見 る よりも分かりやすい視覚的な形でデータを見見た方が多くの情報を認識識できます
ndash まだ視覚的データを要求されてい なくても近いうちに要求されるようになるはずです
ndash それ がセルフサービスBIとどう関係するのかデータを様々な形で見見ることができれば疑問に対する新たな視点を求められることがなくなります
7 すでに一部で使用しているndash 全てに当てはまるわけではありませんが多くの企業がすでにセルフサービスBIを独自に採用しています
ndash 才覚のあるビジネスリーダーはチームの処理理能力力の限界を把握し彼らが非常に優秀で優れたプロジェクトを運営できることを認識識しています
ndash その結果独自のセルフサービスBIを採用するケースが多く見見られます
ndash ITリーダーにとって希望の兆しとなるのはその導入によってすばらしい結果が生み出されることでセルフサービス BI の取り組みをサポートする支援者を 得られるという点です
1413
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い1 複雑すぎるスタート
ndash 野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です
ndash 「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します
2 誰も理理解できない指標を使用するndash あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか
ndash あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません
ndash 指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります
3 重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします
ndash こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください
4 複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash 従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト
が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください
1513
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い
5 ダッシュボードの作成と維持のための時間とリソースを過小評価するndash ダッシュボードの展開は1回で終わる作業ではありません
ndash 指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください
6 指標と目標が一致しないndash ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない
ダッシュボードを作成してしまうことのないようにします
7 効果的でないデザインの悪いグラフやチャートを使うndash グラフやチャートをデザインする際は気をつける必要があります
ndash たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません
ndash 優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください
1613
Copyright copy2014 Treasure Data All Rights Reserved
2 Tableauの特徴
1713
p4
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に
同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました
特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります
次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか
bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか
bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか
bull BI ソリューションは綿密なスケジュールやシステムの
パフォーマンス低下の場合の回避策に依存していますか
bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか
bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか
bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか
これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます
超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選
図 1 データ ワークフローのあらゆる段階で高速化
これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の
分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は
10 ~ 100 倍高速です
Install Access Analyze Publish Share
10 X 100 TIMES FASTER
p14
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI
Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます
VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です
ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo
China Eastern Airlines 社ネットワーキングおよび収益部門上級管理
者James Pu 氏
しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か
して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます
Databases Cubes Spreadsheets Hadoop amp More
In-Memory Data Live Connection
PC Browser iPad AndroidDesktop
図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する
ためにインメモリとライブ接続という 2 つの方法が用意されて
います
最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒a Tableau Desktop
bull 考える速さで分析するndash データに接続しコードを1行行も書かずにクエリを実行行できます
ndash ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ
れています
ndash Windows Macemsp 両対応(ver 82)
ndash Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます
1813
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒b Tableau Reader
bull Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです
bull Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です
bull 作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です
bull 作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です
bull Window Mac 両対応
1913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い1 複雑すぎるスタート
ndash 野心的になりすぎてすべてのビジネス課題を網羅羅する詳細すぎるリアルタイムのダッシュボードを作成しユーザーにたくさんの詳細オプションを提供することは簡単です
ndash 「完璧」なダッシュボードを作成するために何週間も何ヶ月も時間を費やさないでくださいその代わり試作品とテスト調整の短いサイクルで作業します
2 誰も理理解できない指標を使用するndash あなたにとってつじつまが合う指標の表示方法やラベル付け方法は他の人にとってもそうでしょうか
ndash あなたは指標を熟知しているので別のものと検証するステップはいらないかもしれません
ndash 指標がダッシュボードの目標をサポートするだけ でなく閲覧者が理理解できるようにする必要があります
3 重要でないグラフィックや分かりにくいウィジェットで乱雑なダッシュボードにするndash ゲージのようなグラフィックやウィジェットでダッシュボードを派手にデザインしすぎないようにします
ndash こうしたものは見見た目は良良いですが迅速かつ簡単に閲覧者に知らせるというダッシュボードの目的が妨げられる場合がありますダッシュボードは見見た目をシンプルに抑えてください
4 複雑なテクノロジーや大きなビジネス インテリジェンス展開プロジェクトを待つndash 従来のビジネス インテリジェンス (BI) の実装は最初の予測よりも長くかかる場合があります従来の BI プロジェクト
が実現するまで待つと何ヶ月も何年年も遅れる場合がありますすぐにダッシュボードを構築して配布できるアプリケーションを使用してください
1513
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い
5 ダッシュボードの作成と維持のための時間とリソースを過小評価するndash ダッシュボードの展開は1回で終わる作業ではありません
ndash 指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください
6 指標と目標が一致しないndash ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない
ダッシュボードを作成してしまうことのないようにします
7 効果的でないデザインの悪いグラフやチャートを使うndash グラフやチャートをデザインする際は気をつける必要があります
ndash たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません
ndash 優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください
1613
Copyright copy2014 Treasure Data All Rights Reserved
2 Tableauの特徴
1713
p4
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に
同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました
特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります
次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか
bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか
bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか
bull BI ソリューションは綿密なスケジュールやシステムの
パフォーマンス低下の場合の回避策に依存していますか
bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか
bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか
bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか
これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます
超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選
図 1 データ ワークフローのあらゆる段階で高速化
これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の
分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は
10 ~ 100 倍高速です
Install Access Analyze Publish Share
10 X 100 TIMES FASTER
p14
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI
Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます
VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です
ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo
China Eastern Airlines 社ネットワーキングおよび収益部門上級管理
者James Pu 氏
しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か
して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます
Databases Cubes Spreadsheets Hadoop amp More
In-Memory Data Live Connection
PC Browser iPad AndroidDesktop
図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する
ためにインメモリとライブ接続という 2 つの方法が用意されて
います
最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒a Tableau Desktop
bull 考える速さで分析するndash データに接続しコードを1行行も書かずにクエリを実行行できます
ndash ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ
れています
ndash Windows Macemsp 両対応(ver 82)
ndash Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます
1813
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒b Tableau Reader
bull Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです
bull Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です
bull 作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です
bull 作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です
bull Window Mac 両対応
1913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
2 回避したい7つの間違い
5 ダッシュボードの作成と維持のための時間とリソースを過小評価するndash ダッシュボードの展開は1回で終わる作業ではありません
ndash 指標に関連性がありデータが最新であるかを閲覧者と確認 することを怠ると誰も使用しなくなります定期的にダッシュボードの実用性を確認してください
6 指標と目標が一致しないndash ダッシュボードは大きな目標に接続するとより強力力になります部署内の主な指標が組織全体としての成功に反映しない
ダッシュボードを作成してしまうことのないようにします
7 効果的でないデザインの悪いグラフやチャートを使うndash グラフやチャートをデザインする際は気をつける必要があります
ndash たとえば3D チャートで閲覧者の理理解が増すことはありません派手な色が解釈の邪魔になることもあります円グラフは値が6つ以上ある場合は特に効果的とは言えません
ndash 優れたビジュアライゼーションのデザインは「6 Tableau Best Practice」を参照してください
1613
Copyright copy2014 Treasure Data All Rights Reserved
2 Tableauの特徴
1713
p4
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に
同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました
特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります
次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか
bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか
bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか
bull BI ソリューションは綿密なスケジュールやシステムの
パフォーマンス低下の場合の回避策に依存していますか
bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか
bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか
bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか
これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます
超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選
図 1 データ ワークフローのあらゆる段階で高速化
これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の
分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は
10 ~ 100 倍高速です
Install Access Analyze Publish Share
10 X 100 TIMES FASTER
p14
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI
Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます
VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です
ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo
China Eastern Airlines 社ネットワーキングおよび収益部門上級管理
者James Pu 氏
しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か
して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます
Databases Cubes Spreadsheets Hadoop amp More
In-Memory Data Live Connection
PC Browser iPad AndroidDesktop
図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する
ためにインメモリとライブ接続という 2 つの方法が用意されて
います
最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒a Tableau Desktop
bull 考える速さで分析するndash データに接続しコードを1行行も書かずにクエリを実行行できます
ndash ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ
れています
ndash Windows Macemsp 両対応(ver 82)
ndash Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます
1813
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒b Tableau Reader
bull Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです
bull Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です
bull 作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です
bull 作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です
bull Window Mac 両対応
1913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
2 Tableauの特徴
1713
p4
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI 二分に満たしていたためです 4700 人以上の従業員用に
同院では Tableau の超高速処理ビジネス インテリジェンス ソリューションを組織全体 (病院研究施設財団法人) に導入しました
特定の人が適切な時間管理のために病院内にいる必要はありません誰もが時間管理を改善したいと考えていますビジネス ユーザーにも IT 部門にも時間節約のニーズがあります超高速処理 BI を導入すれば大規模な BI プロジェクトでも長引くことはなくなりますビジネス ユーザーが実際に使用できる成果物を得られるまで数か月場合によっては数年かかるような事態に陥ることはなくなりますまたExcel でのレポート作成と共有という不便な環境を強いられることもなくなります
次のいずれかの質問に当てはまる場合既存の BI システムは想定された速度で機能していない bull ビジネス インテリジェンス ソリューションの導入または変更に数週間から数か月かかりますか
bull レポートやダッシュボードの作成または変更に IT 部門への依頼が必要でありIT 部門による対応待ちや未処理の状態になったりしますか
bull BI ソリューションでは新しいユーザーが初めてダッシュボードまたはレポートを作成してパブリッシュできるようになるまでトレーニングに数日または数週間かかりますか
bull BI ソリューションは綿密なスケジュールやシステムの
パフォーマンス低下の場合の回避策に依存していますか
bull 企業のデータ ウェアハウスや高速データベースに多額の投資を行っていてもBI ソリューションによりデータの複製が必要になりますか
bull BI ソリューションでは統合前の特殊な作業を行わないとデータにアクセスできませんか
bull リレーショナル データベース以外に保存されている生データや非構造化データを含め複数のソースからのデータをブレンドできることに制約はありませんか
これまでのビジネス インテリジェンス ソフトウェアは導入に時間がかかります購入に数か月実装に数か月以上かかりますユーザーのトレーニングには数週間かかり高いコストもかかります開発者はビジネス ユーザーに要望を聞きその結果を持ち帰ってレポートを作成します変更の反映には何度かの確認とやり直しを経て数週間かかります2 つのデータ ソースを組み合わせるためにITはそれらの両方を収容する新しいデータ リポジトリを構築する必要がありますその後開発者は再びレポート作成のプログラミングに取り組みますこれでは導入プロセス全体が大幅に停滞しているように感じられます
超高速処理ビジネス インテリジェンスの場合と比べてみましょうこの場合まずトライアル版ソフトウェアをダウンロードしてインストールしますスプレッドシートやリレーショナル データベースからキューブHadoop などに至るまであらゆる種類のデータにアクセスしますこの操作はワンクリックで可能です高速データ ストアにライブ接続するか抽出データを高速データ エンジンにインポートするかを選
図 1 データ ワークフローのあらゆる段階で高速化
これまでのビジネス インテリジェンスと比べて超高速処理分析ではソフトウェアのインストールからデータへのアクセス複雑な情報の
分析インタラクティブなダッシュボードのパブリッシュ組織全体での共有に至るまでワークフローのあらゆる段階でその処理速度は
10 ~ 100 倍高速です
Install Access Analyze Publish Share
10 X 100 TIMES FASTER
p14
ビジネス インテリジェンスへの新しいアプローチ 超高速処理 BI
Tableau 超高速処理ビジネス インテリジェンスの背景テクノロジー超高速処理ビジネス インテリジェンスを文字どおり超高速にしている要因は何でしょうかそれは VizQLtrade ですTableau のこの特許取得済みのクエリ言語により簡単なドラッグ アンド ドロップ操作であらゆる規模トピック形式のデータを視覚化できますVizQL はユーザーによる操作をデータベース クエリに変換した後その応答をグラフィカルに表現しますその結果新しいデータベースおよびスプレッドシートのまったく新しい操作方法が生まれました視覚化計算がサポートされているためインタラクティブな質問と回答を通じてデータのさまざまなビューを繰り返し生成することができます
VizQL に続く超高速処理ビジネス インテリジェンスの次の画期的なテクノロジーはTableau のダイレクト接続 amp クエリ機能を使用して既存のデータベースに高速にアクセスして活用できるというものでしたビッグデータを含めほぼすべてのデータ ソースに対して最適化されたコネクタを使用することでTableau では専門知識を必要とせずにライブ データ ソースへのクエリと接続が可能です
ldquoTableau を使用して昨年度は収益が 2 増加しましたこれは 2 億米ドルに相当します航空または運送業界で収益を挙げたいと考えるならばTableau の使用をお勧めしますrdquo
China Eastern Airlines 社ネットワーキングおよび収益部門上級管理
者James Pu 氏
しかしTableau の進化はまだ続きますライブ データ ソースに接続できないときや接続したくないときのためにTableau にはビルトイン データ エンジンを使用して数百万行のデータのアド ホック分析を数秒で実行できる機能が用意されていますTableau のビルトイン データ エンジンは膨大なデータの高速処理が可能であるためビュー間を簡単に切り替えて意味のある傾向や外れ値を検出できますデータ エンジンは PC 上で動作する高性能のインメモリ分析データベースですデータ エンジンにより低速のデータ ソースを高速化できますさらにその速度を活か
して高速のデータ ストアに直接接続することもできますもちろんこれらの 2 つのデータ アクセス方式 (ライブ接続とインメモリ) の間には完全な互換性がありますアクセス方式がライブ接続かインメモリかにかかわらず複数のデータ ソースをブレンドし組み合わせることができます
Databases Cubes Spreadsheets Hadoop amp More
In-Memory Data Live Connection
PC Browser iPad AndroidDesktop
図 10 Tableau アーキテクチャTableau のアーキテクチャには膨大なデータ ソースに対応する
ためにインメモリとライブ接続という 2 つの方法が用意されて
います
最後に 結論企業や公共機関がビジネス インテリジェンスに求めるものには大きな変化が生じていますこれまでの BI の処理は低速で膨大なリソースが必要ですたとえばSeattle Childrenrsquos Hospital に家族が病気の子供を 連れて行くとしましょう家族は一刻も早く子供を診察してもらいたいと思うでしょう速度の重要性は病院に限られることではありません競争の激しい市場では企業は販売促進やコスト削減のために数か月も待つことはできませんたとえばM Financial Group 社は競合他社より勝るペースで北米で最も認知度と評価度の高い保険ブランドの 2000 万米ドルを超える有標製品を発売しましたTableau を使用して私は膨大なデータ セットをドリルダウンしすぐにリレーシ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
uarr 導入から分析共有までのサイクルが10〜~100倍速いです larrあらゆるデータソース(インプット)あらゆる端末(アウトプット)をTableauが繋ぎます darrTableau Desktop で作成したレポートをすぐにパブリックにできます
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒a Tableau Desktop
bull 考える速さで分析するndash データに接続しコードを1行行も書かずにクエリを実行行できます
ndash ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ
れています
ndash Windows Macemsp 両対応(ver 82)
ndash Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます
1813
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒b Tableau Reader
bull Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです
bull Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です
bull 作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です
bull 作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です
bull Window Mac 両対応
1913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒a Tableau Desktop
bull 考える速さで分析するndash データに接続しコードを1行行も書かずにクエリを実行行できます
ndash ドラッグアンドドロップを使用したビュー間の直感に沿った移動が可能ですndash ペタバイト単位または何十億行行ものデータを測定するかどうかに関わらずTableau は可能な限り高速に動作するように構築さ
れています
ndash Windows Macemsp 両対応(ver 82)
ndash Tablesu Desktop のインプットソースとして無尽蔵の Treasure ストレージを選択可能ビッグデータをマウスでアドホックに扱えます
1813
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒b Tableau Reader
bull Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです
bull Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です
bull 作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です
bull 作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です
bull Window Mac 両対応
1913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒b Tableau Reader
bull Tableau Reader はTableau Desktopで作成したビジュアライゼーションを開いて表示できる無料料のデスクトップアプリケーションです
bull Tableau Reader ではデータを含むTableau Desktopで作成したビジュアライゼーションを開いて操作可能です
bull 作成者の許可の範囲内であればデータをフィルタードリルダウン表示が可能です
bull 作成者によって組み込まれていない場合は操作を編集したり実行行したりすることは不不可能です
bull Window Mac 両対応
1913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒c Tableau Server
bull 作成したダッシュボードをWEBアプリ化する事でどこからでもどのデバイスでも分析出来るようになります
bull データソースへの接続を Tableau Server に集約することによりデータの共有データマートとしての利利用が可能になります
2013
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
2-‐‑‒d Tableau Public
bull 導入利利用は無料料です
bull 接続出来るデータの種類に制限されます
bull EXCELテキスト等接続データソースに制限です
bull 利利用出来る行行数データサイズに(100万行行1GB)制約があります
bull 一般公開を前提としたサービスです
2113
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
2213
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2313
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2413
ディメンションbull 定性的な情報やカテゴリ情報を含むフィール
ドを『ディメンション』として扱います
bull テキストや日付の値を持つフィールドもこれらに含まれます
bull 行行または列列の棚にドラッグドロップをする事でヘッダを生成します
メジャーbull 行行または列列の棚にドラッグドロップを行行う
と『軸』を生成します
bull デフォルトでは数値(定量量的)情報を含む任意のフィールドを『メジャー』として扱います
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2513
フィルタ
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2613
マーク gt カラー
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3 画面構成
2713
マーク gt サイズ マーク gt ラベル
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a テキストテーブル(text tables)b ヒートマップ(heat maps)c ハイライトテーブル(highlight tables)d 記号マップ(symbol maps)e 色塗りマップ(filled maps)f 円グラフ(pie charts)g 水平棒グラフ(horizontal bars)h 積み上げ棒グラフ(stacked bars)i 並列列棒グラフ(side-‐‑‒by-‐‑‒side bars)j ツリーマップ(tree maps)k 円ビュー(circle views)l 並列列円(side-‐‑‒by-‐‑‒side circles)
2813
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3 Show Me(表示形式)
a 線グラフ連続(lines continuous)b 線グラフ不不連続(lines discrete)c 二重線(dual lines)d エリアチャート連続(area charts continuous)e エリアチャート不不連続(area charts discrete)f 2つの組み合わせ(dual combination)g 散布図(scatter plots)h ヒストグラム(histgram)i 箱ヒゲ図(box-‐‑‒and-‐‑‒whisker plot)j ガントビュー(gantt view)k ブレットグラフ(bullet graphs)l パックバブル(packed bubbles)
2913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒1 Show Me gt 棒グラフ
bull ひと目で最高値と最低値を見見ることができます
bull 棒グラフはさまざまなカテゴリーにうまく分けられる数値データには特に便便利利でデータの傾向を簡単に表すことができます
bull 例例各サイズのシャツの数量量発信元サイトごとのWeb トラフィック部門ごとの支出の割合などのカテゴリ間比較
bull 応用例例ndash 1つのダッシュボードに複数の棒グラフを使用多数のス
プレッドシートやスライドをめくる代わりに関連情報を簡単に比較することができ疑問への答えを見見つけやすくなります
ndash 棒に色を付けてインパクトを強める収益を棒グラフにするとわかりやすくなりますがさらに利利益に応じた色を重ねることで瞬時に情報が得られます
ndash 積み上げ棒グラフや並列列バーを使用関連するデータを重ねてまたは横並びに表示することで分析に奥行行きを与えることができ複数の疑問への答えを一度度に見見つけることが可能です
ndash 棒グラフとマップを組み合わせマップを「フィルター」として設定することで異異な る地域をクリックするごとに対応する棒グラフを表示するようにできます
ndash バーを軸の両サイドに連続軸に沿って正の数と負の数をプロットすると傾向を把握しやすくなります
3013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒2 Show Me gt 折れ線グラフ
bull 折れ線グラフは個々の数値データ ポイントを「線」で結びます
bull それにより値の連続性をわかりやすく視覚化することが可能です
bull 主に一定期間にわたる傾向を表す際に使用します
bull 応用例例ndash 折れ線グラフと棒グラフを組み併せ特定の株価の1日あ
たりの売上高を示す棒グラフとそれに対応する株価の折れ線グラフを組み合わせることで詳細に調査するための視覚的なキューを表すことができます
ndash 線の下のエリアに影を付ける2 つ以上の折れ線グラフがある場合それぞれの線の下の領領域を塗りつぶすことで面グラフを作成できますこれによりそれぞれの線が全体 に与える相対的な貢献度度を表すことができます
3113
7HFKHDGVampDSLWDO5DLVHGLQ
Jan 1 Mar 1 May 1 Jul 1 Sep 1 Nov 1 Jan 1
$0
$5000
$10000
$15000
$20000
$25000
$30000
$35000
Run
ning
Sum
of O
ffer A
mou
nt (i
n m
il)
7HFKQRORJ
(QHUJ
+HDOWKampDUH
ampRQVXPHU
XVLQHVV6HUYLFHV5HDO(VWDWH
6HOHFWDQLQGXVWUWRYLHZLQGLYLGXDOFRPSDQLHV
ampOLFNKHUHWRFOHDUILOWHU
5XQQLQJ7RWDORIampDSLWDO5DLVHGEQGXVWULQHVFHQGLQJ2UGHU
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒3 Show Me gt 円グラフ
bull 円グラフは情報の相対比率率率を表す際に使用すます用途はこれだけです
bull 円グラフは最も誤用されやすいグラフです
bull データを比較する場合は棒グラフや積み上げ棒グラフを使用するようにします
bull 円の扇形を関連データとして解釈したり1つの円を別の円と比較したりしないように
bull 例例比率率率を表す
bull 応用例ndash 円の扇形を6つまでに制限します比率率率が6つ以上ある場
合は棒グラフを使用してください扇形の数が多すぎるとグラフの内容が伝わりにくくなります
ndash 円をマップに重ねます データの地理理的な傾向を円グラフで表すこともできますこのテクニックを使用する場合はわかりやすくするために使用する扇形の数を 2〜~3 個にします
3213
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒4 Show Me gt マップ
bull 郵便便番号州名の省省略略形国名カスタムジオコーディングなど地理理的なデータを扱う場合はデータをマップ上に表示する必要があります
bull 例例州別の保険金金請求国別の製品輸出先郵便便番号別の交通事故数カスタムの販売地域
bull 応用例例ndash マップを他の種類のチャートグラフ表のフィルターと
して使用します他の関連データとマップを組み合わせてマップをフィルターとして使用してデータを掘り下げることでデータについてより詳しく検証ディスカッションできます
ndash マップの上にバブル チャートを重ねます バブル チャートはデータの集中を表しそれぞれ異異なるサイズから関連データを簡単に把握できるようになりますマップの上にバブルを 重ねることとで異異なるデータ ポイントの地理理的な影響をすばやく解釈できます
3313
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒5 Show Me gt 散布図
bull 一部のデータをもう少し掘り下げたいのにやり方がいまひとつわからないまたは他の情報 が関連しているかわからない場合は散布図を使用すると傾向や集中外れ値を効果的に把握できさらに詳細に調査すべき対象を示してくれます
bull 例例さまざまな年年齢における肺がんの男女女別発生率率率テクノロジーを先駆けて採用する人とそうでない人のスマートフォンの購入パターン製品カテゴリー別の異異なる地域への送料料
bull 応用例 ndash 傾向線最良良適合線を追加します データの相関性に傾向
線を追加すると結果がより明瞭になります
ndash フィルターを組み込む 散布図にフィルターを追加するとさまざまなビューや詳細をド リルダウンすることができデータのパターンを素早く特定することができます
ndash 情報を与えるマーク タイプを使用します 関連する図形を使用することでデータに隠さ れた背景が見見えやすくなります
3413
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒6 Show Me gt ガントチャート
bull ガントチャートはプロジェクトの開始日と終了了日の要素を表すのに優れています納期を守ることがプロジェクト成功の要になりますそれには達成すべき事柄とその時期を把握することが必要ですそこでガント チャートの出番です
bull プロジェクト管理理にガントチャートを使用するケースは多く見見られますがガントチャートでは従業員や機材などの他の要素が時間とともにどのように変化するのかを知ることもできます例えば従業員が特定のマイルストーン (資格など) を達成するまでの期間や時間と共にそれがどのように変化したかなど人材計画を立立てる際にもガント チャートを役立立てることができます
bull 応用例ndash 色を追加するガント チャート内のバーの色を変えるこ
とで変数の重要側面をすばやく 伝えることができますndash マップや他の種類のチャートをガントチャートと組み合わ
せるダッシュボードにガント チャ ートと他の種類のチャートを含めることでフィルターやドリルダウンが可能になりより多くの 情報を引き出すことができます
3513
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒7 Show Me gt バブルチャート
bull バブルチャート自体はビジュアライゼーションの種類ではなく散布図やマップ上のデータを強調するためのテクニックと考えてください
bull 様々な大きさの円によってデータの意味を表現できるためバブルチャートは魅力力的な方法で す
bull 例例製品別地理理別の売上の集中学部や時間 帯ごとの授業の出席率率率
bull 応用例ndash 散布図のデータを強調する 各データ ポイントのサイズ
や色を変えることで散布図をひ と目でさまざまな疑問に答える豊かなビジュアライゼーションにできます
ndash マップに重ねるバブルによってデータの相対的な集中を瞬時に伝えることができます バブルをマップのオーバーレイとして使用すると地理理的に関連するデータがすばやく効果的に伝わります
3613
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒8 Show Me gt ヒストグラムbull ヒストグラムはグループ間でのデータの分散を表示
する場合に使用しますたとえば100 個のかぼちゃがあり重量量が 1 キロ以下だと何個になるのか15~sim2 キロ25~sim45 キロだと何個になるのかを表示する場合などです
bull データをこうしたカテゴリーにグループ化し軸に沿った垂直バーにプロットすることでかぼちゃの重量量と数の分布を見見ることができます
bull データに適した分類方法を決める必要がない場合もありますヒストグラムを使用してさまざ まな方法を試しながら現在の分析に規模や関連性が適しているグループを作成できます
bull 例例ndash データのグループ化をテストする データに合ったグ
ループや「ビン」を模索索している場合さまざまなヒストグラムを作成することで最も適したデータ セットを探し出すことがで きます
ndash フィルターを追加するデータの異異なるカテゴリーをドリルダウンできるようにすることでヒストグラムは大量量のデータ ビューをすばやく探索索できる便便利利なツールになります
3713
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒9 Show Me gt ブレットグラフbull 目標がある場合その目標までの進行行状況を追跡するにはブレッ
トグラフが適しています
bull 本質的にはブレット グラフは棒グラフの一種でダッシュボードのゲージメーターサーモメーターを置き換えるために開発されましたその理理由は通常ゲージなどの画像には十分な情報が表示されず貴重なダッシュボードのスペースを必要としていたためです
bull ブレットグラフは定義済みのパフォーマンスメトリクス (営業ノルマなど) のコンテキストでプライマリメジャー (過去1年年間の売上など) を 1 つ以上の他のメジャー (年年間売上目標) と 比較する場合に使用します
bull ブレット グラフでは全体的な目標に照らし合わせたプライマリ メ ジャーのパフォーマンスを瞬時に見見ることができます (営業担当の年年間ノルマ達成まであとど れくらいかなど)
bull 例例目標と照らし合わせた指標のパフォーマンス評価 営業ノルマの評価予算と実際 の支出業績の分布 (良良い普通悪い)
bull 応用例例ndash 色を使用して達成のしきい値を示すプライマリメジャーの背景に赤
黄色緑などの色 を使用すると目標に対するパフォーマンスの状況をすばやく把握できます
ndash 概要情報としてブレット グラフをダッシュボードに追加する ブレット グラフを他の種類 のグラフと組み合わせてダッシュボードに組み込むことで目標達成のために注目すべき 内容を伝えやすくなり生産的なディスカッションに導くことができます
3813
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒10 Show Me gt ヒートマップ
bull ヒートマップは色を使用して2つのカテゴリー間でデータを比較する有効な方法ですカテ ゴリー間の共通部分での長所と短所をすばやく伝えることができます
bull 例例2つの要因の関係性を示す対象市場におけるセグメンテーション分析地域全体の製品導入営業担当ごとのセールスリード
bull 応用例ndash 四角形のサイズを変えますヒート マップでは四角形
のサイズにバリエーションを持たせ ることで交差する 2 つの要因の集中を見見ることができますが3つ目の要素を追加することになりますたとえばヒートマップでアンケート回答者が好むスポーツとイベントに参加する頻度度を色で示し四角形の大きさに各カテゴリーの回答者数を反映させることができます
ndash 四角形以外を使用する 別の形のマークを使用した方がデータをよりインパクトある形 で伝えられることがあります
3913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒11 Show Me gt ハイライト表
bull ハイライト表はヒート マップをさらに進化させたものです色を使用してデータの交わりを示 す以外にハイライト表では数値を使用して詳細情報を追加できます
bull 例例ヒート マップの詳細情報を提供する部門別の市場占有率率率特定の地域における 営業担当者ごとの売上各年年の都市の人口
bull 応用例例ndash ハイライト表を他の種類のチャートと組み合わせる たと
えば折れ線グラフとハイライ ト表を組み合わせると全体的な傾向を見見ながらデータの特定の交差点をすばやくドリル ダウンできるようになります
4013
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒12 Show Me gt ツリーマップbull データを見見て全体と各要素との関係をひと目で知りたい場合は
ツリーマップが適していま すこのチャートでは他の四角形の中にネストされた一連の四角形を使用して階層化された データを全体を占める割合で表します
bull チャートの名前にもあるようにデータを木のように関連するものとみなします
bull それぞれの枝が四角形で表されておりそれがどれくらいのデータで構成されているかを示します各四角形は全体を占める割合に基づいてさらに小さな四角形 (または小枝) に分けられます
bull 四角形の大きさと色から異異なるカテゴリー間でも特定の項目が関連しているかどうかなどデータのさまざまな部分からパターンを見見出すことができます
bull またスペースを有効に活用することがで きるためデータ全体をひと目で見見ることができます
bull 例全体を占める割合として階層データを示す コンピューター間のストレージ使用率率率 テクニカル サポート ケースの数と優先度度の管理理各年年の年年度度予算の比較
bull 応用例ndash カテゴリーごとに四角形に色を付けてどのように階層的に構造化されて
いるか表示する
ndash ツリー マップと棒グラフを組み合わせるTableauでは行行に別のディメンションを置くと棒グラフのそれぞれのバーもツリーマップになりますこれによりバーの長さからアイ テムをすばやく比較することができ同時に各バーの比率率率的な関係性も見見ることができます
4113
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
3-‐‑‒13 Show Me gt 箱ひげ図
bull 箱髭図(ボックスプロット)はデータの分布を示すのに有効ですこの名前はプロットの 2 つのパートを指しています「箱」にはデータの中央値と第 1 四分位数および第 3 四分位数 ( 中央値より 25 以上および 25 以下) が含まれ「髭」は通常四分位範囲 (IQR) (第 1 四分 位数と第 3 四分位数の差分) の 15 倍内のデータを表します
bull また髭はデータの最大および最小ポイントを示す際にも使用できます
bull 例例一連のデータの分布を示すひと目でデータを理理解するデータがどのように片方に 偏っているかを見見るデータの外れ値を特定する
bull 応用例ndash ボックス内のポイントを非表示にする これにより外れ
値を見見つけやすくなります カテゴリー別ディメンション全体でボックスプロットを比較します
ndash ボックスプロットはデータ セット間で分布をすばやく比較する際に有効です
4213
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
4313
a 一般ユーザー向け画面
b 管理理者向け画面
c データ更更新方法
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step1 Sign In
4413
bull 一般ユーザーの Tableau Server へのアクセス
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step2View
4513
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step3Workbook
4613
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
4 User Step4Contents
4713
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
4 Admin Server Status
4813
bull 管理理ユーザーはサーバーのステータスなどの情報を参照できます
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Pull)
4913
bull Tableau Server 側からの抽出(Pull)ndash 指定したデータソース(Treasure Data Redshift RDShellip)
から定期的にデータを抽出します
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5013
bull Tableau Desktop 側からのパブリッシュndash Tableau Desktop よりワークシートをパブリッシュ
Create Publish
Tableau Desktop Tableau Server
PC Browser Android
iPad
Access amp Edit
Desktop
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
4 抽出とスケジュール(Push)
5113
bull Treasure Service からのリザルト書き出しndash Tableau Console よりジョブの結果を Tableau Server に
プッシュできます
Scheduled Query
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
5213
1 Treasure バッチクエリ times Tableau Server
2 Treasure アドホッククエリ times Tableau Desktop
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
5Treasure times Tableau
5313
(分析のPDCAに必要な2つの分析エンジンを両方とも提供)
Check(効果測定)
Plan(施策設計)
Do(施策実行行)
Act(原因探索索)
バッチ型分析
+
KPIダッシュボード
チューニング済Hadoop大量量データが得意
KPI
定義済指標の最新データ表示メンバー全員で共有
アドホック型分析
+
BIツール 統計ツール
Treasure Query Accelerator非常に高速
任意の軸でアドホックに分析原因の可視化
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
5バッチクエリ times Tableau Server
5413
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
c Direct TableauServer
全件データ
バッチ Result Push
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Tableau Server 上のソースデータを更更新
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
5アドホッククエリ times Tableau Desktop
5513
小さい CSVTSV
CRM
ERP
RDBMS
POS
センサー
WebログAppログ
スマフォAppログ
Treasure Agent
iOS Android SDK
TD Toolbelt
Web Browser
Streaming
Mobile
Legacy
Trial
データ収集 データ分析 データ保管
Direct BIツール等
Tableau
全件データ
データマート バッチ アドホック JDBCODBC
REST API
アドホック
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
アジェンダ
1 BI Data Visualization に関するトレンド
2 Tableau 製品群紹介
3 Tableau Desktop 紹介
4 Tableau Server 紹介
5 Tableau times Treasure Data
6 Tableau テクニック集
5613
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
6 Tableau テクニック集
1 質問に答えるグラフを描く2 経時的な傾向3 比較とランク付け4 相関性5 分布6 一部と全体の関係7 最重要データの強調8 読みやすいビューの作成9 ビューの整理理10 ビューへの過剰な負荷の回避11 1つのビューで表示する色と形状の数を制限
5713
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒1 質問に答えるグラフを描く
5813
bull 例例えばIPO 投資に注目している株式ブローカーに対して投資先の決定に役立立つビジ ュアライゼーションを作成するとします
bull 「IPO の利利益性は株価の推移に影響を与えますか」というような質問をすることで右図のようなビューを作成できるでしょう
bull このビューからIPOでの利利益がその後の株価の推移に大きく影響することがわかります
bull しかしこのデータセットには過去30 年年にわたるすべてのソフトウェア会社の IPOについての情報が含まれています
bull このビューから見見つけた傾向が果たしてその期間ずっと変わらないのか疑問に感じることでしょう2つめのビューを見見るとその疑問が解消します
bull このビューを見見ると傾向は 1990 年年代にのみ該当することがわかります さらに2 つの点が明らかになります
bull emsp 1) 1980 年年代ではすべての会社が IPO で利利益を生みbull emsp 2) 2000 年年代では IPO での利利益は株価の推移にさほど影響を与えていません
bull これはつまり最近の投資家は前任者よりもリスク受容型であることを意味しませんかまたはIPOで利利益がなかった会社も利利益のあった会社と同様に将来性があるということではないでしょうか
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒2 経時的な傾向
5913
bull データの分析でもっとも頻繁に用いられる方法の 1つに経時的な傾向の追跡がありま す 右の例例でベンチャーファイナンスファンドの流流れの中でのセクター別の経時的な傾向を見見てみましょう
bull 今までの経験から経時的な傾向を示すのに最適なビジュアライゼ ーションは折れ線グラフ面グラフ棒グラフです
bull また経過時間を X 軸にメジャーを Y 軸に設定すると傾向に関する文化的な慣例例に合わせたビューを作成できます
bull まず以下に示す折れ線グラフを見見てみましょう X 軸に年年をY 軸には資金金調達額をそれぞれ設定しセクタータイプを色でエンコードします
bull このビューからすべてのセクターの資金金調達における傾向が時間の経過とともにその後も同じように続くことがわかります
bull また個々のセクターの傾向と各セクター間における傾向の違いもわかります 全体的な資金金調達の傾向についてはどうでしょうか 2000 年年もしくは他の任意の時点におい てすべてのセクターにいくらの資金金調達があったか正確な数値はわかりますか
bull 答えは No です折れ線グラフにはその機能はありません bull その質問に対する回答が必要な場合は以下のような面グラフや棒グラフで調べることができます
bull これらのグラフ はどちらも時間の経過に伴う資金金調達の傾向と期間全体を通した個々のセクターの貢献度度について詳細に述べているという点で優れています
bull しかしこの2つには次のよ な違いがあります面グラフは各セクターを 1 つのパターンとし棒グラフでは各年年を 1 つのパターンとしています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒3 比較とランク付け
6013
bull データ分析の別の手法に比較とランク付けがありますbull 国や地域事業区分営業担当者スポーツ プレーヤーなどを 1 つまたは複数の条件に基づいて比較したりランク付けすることがあります
bull 多くの場合これで方向性や業績などがわかりますbull 棒グラフは 定量量的な値を 1 つのベースライン上での長さとしてエンコードすることによってとても簡 単に値を比較することができるため比較とランク付けに非常に適しています
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒4 相関性
6113
bull 世間ではよくメジャーの間の関係性を見見つけようとしますそれはデータ分析で常に行行なわれていることです
bull 喫煙は発ガンの原因になるのか製品の価格は販売数に影響を与えるのか 外気温と増加しているボート遊びには関係があるのか政府の刺刺激策は新たな 雇用を生み出すのか
bull メジャー間の関係性を認識識するにはまず簡単な相関性の分析を行行うことから始めるとよいでしょう ただし相関性は必ずしも関係性を保証するものではありません 相関性は 関係性の可能性を示唆するくらいの意味合いと捉えてください 関係性が確かに存在す ると立立証するにはより洗練された手法が必要になることがあります
bull ここに簡単な散布図を作成して 2 つの要素の間の関係性を見見出す例例を示します
bull データは惣菜の卸売業者にに関するものです Y 軸には販売価格をX
軸には販売数をそれぞれ設定し月別の売上高を詳細に取り込んでいます
bull 図を見見ると (特に傾向線を加 えた際に)販売価格と販売数のマイナスの相関性があることがわかります 価格が高ければ販売数が減り逆もまた然りです
bull これは売上高を上げるには販売価格を下げるべきということでしょうか必ずしもそうとは限りません 図の中で純利利益を円の大きさで表しているのを見見ると両端で大きな利利益が上がっていることがわかります
bull ほかのタイプのグラフはどうでしょうか 同じような結果を示すことができているでしょうかこの例例では2 つの折れ線グラフと棒グラフを組み合わせています 販売価格と販売数の傾向線を上の方に並べて表示することでビューアーが 2 つの傾向の比較に注目 するように促すことができます 明らかにマイナスの相関性があることがわかりますね
bull また下の方にある純利利益の棒グラフからは相関性の分析が妨げられることなく 意思決定を行行うための情報を得ることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒5 分布
6213
bull 分布の分析はデータ分析に特に便便利利ですすべての定量量的範囲にわたって定量量値がどの ように分布しているかがすぐにわかるからです
bull たとえば病院で患者の治療療時間の分布について調べるとします この場合どのタイプのグラフが最適でしょうか 適したグラフはいくつかありますがこのような目的によく使われる 2 つのタイプのグラフについて 取り上げます 1 つは箱髭図もう 1 つはヒストグラムです
bull 箱髭図は複数の分布を表示するのに優れていますすべてのデータポイント (この場合は 患者 1 人あたりの時間(分)) を 1 つの箱髭図にまとめています (下の図を参照) この図 ではすべてのカテゴリの最小値25 パーセンタイル値中央値75 パーセンタイル値最 大値を一度度に簡単に把握することができます
bull この箱髭図からわかるのはEmergent (緊 急) と Non-‐‑‒Urgent (急を要さない) のカテゴリの箱が他と比べて大きくそのカテゴリの患者間で治療療時間の長さが大きく異異なるということです
bull その理理由は 患者の中に緊急として病院に来たが緊急ではないと判断された人がいたからでしょうか 患者の抱えている問 題は人によって様々であるため受ける治療療も人によって異異なるからでしょうか それとも 緊急治療療室にいる医師によって患者を治療療する方法が大きく異異なるからでしょうか
bull 分布を表示するもう 1 つの方法にヒストグラムがあります患者の緊急度度のカテゴリ別に データを分けカテゴリごとに患者 1 人あたりの治療療時間を図に示す代わりにヒストグラ ムではデータを時間区分 (またはビン) でデータを分けてその区分ごとの患者数を記載します
bull このグラフからピークの (つまりもっとも一般的な) 治療療時間が 70 分であることが わかります 棒グラフの色によって緊急度度カテゴリ別の患者数の違いも一目瞭然です この結果ほとんどの時間区分にさまざまな緊急度度の患者がいてその中でも「緊急」と「 急を要さない」患者が最も多いことがわかります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒6 一部と全体との関係
6313
bull 一部と全体の間の関係を分析することがありますこのような場合にはよく円グラフが使 われますが次の 2 つの理理由から円グラフはお勧めできません
bull 1) 人の視覚系はパイの見見積もりに不不向きでありbull 2) すぐ隣隣りのパイ同士としか比較できないからですbull たとえば右の図で1 番大きなパイがどれで西部地域における年年齢別の割合がどうなっているかすぐに答えることができますか
bull このような比較を円グラフで行行うのは困難ですでは棒グラフはどうでしょうか右下の図では円グラフと同じデータを合計に対する割合で示した棒グラフで表しています
bull こちらのグラフならさきほどの質問にすぐ答えられるはずです西部地域では25 ~sim 40 歳のグループの割合が最も大きいことがわかります さらにすべての年年齢別グループでの地域間の違いもより簡単に調べることができます
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒7 最重要データの強調
6413
bull グラフの種類によっては複数のメジャーとディメンションを 1 つのビューに設定できるものがあります たとえば散布図ではX 軸と Y 軸のメジャーを設定するほかに色やサイズ形状でマークのメジャーを設定することができます
bull メジャーの設定先は分析の内容や強調したい内容によって変わります 最も重要なデータを X 軸と Y 軸に設定しさほど重要でないデータを色やサイズや形状に設定するのが一般的です
bull 右のビューは住宅宅購入者向けに作成したものですこのビューの目的は住宅宅の販売価格建築面積敷地面積さらに購入者が関心を持つ住宅宅のタイプの関係性をわかりやすくすることにありますこのビューからまず最初にわかる関係性は何でしょうか
bull このビューでは販売価格と敷地面積の関係性がとてもわかりやすくなっています しかしこの情報が果たして住宅宅購入者にとって最も重要な情報なのでしょうかおそらくそ うではないでしょう
bull 販売価格と建築面積の関係性の方が重要なはずです 住宅宅購入者が住宅宅を探すときは敷地面積よりも住みやすい大きさであるかどうかを優先するもので すしたがって右下のようなグラフの方がより効果的なのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒8 読みやすいビューの作成
6513
bull ちょっとした変更更を加えることでビジュアライゼーションをよりわかりやすいものにできることがあります右に示すビューをご覧ください
bull このビューは読みにくいと思いませんか読みにくいのはおそらくすべてのラベルが縦方向に記載されているからですそのためビュー全体が読みにくいものになっています
bull 縦方向にしか表示できないような長いラベルがある場合はビューを回転させてみてください
bull ツールバーボタンの [Swap] (スワップ) を使用すると行行と列列のフィールドを簡単に入れ替えることができます
bull 同じビューで方向を縦から横に変えた例例を以下に示します bull このように少し変更更を加える ことによってグラフが読みやすくなり比較もしやすくなります
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒9 ビューの整理理
6613
bull 営業チームのメンバーを売上高とノルマで比較して評価するとします bull とりあえず2 つのメジャーを横に並べてみますbull その結果のグラフは右のとおりですbull しかしこのビュー から Greg Powell 氏の業績がすぐにわかりますか bull ノルマは達成しているようですがどれほどノルマを上回っているか正確
にはわかりませんbull 横方向の棒グラフが 2つ横に並んでいるためこのような比較がしにく
くなっているのですbull では次のグラフはどうでしょうか売上高とノルマのデータを列列では
なく行行に設定していますそのため売上高の棒とノルマの棒に 1 つのベースラインを作成できるため比較 がとても簡単になります
bull このグラフからGreg Powell 氏はノルマを上回っているもののその額はわずかであることがわかります
bull しかしこれよりもさらに適したビジュアライゼーションタイプがあります それはブレットグラフです
bull このグラフは棒グラフに参照線を組み合わせることで実際の数と目標の数を視覚的に比較できるようになります
bull この例例で言うと実際の数は売上高 (棒)目標の 数はノルマ (縦の参照線) に該当します
bull 営業チームの各メンバーがノルマを達成してい るかどうかが一目でわかるだけでなく参照線を使用することでデータを表す棒の数を半分に減らすこともできるのです
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒10 ビューへの過剰な負荷の回避
6713
bull データのビジュアライゼーションを行行う上でビューに過重に負荷をかけてしまうことは最も起こりがちなミスの 1 つです右のビューをご覧ください
bull インドにおける顧客や部門ごとの売上や利利益に関して何かわかりますか おそらく何もわからないでしょうこのビューに含まれているメジャーやディメンションの数が多すぎるのです
bull 国部門利利益を 1 つのビューに重ねて表示するのではなく複数の小さいグラフに分割するべきです
bull 次に示すビューは関連の情報がすべてわかりやすく表示されていて一 目で理理解できますビジュアライゼーションに従来のクロス集計を組み込むことには大き なメリットがあるという好例例です
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
6-‐‑‒11 1つのビューで使用する色と形状の数を制限
6813
bull 色や形状を効果的に使用するとパターンを簡単に読み取ることができて便便利利です しかし1 つのビューで使用する色と形状の数が多すぎると逆効果になります
bull 右のビューでは24 色が使用されています色と線が混ざり合っていて注文数に関する特定の国のパターンを読み取れないのはもちろんのことどの国がどの線で表されているのかさえ読み取るのはほぼ不不可能です
bull さらに見見分けのつきやすい色の種類が限られているため複数の国が同じ色または似たような色で表示されています
bull 国に色を設定するのではなく部門に色を設定してその違いを見見てみましょう部門ごとの傾向がわかりやすくなりましたね
bull 1つのビューで使用する色と形状の数を7〜~10に制限することでデータを識識別しやすくなり重要なパターンを読み取れるようになります
2010 2011 2012 2013 2014
0
500
1000
1500
2000
Ord
er Q
uant
ity
Alge
Arg
Aus
Aus
Bra
Can
Chi
Egy
Eth
Fiji
Fra
Ger
Gre
Algeria
Argentina
Australia
Austria
Brazil
Canada
Chile
Egypt
Ethiopia
Fiji
France
Germany
Greece
Hong Kong
India
Iraq
Ireland
Israel
Italy
Japan
Kenya
Mexico
Peru
Turkey
2010 2011 2012 2013 2014
0K
1K
2KO
rder
Qua
ntity
HSDUWPHQWFurniture
Office Supplies
Technology
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Copyright copy2014 Treasure Data All Rights Reserved
Q and A
6913
Recommended