18
TIBCO Spotfire チュートリアル

TIBCO Spotfire Desktop チュートリアル6.5

Embed Size (px)

Citation preview

TIBCO Spotfire チュートリアル

ファイルを開いてみましょう。

サンプルファイルを開くインストールが完了しSpotfireが起動出来たら、サンプルファイルを開いてみましょう。

C:¥Users¥ユーザー名¥AppData¥Local¥TIBCO¥Spotfire Desktop¥6.5.1¥Example Data

上記フォルダにいくつかサンプルDXPファイルがあります。Baseballフォルダにある、Baseball.dxpファイルを開いてください。

下記のような画面が開きます。

画面構成

ページ移動ページ選択で「Getting Started」ページをクリックします。

グラフ領域

フィルターパネル

Detail on Demand

画面構成

Spotfireのページは主にグラフ領域、フィルターパネル、Detail on Demandから構成されます。

グラフ領域には様々なグラフが表示されます。

フィルターパネルはデータを絞り込むためのフィルターが表示されます。

Detail on Demandにはマークされた生データが表示されます。

フィルターとDetail On Demand

フィルターパネル画面右上に表示されているフィルターパネルの機能を使用すると、データにフィルターをかけることできます。試しに、Teamのフィルターをスライドし、「Arizona」を選んでみてください。今まで全てのチームが表示されていたグラフがArizonaチームだけのグラフに変わります。

フィルターパネルはデータを取り込み時に、全てのカラムに対して自動的に作成されます。

Detail on Demand画面右下に表示されているDetail on Demandはマークで選択された範囲の元データを表示します。

マークの方法はグラフ上で左クリックしながらドラッグします。Ctrlを押しながら選択すると追加選択も可能です。

左クリック&ドラッグで範囲選択すると、選択範囲にあるデータが表示される。

※フィルター形式は変更する事が可能です。フィルター上で右クリック→「フィルターの種類」から好きな形式を選択できます。

Detail-on-Demandパネルはドラッグアンドドロップで下へ配置する事も可能です。

新規データの取り込み

新規ファイルの取り込み方Spotfireを新たに起動してください。先ほどと同じフォルダにあるBaseball.txtファイルを取り込んでください。

取り込み方法は下記の方法があります。• エクスプローラーからSpotfireにドラッグアンドドロップ• 「ファイル」→「開く」• 起動画面の「ファイルを開く」を選択

取り込み可能なデータSpotfireは様々な形式のファイルを取り込み可能です。CSVやExcelファイルなどの一般的なものから、データベースからデータを読み込むことができます。

インポートの設定で「OK」を押します。

棒グラフを作ってみよう!

1.ページの作成画面上の「ページ」で右クリックして「新規ページ」を選択し、新規ページを作成します。

2.グラフの作成棒グラフを作成します。画面上部にあるアイコンからをクリックします。

3.グラフの確認棒グラフが作成されます。最初の状態では、Position別のカウント集計になっています。

4.軸の変更(チーム別給料の集計)「ローの数」の をクリックすると軸の一覧が表示されます。Salaryを選択してください。X軸も同じように「Team」に変更してください。

5.色の変更「色の基準」を「Position」に設定します。 同様に色の基準を「Player Name」に変更す

ると、どの選手が一番高い給料をもらっているのか確認できます。

また、Y軸を「Hits」や「Home Runs」に変更することで、成績を確認する事ができます。

円グラフを作ってみよう!

1.新規ページの作成新規ページを作成します。

2.グラフの作成棒グラフを作成します。画面上部にあるアイコンからをクリックします。

3.グラフの確認円グラフが作成されます。最初の状態では、Position別のBatting AverageのSum(合計)になっています。

4.集計軸の変更「扇形サイズの基準」から「Salary」を選択してください。Position別の給料集計になります。

5.トレリス現在表示されている円グラフをTeam別に表示します。右のフィルターパネルからTeamをクリックし、そのまま円グラフ上にドラッグすると、設定パネルが表示されますので にドロップします。

円グラフの表示がチーム毎に表示されます。

クロステーブルを作ってみよう!

1.ページの作成新規ページを作成します。

2.グラフの作成クロステーブル作成します。画面上部にあるアイコンからをクリックします。

3.グラフの確認クロステーブルが作成されます。現在の表記だと、縦「Position」横「x」のBatting Averageの集計です。

4.縦軸の変更 横軸の変更縦軸の「Position」を「Team」に変更します。軸を選択した時に検索窓にteamと入力する事で軸を検索する事もできます。縦軸も同じように「Position」に変更します。縦軸はグラフ上方の設定項目になりますので注意してください。

5.集計項目変更グラフ下の「Sum(Batting Average)」を選択し「Salary」に変更します。これでチーム・ポジション別給料の集計

が出来ました。

軸の追加給料の集計が出来ましたが、ホームラン数も同時に表示したい場合、Salaryの横にある を選択し、「Home Runs」を追加する事ができます。

横軸の設定

縦軸の設定

散布図を作ってみよう!

1.ページの作成新規ページを作成します。

2.グラフの作成散布図を作成します。画面上部にあるアイコンからをクリックします。

3.グラフの確認散布図が作成されます。作成時は縦「On Base Percentage」横「Batting Average」の集計になっています。

4.縦軸の変更 横軸の変更縦軸を「Hits」横軸を「Home Runs」に変更し相関性を見てみます。この状態では選手一人がプロット一点になっていますので、次の手順でPosition別の集計グラフにします。

5.集計単位変更グラフ左の「マーカーの基準」が(ロー番号)になっています。こちらを選択し、一番下の「削除」を選択します。

マーカーの基準を削除すると、色の基準でサマリーされたグラフになります。縦軸、横軸がSumで計算されます。

8つのPosition別にプロットが打たれます。チーム別に集計したい場合は、色の基準を「Team」に変更してください。

ドリルダウンで選択データを可視化

ドリルダウン機能を使用すると、元のグラフから選択したデータを、別のグラフに表示する事ができます。Spotfireではデータを総括的に把握し「フィルター」や「ドリルダウン」でセグメント別にデータを比較、Detail-On-Demandで問題となるデータを突き止める処理が簡単にできます。

1.元グラフからデータを選択作成した棒グラフのページに行き、任意のデータ範囲をマークします。

2.ビジュアライゼーションの詳細を作成マークした状態のままグラフ上で右クリックするとメニューが表示されます。「ビジュアライゼーションの詳細を作成」を選択し、円グラフを選択します。

3.ドリルダウンの確認作成された円グラフは選択されたデータを表示します。試しに別のチームを選択すると表示が変わります。

4.円グラフの設定変更作成された円グラフは普通のものと同じようにカスタマイズができます。チームでトレリスをかけてみてください。

ドリルダウンは複数階層にすることが可能です。今回は「棒グラフ」→「円グラフ」のドリルダウンをご紹介しましたが、更に同様の手順で「円グラフ」→「クロステーブル」のドリルダウンに挑戦してみてください。

ファイルへの保存

1.保存方法分析したファイルを保存する場合は「ファイル」→「名前を付けて保存」→「ファイル」を選択します。

2.データ保存方法の設定Spotfire内に取り込まれているデータの保存方法を設定します。既定では「元のデータソースへのリンク」となっています。「解析ファイル内に全てのデータを保存する」を選択すると保存後のDXPファイル内に現在読み込まれているデータも保存します。

3.ファイルを保存ファイルの拡張子はDXPファイルとなります。任意のフォルダに保存してください。

「リンク保存」と「解析ファイル内に保存」の違いリンク形式で保存するとDXPファイルを開いた時、毎回データファイルからデータをロードし直します。解析ファイル内にデータを保存すると、DXPファイル自体にデータが保存されますので、元ファイルのデータが変更されても影響しません。

【重要】DXPファイルに関してDXPファイルはSpotfire専用形式のファイルです。そのため、トライアル期間が終了後は開く事が出来なくなりますので、必要なグラフがあれば、パワーポイントに出力する等の方法で保存をお願いします。

統計でデータの相関をみる。

1.Data RelationshipsSpotfireには様々な統計機能があります。今回はデータの相関性を表示する「Data Relationships」をご紹介します。

「ツール」→「Data Relationships」を選択

2.カラムの設定給料に一番関係しているパラメータを調べたいと思います。比較方法に「線形回帰」選択したYカラムに「Salary」を選択し選択したXカラムに全てのカラムを選択して「OK」を押して下さい。

3.結果表示統計的に相関性が高い順序に結果が表示されます。表をクリックすることで、散布図が切り替わるので、本当に結果が正しいのか実際に見て確認してください。散布図は通常の物と同じように色やトレリスの設定をする事もできます。

今回は簡単な例を紹介しましたが、Spotfireには他にも色々な統計機能があります。また、R言語エンジンも内蔵していますので高度な統計機能を実装する事も可能です。

計算でカラムを追加

1.計算カラムの追加取り込んだデータを元に計算カラムを作成する事ができます。「挿入」→「計算カラム」を選択して下さい。

2.計算式の入力ホームラン一本あたりの給料を算出してみましょう。「式」に”[Home Runs] / [Salary] “と入力してください。カラム名は「ホームラン当たりのコスト」にし、「OK」を押してください。

3.カラムを確認作成された計算カラムは通常のカラムと同じように使用できます。フィルターを使用して絞り込んだり、グラフの軸に設定する事も可能です。

計算カラムでは様々な関数を使用する事が出来ます。式の入力画面で選択するとサンプルを見ることが出来ます。どのような関数があるのかはヘルプをご覧ください。

グラフの軸に計算式を設定する

1.カスタム演算式前ページで計算したカラムを追加しました。Spotfireでは全ての軸で、そのグラフだけに有効な「カスタム演算式」を設定する事もできます。

軸の上で右クリックし「カスタム演算式」を選択します。

2.式の入力計算カラムと同じ式入力画面が表示されます。こちらで式を設定できます。

■棒グラフのY軸に設定した例Avg([At Bats] - ([Hits] + [Doubles] + [Triples] + [Home Runs]))を設定し、打席数-打数を算出

■色の基準に設定した例<If([Team]="Arizona","yes","no")>を設定し、アリゾナチームを目立たせる。

カスタム演算式を使用する事で様々な描画が可能になります。■プロパティからラベルに設定した例"名前は" & [Player Name] & "¥n給料は" & (if([Salary]>1000000,"高い","普通"))

その他

ドラッグアンドドロップによる軸の設定フィルターパネルから色々な設定が可能です。フィルターで軸の名前をクリックし、青色に変更した状態でグラフ上にドラッグすると、メニューが表示されます。設定項目はグラフにより異なりますが、軸やトレリス、色の基準、サイズの基準等が設定可能です。

設定可能な項目:散布図の場合

左から横軸、縦軸、色、サイズ、図形、トレリス(縦)、トレリス(横)、トレリス(パネル)

軸の集計方法の変更集計方法は数値ならSum、文字列ならCountが初期設定されます。集計方法を変更したい場合、軸を選択時、右に表示されている「集計」メニューから変更する事ができます。

その他

プロパティによるグラフの設定Spotfireではドラッグアンドドロップで一通りの設定が可能ですが、詳細な設定はプロパティを使用します。グラフ上で右クリックするとメニューが表示されますので、一番したの「プロパティ」を選択します。

プロパティメニュー今までドラッグアンドドロップで設定していた項目も全てプロパティで設定できます。また、詳細な色の設定やラベルの表示、書式設定なども可能です。

一度設定したトレリスなどを解除するのもプロパティを使用します。設定されているカラムを選択して「削除」を選択してください。

その他

パワーポイントでのレポート作成作成したページはパワーポイントにエクスポートする事ができます。「ファイル」→「エクスポート」→「Microsoft@ Power Pointへ」を選択して下さい。出力はページ指定か、全てのページを一度に出力する事も可能です。

テキストエリアに注釈を記載グラフだけで分かりづらい場合はテキストエリアにコメントを書き込むことが出来ます。グラフアイコンから をクリックしてください。

テキストエリアにはコメントだけでなく画像やフィルターを追加する事もできます。

その他

関数紹介カスタム演算式や、計算カラムで色々な関数を使用できます。その中でも使用頻度が高い関数を紹介します。

テキスト関数& 文字列を連結します。Left 文字列を左から○文字切り取ります。Right 文字列を右から○文字切り取ります。Mid 文字列を×文字目から○文字切り取ります。Find 文字列中から文字を検索し、その位置を返します。

主にmidやright,left関数と共に使用します。Len 文字列の長さを返します。こちらもfindやmidと

使用する事が多いです。RxReplace 文字列を正規表現で処理します。Substitute 文字列の単語を置換します。Trim 文字列の先頭・末尾の空白を削除します。UniqueConcatinate 文字列の固有値を連結します。

ラベルに使用する事が多いです。

数学関数Ceiling 引数を最も近い自然数に切り上げますFloor 引数を最も近い自然数に切り下げます。Mod 除算した余りを計算します。Product 引数の積を計算します。

統計関数Avg 平均値を計算します。Count 引数のカラム内の空でない値の数を計算しますMax 最大値を計算します。Median 引数の中央値を計算します。Min 最小値を計算します。StdDev 標準偏差を計算します。UniqueCount カラム内の空でない固有値の数を計算します。

論理関数Case 複数の条件分岐ができます。If 条件分岐が出来ます。

日付関数DataAdd 間隔を日付、時刻または日付時刻に追加しますDataDiff 日付時刻カラムの間の差異を計算します。DataTimeNow 現在時刻を返します。DataPart 日付、時刻または日付時刻の指定部分を返します。

Rank関数Rank,DenseRank 共にランキング順位を返す関数です。

順位付けやソート順序に使用する事が多いです。