57
Interaktive Visualisierung und Visual Analytics Dr.-Ing. Jörn Kohlhammer Fraunhofer-Institut für Graphische Datenverarbeitung (IGD) Fraunhoferstraße 5 64283 Darmstadt Tel.: +49 6151 155 - 646 Fax: +49 6151 155 - 139 Email: [email protected] http://www.igd.fraunhofer.de/iva

Visual Analytics und Business Intelligence - sigs.de · PDF fileInteraktive Visualisierung und Visual Analytics Dr.-Ing. Jörn Kohlhammer Fraunhofer-Institut für Graphische Datenverarbeitung

  • Upload
    dotuyen

  • View
    217

  • Download
    0

Embed Size (px)

Citation preview

Interaktive Visualisierung und Visual Analytics

Dr.-Ing. Jörn Kohlhammer

Fraunhofer-Institut für Graphische Datenverarbeitung (IGD)

Fraunhoferstraße 5

64283 Darmstadt

Tel.: +49 6151 155 - 646

Fax: +49 6151 155 - 139

Email: [email protected]

http://www.igd.fraunhofer.de/iva

2 © 2013 Fraunhofer IGD

Ausbaustufen von Visual Business Analytics

Informationsdesign

Gutes Verständnis und adäquate Verwendung von visuellen

Elementen im Reporting

Informationsvisualisierung

Dynamische Informationen interaktiv und visuell zugänglich

machen

Visuelle Analyse (Visual Analytics)

Neue Erkenntnisse durch das abgestimmte Zusammenspiel

von Mensch und System

3 © 2013 Fraunhofer IGD

Ausbaustufen von Visual Business Analytics

4

Informationsvisualisierung

Daten Informations

Visualisierung Wissen

Wir benutzen auf natürliche Weise unsere

Augen, um die Welt zu verstehen...

„Ein Bild sagt mehr als 1000 Worte.“

© 2013 Fraunhofer IGD

5 © 2013 Fraunhofer IGD

Interaktive Visualisierung

“Graphische Unterstützung macht uns klüger.” (Stuart Card)

Zwei Ziele der graphischen Unterstützung

Bessere Kommunikation vorhandener Ideen

Entdeckung neuer Ideen

Nutzung von visuellen Hilfsmitteln zum

Denken und Entscheiden

Allein Stift und Papier reduzieren

die Rechenzeit um den Faktor 5

34

x 72

68

23280

2448

6 © 2013 Fraunhofer IGD

Herkunft der Informationsvisualisierung

Wissenschaftliche

Visualisierung Informations-

Visualisierung

Visual

Analytics

7 © 2013 Fraunhofer IGD

Beispiel: Tree Maps

Hier: Darstellung der Entwicklung von Börsenkursen (2001)

Übersicht über aktuelle Börsentrends

Branchenklassifikation

Fokus auf relevante

Informationen

10 © 2013 Fraunhofer IGD

Informationsvisualisierung

Beachtung der menschlichen Wahrnehmung

Beispiel: Change Blindness

Vorsicht bei:

Animation und interaktiven Visualisierungen

„Springen“ zwischen Darstellungen

Mehrseitigen Darstellungen

11 © 2013 Fraunhofer IGD

Menschliche Wahrnehmung

„Hervorspringen“ von Informationen

Ein „Hervorspringen“ erfolgt, wenn das Zielobjekt eine

Eigenschaft besitzt, die kein anderes ablenkendes Objekt

besitzt.

(Suchen Sie das blaue “T”)

12

Menschliche Wahrnehmung

© 2013 Fraunhofer IGD

13

(Suchen Sie das “/”)

Menschliche Wahrnehmung

© 2013 Fraunhofer IGD

14

Menschliche Wahrnehmung

© 2013 Fraunhofer IGD

15

Ein „Hervorspringen“ erfolgt, wenn das Zielobjekt eine

Eigenschaft besitzt, die kein anderes ablenkendes Objekt

besitzt.

Menschliche Wahrnehmung

© 2013 Fraunhofer IGD

16

(Suchen Sie das grüne “T”)

Eine serielle Suche ist nötig, wenn jede visuelle Eigenschaft

des Zielobjekts auch unter den ablenkenden Objekten

vorkommt.

Menschliche Wahrnehmung

© 2013 Fraunhofer IGD

17

Menschliche Wahrnehmung

© 2013 Fraunhofer IGD

19

Daten, Information, Wissen

Daten

• Rohform

Information

• Bedeutung

• Kontext

Wissen

• Zusammenhänge

© 2013 Fraunhofer IGD

20 © 2013 Fraunhofer IGD

Informationsvisualisierung

Modell von Card et al.

21

Rohdaten in vielfältiger Form

Datentabellen

Datenströme

Bilder, Videos, Audio etc.

Texte

Datenarten

Text

Text

Text

© 2013 Fraunhofer IGD

22 © 2013 Fraunhofer IGD

Informationsvisualisierung

Modell von Card et al.

23

Vier grundlegende Typen von

sichtbaren “Dingen” im Raum

© 2013 Fraunhofer IGD

Informationsvisualisierung

24 © 2013 Fraunhofer IGD

Sichtbare Eigenschaften

25 © 2013 Fraunhofer IGD

Informationsvisualisierung

Modell von Card et al.

26 © 2013 Fraunhofer IGD

Beispiel: Gapminder

27 © 2013 Fraunhofer IGD

Informationsvisualisierung

Modell von Card et al.

28 © 2013 Fraunhofer IGD

Interaktive Visualisierung

Wie erstellt man gute, interaktive Visualisierungen?

Shneiderman-Vorgehen

1. Überblick über alle Daten

2. Zoom und Filter

3. Details auf Anfrage

29

Filmfinder, Ahlberg&Shneiderman

© 2013 Fraunhofer IGD

Informationsvisualisierung

Shneiderman-Vorgehen

1. Überblick aller Daten

2. Zoom und Filter

3. Details auf Anfrage

30 © 2013 Fraunhofer IGD

Informationsvisualisierung

Gegenbeispiel aus dem Notfallmanagement

1. Immer alle Details

2. Scroll und Select

3. Größere und mehr Monitore für den

besseren „Überblick“

31 © 2013 Fraunhofer IGD

Big Data

Zu viele Daten für den Überblick nach Shneiderman

100 Mio. FedEx Transaktionen

pro Tag

Über 1800 Gbps über DE-CIX

peak traffic

7,2 Mrd. VISA Kreditkarten-

transaktionen pro Jahr

32 © 2013 Fraunhofer IGD

Big Data

33 © 2013 Fraunhofer IGD

VBA-Studie: Relevanz von Big Data

34 © 2013 Fraunhofer IGD

Beispiel: Kreditkarten

Geldautomaten

POS Acquirer

Real-Time

Online Switch

Host / Issuer

35 © 2013 Fraunhofer IGD

Beispiel: Kreditkarten

Daten-

bank

Regeln und

Abfragen

Alerts! Visualisierung

Reports

36 © 2013 Fraunhofer IGD

Beispiel: Kreditkarten

Amount Merchant# Location Local Trans-

action Time

Country

Code

POS PAN MCC Expiry

Date … Card#

50 und mehr Attribute

Große Anzahl Transaktionen

(z.B. 7,2 Mrd. VISA-Transaktionen in 2009)

Problem: Fixe Regeln erkennen nur bekannte Betrugsschemata

Wie erkennt man neue Fälle möglichst rasch und proaktiv?

37 © 2013 Fraunhofer IGD

Dynamische Daten

Verkaufsdaten

Transaktionsdaten

Betrugserkennung

Schnelles Erkennen von Korrelationen

Neuartige Verhaltensmuster

Sich verändernde Transaktionsmuster

Experten im Zentrum der Analyse

Relevante Muster in Daten erkennen

38 © 2013 Fraunhofer IGD

Histogramm für ein Attribut

Beispiel:

Zeit der Kreditkarten-

transaktion

1-dimensionales

Histogramm

05:0

0-0

8:5

9

09:0

0-1

1:5

9

12:0

0-1

5:5

9

16:0

0-1

8:5

9

19:0

0-2

2:5

9

23:0

0-0

1:5

9

02:0

0-0

4:5

9

Time of

Day

39 © 2013 Fraunhofer IGD

Histogramme und Tabelle für zwei Attribute

Beispiel:

Zeit der Transaktion

abgebildet auf

Zahlungsbetrag

Zwei 1-dimensionale

Verteilungen kombiniert

in einer Tabelle

(Zahlen stehen für die

Größe der

verschiedenen Gruppen)

4

6

4

0

1

0

2

10

25

32

31

2

1

5

6

12

41

35

28

12 15 10 16

23

28

6

20

6

8

5

10

13 16 12

14

10

30

5

17

3

6

9

4

8

0

2

0

3

5

-$9

$10-$99

$100-$299

$300-$499

$500-$699

$700-$999

$1000-

40 © 2013 Fraunhofer IGD

Mustererkennung

Abbildung der Gruppen-

größe auf Helligkeit

Interessante Bereiche

können „auf einen Blick“

erkannt werden. 4

0

1

0

2

10

25

32

31

2

1

5

6

12

41

35

28

12 15 10 16

23

28

6

20

6

8

5

10

13 16 12

-$9

$10-$99

$100-$299

$300-$499

$500-$699

$700-$999

$1000-

41 © 2013 Fraunhofer IGD

Herausforderung: Sehr viele Attribute

Verwobene Darstellung

von drei (und mehr)

Attributen

Hier zusätzliches

Attribut: POS oder ATM

po

s

atm

po

s

atm

po

s

atm

po

s

atm

po

s

atm

po

s

atm

po

s

atm

-$9

$10-$99

$100-$299

$300-$499

$500-$699

$700-$999

$1000-

42

Visualisierung mehrdimensionaler Beziehungen

KVMap: 100.000 Datensätze in sechs Dimensionen

© 2013 Fraunhofer IGD

43

KVMap-System

© 2013 Fraunhofer IGD

Komplexe Muster von 10 und mehr

Dimensionen als farbige Muster

Erkennen von neuen Zusammen-

hängen ohne kognitiven Aufwand

Automatische Methoden im

Hintergrund

Identifizierung interessanter Muster

aus Datenbank oder DWH

Mächtige Analysetechnik für das

“Back Office”

44 © 2013 Fraunhofer IGD

Visual Analytics

45 © 2013 Fraunhofer IGD

Heutige Graphiken für große Datenmengen?

USA

EU

Japan

0

2

4

6

8

10

12

14

16

0 2 4 6 8 10 12

Portugal

Spanien

Frankreich

Großbritannien

Polen

Slowakei

Tschechien

Slowenien

Schweiz

Italien

Österreich

Irland

Ungarn

Rumnänien

Deutschland

Dänemark

Kroatien

Schweden

Finnland

46 © 2013 Fraunhofer IGD

Große und wachsende Datensammlungen (Big Data)

Notwendigkeit schneller und informierter

Entscheidungsfindung auf Basis dieser Daten

Reine Visualisierungsmethoden (Informationsvisualisierung)

nicht adäquat für Milliarden von Datensätzen

Vollautomatische Knowledge Discovery-Ansätze/Modelle

nur für wohldefinierte und eindeutig spezifizierbare Probleme

Beispiel: Abwehrsituationen:

Betrug, Viren, SPAM, DOS-Angriffe, Wettbewerb, …

Warum Visual Analytics, warum heute?

47 © 2013 Fraunhofer IGD

Was ist das Neue an Visual Analytics?

Was gibt es schon?

Automatisches Knowledge Discovery & Data Mining

Interaktive visuelle Daten-Exploration

Was brauchen wir?

Enge Integration visueller und automatischer Datenanalysemethoden mit

Datenbanktechnologien für skalierbare interaktive Entscheidungsunterstützung

Feedback Loop

Visualisierung

Visuelle Daten-Exploration

Daten Wissen

Modelle

Data Mining

48

Visual Analytics – ein neuer Ansatz

Kombination aus Informationsvisualisierung,

Statistik, Data Mining, Business Intelligence

und anderen Gebieten

Datenbank-

management

Statistik

Data Mining

Wissens-

management

Visual

Analytics

Benutzer-

freundlichkeit

Informations-

visualisierungWahrnehmungs-

theorie

Interaktivität

Datenbank-

management

Statistik

Data Mining

Wissens-

management

Visual

Analytics

Benutzer-

freundlichkeit

Informations-

visualisierung

Informations-

visualisierungWahrnehmungs-

theorie

InteraktivitätInteraktivität

© 2013 Fraunhofer IGD

49 © 2013 Fraunhofer IGD

Business Intelligence und Visual Analytics

Visual Analytics

Neue Möglichkeiten durch Integration mit automatischen

Verfahren

Stärkerer Einfluss der menschlichen Erfahrung und Ideen

in den Gesamtprozess

Effektiverer Umgang mit Big Data

Erste Ansätze in heutigen Tools in Erweiterungen zur interaktiven

Exploration, Prediction oder Simulation

50 © 2013 Fraunhofer IGD

Business Intelligence und Visual Analytics

TDWI-Report „Big Data Analytics“

Russom, 2011

51 © 2013 Fraunhofer IGD

VBA-Studie: Relevanz von Visual Analytics

52 © 2013 Fraunhofer IGD

Aufzeigen von Verbindungen und

Zusammenhängen

Beispiel: Beteiligungsstrukturen

Wer hält welche

Anteile?

Wer hat auch über

Umwege welchen Einfluß

auf welches Unternehmen?

Wer hat über Beteiligungen

kombiniert eine Sperr-

minorität?

Beispiel: Netzwerkverbindungen

Fehlende analytische Funktionalität bei

Graphendarstellungen in heutigen Systemen

53 © 2013 Fraunhofer IGD

Interaktives Verständnis von Netzwerken

T. Tekusová and J. Kohlhammer: Visual Analysis and Exploration of Complex Corporate Shareholder Networks.

SPIE Conference on Visualization and Data Analysis 2008.

Interaktive Analyse von

Beteiligungsstrukturen

Aufzeigen von Verbindungen und

Zusammenhängen

Beispiel: Beteiligungsstrukturen

Wer hält welche

Anteile?

Wer hat auch über

Umwege welchen Einfluß

auf welches Unternehmen?

Wer hat über Beteiligungen

kombiniert eine Sperr-

minorität?

54 © 2013 Fraunhofer IGD

Viele Anteilseigner

55

Analyse von Netzwerken

Analyse von Verbindungen und Relationen

Anwendungen

Unternehmens- und Beteilungsnetzwerke

Personennetzwerke

Dokumente und Referenzen

© 2013 Fraunhofer IGD

56

Einsatz im Bankenbereich

© 2013 Fraunhofer IGD

57 © 2013 Fraunhofer IGD

Weitere Einsatzgebiete von Visual Analytics

CRM-Analysen

Trendanalysen

Sicherheit

Medizin

Analysen im Fertigungsumfeld

Überall, wo massive Datenmengen anfallen

58 © 2013 Fraunhofer IGD

Ausbaustufen von Visual Business Analytics

59 © 2013 Fraunhofer IGD

Dr. Jörn Kohlhammer

Fraunhofer-Institut für Graphische Datenverarbeitung

Fraunhoferstraße 5

64283 Darmstadt

Deutschland

Tel.: +49 (6151) 155 – 646

Fax: +49 (6151) 155 – 139

Email: [email protected]

http://www.igd.fraunhofer.de

Kontakt