Upload
dotuyen
View
217
Download
0
Embed Size (px)
Citation preview
Interaktive Visualisierung und Visual Analytics
Dr.-Ing. Jörn Kohlhammer
Fraunhofer-Institut für Graphische Datenverarbeitung (IGD)
Fraunhoferstraße 5
64283 Darmstadt
Tel.: +49 6151 155 - 646
Fax: +49 6151 155 - 139
Email: [email protected]
http://www.igd.fraunhofer.de/iva
2 © 2013 Fraunhofer IGD
Ausbaustufen von Visual Business Analytics
Informationsdesign
Gutes Verständnis und adäquate Verwendung von visuellen
Elementen im Reporting
Informationsvisualisierung
Dynamische Informationen interaktiv und visuell zugänglich
machen
Visuelle Analyse (Visual Analytics)
Neue Erkenntnisse durch das abgestimmte Zusammenspiel
von Mensch und System
4
Informationsvisualisierung
Daten Informations
Visualisierung Wissen
Wir benutzen auf natürliche Weise unsere
Augen, um die Welt zu verstehen...
„Ein Bild sagt mehr als 1000 Worte.“
© 2013 Fraunhofer IGD
5 © 2013 Fraunhofer IGD
Interaktive Visualisierung
“Graphische Unterstützung macht uns klüger.” (Stuart Card)
Zwei Ziele der graphischen Unterstützung
Bessere Kommunikation vorhandener Ideen
Entdeckung neuer Ideen
Nutzung von visuellen Hilfsmitteln zum
Denken und Entscheiden
Allein Stift und Papier reduzieren
die Rechenzeit um den Faktor 5
34
x 72
68
23280
2448
6 © 2013 Fraunhofer IGD
Herkunft der Informationsvisualisierung
Wissenschaftliche
Visualisierung Informations-
Visualisierung
Visual
Analytics
7 © 2013 Fraunhofer IGD
Beispiel: Tree Maps
Hier: Darstellung der Entwicklung von Börsenkursen (2001)
Übersicht über aktuelle Börsentrends
Branchenklassifikation
Fokus auf relevante
Informationen
10 © 2013 Fraunhofer IGD
Informationsvisualisierung
Beachtung der menschlichen Wahrnehmung
Beispiel: Change Blindness
Vorsicht bei:
Animation und interaktiven Visualisierungen
„Springen“ zwischen Darstellungen
Mehrseitigen Darstellungen
11 © 2013 Fraunhofer IGD
Menschliche Wahrnehmung
„Hervorspringen“ von Informationen
Ein „Hervorspringen“ erfolgt, wenn das Zielobjekt eine
Eigenschaft besitzt, die kein anderes ablenkendes Objekt
besitzt.
(Suchen Sie das blaue “T”)
15
Ein „Hervorspringen“ erfolgt, wenn das Zielobjekt eine
Eigenschaft besitzt, die kein anderes ablenkendes Objekt
besitzt.
Menschliche Wahrnehmung
© 2013 Fraunhofer IGD
16
(Suchen Sie das grüne “T”)
Eine serielle Suche ist nötig, wenn jede visuelle Eigenschaft
des Zielobjekts auch unter den ablenkenden Objekten
vorkommt.
Menschliche Wahrnehmung
© 2013 Fraunhofer IGD
18 © 2013 Fraunhofer IGD
Interaktive Visualisierung
Besseres Verständnis durch Interaktion und bewegte Daten
Hans Rosling (Gapminder) at TED Talks
19
Daten, Information, Wissen
Daten
• Rohform
Information
• Bedeutung
• Kontext
Wissen
• Zusammenhänge
© 2013 Fraunhofer IGD
21
Rohdaten in vielfältiger Form
Datentabellen
Datenströme
Bilder, Videos, Audio etc.
Texte
Datenarten
Text
Text
Text
© 2013 Fraunhofer IGD
23
Vier grundlegende Typen von
sichtbaren “Dingen” im Raum
© 2013 Fraunhofer IGD
Informationsvisualisierung
28 © 2013 Fraunhofer IGD
Interaktive Visualisierung
Wie erstellt man gute, interaktive Visualisierungen?
Shneiderman-Vorgehen
1. Überblick über alle Daten
2. Zoom und Filter
3. Details auf Anfrage
29
Filmfinder, Ahlberg&Shneiderman
© 2013 Fraunhofer IGD
Informationsvisualisierung
Shneiderman-Vorgehen
1. Überblick aller Daten
2. Zoom und Filter
3. Details auf Anfrage
30 © 2013 Fraunhofer IGD
Informationsvisualisierung
Gegenbeispiel aus dem Notfallmanagement
1. Immer alle Details
2. Scroll und Select
3. Größere und mehr Monitore für den
besseren „Überblick“
31 © 2013 Fraunhofer IGD
Big Data
Zu viele Daten für den Überblick nach Shneiderman
100 Mio. FedEx Transaktionen
pro Tag
Über 1800 Gbps über DE-CIX
peak traffic
7,2 Mrd. VISA Kreditkarten-
transaktionen pro Jahr
34 © 2013 Fraunhofer IGD
Beispiel: Kreditkarten
Geldautomaten
POS Acquirer
Real-Time
Online Switch
Host / Issuer
35 © 2013 Fraunhofer IGD
Beispiel: Kreditkarten
Daten-
bank
Regeln und
Abfragen
Alerts! Visualisierung
Reports
36 © 2013 Fraunhofer IGD
Beispiel: Kreditkarten
Amount Merchant# Location Local Trans-
action Time
Country
Code
POS PAN MCC Expiry
Date … Card#
50 und mehr Attribute
Große Anzahl Transaktionen
(z.B. 7,2 Mrd. VISA-Transaktionen in 2009)
Problem: Fixe Regeln erkennen nur bekannte Betrugsschemata
Wie erkennt man neue Fälle möglichst rasch und proaktiv?
37 © 2013 Fraunhofer IGD
Dynamische Daten
Verkaufsdaten
Transaktionsdaten
Betrugserkennung
Schnelles Erkennen von Korrelationen
Neuartige Verhaltensmuster
Sich verändernde Transaktionsmuster
Experten im Zentrum der Analyse
Relevante Muster in Daten erkennen
38 © 2013 Fraunhofer IGD
Histogramm für ein Attribut
Beispiel:
Zeit der Kreditkarten-
transaktion
1-dimensionales
Histogramm
05:0
0-0
8:5
9
09:0
0-1
1:5
9
12:0
0-1
5:5
9
16:0
0-1
8:5
9
19:0
0-2
2:5
9
23:0
0-0
1:5
9
02:0
0-0
4:5
9
Time of
Day
39 © 2013 Fraunhofer IGD
Histogramme und Tabelle für zwei Attribute
Beispiel:
Zeit der Transaktion
abgebildet auf
Zahlungsbetrag
Zwei 1-dimensionale
Verteilungen kombiniert
in einer Tabelle
(Zahlen stehen für die
Größe der
verschiedenen Gruppen)
4
6
4
0
1
0
2
10
25
32
31
2
1
5
6
12
41
35
28
12 15 10 16
23
28
6
20
6
8
5
10
13 16 12
14
10
30
5
17
3
6
9
4
8
0
2
0
3
5
-$9
$10-$99
$100-$299
$300-$499
$500-$699
$700-$999
$1000-
40 © 2013 Fraunhofer IGD
Mustererkennung
Abbildung der Gruppen-
größe auf Helligkeit
Interessante Bereiche
können „auf einen Blick“
erkannt werden. 4
0
1
0
2
10
25
32
31
2
1
5
6
12
41
35
28
12 15 10 16
23
28
6
20
6
8
5
10
13 16 12
-$9
$10-$99
$100-$299
$300-$499
$500-$699
$700-$999
$1000-
41 © 2013 Fraunhofer IGD
Herausforderung: Sehr viele Attribute
Verwobene Darstellung
von drei (und mehr)
Attributen
Hier zusätzliches
Attribut: POS oder ATM
po
s
atm
po
s
atm
po
s
atm
po
s
atm
po
s
atm
po
s
atm
po
s
atm
-$9
$10-$99
$100-$299
$300-$499
$500-$699
$700-$999
$1000-
42
Visualisierung mehrdimensionaler Beziehungen
KVMap: 100.000 Datensätze in sechs Dimensionen
© 2013 Fraunhofer IGD
43
KVMap-System
© 2013 Fraunhofer IGD
Komplexe Muster von 10 und mehr
Dimensionen als farbige Muster
Erkennen von neuen Zusammen-
hängen ohne kognitiven Aufwand
Automatische Methoden im
Hintergrund
Identifizierung interessanter Muster
aus Datenbank oder DWH
Mächtige Analysetechnik für das
“Back Office”
45 © 2013 Fraunhofer IGD
Heutige Graphiken für große Datenmengen?
USA
EU
Japan
0
2
4
6
8
10
12
14
16
0 2 4 6 8 10 12
Portugal
Spanien
Frankreich
Großbritannien
Polen
Slowakei
Tschechien
Slowenien
Schweiz
Italien
Österreich
Irland
Ungarn
Rumnänien
Deutschland
Dänemark
Kroatien
Schweden
Finnland
46 © 2013 Fraunhofer IGD
Große und wachsende Datensammlungen (Big Data)
Notwendigkeit schneller und informierter
Entscheidungsfindung auf Basis dieser Daten
Reine Visualisierungsmethoden (Informationsvisualisierung)
nicht adäquat für Milliarden von Datensätzen
Vollautomatische Knowledge Discovery-Ansätze/Modelle
nur für wohldefinierte und eindeutig spezifizierbare Probleme
Beispiel: Abwehrsituationen:
Betrug, Viren, SPAM, DOS-Angriffe, Wettbewerb, …
Warum Visual Analytics, warum heute?
47 © 2013 Fraunhofer IGD
Was ist das Neue an Visual Analytics?
Was gibt es schon?
Automatisches Knowledge Discovery & Data Mining
Interaktive visuelle Daten-Exploration
Was brauchen wir?
Enge Integration visueller und automatischer Datenanalysemethoden mit
Datenbanktechnologien für skalierbare interaktive Entscheidungsunterstützung
Feedback Loop
Visualisierung
Visuelle Daten-Exploration
Daten Wissen
Modelle
Data Mining
48
Visual Analytics – ein neuer Ansatz
Kombination aus Informationsvisualisierung,
Statistik, Data Mining, Business Intelligence
und anderen Gebieten
Datenbank-
management
Statistik
Data Mining
Wissens-
management
Visual
Analytics
Benutzer-
freundlichkeit
Informations-
visualisierungWahrnehmungs-
theorie
Interaktivität
Datenbank-
management
Statistik
Data Mining
Wissens-
management
Visual
Analytics
Benutzer-
freundlichkeit
Informations-
visualisierung
Informations-
visualisierungWahrnehmungs-
theorie
InteraktivitätInteraktivität
© 2013 Fraunhofer IGD
49 © 2013 Fraunhofer IGD
Business Intelligence und Visual Analytics
Visual Analytics
Neue Möglichkeiten durch Integration mit automatischen
Verfahren
Stärkerer Einfluss der menschlichen Erfahrung und Ideen
in den Gesamtprozess
Effektiverer Umgang mit Big Data
Erste Ansätze in heutigen Tools in Erweiterungen zur interaktiven
Exploration, Prediction oder Simulation
50 © 2013 Fraunhofer IGD
Business Intelligence und Visual Analytics
TDWI-Report „Big Data Analytics“
Russom, 2011
52 © 2013 Fraunhofer IGD
Aufzeigen von Verbindungen und
Zusammenhängen
Beispiel: Beteiligungsstrukturen
Wer hält welche
Anteile?
Wer hat auch über
Umwege welchen Einfluß
auf welches Unternehmen?
Wer hat über Beteiligungen
kombiniert eine Sperr-
minorität?
Beispiel: Netzwerkverbindungen
Fehlende analytische Funktionalität bei
Graphendarstellungen in heutigen Systemen
53 © 2013 Fraunhofer IGD
Interaktives Verständnis von Netzwerken
T. Tekusová and J. Kohlhammer: Visual Analysis and Exploration of Complex Corporate Shareholder Networks.
SPIE Conference on Visualization and Data Analysis 2008.
Interaktive Analyse von
Beteiligungsstrukturen
Aufzeigen von Verbindungen und
Zusammenhängen
Beispiel: Beteiligungsstrukturen
Wer hält welche
Anteile?
Wer hat auch über
Umwege welchen Einfluß
auf welches Unternehmen?
Wer hat über Beteiligungen
kombiniert eine Sperr-
minorität?
55
Analyse von Netzwerken
Analyse von Verbindungen und Relationen
Anwendungen
Unternehmens- und Beteilungsnetzwerke
Personennetzwerke
Dokumente und Referenzen
© 2013 Fraunhofer IGD
57 © 2013 Fraunhofer IGD
Weitere Einsatzgebiete von Visual Analytics
CRM-Analysen
Trendanalysen
Sicherheit
Medizin
Analysen im Fertigungsumfeld
Überall, wo massive Datenmengen anfallen
59 © 2013 Fraunhofer IGD
Dr. Jörn Kohlhammer
Fraunhofer-Institut für Graphische Datenverarbeitung
Fraunhoferstraße 5
64283 Darmstadt
Deutschland
Tel.: +49 (6151) 155 – 646
Fax: +49 (6151) 155 – 139
Email: [email protected]
http://www.igd.fraunhofer.de
Kontakt