44
Visualiseren van tijdsafhankelijke datasets ______________________________________________________________________________________________________________________ Ward Cools @WardCools wardcools.wordpress.com Promotoren: Prof. dr. ir. Erik Duval, Dr. Joris Klerkx Begeleider: Dr. Joris Klerkx

Eindpresentatie masterproef

Embed Size (px)

Citation preview

Visualiseren van tijdsafhankelijke datasets

______________________________________________________________________________________________________________________

Ward Cools@WardCools wardcools.wordpress.com

Promotoren: Prof. dr. ir. Erik Duval, Dr. Joris KlerkxBegeleider: Dr. Joris Klerkx

Overzicht

• Inleiding/doelstelling• Literatuur• Onderzoek• Evaluatie• Technologie/implementatie• Besluit• Statistieken

Datavisualisatie

• A picture’s worth a thousand bucks

Probleem- en doelstelling

• 70% visualisaties bevat tijdsparameter• Tijd lang behandeld als gewone parameter

• Verschillende oplossingen, bruikbaarheid vaak beperkt

=> Techniek voor ruime, duidelijk gedefinieerde collectie tijdsgebonden datasets

Overzicht

• Inleiding/doelstelling• Literatuur• Onderzoek• Evaluatie• Technologie/implementatie• Besluit• Statistieken

Categorisatie parameter tijd

Door Aigner [1], gebaseerd op Frank [2]:• Discrete tijdspunten vs tijdsintervals

[1] W. Aigner, S. Miksch, W. Muller, H. Schumann, and C. Tominski, “Visualizing time-oriented data—A systematic view,” Comput. Graph., vol. 31, no. 3, pp. 401–409, 2007.[2] A. U. Frank. Different types of time in gis. In R. G. G. Max J. Egenhofer, editor, Spatial and temporal reasoning in geographic information systems, pages 40-62. Oxford University Press, 1998.

Categorisatie parameter tijd

Door Aigner [1], gebaseerd op Frank [2]:• Lineaire vs cyclische tijd

[1] W. Aigner, S. Miksch, W. Muller, H. Schumann, and C. Tominski, “Visualizing time-oriented data—A systematic view,” Comput. Graph., vol. 31, no. 3, pp. 401–409, 2007.[2] A. U. Frank. Different types of time in gis. In R. G. G. Max J. Egenhofer, editor, Spatial and temporal reasoning in geographic information systems, pages 40-62. Oxford University Press, 1998.

Categorisatie parameter tijd

Door Aigner [1], gebaseerd op Frank [2]:• Geordende tijd vs ‘branching time’ vs tijd met

meerdere perspectieven

• Meest voorkomende: lineair, geordende tijdspunten

[1] W. Aigner, S. Miksch, W. Muller, H. Schumann, and C. Tominski, “Visualizing time-oriented data—A systematic view,” Comput. Graph., vol. 31, no. 3, pp. 401–409, 2007.[2] A. U. Frank. Different types of time in gis. In R. G. G. Max J. Egenhofer, editor, Spatial and temporal reasoning in geographic information systems, pages 40-62. Oxford University Press, 1998.

Specifieke techniek

• ThemeRiver [1]

[1] S. Havre, E. Hetzler, P. Whitney, and L. Nowell, ThemeRiver: visualizing thematic changes in large document collections, vol. 8, no. 1. IEEE, 2002, pp. 9–20.

Geanimeerde scatterplot

• Door o.a. Few [1] en Rosling [2]:

• Lijngrafiek goede tijdsvoorstelling, maar beperkt # variabelen -> beter scatterplot

• Tijd voorstellen door beweging• Probleem: menselijk geheugen beperkt• Oplossing: – Tijd door gebruiker laten controleren– ‘Sporen’ achterlaten

[1] Few Stephen, “Visualizing Change - An Innovation in Time-Series Analysis,” 2007.[2] H. Rosling, “Hans Rosling shows the best stats you’ve ever seen,” Ted Conference, vol. 2009, no. 9/29. TED Conferences, 2006.

Geanimeerde scatterplot

Overzicht

• Inleiding/doelstelling• Literatuur• Onderzoek• Evaluatie• Technologie/implementatie• Besluit• Statistieken

Dataset

• Techniek voor grote categorie tijdsgebonden datasets -> Lineaire, discrete en geordende tijd

• Dataset met alle matchen verschillende voetbalcompetities 1994-2014 in .csv formaat

• Resultaten, statistieken, odds• Parameter tijd = speeldag: discreet, geordend,

continue, lineair (eventueel cyclisch)

Iteratie 1 - Visualisatie 1

• Verandering rangschikking doorheen tijd (dynamisch)

Iteratie 1 - Visualisatie 2

• Evolutie winst bij wedden op ploeg (gebaseerd op onder andere Few [1])

[1] Few Stephen, “Visualizing Change - An Innovation in Time-Series Analysis,” 2007.

Iteratie 1 - Visualisatie 3

• Statisch, maar interactief (lijngrafiek)

Iteratie 1 - Evaluatie

• Gebaseerd op Seven Scenarios [1]

• Eerste tip: alle visualisaties van zelfde data• Visualisaties 2 en 3 aangepast

[1] H. Lam, E. Bertini, P. Isenberg, C. Plaisant, and S. Carpendale, “Empirical Studies in Information Visualization: Seven Scenarios.,” IEEE Trans. Vis. Comput. Graph., vol. 18, no. 9, pp. 1520–1536, 2011.

Visualisatie 2

Visualisatie 3

Iteratie 1 - Evaluatie

• Scenario 6: gebruikservaring evalueren• Via gebruikerstests met gerichte vragen• Bvb: Welk team stijgt het meest tussen speeldag

X en Y?• Ook algemene vragen: Wat valt u direct op?• Quotatie op 10 op basis van efficiëntie en

effectiviteit (mogelijk subjectief)

• 8 testgebruikers, gemengde achtergrond

Iteratie 1 - Evaluatie• Visualisatie 2 slechtst– Neg: slecht bij groot aantal ploegen– Pos: correlaties

Visualisatie 1 Visualisatie 3

Iteratie 1 - Conclusie

• Visualisatie 3 goed bij vragen over rangschikking

• Visualisatie 1 goed bij vragen over andere parameters

=> Voordelen 1 en 3 proberen combineren

Iteratie 2 – Visualisatie 1

• Eerste idee: letterlijk combineren

Iteratie 2 – Visualisatie 2• Kan simpeler -> teams van boven naar onder

gerangschikt

Iteratie 2 – Evaluatie• 5 testgebruikers, homogene groep, zelfde

methode

Visualisatie 1 Visualisatie 2

Iteratie 2 – Conclusie• Visualisatie 1 verbetering tov iteratie 1, maar

scoort niet geweldig• Visualisatie 2 wel algemene verbetering

• Iteratie 3 -> nagaan hoe goed visualisatie 2 (minder logische) correlaties weergeeft

Iteratie 3 – Visualisaties• Nevenparameters wijzigen

Visualisatie 1 Visualisatie 2

Iteratie 3 – Evaluatie• 6 testgebruikers, vragen naar gevonden

correlaties

• Zelfde correlaties gevonden bij de twee visualisaties

Conclusie• Scatterplot wordt genoemd als goede manier

om correlaties af te leiden• Visualisatie 1 toont evenveel correlaties als de

scatterplot van visualisatie 2

• Het rechtse deel van visualisatie 1 vormt dan ook een soort scatterplot

Conclusie

Overzicht

• Inleiding/doelstelling• Literatuur• Onderzoek• Evaluatie• Technologie/implementatie• Besluit• Statistieken

Dataset• Ditmaal geen rangschikking visualiseren

• Dataset met evolutie verschillende parameters over landen Europese Unie (datamarket.com)

• Meerdere hoofdparameters mogelijk• Tijd = jaartallen: lineair, discreet en geordend

Visualisatie• Gebruiker kan hoofd- en nevenparameters

kiezen

Visualisatie-demo

Evaluatie• Face-to-face gebruikerstests en online

enquête op basis van visualisatie:

face-to-face online

Conclusie• Voor de gebruikte evaluatiemethode scoort de

visualisatie goed• Scores face-to-face en online evaluaties in

zelfde lijn• Zowel correlaties als evolutie doorheen de tijd

kunnen worden afgelezen• Positieve feedback van onbekende gebruiker

Overzicht

• Inleiding/doelstelling• Literatuur• Onderzoek• Evaluatie• Technologie/implementatie• Besluit• Statistieken

Technologie/implementatie

Overzicht

• Inleiding/doelstelling• Literatuur• Onderzoek• Evaluatie• Technologie/implementatie• Besluit• Statistieken

Besluit• Op iteratieve manier een techniek gevonden

voor een grote collectie tijdsafhankelijke datasets

• Geëvalueerd met nieuwe dataset

• => Scoorde goed op de evaluaties gebruikt tijdens het onderzoek

Besluit – beschrijving techniek

Besluit- moeilijkheden en toekomst• Evaluatiemethode mogelijk niet ideaal – Misschien Lickert-schaal beter– Efficiëntie/effectiviteit apart

• Interessant om de techniek te gebruiken voor andere dataset en op andere manier te evalueren

Overzicht

• Inleiding/doelstelling• Literatuur• Onderzoek• Evaluatie• Technologie/implementatie• Besluit• Statistieken

StatistiekenToggl Blogposts584h 22

0:00:00

24:00:00

48:00:00

72:00:00

96:00:00

120:00:00

144:00:00

168:00:00

192:00:00

216:00:00

Evaluatie

Implementatie

Lezen

Meetings

Ontwerp

Presentatie

Reflectie

Schrijven

Social network activiteiten

Vragen?