'
&
$
%
Univerza v Ljubljanipodiplomski studij statistike
Informacijska tehnologijav analizi podatkov
Prikazi podatkov
Vladimir BatageljFMF, matematika
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov I-1'
&
$
%
Kazalo1 Merske lestvice. . . . . . . . . . . . . . . . . . . . . . . . . . 1
2 Vrste merskih lestvic. . . . . . . . . . . . . . . . . . . . . . . 2
3 Preiskovanje in predstavitve podatkov. . . . . . . . . . . . . . 3
4 Prikazni sestav . . . . . . . . . . . . . . . . . . . . . . . . . . 4
5 Izhodne naprave. . . . . . . . . . . . . . . . . . . . . . . . . . 5
6 Slikovne sestavine. . . . . . . . . . . . . . . . . . . . . . . . . 6
7 Slikovne sestavine – globinska ostrina. . . . . . . . . . . . . . 7
8 Weber-ov zakon. . . . . . . . . . . . . . . . . . . . . . . . . . 8
9 Stevens-ov zakon. . . . . . . . . . . . . . . . . . . . . . . . . 9
10 Posledice . . . . . . . . . . . . . . . . . . . . . . . . . . . . .10
11 Slikovne prevare . . . . . . . . . . . . . . . . . . . . . . . . . 11
13 Podatkovja . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov I-2'
&
$
%
14 Zunanji in notranji pogled . . . . . . . . . . . . . . . . . . . . 14
15 Krmilje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15
16 Ocala in lupe . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
17 Prikazi vecrazseznih podatkovij . . . . . . . . . . . . . . . . . 17
18 Ravni v podatkovju. . . . . . . . . . . . . . . . . . . . . . . . 18
19 Slikovne sestavine in vrste lestvic. . . . . . . . . . . . . . . . 19
20 Trirazsezne predstavitve . . . . . . . . . . . . . . . . . . . . . 20
22 Dodatni viri . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 1'
&
$
%
Merske lestviceMerska lestvicaje predpisf : A → IR, ki posameznemu objektux iz
mnoziceA priredi neko realnostevilof(x). V analizi podatkov izmerjene
vrednosti dane lastnosti na izbranih objektih dolocajo spremenljivko.
Merske lestvice, ki merijo isto lastnost so enakovredne – npr. vrednost
izrazena v USD oziroma v EUR. Za obicajne lestvice velja, da lahko
enakovredni lestvici predelamo eno v drugo zdopustnimi transformacijami.
Te dolocajovrsto(tip) lestvice (glej naslednjo prosojnico).
Vrste lestvic imajo v analizi podatkov pomembno vlogo – dolocajo, kaj
lahko z danimi podatki pocnemo.
Teorija merjenja.
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 2'
&
$
%
Vrste merskih lestvicdopustne transformacije vrsta lestvice primeri
ϕ(x) = x (identiteta) absolutna stetje
ϕ(x) = a.x, a > 0 razmernostna masa
podobnost temperatura (K)
ϕ(x) = a.x+ b, a > 0 razmicna temperatura (C,F)
cas (koledar)
x ≥ y ⇔ ϕ(x) ≥ ϕ(y) urejenostna solske ocene, kakovost
strogo narascajoca zraka, trdost kamnin
ϕ je povratno enolicna imenska barva las, narodnost
ϕ(x) = a.xb, a > 0 log-razmicna
ϕ(x) = x+ b diferencna
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 3'
&
$
%
Preiskovanje in predstavitve podatkovZ rastjo zmogljivosti namiznih racunalnikov se je v 90. letihprikazo-
vanjepodatkov zacelo uveljavljati kot pomembno orodje zapreiskovanje
podatkovij in zapredstavitvedobljenih rezultatov.
Osnovna nalogaanalize in prikazov podatkovje razkrivanje lastnosti
(obseznih) z uporabo zmogljivosticlovekovega vida na prikazih ustvarjenih
s sodobno racunalnisko grafiko. Koncni cilj je dobiti vpogled v podatke in
razumeti odnose med posameznimi deli.
Cilj (slikovnih) predstavitev je kar se da razumljivo posredovanje rezultatov.
Pri (znanstvenih) prikazih pa uporabljamo slike, da bi razkrili posamezne
znacilnosti podatkov. Pogosto se oba vidika prekrivata.
Milestones
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 4'
&
$
%
Prikazni sestavPri prikazovanju podatkov uporabnik sledi razlicnim ciljem: najde/doloci,
razlikuje, uvrsti, razvrsti, uredi, primerja, poveze, . . .
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 5'
&
$
%
Izhodne napraveVecina starejsih virov o prikazovanju podatkov je usmerjena na ’list papirja’.
Racunalniski zaslon ponuja veliko novih moznosti
• vzporedni prikazi
• zacasne sestavine (oznake, pojasnila, zastavice, . . . )
• poudarjene izbire, povezave med prikazi
• sodejnost
• obcutek trirazseznosti (gibanje)
Te moznosti je potrebno kar se le da izkoristiti za podporo resevanja
nalog analize podatkov. Prihodnost je v sodejnih, dinamicnih in vecslicnih
(lokalni/celotni pogled, izbire, primerjave, . . . ) prikazih.
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 6'
&
$
%
Slikovne sestavineSlikovne sestavine so lastnosti s katerimi lahko predstavimo izbrano lastnost
podatkov.
• polnila: barva (hue), nasicenost, svetlost, ostrina, vzorec
• prostorske sestavine:
– splosne: dolzina, velikost, lik, mesto, smer, simetrija, polozaj
(spredaj / zadaj), zasuk, razdalja (med gradniki)
– posebne 3D : zakrivanje, perspektiva, prozornost, globina, gibanje
• razseznosti: pika, daljica, lik, telo
Slikovne sestavine so osnova razlicnihslikovnih prikazov.
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 7'
&
$
%
Slikovne sestavine – globinska ostrina
Semantic Depth of Field
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 8'
&
$
%
Weber-ov zakonWebrov zakon (ose zaznavnih razlikah) pravi, da je verjetnost, da ne bomo
zaznali razliko med dvema prikazoma dane sestavine sorazmerna razmerju
vrednosti.∆ψψ + a
= c
ψ je zaznana (’merjena’) lastnost,c in a sta konstanti. vid:c = 160 ;
bolecina: c = 130 ; vonj: c = 1
4 ; slanost:c = 13 .
Na primer: opaznost razlicnosti dveh dolzin je odvisna od razmerja teh
dveh dolzin, ne pa od njune razlike.
Opaznost razlik pri primerjavi dolzin lahko bistveno povecamo z vpeljavo
oporne mreze.
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 9'
&
$
%
Stevens-ov zakonStevensov zakon pravi, da je zaznana vrednostψ dane lastnosti povezana z
dejansko (fizikalno) vrednostjoφ po obrazcu
ψ = k(φ− φ0)c
kjer sok, c in φ0 konstante.
Natancnost nasih zaznav je za lastnosti sc razlicnim od 1 odvisna od
velikosti vrednosti – zaznave so pristranske.
Poskusi so pokazali, da jec za dolzino med .9 in 1.1; za ploscino med .6 in
.9; in za prostornino med .5 in .8 .
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 10'
&
$
%
PosledicePoskusi na osnovi Stevensovega zakona so dali naslednjo urejenost
slikovnih sestavin glede na natancnost zaznavanja:
• mesto glede na skupno os (najbolj natancno)
• lega na dveh enakih, a neporavnanih oseh
• dolzina
• kot – naklon
• ploscina
• prostornina
• barva (hue) – barvna nasicenost – barvna svetlost (najmanj natancno)
Ljudje smo razlicni: barvna slepota, navajenost, izurjenost, izobrazenost,
. . .
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 11'
&
$
%
Slikovne prevareNase zaznave so odvisnese od drugihlastnosticloveskega vida. Te je
potrebno upostevati pri nacrtovanju resitev.1, 2, 3, 4.
Primer iz knjige Darrrell H.:How to Lie with Statistics.
Desni plavz na sliki je 1.4 krat visji od levega – kar naj bi prikazalo, da
je bila prozvodnja jekla 1.4 krat vecja. Toda, ker pri primerjavi likov,
primerjamo njihove ploscine, je zaznano raumerje 2 (= 1.42).
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 12'
&
$
%
. . . Slikovne prevare
Pri primerjavi dveh krivulj nas obicajno zanimanavpicna razdalja –
razlika funkcijskih vrednosti; tisto, kar obicajno opazimo pa jenajmanj sarazdalja med krivuljama.
Kaj je vas prvi vtis o obeh funkcijah? Tezita skupaj?
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 13'
&
$
%
PodatkovjaNa izbiro oblik prikaza mocno vplivajo:
• velikost: majhno, veliko, ’neskoncno’;
• gostota: razprseno, gosto, vec skupin; in
• dejavnost: ustaljeno, spreminjajoce.
Majhna podatkovja lahko prikazemo v celoti in v vseh podrobnostih na eni
sliki. V celovitem prikazu obseznega podatkovja se podrobnosti zgubijo;
podrobni prikaz pa lahko zaobjame le del podatkovja.
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 14'
&
$
%
Zunanji in notranji pogledObicajni prikazi podatkov, kakrsne najdemo v splosno namenskih pro-
gramih (Excel, PowerPoint, ...) omogocajo praviloma pogledod zunaj–
uporabnik je postavljen izven prikaza. V teh primerih je tretja razseznost
uporabljena predvsem za ’okraske’, in ne za ustreznejsi prikaz.
Ena od osnovnih znacilnosti navidezne resnicnosti (Virtual Reality) je
podporanotranjegapogleda – uporabnik je vkljucen v prikaz kot njegov
dejavni del in lahko potuje po prikazu. Slika je dolocena z njegovim
mestom v prikazu.
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 15'
&
$
%
KrmiljePri pregledovanju obseznih podatkovij se lahko uporabnik “izgubi v gozdu”.Pri usmerjanju uporabnika so na voljo razlicni prijemi:
• ponoven zacetek: vrne uporabnika v izhodisce;
• vpeljava dodatnihorientacijskih sestavin: prikaz osi, mreze, sence,znamenja (stalna / uporabniska). Te sestavine lahko uporabnik vklapljain izklaplja.
• vec slik: prikaz na vsaj dveh slikah (oknih):
– zemljevid: celovit (praviloma zunanji) pogled, ki prikazuje tuditrenutno mesto uporabnika in omogoca ’dolge’ korake (skoke).Za zelo obsezna podatkovja lahko vkljucuje moznost povecaveoziroma ’ribjega ocesa’.
– trenutna okolica: prikaz izbranega dela podatkovja.
Koristna je uvedbasledi / nazaj / ponovi in vodenih sprehodov.
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 16'
&
$
%
Ocala in lupeZ vecslicnimi prikazi so tesno povezani pojmiocal, lup in povecevanja
(Pad++, inXight ).
Z izbiro razlicnih ocal do-
bimo razlicne poglede na
iste podatke – ki podpirajo
razlicne vidike/cilje prikaza.
Ocala delujejo na celo sliko,
lupe pa samo na izbrano
obmocje slike. Pristop poz-
namo iz slikovnih vmes-
nikov.Prikaz lahko dopolnimo spodpornimi sestavinami: oznake, mreze, pojas-
nila, . . .
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 17'
&
$
%
Prikazi vecrazseznih podatkovijNaj boE = {Xi} mnozica enot. EnotaX je obicajno opisana z naborom
vrednosti izbranih lastnosti –spremenljivk
Xi = (V1 = xi1, V2 = xi2, ..., Vm = xim)
Posamezno enoto lahko prikazemo z uporaboglif a, ki v sebi zdruzuje
sestavine, ki predstavljajo vrednosti posameznih spremenljivk.
Znanih je vec ravninskih (2D) glifov: tocka v ravnini, krozni prikaz, stolpcni
prikaz, zvezda, obraz Chernoffa, krivulja Andrewsa, tirnica, . . . Vecino teh
resitev je mogoce razsiriti za prostorske prikaze.*
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 18'
&
$
%
Ravni v podatkovjuPosamezne sestavine predstavitve enote podpirajo razlicna opravila (iskanje
povezav, izbiranje, urejanje, . . . ) nad enotami. Pri tem se pogosto prepletajo
deli z razlicnih ravni
spremenljivka, enota, skupina, skupine, podatkovje
Vecino postopkov analize podatkov je mogoce obravnavati kot transforma-
cije ali odnose med temi ravnmi.
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 19'
&
$
%
Slikovne sestavine in vrste lestvicPosamezne vrste spremenljivk predstavljamo z ustreznimi slikovnimi
sestavinami
lestvica slikovne sestavine
imenska barva, oblika(lik)
urejenostna stopnja, svetlost, gostota vzorca, razmestitev (mesto v)
stevilska velikost, mesto, smer, kot
Ker sostevilskelestvice tudiurejenostne, in te tudiimenske, lahko ustrezne
sestavine uporabimo tudi za predstavitve vsebovanih vrst lestvic – vendar
pri tem zgubimo na natancnosti.
Uporaba neustreznih sestavin pa lahko privede do pojavitve neosnovanih
povezav.
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 20'
&
$
%
Trirazsezne predstavitveZa razvoj trirazseznih predstavitev lahko uporabimo spletni jezikVRML(Virtual Reality Modeling Language).
Pri tem lahko pri predstavitvah uporabimo naslednje sestavine:
• mesto v prostoru(x, y, z);
• obliko (krogla, kocka, stozec, valj, ravnina, . . . ;
• barva;
• velikost, kot, naklon, ploscina, prostornina;
• vzorec;
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 21'
&
$
%
• smer (usmerjenost);
• besedilo;
• svetila (razlicni viri, sence, prozornost, odsevi, . . . );
• zasuki;
• razlicni pogledi in nacini sprehajanja po prostoru; lastnosti kamere
(pravokotna, perspektiva, stereoskopska; zorni kot).
• sodejnost
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖
V. Batagelj: Informacijska tehnologija v analizi podatkov / Prikazi podatkov 22'
&
$
%
Dodatni viriJacques Bertin:Graphics and Graphic Information-Processing
Edward R. Tufte:The Visual Display of Quantitative Information
Leland Wilkinson:The Grammar of Graphics
Colin Ware:Information Visualization: Perception for Design
Jock Mackinlay:Information Visualization
Marti Hearst:Information Visualization and Presentation
John Stasko:Information Visualization
Wojciech Basalaj:Proximity Visualization of Abstract Data
Chris North:Information Visualization
Gitta Domik: Computer-generated Visualization
Toward a Perceptual Science of Multidimensional Data Visualization
Univerza v Ljubljani, Podiplomskistudij statistike ▲ ▲ ❙ ▲ ● ▲ ❙ ▲▲ ☛ ✖