Upload
dophuc
View
250
Download
7
Embed Size (px)
Citation preview
OSNOVE STATISTIKE
Statisti ki nizovi, definicija, na in prikazivanja i analiza
Osnovni pojmovi u statistici
Statistika je posebna znanstvena disciplina koja na organiziran na in prikuplja, obra uje, prikazuje i vrši analizu podataka, te interpretira rezultate provedene analize prema postavljenim ciljevima istraživanja.U drugom zna enju statistika predstavlja sustavan pristup prikupljanju, sre ivanju i analizi podataka za potrebe vo enja državne politike ili poslovne politike gospodarskih subjekata.
Statistika kao znanstvena disciplina
Predmet prou avanja – masovne pojaveZajedni ko svojstvo tih pojava je varijabilnost, a statistika prou ava varijacije i kovarijacije podataka koji predo uju razli ite pojave ili procese u prirodi i društvuStatisti ka metodologija – u okviru statisti ke teorije razvijen je veliki broj statisti kih metoda. Metode mogu biti kvalitativne i kvantitativne, u statistici prevladavaju kvantitativne metode
Statistika u zna enju statisti ki sustav za potrebe vo enja državne politike
Statisti ki sustav je skup elemenata, uskla enih i povezanih u jedinstvenu cjelinu.Elementi statisti kog sustava su:
- Statisti ke organizacije- Statisti ka istraživanja- Baze podataka- Jedinstveni statisti ki standardi i
metodologija- Statisti ki pokazatelji i statisti ke
publikacije
Statisti ki skup, pojam i definicija
Skup svih elemenata na kojima se odre ena pojava statisti ki istražuje zove se statisti ki skup.Statisti ki skup se definira
- Pojmovno, definiraju se svojstva koja mora imati svaka jedinica da bi pripadala statisti kom skupu,
- Prostorno, odrediti prostor kojem pripadaju sve jedinice skupa,
- Vremenski, odrediti vremenski interval ili vremensku to ku za koju su vezane sve jedinice statisti kog skupa
Statisti ki skup, pojam i definicija
Statisti ki skup može biti realan i hipoteti an.Jedinice realnog skupa postoje u teku em vremenu.Jedinice hipoteti nog skupa se definiraju odre enim pravilom i rezultat su statisti kog procesa ili statisti kog pokusa.Broj jedinica nekog skupa se naziva opsegom skupa. Prema opsegu statisti ki skup može biti kona an i beskona an.
Statisti ki skup, pojam i definicija
Statisti ko istraživanje se može provoditi na cijelom statisti kom skupu ili na dijelu statisti kog skupa koji se zove uzorak.Uzorak je reprezentativan dio osnovnog skupa u kojem se promatrana statisti ka pojava ponaša na približno isti na in kao i u cijelom skupu. Rezultati dobiveni istraživanjem na uzorku se uop avaju i statisti kim zaklju ivanjem se donose zaklju ci o osnovnom skupu.
Statisti ko obilježje, pojam i definicija
Statisti ka obilježja su svojstva po kojima su jedinice skupa me usobno sli ne ili se razlikuju.Dijele se na:
- Nominalna, svojstva jedinica statisti kog skupa koja se izražavaju opisno
- Redoslijedna, svojstva jedinica statisti kog skupa za koja se može utvrditi stupanj posjedovanja promatranog obilježja.
- Numeri ka, svojstva jedinica statisti kog skupa koja se izražavaju pomo u brojeva.
Statisti ki podaci
Statisti ki podaci su rezultat mjerenja svojstava jedinica statisti kog skupaMjerenje je pridruživanje numeri kih i nenumeri kih oznaka jedinicama skupa prema odre enom pravilu. Pravila pridruživanja odre ena su mjernom skalom koja se koristi kod mjerenja. Svakom mjerenju prethodi definiranje mjerne skale. S obzirom na metri ka svojstva razlikuju se nominalna, ordinalna, intervalna i omjerna skala.
Statisti ki podaci
Nominalna skala je dana u obliku liste naziva (atributa ili geografskih pojmova). Mjerenje nominalnom skalom zna i pridruživanje statisti kim jedinicama odgovaraju eg naziva (atributa ili geografskog pojma) iz liste. Ordinalna skala je dana u obliku liste modaliteta rangiranih prema intenzitetu mjernog svojstva. Modaliteti na listi su rangovi koji mogu biti izraženi opisno ili brojem.
Statisti ki podaci
Intervalna skala je numeri ka skala koju karakterizira definirana mjerna jedinica i dogovorno utvr ena nula. Mjerenje intervalnom skalom zna i pridruživanje brojeva jedinicama skupa prema intenzitetu mjerenog svojstva, izraženo u definiranim mjernim jedinicama. Omjerna skala je numeri ka skala koju karakterizira definirana mjerna jedinica i nula koja ozna uje nepostojanje svojstva.
Statisti ki podaci
Statisti ki podaci mogu biti izvorni i izvedeni. Izvorni podaci su rezultat izravnog mjerenja obilježja pomo u mjerne skale.Izvedeni se dobiju ra unskim operacijama nad podacima koji se odnose na jednu ili više varijabli.Izvori podataka mogu biti primarni i sekundarni
URE IVANJE STATISTI KIH PODATAKA. STATISTI KI NIZ
Za dobivanje preglednih podataka nužno je izvršiti klasifikaciju istih ili grupiranje podataka, kako se taj postupak uobi ajeno naziva u obradi statisti kih podataka. Grupiranjem statisti kih podataka nastaju statisti ki nizovi. Grupiranje statisti kih podataka je postupak kojim se statisti ki skup dijeli na odre eni broj grupa ili podskupova prema prethodno utvr enim modalitetima istraživanog obilježja i uz uvažavanje principa isklju ivosti i iscrpnosti.
Nominalni statisti ki niz
Nominalni niz nastaje ure enjem podataka prema modalitetima nominalne varijable. Ako se modaliteti nominalne varijable ozna e sa , gdje je k broj razli itih modaliteta, a pripadaju e frekvencije sa , onda skup ure enih parova predstavlja nominalni niz. Redoslijed grupa u nominalnom nizu je proizvoljan.
ki aaaa ,...,,...,, 21
ki ffff ,...,,...,, 21
kifa ii ,...,2,1,,
Nominalni statisti ki niz
Veli ine fi zovu se apsolutne frekvencije.Apsolutna frekvencija je broj statisti kih jedinica koje imaju istu vrijednost obilježja. Zbroj apsolutnih frekvencija jednak je opsegu statisti kog skupa. U statisti koj analizi nominalnih nizova koriste se i relativne frekvencije. Relativna frekvencija pi je relativni broj koji pokazuje udio grupe podataka u ukupnom broju podataka. Dobiva se tako da se frekvencija grupe podijeli ukupnim brojem podataka.
Nominalni statisti ki niz
Relativna postotna frekvencija Pi dobiva se tako da se relativna frekvencija pomnoži sa 100. Mogu nosti broj ane analize nominalnih nizova su ograni ene, osim ve spomenutih relativnih frekvencija mogu se koristiti indeksni brojevi i relativni brojevi koordinacije.Nominalni nizovi se prikazuju u statisti kim tablicama i pomo u grafikona. Nominalna varijabla ima najslabija metri ka svojstva pa su mogu nosti broj ane analize ograni ene. Od srednjih vrijednosti u njihovoj analizi može se odrediti mod ili naj eš i modalitet.
Redoslijedni (ordinalni) statisti ki niz
Redoslijedni niz se dobiva ure enjem podataka prema modalitetima varijable ranga. Ako se mogu i rangovi odre ene varijable ozna e sa gdje je k broj rangova, a pripadaju e frekvencije sa onda skup ure enih parova
predstavlja redoslijedni niz.
ki rrrr ,...,,...,, 21
ki ffff ,...,,...,, 21
kifr ii ,...,2,1);,(
Redoslijedni (ordinalni) statisti ki niz
Kod prikazivanja redoslijednog niza pored apsolutnih frekvencija mogu se koristiti relativne frekvencije i relativne postotne frekvencije. Osim toga mogu se izra unavati i kumulativne frekvencije.Redoslijedni nizovi se prikazuju u tablici i grafi ki, sli no kao i nominalni nizovi. U analizi redoslijednih nizova mogu se odrediti položajne srednje vrijednosti, mod i medijan.
Numeri ki statisti ki nizNumeri ki niz se dobiva ure enjem podataka prema modalitetima numeri ke varijable. Ako se mogu e vrijednosti numeri ke varijable ozna e sa
gdje je k broj razli itih vrijednosti diskretne numeri ke varijable, a pripadaju e frekvencije sa
onda skup ure enih parova
predstavlja numeri ki niz.
ki xxxx ,...,,...,, 21
ki ffff ,...,,...,, 21
kifx ii ,...,2,1);,(
Numeri ki statisti ki niz
Ako diskretna numeri ka varijabla poprima veliki broj razli itih vrijednosti ili se radi o kontinuiranoj varijabli, grupiranje se provodi tako da se interval vrijednosti podijeli na podintervale ili razrede veli ina. Pojedina ni podaci se razvrstavaju u grupe prema vrijednosti.U tom slu aju numeri ki niz je skup ure enih parova
Kod analize statisti kih nizova sa razredima koristi se razredna sredina.
kifLL iii ,...,2,1;,, 21
Numeri ki statisti ki niz
Numeri ki nizovi se prikazuju u tablicama i pomo u grafikona. Za prikazivanje numeri kih nizova mogu se koristiti pored površinskih i linijski grafikoni. Za prikazivanje kumulativnog niza koristi se posebna vrsta linijskog grafikona koji se naziva kumulantom.Mogu nosti broj ane analize numeri kih nizova su velike. U analizi se izra unavaju razli iti pokazatelji koji se mogu svrstati u etiri skupine. To su pokazatelji centralne tendencije numeri kih podataka, pokazatelji disperzije podataka, pokazatelji simetri nosti distribucije i pokazatelji zaobljenosti modalnog vrha.
Statisti ke tablice
R E D A KZ B I R N I
....
Modalitet 2
modalitet 1
LJ EL A V Sadržaj kolone
Z A G Sadržaj kolone
Obilježje
Statisti ke tablice
Statisti ke tablice mogu biti proste, skupne i kombinirane.Prosta statisti ka tablica sadrži samo jedan statisti ki niz. Statisti ko obilježje i njegovi modaliteti se prikazuju u pretkoloni, a frekvencije su u drugom stupcu.Skupna statisti ka tablica sadrži dva statisti ka niza kojima je zajedni ko istraživano obilježje.
Statisti ke tablice
Kombinirane statisti ke tablice imaju dva ili više statisti kih nizova koji predstavljaju podatke istog statisti kog skupa prema modalitetima dva ili obilježja. Modaliteti jednog obilježja se navode u pretkoloni, a drugog u zaglavlju tablice.Proste i skupne tablice imaju zbirni redak, a kombinirane pored zbirnog retka imaju i zbirnu kolonu.
Grafi ko prikazivanje statisti kih nizova
Statisti ki nizovi se mogu prikazati pomo u razli itih vrsta grafikona.Grafikoni se dijele na
- Piktograme ili to kaste dijagrame,- Površinske dijagrame,- Linijske dijagrame i- Prostorne ili 3D dijagrame.
To kasti dijagram ili piktogram
Podaci o prodanim garniturama namještaja
15 20 25 30 35 40 45 50 55 60 65
Dnevna prodaja
Dvostruki stupci
Ro eni i umrli u Federaciji BiH, prosinac 2007.
050
100150200250300350400
1 2 3 4 5 6 7 8 9 10
Kanton / županija
Frek
venc
ije
Ro eniUmrli
Razdijeljeni stupci
No enja turista u Federaciji BiH u 2007. godini
0%
20%
40%
60%
80%
100%
Hoteli
Moteli
Pansio
ni
Kuanstv
aOsta
lo
Ukupno
Stru
ktur
a tu
rist
a
StraniDoma i
Histogram
Nepismeno stanovništvo preko 10 godina starosti u BiH po popisu 1991.
0
10000
20000
30000
40000
50000
60000
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80
Godine starosti
Kor
igir
ane
frek
venc
ije
Strukturni krug
Registrirana vozila u Federaciji BiH 2007. godine prema starosti
do 1 god
1 - 2
3 - 5
6 - 10
11 - 15
više od 15
Linijski dijagram-poligon frekvencija
Sklopljeni brakovi u Bosni i Hercegovini u 2006. godini
0
2.000
4.000
6.000
8.000
10.000
0 10 20 30 40 50 60 70
Starost nevjeste
Kor
igir
ane
frek
venc
ije
Kumulanta
Funkcija distribucije sklopljenih brakova u Bosni i Hercegovini 2006. godine
0,00
0,20
0,40
0,60
0,80
1,00
1,20
10 15 20 25 30 35 40 45 50 55 60 65 70
Starost nevjeste
Kum
ulat
ivne
frek
venc
ije
Kumulanta
Ku anstva u BiH prema broju lanova po popisu iz 1991.
0
200.000
400.000
600.000
800.000
1.000.000
1.200.000
1.400.000
0 1 2 3 4 5 6 7 8 9 10
Broj lanova
Kum
ulat
ivne
frek
venc
ije
Prostorni ili 3D dijagram
Hoteli
Moteli
Pansio
ni
Kuanstv
a
Ostalo
Doma iStrani
Ukupno0
100.000
200.000
300.000
400.000
500.000
600.000
700.000
Bro
j no
enja
No enja turista u F BiH u 2007. g. prema vrstama objekta
Doma iStraniUkupno
Analiza statisti kih nizova
Skupine mjera u analizi statisti kih nizova- srednje vrijednosti- mjere disperzije podataka- mjere asimetrije podataka- mjere razvu enosti podataka po brojnoj osi
ili mjere zaobljenosti modalnog vrhaSrednje vrijednostiSrednje vrijednosti su konstante kojima se predo uju nizovi varijabilnih podataka. One pokazuju tendenciju koncentracije podataka pa se još zovu i mjere centralne tendencije.Dijele se na potpune i položajne.
Analiza statisti kih nizova
Potpune srednje vrijednosti se izra unavaju na temelju svih podataka, a najvažnije su aritmeti ka, geometrijska i harmonijska sredina.Položajne srednje vrijednosti se odre uju prema položaju u nizu, sukladno definiciji srednje vrijednosti. To može biti jedan modalitet obilježja ili vrijednost koja se izra una pomo u manjeg broja podataka. Položajne srednje vrijednosti su mod i medijan.
Aritmeti ka sredina
Aritmeti ka sredina je prosje na vrijednost numeri ke varijable.Za negrupirane podatke izra unava se prosta ili jednostavna aritmeti ka sredina
N
x
Nxxx
x
N
ii
N 121 ...
Aritmeti ka sredina
Za grupirane podatke izra unava se vagana ili ponderirana aritmeti ka sredina
k
iiik
ii
k
iii
k
kk xfNf
xf
fffxfxfxfx
1
1
1
21
2211 1.......
Aritmeti ka sredina
Karakteristike aritmeti ke sredine su:Svaki numeri ki niz podataka ima aritmeti ku sredinu.Za izra unavanje aritmeti ke sredine koriste se svi podaci numeri kog niza.Numeri ki niz ima samo jednu aritmeti ku sredinu. Aritmeti ka sredina se uvijek nalazi izme u najmanje i najve e vrijednosti u nizu, .Ako su sve vrijednosti u nizu jednake nekoj konstanti, onda je i aritmeti ka sredina jednaka toj konstanti, Zbroj odstupanja vrijednosti numeri kog obilježja od aritmeti ke sredine jednak je nuli.Zbroj kvadrata odstupanja pojedina nih vrijednosti numeri kog obilježja od aritmeti ke sredine je minimalan.
Geometrijska sredina
Geometrijska sredina N vrijednosti numeri ke varijable X se definira kao N-ti korijen iz produkta njezinih vrijednosti i ozna ava se sa G. Izraz za izra unavanje je:
NN
ii
NNi xxxxxG
121 ......
N
iix
NG
1log1log
Geometrijska sredina
Ako su podaci grupirani, geometrijska sredinu distribucije frekvencija se ra una kao ponderirana sredina pomo u formule:
Nk
i
fi
N fk
fi
ff iki xxxxxG1
21 ......21
k
iii xf
NG
1
log1log
Geometrijska sredina
Karakteristike geometrijske sredine su:Geometrijska sredina se nalazi izme u najve e i najmanje vrijednosti obilježja, Ako su sve vrijednosti obilježja jednake nekoj konstanti, onda je i geometrijska sredina jednaka toj konstanti, Produkt omjera geometrijske sredine i vrijednosti obilježja manjih od geometrijske sredine jednak je produktu omjera ve ih vrijednosti obilježja i geometrijske sredine.
Harmonijska sredina
Harmonijska sredina je recipro na vrijednost aritmeti ke sredine recipro nih vrijednosti obilježja. Za negrupirane podatke ra una se prosta harmonijska sredina prema izrazu:
N
i iNi x
N
xxxx
NH
121
11...1...11
Harmonijska sredina
a za grupirane podatke se ra una ponderirana harmonijska sredinaprema izrazu:
k
i i
i
k
ii
k
k
i
i
ki
xf
f
xf
xf
xf
xf
ffffH
1
1
2
2
1
1
21
......
......
Harmonijska sredina
Harmonijsku sredinu ima smisla ra unati samo za obilježja ije su sve vrijednosti ve e od nule. Ima svojstva srednje vrijednosti, ali njezino tuma enje nije jednostavno. Koristi se uglavnom kao prosje na vrijednost izvedenih podataka prikazanih kao recipro ne vrijednosti. Primjer izvedenih podataka kod kojih se koristi harmonijska sredina kao srednja vrijednost jesu relativni brojevi koordinacije s jednakim brojnicima.
Momenti numeri kog niza
Moment r-tog reda oko broja „a“ se definira kao aritmeti ka sredina odstupanja numeri ke varijable od zadanog broja a, podignute na r-tu potenciju. Izraz za momente je:
N
i
rir ax
Nm
1
1
Momenti numeri kog niza
Za vrijednost broja a kod izra unavanja momenata obi no se uzima vrijednost 0 (nula), pa se takvi momenti zovu momenti oko nule ili pomo ni momenti; ili vrijednost aritmeti ke sredine, pa se takvi momenti zovu momenti oko sredine ili centralni momenti.
Momenti numeri kog niza
Momenti oko nule se ozna avaju sa mr a ra unaju se za negrupirane i grupirane podatke pomo u izraza:
Prvi moment oko nule je aritmeti ka sredina, a ostali momenti oko nule nisu kao takvi pokazatelji u analizi numeri kog niza ve se koriste za jednostavnije izra unavanje momenata oko sredine, pa se zbog toga i nazivaju pomo ni momenti.
N
i
rir x
Nm
1
1 N
i
riir xf
Nm
1
1
Momenti numeri kog niza
Momenti oko sredine se uobi ajeno ozna avaju sa Mr , a izra unavaju se za negrupirane i grupirane podatke prema izrazima:
Prvi moment oko sredine je jednak nuli, zbog svojstva aritmeti ke sredine da je zbroj odstupanja vrijednosti numeri kog obilježja od aritmeti ke sredine jednak nuli. Drugi moment oko sredine služi za mjerenje disperzije podataka, tre i moment za mjerenje simetri nosti podataka, a etvrti moment za mjerenje zaobljenosti distribucije.
N
i
rir xx
NM
1
1 N
i
riir xxf
NM
1
1
Momenti numeri kog niza
U statisti koj analizi se koriste momenti drugog (za mjerenje disperzije), tre eg (za mjerenje simetri nosti) i etvrtog reda (za mjerenje razvu enosti podataka), Momenti oko sredine mogu se odrediti korištenjem pomo nih momenata. Odgovaraju i izrazi za drugi, tre i i etvrti moment oko sredine su:
412
213144
312133
2122
364
23
mmmmmmMmmmmM
mmM
Mod
Mod je naj eš a vrijednost kvantitativne ili kvalitativne varijable.To je vrijednost u nizu koja se javlja najve i broj putaAko su podaci grupirani, to je modalitet sa najve om frekvencijom
Mod
Ako je grupiranje provedeno s razredima, onda se pomo u frekvencija odre uje modalni razred, a vrijednost moda se aproksimira pomo u izraza:
Ako su razredi iste veli ine koriste se originalne frekvencije (apsolutne ili relativne), a ako su razredi razli ite veli ine koriste se korigirane frekvencije.
icbab
abLMo 1
Mod
Mod ima sljede a svojstva:Mod se može odrediti za svaku vrstu statisti kog niza.Svaki niz podataka ne mora imati mod. Ako su sve vrijednosti obilježja razli ite, niz nema mod.Jedan statisti ki niz može imati jedan ili više modova, pa se kaže da se radi o unimodalnoj ili o multimodalnoj distribuciji.Kod numeri kih nizova mod se nalazi izme u najve e i najmanje vrijednosti obilježja, s tim što može biti i jednak najve oj vrijednosti obilježja, odnosno najmanjoj vrijednosti obilježja ak i onda kada nisu sve vrijednosti u nizu jednake.
Grafi ko odre ivanje moda
Sklopljeni brakovi u BiH 2006. godine
0
2.000
4.000
6.000
8.000
10.000
10 15 20 25 30 35 40 45 50 55 60 65
Starost nevjeste
Kor
igir
ane
frek
venc
ije
Mo
Medijan
Medijan je ona vrijednost obilježja koja niz ure en po veli ini dijeli na dva jednakobrojna dijela. Postupak odre ivanja medijana po injeutvr ivanjem rednog broja podatka ija vrijednost predstavlja medijalnu vrijednost.Ako je broj podataka neparan redni broj medijalnog podatka je:
12NINTr
rxMe
Medijan
Ako je broj podataka paran, medijan je poluzbroj dva središnja podatka u nizu. Redni broj prvog podatka je:
2Nr
21rr xxMe
Medijan
U distribuciji frekvencija s razredima prvo se odredi medijalni razred, a to je onaj ija kumulativna frekvencija prvi put uklju uje vrijednost N/2.
if
fN
LMemed
1
12
Grafi ko odre ivanje medijana
Kumulativna distribucija sklopljenih brakova u BiH 2006. godine
0
0,2
0,4
0,6
0,8
1
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70
Starost nevjeste
Kum
ulat
ivne
rel
ativ
ne
frek
venc
ije
Me
Kvantili
Vrijednosti numeri ke varijable ili modaliteti rang-varijable koji niz podataka ure en po veli ini dijele na odre eni broj dijelova, r – dijelova, zovu se kvantili. Broj dijelova r predstavlja red kvantila. U statisti koj analizi se koriste kvantili etvrtog reda i zovu se kvartili, kvantili desetog reda ili decili i kvantilistotog reda ili percentili.Broj kvartila je za jedan manji od njegovog reda, pa tako imaju tri kvartila, devet decila i devedeset devet percentila. Na ini odre ivanja kvantila su analogni onima za odre ivanje medijana.Od kvantila u statisti koj analizi se najviše koriste kvartili. Kvartila imaju tri i to prvi kvartil –Q1, drugi kvartil – Q2 (ili medijan) i tre i kvartil – Q3.
Kvartili
Za prvi ili donji kvartil, redni broj podatka ija vrijednost obilježja predstavlja kvartilnu vrijednost odre uje se prema vrijednosti N/4. Ako N/4 nije cjelobrojna vrijednost, redni broj broj prvog kvartila je:
Ako je N/4 cjelobrojna vrijednost redni broj donjeg kvartila je:
14NINTr rxQ1
4Nr
21
1rr xx
Q
Kvartili
Za podatke grupirane u razrede kvartilni razred je onaj ija kumulativna frekvencija prvi put uklju uje veli inu N/4. Vrijednost kvartila se aproksimira izrazom:
if
fN
LQk var
1
114
Kvartili
Za tre i ili gornji kvartil, redni broj podatka ija vrijednost obilježja predstavlja kvartilnu vrijednost odre uje se prema vrijednosti 3N/4. Ako 3N/4 nije cjelobrojna vrijednost, redni broj broj tre eg kvartila je:
Ako je 3N/4 cjelobrojna vrijednost, redni broj gornjeg kvartila je:
14
3NINTr rxQ3
43Nr
21
3rr xx
Q
Kvartili
Za podatke grupirane u razrede kvartilnirazred je onaj ija kumulativna frekvencija prvi put uklju uje veli inu 3N/4. Vrijednost kvartila se aproksimira izrazom:
if
fN
LQk var
1
134
3
MJERENE DISPERZIJE PODATAKA
Mjere disperzije su broj ani pokazatelji kojima se opisuje stupanj varijabilnosti statisti kih podataka. Za mjerenje disperzije koristi se više pokazatelja, koji mogu biti apsolutni ili relativni. Apsolutne mjere iskazuju disperziju u mjernim jedinicama promatranog obilježja, a relativnim mjerama disperzija je iskazana u postotcima ili nekim drugim relativnim brojevima. Prema broju podataka koji se koriste kod ra unanja odre enog pokazatelja, razlikuju se potpune i nepotpune mjere disperzije.
MJERENE DISPERZIJE PODATAKA
Od nepotpunih mjera u statisti koj analizi se koriste raspon varijacije, interkvartil i koeficijent kvartilne devijacijea od potpunih mjera se koriste srednje apsolutno odstupanje, varijanca, standardna devijacija i koeficijent varijacije.Raspon varijacije je najjednostavnija mjera disperzije, a predstavlja razliku izme u najve e i najmanje vrijednosti u nizu kvantitativnih podataka:
minmax xxR
MJERENE DISPERZIJE PODATAKA
Interkvartil je raspon varijacija središnjih pedeset posto lanova niza ure enih podataka. Dobiva se kao razlika gornjeg i donjeg kvartila:
Koeficijent kvartilne devijacije je relativna mjera disperzije koja se izra unava pomo u kvartila. Dobiva se kao omjer interkvartila i zbroja kvartila:
13 QQIQ
13
13
QQQQ
VQ
MJERENE DISPERZIJE PODATAKA
Mjera koja polazi od apsolutnih vrijednosti odstupanja podataka od aritmeti ke sredine poznata je pod nazivom prosje no apsolutno odstupanje, ozna ava se sa MAD (skra enica od engleskog naziva ove mjere, Mean AbsoluteDeviation). Za negrupirane i grupirane podatke izra unava se prema izrazima:
N
ii xx
NMAD
1
1 k
iii xxf
NMAD
1
1
MJERENE DISPERZIJE PODATAKA
Prosje no apsolutno odstupanje esto se ra una kao odstupanje podataka od medijana, zbog svojstva da je zbroj odstupanja vrijednosti numeri ke varijable od medijana minimalan. Izrazi za njegovo ra unanje, za negrupirane i grupirane podatke su:
N
ii Mex
NMAD
1
1 k
iii Mexf
NMAD
1
1
MJERENE DISPERZIJE PODATAKA
Varijanca je aritmeti ka sredina kvadrata odstupanja numeri ke varijable od njezine aritmeti ke sredine, a ra una se pomo u izraza (za negrupirane i grupirane podatke):
Kod ra unanja varijance eš e se koristi izraz u tzv. razvijenom obliku koji glasi (za negrupirane i grupirane podatke):
N
ii xx
Ns
1
22 1 k
iii xxf
Ns
1
22 1
2
1 1
22 11 N
i
N
iii x
Nx
Ns
2
1 1
22 11 k
i
k
iiiii xf
Nxf
Ns
MJERENE DISPERZIJE PODATAKA
Standardna devijacija se tuma i kao prosje no odstupanje vrijednosti numeri ke varijable od njezine aritmeti ke sredine. Izrazi za ra unanje standardne devijacije izvedeni su iz izraza za varijancu. Dobiva se kao pozitivni drugi korijen iz varijance.Koeficijent varijacije predstavlja omjer standardne devijacije i aritmeti ke sredine podataka pomnožen sa 100. Izraz za koeficijent varijacije je:
100xsV
Standardizirana varijabla
Standardizirana varijabla predstavlja odstupanja vrijednosti numeri ke varijable od aritmeti ke sredine izražena u jedinicama standardnih devijacija. Izra unava se pomo u izraza:
Vrijednost standardizirane varijable može biti pozitivna ili negativnaAritmeti ka sredina distribucije frekvencija standardizirane varijable jednaka je nuli, a standardna devijacija je jednaka jedan.Pravilo ebiševa – najmanja proporcija podataka obuhva ena intervalom iznosi
sxx
z ii
ksx2
11k
1k
Standardizirana varijabla
Prema navedenom pravilu u intervalu nalazi se 75% podataka, u intervalu nalazi se 88,89% podataka, u intervalu nalazi se 93,75% podataka, a u intervalu ima 96% podataka. Dakle, 96% lanova bilo kojeg niza standardiziranih vrijednosti imat e vrijednost od -5 do +5.Prema pravilima normalne distribucije u intervalu
nalazi se 68,26% podataka, u intervalu ima 95,44%, a u intervalu ima 99,73% podataka. Zna i, gotovo svi podaci simetri ne distribucije imaju vrijednost standardizirane varijable u intervalu od -3 do +3.
sx 2sx 3
sx 4sx 5
sx sx 2sx 3
Mjetrenje simetri nosti podataka
Najvažniji pokazatelji asimetri nosti rasporeda podataka su koeficijent asimetrije, Pearson-ov i Bowley-ev koeficijent asimetrije.Koeficijent asimetrije - K predstavlja omjer tre eg momenta oko sredine i standardne devijacije podignute na tre u potenciju.
Tre i moment oko sredine za negrupirane podatke i za distribuciju frekvencija se dobivaju prema izrazima:
N
ii xx
NM
1
33
1 k
iii xxf
NM
1
33
1
33
sMK
Mjerenje simetri nosti podataka
Pearson-ov koeficijent asimetrije temelji se na položaju srednjih vrijednosti numeri ke varijable.
Bowley-ev koeficijent asimetrije temelji se na odnosu kvartila i medijana
sMexK s
3sMoxK s
13
31 2QQ
MeQQKQ
Simetri na distribucija
Vrijednost obilježja
Frek
venc
ije
x=Me=Mo
Asimetri ne distribucije
Vrijednost obilježja
Frek
venc
ija
Mo<Me<x Vrijednost obilježja
Frek
venc
ije
x< Me<Mo
Mjerenje zaobljenosti distribucije
Zaobljenost modalnog vrha distribucije mjeri se koeficijentom zaobljenosti. Koeficijent zaobljenosti - E dobiva se kao omjer etvrtog momenta oko sredine i standardne devijacije dignute na etvrtu potenciju, to jest:
A etvrti moment oko sredine za negrupirane i grupirane podatke je:
44
sME
N
ii xx
NM
1
44
1 k
iii xxf
NM
1
44
1