Upload
ngonhan
View
228
Download
3
Embed Size (px)
12009/2009
Numeričke deskriptivne veličineNumeričke deskriptivne veličine
22009/2009
Osobine numeričkih podataka- mereOsobine numeričkih podataka- mere
aritmetička aritmetička srednja vrednostsrednja vrednost
medijanamedijana
modusmodus
Numeričko opisivanje podatakaNumeričko opisivanje podataka
varijansavarijansa
standardna devijacijastandardna devijacija
koeficijent varijacijekoeficijent varijacije
rasponraspon
interkvartilini rasponinterkvartilini raspon
geometrijska geometrijska srednja vrednostsrednja vrednost
zakrivljenostzakrivljenost
Centralna Centralna tendencijatendencija
VarijacijaVarijacija AsimetrijaAsimetrijaKvartiliKvartili
zašiljenostzašiljenost
32009/2009
Osobine numeričkih podatakaOsobine numeričkih podataka
Centralna tendencijaCentralna tendencija ((lokacija centralokacija centra))
VariVarijjaacijacija ( (RasipanjeRasipanje))
AsimetrijaAsimetrija
42009/2009
Odbacivanje ekstremnih vrednostiOdbacivanje ekstremnih vrednosti
Ekstremno visoka vrednost se odbacuje ako je:
Ekstremno niska vrednost se odbacuje ako je:
33,0xx
xx
1N
1NN
33,0xxxx
1N
12
52009/2009
Mere centralne tendencijeMere centralne tendencije
Centralna tendencija
Aritmetička srednja vrednost
Medijana Modus Geometrijska srednja vrednost
N
x
x
N
1ii
n/1n21G )xxx(x
sredina rangiranih vrednosti
najfrekventnija vrednost
62009/2009
Aritmetička srednja vrednost (average, mean)Aritmetička srednja vrednost (average, mean)
Najčešće korišćena meraNajčešće korišćena mera Ponaša se kao ”ravnotežna tačka”Ponaša se kao ”ravnotežna tačka” Na njenu vrednost utiču ekstremne vrednosti Na njenu vrednost utiču ekstremne vrednosti
(”outliers”) (”outliers”) Izražava se u istim jedinicama kao i osnovni podaciIzražava se u istim jedinicama kao i osnovni podaci Izraz za izračunavanjeIzraz za izračunavanje::
Nxxx
Nx
x N21
broj podataka dobijena vrednost
72009/2009
Aritmetička srednja vrednostAritmetička srednja vrednost
0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10
srednja vrednost = 3
35
155
54321
4520
5104321
srednja vrednost = 4
Uticaj ekstremnih vrednosti
82009/2009
Prosta srednja vrednost vs. ponderisana – težinska Prosta srednja vrednost vs. ponderisana – težinska srednja vrednostsrednja vrednost
Ponderisana aritmetička srednja vrednost izračunava se kada su podaci Ponderisana aritmetička srednja vrednost izračunava se kada su podaci prikazani kao frekvence:prikazani kao frekvence:
Ako su podaci grupisani u klasne intervale, ponderisana srednja vrednost se Ako su podaci grupisani u klasne intervale, ponderisana srednja vrednost se izračunava:izračunava:
i
i
f
xfx
i
is
f
)x(fx
92009/2009
Geometrijska srednja vrednostGeometrijska srednja vrednost
n-ti koren proizvoda svih članova skupan-ti koren proizvoda svih članova skupa Primer: 1,2,3,10Primer: 1,2,3,10 GGx = 4-ti koren iz 60 = 2.78x = 4-ti koren iz 60 = 2.78
II način izračunavanja GII način izračunavanja Gx:x:1. logaritmovanje svakog broja u skupu1. logaritmovanje svakog broja u skupu2. računanje aritmetičke sredine tih logaritama2. računanje aritmetičke sredine tih logaritama3.dizanje osnove logaritma (ln-2.718 ili log-10) na 3.dizanje osnove logaritma (ln-2.718 ili log-10) na izračunatu aritmetičku sredinu logaritama (korak izračunatu aritmetičku sredinu logaritama (korak 2)2)
102009/2009
Skraćena srednja vrednostSkraćena srednja vrednost
Računa se tako što se iz skupa izbace ekstremne Računa se tako što se iz skupa izbace ekstremne vrednosti sa oba kraja raspodele (najniže i najviše vrednosti sa oba kraja raspodele (najniže i najviše vrednostivrednosti
5-25% vrednosti je uobičajeno da se odbaci i 5-25% vrednosti je uobičajeno da se odbaci i onda se računa srednja vrednostonda se računa srednja vrednost
Eliminiše se uticaj ekstremnih vrednostiEliminiše se uticaj ekstremnih vrednosti Primena – sport da bi se eliminisali efekti Primena – sport da bi se eliminisali efekti
ekstremnih ocena dobijenih pogrešnom procenom ekstremnih ocena dobijenih pogrešnom procenom sudijasudija
112009/2009
Medijana (Me)Medijana (Me)
Medijana je centralna vrednost u nizu podatakaMedijana je centralna vrednost u nizu podataka 50%50% vrednosti je iznad vrednosti je iznad, 50% , 50% ispod medijaneispod medijane
Pre određivanje medijane podaci se urede po veličiniPre određivanje medijane podaci se urede po veličini Na Me ne utiču ekstremne vrednosti Na Me ne utiču ekstremne vrednosti
0 1 2 3 4 5 6 7 8 9 10
medijana = 3
0 1 2 3 4 5 6 7 8 9 10
medijana = 3
122009/2009
Određivanje medijaneOdređivanje medijane
Pozicija medijane (u uređenim podacima)Pozicija medijane (u uređenim podacima)::
Ako je broj podataka neparan, medijana je vrednost u Ako je broj podataka neparan, medijana je vrednost u sredini niza sredini niza
Ako je broj podataka paran, medijana je srednja Ako je broj podataka paran, medijana je srednja vrednost dve vrednosti u sredini niza (između N/2 i vrednost dve vrednosti u sredini niza (između N/2 i (N+2)/2)(N+2)/2)
Napomena: Napomena:
izraz nije izraz nije vrednostvrednost medijane, već medijane, već redni brojredni broj vrednosti vrednosti koja predstavlja medijanukoja predstavlja medijanu
21Nmedijanepozicija
21N
132009/2009
Modus (Mo)Modus (Mo)
Vrednost koja se pojavljuje najčešćeVrednost koja se pojavljuje najčešće Na Mo ne utiču ekstremne vrednostiNa Mo ne utiču ekstremne vrednosti U skupu može biti jedan ili više modusaU skupu može biti jedan ili više modusa Skup može biti bez modusaSkup može biti bez modusa Mo može da se odredi i za numeričke i kategoričke Mo može da se odredi i za numeričke i kategoričke
podatkepodatke
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
modus = 9
0 1 2 3 4 5 6
nema modusa
142009/2009
152009/2009
0
10
20
30
40
50
60
70
1 1,5
2 2,5
3 3,5
4 4,5
5
Log PO-aze Log DZO-aze Aktivnost enzima PON1
Broj osoba
KV
KG
antimodeantimode
162009/2009
Skale merenja- mere centralne tendencijeSkale merenja- mere centralne tendencije
intervalna/skala odnosa - intervalna/skala odnosa - x, Me, Mox, Me, Mo ordinalna – Me, Moordinalna – Me, Mo nominalna – samo Mo!!!nominalna – samo Mo!!!
172009/2009
KvartiliKvartili
Kvartili dele skup uređenih podataka na četiri Kvartili dele skup uređenih podataka na četiri jednaka delajednaka dela
Pozicione veličinePozicione veličine
25% 25% 25% 25%
QQ11 QQ22 QQ33
25%25% 25%
Prvi kvartilPrvi kvartil, , QQ11 – 25% vrednosti su manje od Q – 25% vrednosti su manje od Q11
Drugi kvartil, Drugi kvartil, QQ22 = medijana= medijana Treći kvartil, Treći kvartil, QQ33 = 25% vrednosti su veće od Q = 25% vrednosti su veće od Q11 QQ11 i Q i Q33 nisu mere centralne tendencije nisu mere centralne tendencije
182009/2009
Određivanje kvartilaOdređivanje kvartila
Pozicija (redni broj vrednosti) prvog kvartila:Q1 = (N+1)/4
Pozicija (redni broj vrednosti) drugog kvartila: Q2 = (N+1)/2
Pozicija (redni broj vrednosti) trećeg kvartila:Q3 = 3(N+1)/4
gde je N ukupan broj podataka
192009/2009
PercentiliPercentili
Pozicija percentila:Pozicija percentila:
Prvi percentil PPrvi percentil P11: odvaja 1% vrednosti: odvaja 1% vrednosti QQ11 = P = P2525
QQ22 = Me = P = Me = P5050
QQ33 = P = P7575
)1N(100PNP
202009/2009
Mere varijacijeMere varijacije
isti centar, različita varijacija
Mere varijacije daju Mere varijacije daju informaciju o informaciju o rasipanjurasipanju ili ili varijabilnostivarijabilnosti podatakapodataka
varijacija
varijansa standardna devijacija
koeficijent varijacije
raspon interkvartilni raspon
212009/2009
RasponRaspon
Najjednostavnija mera varijacijeNajjednostavnija mera varijacije Raspon – razlika između najveže i najmanje vrednosti Raspon – razlika između najveže i najmanje vrednosti
u skupuu skupu
raspon = xmax – xmin
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
raspon = 14 - 1 = 13
primer:
222009/2009
Nedostatak rasponaNedostatak raspona
Ignoriše oblik raspodele podatakaIgnoriše oblik raspodele podataka
Osetljiv na ekstremne vrednostiOsetljiv na ekstremne vrednosti
7 8 9 10 11 12
raspon = 12 - 7 = 57 8 9 10 11 12
raspon = 12 - 7 = 5
1, 1, 1, 1, 1, 1, 1, 1, 1,1,1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 5
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 120
raspon = 5 - 1 = 4
raspon = 120 - 1 = 119
232009/2009
Interkvartilni rasponInterkvartilni raspon
Rasipanje unutar srednjih 50%: QRasipanje unutar srednjih 50%: Q33 – Q – Q11 Nema uticaja ekstremnih vrednostiNema uticaja ekstremnih vrednosti
primer:
medijana(Q2) XmaxXmin Q1 Q3
25% 25% 25% 25%
12 30 45 57 70
interkvartilni raspon = 57 – 30 = 27
242009/2009
Srednje apsolutno odstupanje - SoSrednje apsolutno odstupanje - So
Nxx
S i0
Srednje apsolutno odstupanje (obeležava se sa Soo) određuje se tako što se zbir apsolutnih vrednosti pojedinačnih odstupanja svakog člana niza od srednje vrednosti podeli ukupnim brojem članova niza:
252009/2009
VarijansaVarijansa
Prosečno (približno) kvadratno odstupanje vrednosti od srednje vrednostiProsečno (približno) kvadratno odstupanje vrednosti od srednje vrednosti
Izraz za izračunavanje:Izraz za izračunavanje:
N – 1 – broj stepena slobode N – 1 – broj stepena slobode
1-N
)x(x
V
n
1i
2i
262009/2009
Standardna devijacija Standardna devijacija
Najčešće korišćena mera varijacijeNajčešće korišćena mera varijacije Pokazuje varijaciju oko srednje vrednostiPokazuje varijaciju oko srednje vrednosti Kvadratni koren iz varijanseKvadratni koren iz varijanse Izražava se u Izražava se u istim jedinicamaistim jedinicama kao i osnovni podaci kao i osnovni podaci
1-N
)x(x
Sd
N
1i
2i
1N
xNx
Sd
2N
1i
2
272009/2009
Broj stepena slobode - df, θ, Broj stepena slobode - df, θ, φφ
φφ = N - 1 = N - 1 φφ - broj nezavisnih poredjenja - broj nezavisnih poredjenja
xx11 i x i x22 nezavisne vrednosti, nezavisne vrednosti, φφ = 2 = 2
321
321
xxxx33
xxxx
282009/2009
Standardna devijacija - SdStandardna devijacija - Sd
Podaci:Podaci: 4,9 6,34,9 6,3 7,7 8,9 10,3 11,77,7 8,9 10,3 11,7
2,5236,3681N
)XN(XSd
22
292009/2009
Sd - grupisani podaciSd - grupisani podaci
μmol/L4,093Sd
12Ki
f
)x(f xf = Sd
222s
302009/2009
Standardna devijacija iz razlike parovaStandardna devijacija iz razlike parova
par x1 x2 d d2
1. 4,5 4,7 0,2 0,04
2. 6,7 6,9 0,2 0,04
3. 5,6 5,3 0,3 0,09
4. 7,8 7,8 0 0
5. 5,3 5,2 0,1 0,01
6. 4,5 4,8 0,3 0,09
7. 8,4 8,5 0,1 0,01
8. 6,3 6,1 0,2 0,04
9. 5,7 5,8 0,1 0,01
10. 9,2 9,6 0,4 0,16
11 4,3 4,2 0,1 0,01
12. 5,9 6,2 0,3 0,09
ukupno - - 0,59
N2d
Sd2
mmol/L 0,157 = 0,024583 = 24
0,59 = Sd
U 12 uzoraka seruma određena U 12 uzoraka seruma određena glukoza u duplikatuglukoza u duplikatu
312009/2009
Značenje standardne devijacijeZnačenje standardne devijacije
mala standardna devijacija
velika standardna devijacija
322009/2009
Poređenje standardnih devijacijaPoređenje standardnih devijacija
sr. vrednost = 15.5SD = 3,338
11 12 13 14 15 16 17 18 19 20 21
11 12 13 14 15 16 17 18 19 20 21
grupa B
grupa A
sr. vrednost = 15.5Sd = 0,926
11 12 13 14 15 16 17 18 19 20 21
sr. vrednost = 15.5Sd = 4,567
grupa C
332009/2009
Osobine varijanse i standardne devijacijeOsobine varijanse i standardne devijacije
Svaka vrednost se koristi u izračunavanjuSvaka vrednost se koristi u izračunavanju razlika u odnosu na raspon i interkvartilni rasponrazlika u odnosu na raspon i interkvartilni raspon
Veliki uticaj ekstremnih vrednostiVeliki uticaj ekstremnih vrednosti izračunava se kvadrat odstupanja od srednje vrednostiizračunava se kvadrat odstupanja od srednje vrednosti
342009/2009
Koeficijent varijacije - KvKoeficijent varijacije - Kv
Mera relativne Mera relativne varijacije (u odnosu na srednju varijacije (u odnosu na srednju vrednost)vrednost)
Uvek se izražava u %Uvek se izražava u % Omogućava poredjenje više grupaOmogućava poredjenje više grupa podataka, čak i podataka, čak i
kada su izraženi u različitim jedinicamakada su izraženi u različitim jedinicama
100 x
Sd = Kv
352009/2009
Poređenje koeficijenata varijacijePoređenje koeficijenata varijacije
GrupaGrupa A: A: srednja vrednostsrednja vrednost = 50 = 50 sstandardtandardnana devi devillaacijacija = 5 = 5
GrupaGrupa B: B: srednja vrednostsrednja vrednost = = 101000 sstandardtandardnana devi devillaacijacija = 5 = 5
5%100%100
5100%x
SdvK B
%01100%505100%
xSdvK A
362009/2009
Asimetrija raspodeleAsimetrija raspodele
Pokazuju kako su podaci distribuiraniPokazuju kako su podaci distribuirani zakrivljenost i zašiljenostzakrivljenost i zašiljenost
desnostranadesnostranalevostranalevostrana simetričnasimetrična
MeMe MoMo MoMo MeMe = Me = Mo= Me = Mox xx
372009/2009
Numeričke mere za populaciju i uzorakNumeričke mere za populaciju i uzorak
Statistički parametri koji se izračunavaju iz Statistički parametri koji se izračunavaju iz populacijepopulacije opisuju osobine populacijeopisuju osobine populacije
Statistički parametri koji se izračunavaju iz Statistički parametri koji se izračunavaju iz uzorkauzorka opisuju osobine uzorkaopisuju osobine uzorka
Srednja vrednost populacije – Srednja vrednost populacije – μμ Srednja vrednost uzorka –Srednja vrednost uzorka –
Standardna devijacija populacije –Standardna devijacija populacije – σσ Standardna devijacija uzorkaStandardna devijacija uzorka –– Sd Sd
x
382009/2009
Z-score –Standardni skorZ-score –Standardni skor
Odstupanje posmatrane vrednosti od Odstupanje posmatrane vrednosti od x izraženo x izraženo u broju Sdu broju Sd
Z=(x -Z=(x -x)/Sdx)/Sd
Mera relativnog odstupanjaMera relativnog odstupanja Z pozitivan – veći od većine vrednosti u skupuZ pozitivan – veći od većine vrednosti u skupu Z negativan – manji od većine vrednosti u skupuZ negativan – manji od većine vrednosti u skupu
392009/2009
Z-score Z-score
402009/2009
Z-score primerZ-score primer
Kontrolom kvaliteta težine tableta dobijeno je 120 Kontrolom kvaliteta težine tableta dobijeno je 120 vrednosti iz kojih su izračunate srednja vrednost vrednosti iz kojih su izračunate srednja vrednost 500.5 mg i Sd 3 mg. Koliki je Z-score za tablete 500.5 mg i Sd 3 mg. Koliki je Z-score za tablete težine 496 mg?težine 496 mg?
Rešenje (496-500.5)/3=-1.5Rešenje (496-500.5)/3=-1.5
412009/2009
Devojka je visoka 160 cm i ima z-score 0.7 u Devojka je visoka 160 cm i ima z-score 0.7 u odnosu na odnosu na x visinu grupe koja iznosi 168 cm. x visinu grupe koja iznosi 168 cm. Kolika je Sd?Kolika je Sd?
Z-score primer 2 Z-score primer 2