41
1 2009/2009 Numeričke deskriptivne veličine Numeričke deskriptivne veličine

2-Deskriptivne velicine 2009

  • Upload
    ngonhan

  • View
    230

  • Download
    3

Embed Size (px)

Citation preview

Page 1: 2-Deskriptivne velicine 2009

12009/2009

Numeričke deskriptivne veličineNumeričke deskriptivne veličine

Page 2: 2-Deskriptivne velicine 2009

22009/2009

Osobine numeričkih podataka- mereOsobine numeričkih podataka- mere

aritmetička aritmetička srednja vrednostsrednja vrednost

medijanamedijana

modusmodus

Numeričko opisivanje podatakaNumeričko opisivanje podataka

varijansavarijansa

standardna devijacijastandardna devijacija

koeficijent varijacijekoeficijent varijacije

rasponraspon

interkvartilini rasponinterkvartilini raspon

geometrijska geometrijska srednja vrednostsrednja vrednost

zakrivljenostzakrivljenost

Centralna Centralna tendencijatendencija

VarijacijaVarijacija AsimetrijaAsimetrijaKvartiliKvartili

zašiljenostzašiljenost

Page 3: 2-Deskriptivne velicine 2009

32009/2009

Osobine numeričkih podatakaOsobine numeričkih podataka

Centralna tendencijaCentralna tendencija ((lokacija centralokacija centra))

VariVarijjaacijacija ( (RasipanjeRasipanje))

AsimetrijaAsimetrija

Page 4: 2-Deskriptivne velicine 2009

42009/2009

Odbacivanje ekstremnih vrednostiOdbacivanje ekstremnih vrednosti

Ekstremno visoka vrednost se odbacuje ako je:

Ekstremno niska vrednost se odbacuje ako je:

33,0xx

xx

1N

1NN

33,0xxxx

1N

12

Page 5: 2-Deskriptivne velicine 2009

52009/2009

Mere centralne tendencijeMere centralne tendencije

Centralna tendencija

Aritmetička srednja vrednost

Medijana Modus Geometrijska srednja vrednost

N

x

x

N

1ii

n/1n21G )xxx(x

sredina rangiranih vrednosti

najfrekventnija vrednost

Page 6: 2-Deskriptivne velicine 2009

62009/2009

Aritmetička srednja vrednost (average, mean)Aritmetička srednja vrednost (average, mean)

Najčešće korišćena meraNajčešće korišćena mera Ponaša se kao ”ravnotežna tačka”Ponaša se kao ”ravnotežna tačka” Na njenu vrednost utiču ekstremne vrednosti Na njenu vrednost utiču ekstremne vrednosti

(”outliers”) (”outliers”) Izražava se u istim jedinicama kao i osnovni podaciIzražava se u istim jedinicama kao i osnovni podaci Izraz za izračunavanjeIzraz za izračunavanje::

Nxxx

Nx

x N21

broj podataka dobijena vrednost

Page 7: 2-Deskriptivne velicine 2009

72009/2009

Aritmetička srednja vrednostAritmetička srednja vrednost

0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10

srednja vrednost = 3

35

155

54321

4520

5104321

srednja vrednost = 4

Uticaj ekstremnih vrednosti

Page 8: 2-Deskriptivne velicine 2009

82009/2009

Prosta srednja vrednost vs. ponderisana – težinska Prosta srednja vrednost vs. ponderisana – težinska srednja vrednostsrednja vrednost

Ponderisana aritmetička srednja vrednost izračunava se kada su podaci Ponderisana aritmetička srednja vrednost izračunava se kada su podaci prikazani kao frekvence:prikazani kao frekvence:

Ako su podaci grupisani u klasne intervale, ponderisana srednja vrednost se Ako su podaci grupisani u klasne intervale, ponderisana srednja vrednost se izračunava:izračunava:

i

i

f

xfx

i

is

f

)x(fx

Page 9: 2-Deskriptivne velicine 2009

92009/2009

Geometrijska srednja vrednostGeometrijska srednja vrednost

n-ti koren proizvoda svih članova skupan-ti koren proizvoda svih članova skupa Primer: 1,2,3,10Primer: 1,2,3,10 GGx = 4-ti koren iz 60 = 2.78x = 4-ti koren iz 60 = 2.78

II način izračunavanja GII način izračunavanja Gx:x:1. logaritmovanje svakog broja u skupu1. logaritmovanje svakog broja u skupu2. računanje aritmetičke sredine tih logaritama2. računanje aritmetičke sredine tih logaritama3.dizanje osnove logaritma (ln-2.718 ili log-10) na 3.dizanje osnove logaritma (ln-2.718 ili log-10) na izračunatu aritmetičku sredinu logaritama (korak izračunatu aritmetičku sredinu logaritama (korak 2)2)

Page 10: 2-Deskriptivne velicine 2009

102009/2009

Skraćena srednja vrednostSkraćena srednja vrednost

Računa se tako što se iz skupa izbace ekstremne Računa se tako što se iz skupa izbace ekstremne vrednosti sa oba kraja raspodele (najniže i najviše vrednosti sa oba kraja raspodele (najniže i najviše vrednostivrednosti

5-25% vrednosti je uobičajeno da se odbaci i 5-25% vrednosti je uobičajeno da se odbaci i onda se računa srednja vrednostonda se računa srednja vrednost

Eliminiše se uticaj ekstremnih vrednostiEliminiše se uticaj ekstremnih vrednosti Primena – sport da bi se eliminisali efekti Primena – sport da bi se eliminisali efekti

ekstremnih ocena dobijenih pogrešnom procenom ekstremnih ocena dobijenih pogrešnom procenom sudijasudija

Page 11: 2-Deskriptivne velicine 2009

112009/2009

Medijana (Me)Medijana (Me)

Medijana je centralna vrednost u nizu podatakaMedijana je centralna vrednost u nizu podataka 50%50% vrednosti je iznad vrednosti je iznad, 50% , 50% ispod medijaneispod medijane

Pre određivanje medijane podaci se urede po veličiniPre određivanje medijane podaci se urede po veličini Na Me ne utiču ekstremne vrednosti Na Me ne utiču ekstremne vrednosti

0 1 2 3 4 5 6 7 8 9 10

medijana = 3

0 1 2 3 4 5 6 7 8 9 10

medijana = 3

Page 12: 2-Deskriptivne velicine 2009

122009/2009

Određivanje medijaneOdređivanje medijane

Pozicija medijane (u uređenim podacima)Pozicija medijane (u uređenim podacima)::

Ako je broj podataka neparan, medijana je vrednost u Ako je broj podataka neparan, medijana je vrednost u sredini niza sredini niza

Ako je broj podataka paran, medijana je srednja Ako je broj podataka paran, medijana je srednja vrednost dve vrednosti u sredini niza (između N/2 i vrednost dve vrednosti u sredini niza (između N/2 i (N+2)/2)(N+2)/2)

Napomena: Napomena:

izraz nije izraz nije vrednostvrednost medijane, već medijane, već redni brojredni broj vrednosti vrednosti koja predstavlja medijanukoja predstavlja medijanu

21Nmedijanepozicija

21N

Page 13: 2-Deskriptivne velicine 2009

132009/2009

Modus (Mo)Modus (Mo)

Vrednost koja se pojavljuje najčešćeVrednost koja se pojavljuje najčešće Na Mo ne utiču ekstremne vrednostiNa Mo ne utiču ekstremne vrednosti U skupu može biti jedan ili više modusaU skupu može biti jedan ili više modusa Skup može biti bez modusaSkup može biti bez modusa Mo može da se odredi i za numeričke i kategoričke Mo može da se odredi i za numeričke i kategoričke

podatkepodatke

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

modus = 9

0 1 2 3 4 5 6

nema modusa

Page 14: 2-Deskriptivne velicine 2009

142009/2009

Page 15: 2-Deskriptivne velicine 2009

152009/2009

0

10

20

30

40

50

60

70

1 1,5

2 2,5

3 3,5

4 4,5

5

Log PO-aze Log DZO-aze Aktivnost enzima PON1

Broj osoba

KV

KG

antimodeantimode

Page 16: 2-Deskriptivne velicine 2009

162009/2009

Skale merenja- mere centralne tendencijeSkale merenja- mere centralne tendencije

intervalna/skala odnosa - intervalna/skala odnosa - x, Me, Mox, Me, Mo ordinalna – Me, Moordinalna – Me, Mo nominalna – samo Mo!!!nominalna – samo Mo!!!

Page 17: 2-Deskriptivne velicine 2009

172009/2009

KvartiliKvartili

Kvartili dele skup uređenih podataka na četiri Kvartili dele skup uređenih podataka na četiri jednaka delajednaka dela

Pozicione veličinePozicione veličine

25% 25% 25% 25%

QQ11 QQ22 QQ33

25%25% 25%

Prvi kvartilPrvi kvartil, , QQ11 – 25% vrednosti su manje od Q – 25% vrednosti su manje od Q11

Drugi kvartil, Drugi kvartil, QQ22 = medijana= medijana Treći kvartil, Treći kvartil, QQ33 = 25% vrednosti su veće od Q = 25% vrednosti su veće od Q11 QQ11 i Q i Q33 nisu mere centralne tendencije nisu mere centralne tendencije

Page 18: 2-Deskriptivne velicine 2009

182009/2009

Određivanje kvartilaOdređivanje kvartila

Pozicija (redni broj vrednosti) prvog kvartila:Q1 = (N+1)/4

Pozicija (redni broj vrednosti) drugog kvartila: Q2 = (N+1)/2

Pozicija (redni broj vrednosti) trećeg kvartila:Q3 = 3(N+1)/4

gde je N ukupan broj podataka

Page 19: 2-Deskriptivne velicine 2009

192009/2009

PercentiliPercentili

Pozicija percentila:Pozicija percentila:

Prvi percentil PPrvi percentil P11: odvaja 1% vrednosti: odvaja 1% vrednosti QQ11 = P = P2525

QQ22 = Me = P = Me = P5050

QQ33 = P = P7575

)1N(100PNP

Page 20: 2-Deskriptivne velicine 2009

202009/2009

Mere varijacijeMere varijacije

isti centar, različita varijacija

Mere varijacije daju Mere varijacije daju informaciju o informaciju o rasipanjurasipanju ili ili varijabilnostivarijabilnosti podatakapodataka

varijacija

varijansa standardna devijacija

koeficijent varijacije

raspon interkvartilni raspon

Page 21: 2-Deskriptivne velicine 2009

212009/2009

RasponRaspon

Najjednostavnija mera varijacijeNajjednostavnija mera varijacije Raspon – razlika između najveže i najmanje vrednosti Raspon – razlika između najveže i najmanje vrednosti

u skupuu skupu

raspon = xmax – xmin

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

raspon = 14 - 1 = 13

primer:

Page 22: 2-Deskriptivne velicine 2009

222009/2009

Nedostatak rasponaNedostatak raspona

Ignoriše oblik raspodele podatakaIgnoriše oblik raspodele podataka

Osetljiv na ekstremne vrednostiOsetljiv na ekstremne vrednosti

7 8 9 10 11 12

raspon = 12 - 7 = 57 8 9 10 11 12

raspon = 12 - 7 = 5

1, 1, 1, 1, 1, 1, 1, 1, 1,1,1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 5

1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 120

raspon = 5 - 1 = 4

raspon = 120 - 1 = 119

Page 23: 2-Deskriptivne velicine 2009

232009/2009

Interkvartilni rasponInterkvartilni raspon

Rasipanje unutar srednjih 50%: QRasipanje unutar srednjih 50%: Q33 – Q – Q11 Nema uticaja ekstremnih vrednostiNema uticaja ekstremnih vrednosti

primer:

medijana(Q2) XmaxXmin Q1 Q3

25% 25% 25% 25%

12 30 45 57 70

interkvartilni raspon = 57 – 30 = 27

Page 24: 2-Deskriptivne velicine 2009

242009/2009

Srednje apsolutno odstupanje - SoSrednje apsolutno odstupanje - So

Nxx

S i0

Srednje apsolutno odstupanje (obeležava se sa Soo) određuje se tako što se zbir apsolutnih vrednosti pojedinačnih odstupanja svakog člana niza od srednje vrednosti podeli ukupnim brojem članova niza:

Page 25: 2-Deskriptivne velicine 2009

252009/2009

VarijansaVarijansa

Prosečno (približno) kvadratno odstupanje vrednosti od srednje vrednostiProsečno (približno) kvadratno odstupanje vrednosti od srednje vrednosti

Izraz za izračunavanje:Izraz za izračunavanje:

N – 1 – broj stepena slobode N – 1 – broj stepena slobode

1-N

)x(x

V

n

1i

2i

Page 26: 2-Deskriptivne velicine 2009

262009/2009

Standardna devijacija Standardna devijacija

Najčešće korišćena mera varijacijeNajčešće korišćena mera varijacije Pokazuje varijaciju oko srednje vrednostiPokazuje varijaciju oko srednje vrednosti Kvadratni koren iz varijanseKvadratni koren iz varijanse Izražava se u Izražava se u istim jedinicamaistim jedinicama kao i osnovni podaci kao i osnovni podaci

1-N

)x(x

Sd

N

1i

2i

1N

xNx

Sd

2N

1i

2

Page 27: 2-Deskriptivne velicine 2009

272009/2009

Broj stepena slobode - df, θ, Broj stepena slobode - df, θ, φφ

φφ = N - 1 = N - 1 φφ - broj nezavisnih poredjenja - broj nezavisnih poredjenja

xx11 i x i x22 nezavisne vrednosti, nezavisne vrednosti, φφ = 2 = 2

321

321

xxxx33

xxxx

Page 28: 2-Deskriptivne velicine 2009

282009/2009

Standardna devijacija - SdStandardna devijacija - Sd

Podaci:Podaci: 4,9 6,34,9 6,3 7,7 8,9 10,3 11,77,7 8,9 10,3 11,7

2,5236,3681N

)XN(XSd

22

Page 29: 2-Deskriptivne velicine 2009

292009/2009

Sd - grupisani podaciSd - grupisani podaci

μmol/L4,093Sd

12Ki

f

)x(f xf = Sd

222s

Page 30: 2-Deskriptivne velicine 2009

302009/2009

Standardna devijacija iz razlike parovaStandardna devijacija iz razlike parova

par x1 x2 d d2

1. 4,5 4,7 0,2 0,04

2. 6,7 6,9 0,2 0,04

3. 5,6 5,3 0,3 0,09

4. 7,8 7,8 0 0

5. 5,3 5,2 0,1 0,01

6. 4,5 4,8 0,3 0,09

7. 8,4 8,5 0,1 0,01

8. 6,3 6,1 0,2 0,04

9. 5,7 5,8 0,1 0,01

10. 9,2 9,6 0,4 0,16

11 4,3 4,2 0,1 0,01

12. 5,9 6,2 0,3 0,09

ukupno - - 0,59

N2d

Sd2

mmol/L 0,157 = 0,024583 = 24

0,59 = Sd

U 12 uzoraka seruma određena U 12 uzoraka seruma određena glukoza u duplikatuglukoza u duplikatu

Page 31: 2-Deskriptivne velicine 2009

312009/2009

Značenje standardne devijacijeZnačenje standardne devijacije

mala standardna devijacija

velika standardna devijacija

Page 32: 2-Deskriptivne velicine 2009

322009/2009

Poređenje standardnih devijacijaPoređenje standardnih devijacija

sr. vrednost = 15.5SD = 3,338

11 12 13 14 15 16 17 18 19 20 21

11 12 13 14 15 16 17 18 19 20 21

grupa B

grupa A

sr. vrednost = 15.5Sd = 0,926

11 12 13 14 15 16 17 18 19 20 21

sr. vrednost = 15.5Sd = 4,567

grupa C

Page 33: 2-Deskriptivne velicine 2009

332009/2009

Osobine varijanse i standardne devijacijeOsobine varijanse i standardne devijacije

Svaka vrednost se koristi u izračunavanjuSvaka vrednost se koristi u izračunavanju razlika u odnosu na raspon i interkvartilni rasponrazlika u odnosu na raspon i interkvartilni raspon

Veliki uticaj ekstremnih vrednostiVeliki uticaj ekstremnih vrednosti izračunava se kvadrat odstupanja od srednje vrednostiizračunava se kvadrat odstupanja od srednje vrednosti

Page 34: 2-Deskriptivne velicine 2009

342009/2009

Koeficijent varijacije - KvKoeficijent varijacije - Kv

Mera relativne Mera relativne varijacije (u odnosu na srednju varijacije (u odnosu na srednju vrednost)vrednost)

Uvek se izražava u %Uvek se izražava u % Omogućava poredjenje više grupaOmogućava poredjenje više grupa podataka, čak i podataka, čak i

kada su izraženi u različitim jedinicamakada su izraženi u različitim jedinicama

100 x

Sd = Kv

Page 35: 2-Deskriptivne velicine 2009

352009/2009

Poređenje koeficijenata varijacijePoređenje koeficijenata varijacije

GrupaGrupa A: A: srednja vrednostsrednja vrednost = 50 = 50 sstandardtandardnana devi devillaacijacija = 5 = 5

GrupaGrupa B: B: srednja vrednostsrednja vrednost = = 101000 sstandardtandardnana devi devillaacijacija = 5 = 5

5%100%100

5100%x

SdvK B

%01100%505100%

xSdvK A

Page 36: 2-Deskriptivne velicine 2009

362009/2009

Asimetrija raspodeleAsimetrija raspodele

Pokazuju kako su podaci distribuiraniPokazuju kako su podaci distribuirani zakrivljenost i zašiljenostzakrivljenost i zašiljenost

desnostranadesnostranalevostranalevostrana simetričnasimetrična

MeMe MoMo MoMo MeMe = Me = Mo= Me = Mox xx

Page 37: 2-Deskriptivne velicine 2009

372009/2009

Numeričke mere za populaciju i uzorakNumeričke mere za populaciju i uzorak

Statistički parametri koji se izračunavaju iz Statistički parametri koji se izračunavaju iz populacijepopulacije opisuju osobine populacijeopisuju osobine populacije

Statistički parametri koji se izračunavaju iz Statistički parametri koji se izračunavaju iz uzorkauzorka opisuju osobine uzorkaopisuju osobine uzorka

Srednja vrednost populacije – Srednja vrednost populacije – μμ Srednja vrednost uzorka –Srednja vrednost uzorka –

Standardna devijacija populacije –Standardna devijacija populacije – σσ Standardna devijacija uzorkaStandardna devijacija uzorka –– Sd Sd

x

Page 38: 2-Deskriptivne velicine 2009

382009/2009

Z-score –Standardni skorZ-score –Standardni skor

Odstupanje posmatrane vrednosti od Odstupanje posmatrane vrednosti od x izraženo x izraženo u broju Sdu broju Sd

Z=(x -Z=(x -x)/Sdx)/Sd

Mera relativnog odstupanjaMera relativnog odstupanja Z pozitivan – veći od većine vrednosti u skupuZ pozitivan – veći od većine vrednosti u skupu Z negativan – manji od većine vrednosti u skupuZ negativan – manji od većine vrednosti u skupu

Page 39: 2-Deskriptivne velicine 2009

392009/2009

Z-score Z-score

Page 40: 2-Deskriptivne velicine 2009

402009/2009

Z-score primerZ-score primer

Kontrolom kvaliteta težine tableta dobijeno je 120 Kontrolom kvaliteta težine tableta dobijeno je 120 vrednosti iz kojih su izračunate srednja vrednost vrednosti iz kojih su izračunate srednja vrednost 500.5 mg i Sd 3 mg. Koliki je Z-score za tablete 500.5 mg i Sd 3 mg. Koliki je Z-score za tablete težine 496 mg?težine 496 mg?

Rešenje (496-500.5)/3=-1.5Rešenje (496-500.5)/3=-1.5

Page 41: 2-Deskriptivne velicine 2009

412009/2009

Devojka je visoka 160 cm i ima z-score 0.7 u Devojka je visoka 160 cm i ima z-score 0.7 u odnosu na odnosu na x visinu grupe koja iznosi 168 cm. x visinu grupe koja iznosi 168 cm. Kolika je Sd?Kolika je Sd?

Z-score primer 2 Z-score primer 2