41
1 2009/2009 Numeričke deskriptivne veličine Numeričke deskriptivne veličine

Numeričke deskriptivne veličine

  • Upload
    sydnee

  • View
    75

  • Download
    2

Embed Size (px)

DESCRIPTION

Numeričke deskriptivne veličine. Numeričko opisivanje podataka. Centralna tendencija. Kvartili. Varijacija. Asimetrija. raspon. zakrivljenost. aritmetička srednja vrednost. interkvartilini raspon. zašiljenost. varijansa. medijana. standardna devijacija. modus. koeficijent varijacije. - PowerPoint PPT Presentation

Citation preview

Page 1: Numeričke deskriptivne veličine

12009/2009

Numeričke deskriptivne veličineNumeričke deskriptivne veličine

Page 2: Numeričke deskriptivne veličine

22009/2009

Osobine numeričkih podataka- mereOsobine numeričkih podataka- mere

aritmetička aritmetička srednja vrednostsrednja vrednost

medijanamedijana

modusmodus

Numeričko opisivanje podatakaNumeričko opisivanje podataka

varijansavarijansa

standardna devijacijastandardna devijacija

koeficijent varijacijekoeficijent varijacije

rasponraspon

interkvartilini rasponinterkvartilini raspon

geometrijska geometrijska srednja vrednostsrednja vrednost

zakrivljenostzakrivljenost

Centralna Centralna tendencijatendencija

VarijacijaVarijacija AsimetrijaAsimetrijaKvartiliKvartili

zašiljenostzašiljenost

Page 3: Numeričke deskriptivne veličine

32009/2009

Osobine numeričkih podatakaOsobine numeričkih podataka

Centralna tendencijaCentralna tendencija ((lokacija centralokacija centra))

VariVarijjaacijacija ( (RasipanjeRasipanje))

AsimetrijaAsimetrija

Page 4: Numeričke deskriptivne veličine

42009/2009

Odbacivanje ekstremnih vrednostiOdbacivanje ekstremnih vrednosti

Ekstremno visoka vrednost se odbacuje ako je:

Ekstremno niska vrednost se odbacuje ako je:

33,0xx

xx

1N

1NN

33,0xx

xx

1N

12

Page 5: Numeričke deskriptivne veličine

52009/2009

Mere centralne tendencijeMere centralne tendencije

Centralna tendencija

Aritmetička srednja vrednost

Medijana Modus Geometrijska srednja vrednost

N

x

x

N

1ii

n/1n21G )xxx(x

sredina rangiranih vrednosti

najfrekventnija vrednost

Page 6: Numeričke deskriptivne veličine

62009/2009

Aritmetička srednja vrednost (average, mean)Aritmetička srednja vrednost (average, mean)

Najčešće korišćena meraNajčešće korišćena mera Ponaša se kao ”ravnotežna tačka”Ponaša se kao ”ravnotežna tačka” Na njenu vrednost utiču ekstremne vrednosti Na njenu vrednost utiču ekstremne vrednosti

(”outliers”) (”outliers”) Izražava se u istim jedinicama kao i osnovni podaciIzražava se u istim jedinicama kao i osnovni podaci Izraz za izračunavanjeIzraz za izračunavanje::

N

xxx

N

xx N21

broj podataka dobijena vrednost

Page 7: Numeričke deskriptivne veličine

72009/2009

Aritmetička srednja vrednostAritmetička srednja vrednost

0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10

srednja vrednost = 3

35

15

5

54321

4

5

20

5

104321

srednja vrednost = 4

Uticaj ekstremnih vrednosti

Page 8: Numeričke deskriptivne veličine

82009/2009

Prosta srednja vrednost vs. ponderisana – težinska Prosta srednja vrednost vs. ponderisana – težinska srednja vrednostsrednja vrednost

Ponderisana aritmetička srednja vrednost izračunava se kada su podaci Ponderisana aritmetička srednja vrednost izračunava se kada su podaci prikazani kao frekvence:prikazani kao frekvence:

Ako su podaci grupisani u klasne intervale, ponderisana srednja vrednost se Ako su podaci grupisani u klasne intervale, ponderisana srednja vrednost se izračunava:izračunava:

i

i

f

xfx

i

is

f

)x(fx

Page 9: Numeričke deskriptivne veličine

92009/2009

Geometrijska srednja vrednostGeometrijska srednja vrednost

n-ti koren proizvoda svih članova skupan-ti koren proizvoda svih članova skupa Primer: 1,2,3,10Primer: 1,2,3,10 GGx = 4-ti koren iz 60 = 2.78x = 4-ti koren iz 60 = 2.78

II način izračunavanja GII način izračunavanja Gx:x:

1. logaritmovanje svakog broja u skupu1. logaritmovanje svakog broja u skupu

2. računanje aritmetičke sredine tih logaritama2. računanje aritmetičke sredine tih logaritama

3.dizanje osnove logaritma (ln-2.718 ili log-10) na 3.dizanje osnove logaritma (ln-2.718 ili log-10) na izračunatu aritmetičku sredinu logaritama (korak izračunatu aritmetičku sredinu logaritama (korak 2)2)

Page 10: Numeričke deskriptivne veličine

102009/2009

Skraćena srednja vrednostSkraćena srednja vrednost

Računa se tako što se iz skupa izbace ekstremne Računa se tako što se iz skupa izbace ekstremne vrednosti sa oba kraja raspodele (najniže i najviše vrednosti sa oba kraja raspodele (najniže i najviše vrednostivrednosti

5-25% vrednosti je uobičajeno da se odbaci i 5-25% vrednosti je uobičajeno da se odbaci i onda se računa srednja vrednostonda se računa srednja vrednost

Eliminiše se uticaj ekstremnih vrednostiEliminiše se uticaj ekstremnih vrednosti Primena – sport da bi se eliminisali efekti Primena – sport da bi se eliminisali efekti

ekstremnih ocena dobijenih pogrešnom procenom ekstremnih ocena dobijenih pogrešnom procenom sudijasudija

Page 11: Numeričke deskriptivne veličine

112009/2009

Medijana (Me)Medijana (Me)

Medijana je centralna vrednost u nizu podatakaMedijana je centralna vrednost u nizu podataka 50%50% vrednosti je iznad vrednosti je iznad, 50% , 50% ispod medijaneispod medijane

Pre određivanje medijane podaci se urede po veličiniPre određivanje medijane podaci se urede po veličini Na Me ne utiču ekstremne vrednosti Na Me ne utiču ekstremne vrednosti

0 1 2 3 4 5 6 7 8 9 10

medijana = 3

0 1 2 3 4 5 6 7 8 9 10

medijana = 3

Page 12: Numeričke deskriptivne veličine

122009/2009

Određivanje medijaneOdređivanje medijane

Pozicija medijane (u uređenim podacima)Pozicija medijane (u uređenim podacima)::

Ako je broj podataka neparan, medijana je vrednost u Ako je broj podataka neparan, medijana je vrednost u sredini niza sredini niza

Ako je broj podataka paran, medijana je srednja Ako je broj podataka paran, medijana je srednja vrednost dve vrednosti u sredini niza (između N/2 i vrednost dve vrednosti u sredini niza (između N/2 i (N+2)/2)(N+2)/2)

Napomena: Napomena:

izraz nije izraz nije vrednostvrednost medijane, već medijane, već redni brojredni broj vrednosti vrednosti koja predstavlja medijanukoja predstavlja medijanu

2

1Nmedijanepozicija

2

1N

Page 13: Numeričke deskriptivne veličine

132009/2009

Modus (Mo)Modus (Mo)

Vrednost koja se pojavljuje najčešćeVrednost koja se pojavljuje najčešće

Na Mo ne utiču ekstremne vrednostiNa Mo ne utiču ekstremne vrednosti

U skupu može biti jedan ili više modusaU skupu može biti jedan ili više modusa

Skup može biti bez modusaSkup može biti bez modusa

Mo može da se odredi i za numeričke i kategoričke Mo može da se odredi i za numeričke i kategoričke podatkepodatke

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

modus = 9

0 1 2 3 4 5 6

nema modusa

Page 14: Numeričke deskriptivne veličine

142009/2009

Page 15: Numeričke deskriptivne veličine

152009/2009

0

10

20

30

40

50

60

70

1 1,5

2 2,5

3 3,5

4 4,5

5

Log PO-aze Log DZO-aze Aktivnost enzima PON1

Broj osoba

KV

KG

antimodeantimode

Page 16: Numeričke deskriptivne veličine

162009/2009

Skale merenja- mere centralne tendencijeSkale merenja- mere centralne tendencije

intervalna/skala odnosa - intervalna/skala odnosa - x, Me, Mox, Me, Mo ordinalna – Me, Moordinalna – Me, Mo nominalna – samo Mo!!!nominalna – samo Mo!!!

Page 17: Numeričke deskriptivne veličine

172009/2009

KvartiliKvartili

Kvartili dele skup uređenih podataka na četiri Kvartili dele skup uređenih podataka na četiri jednaka delajednaka dela

Pozicione veličinePozicione veličine

25% 25% 25% 25%

QQ11 QQ22 QQ33

25%25% 25%

Prvi kvartilPrvi kvartil, , QQ11 – 25% vrednosti su manje od Q – 25% vrednosti su manje od Q11

Drugi kvartil, Drugi kvartil, QQ22 = medijana= medijana Treći kvartil, Treći kvartil, QQ33 = 25% vrednosti su veće od Q = 25% vrednosti su veće od Q11 QQ11 i Q i Q33 nisu mere centralne tendencije nisu mere centralne tendencije

Page 18: Numeričke deskriptivne veličine

182009/2009

Određivanje kvartilaOdređivanje kvartila

Pozicija (redni broj vrednosti) prvog kvartila:

Q1 = (N+1)/4 Pozicija (redni broj vrednosti) drugog kvartila:

Q2 = (N+1)/2 Pozicija (redni broj vrednosti) trećeg kvartila:

Q3 = 3(N+1)/4

gde je N ukupan broj podataka

Page 19: Numeričke deskriptivne veličine

192009/2009

PercentiliPercentili

Pozicija percentila:Pozicija percentila:

Prvi percentil PPrvi percentil P11: odvaja 1% vrednosti: odvaja 1% vrednosti

QQ11 = P = P2525

QQ22 = Me = P = Me = P5050

QQ33 = P = P7575

)1N(100

PNP

Page 20: Numeričke deskriptivne veličine

202009/2009

Mere varijacijeMere varijacije

isti centar, različita varijacija

Mere varijacije daju Mere varijacije daju informaciju o informaciju o rasipanjurasipanju ili ili varijabilnostivarijabilnosti podatakapodataka

varijacija

varijansa standardna devijacija

koeficijent varijacije

raspon interkvartilni raspon

Page 21: Numeričke deskriptivne veličine

212009/2009

RasponRaspon

Najjednostavnija mera varijacijeNajjednostavnija mera varijacije Raspon – razlika između najveže i najmanje vrednosti Raspon – razlika između najveže i najmanje vrednosti

u skupuu skupu

raspon = xmax – xmin

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

raspon = 14 - 1 = 13

primer:

Page 22: Numeričke deskriptivne veličine

222009/2009

Nedostatak rasponaNedostatak raspona

Ignoriše oblik raspodele podatakaIgnoriše oblik raspodele podataka

Osetljiv na ekstremne vrednostiOsetljiv na ekstremne vrednosti

7 8 9 10 11 12

raspon = 12 - 7 = 5

7 8 9 10 11 12

raspon = 12 - 7 = 5

1, 1, 1, 1, 1, 1, 1, 1, 1,1,1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 5

1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 120

raspon = 5 - 1 = 4

raspon = 120 - 1 = 119

Page 23: Numeričke deskriptivne veličine

232009/2009

Interkvartilni rasponInterkvartilni raspon

Rasipanje unutar srednjih 50%: QRasipanje unutar srednjih 50%: Q33 – Q – Q11 Nema uticaja ekstremnih vrednostiNema uticaja ekstremnih vrednosti

primer:

medijana(Q2) XmaxXmin Q1

Q3

25% 25% 25% 25%

12 30 45 57 70

interkvartilni raspon = 57 – 30 = 27

Page 24: Numeričke deskriptivne veličine

242009/2009

Srednje apsolutno odstupanje - SoSrednje apsolutno odstupanje - So

N

xxS

i0

Srednje apsolutno odstupanje (obeležava se sa Soo) određuje se tako što se zbir apsolutnih vrednosti pojedinačnih odstupanja svakog člana niza od srednje vrednosti podeli ukupnim brojem članova niza:

Page 25: Numeričke deskriptivne veličine

252009/2009

VarijansaVarijansa

Prosečno (približno) kvadratno odstupanje vrednosti od srednje vrednostiProsečno (približno) kvadratno odstupanje vrednosti od srednje vrednosti

Izraz za izračunavanje:Izraz za izračunavanje:

N – 1 – broj stepena slobode N – 1 – broj stepena slobode

1-N

)x(x

V

n

1i

2i

Page 26: Numeričke deskriptivne veličine

262009/2009

Standardna devijacija Standardna devijacija

Najčešće korišćena mera varijacijeNajčešće korišćena mera varijacije Pokazuje varijaciju oko srednje vrednostiPokazuje varijaciju oko srednje vrednosti Kvadratni koren iz varijanseKvadratni koren iz varijanse Izražava se u Izražava se u istim jedinicamaistim jedinicama kao i osnovni podaci kao i osnovni podaci

1-N

)x(x

Sd

N

1i

2i

1N

xNx

Sd

2N

1i

2

Page 27: Numeričke deskriptivne veličine

272009/2009

Broj stepena slobode - df, θ, Broj stepena slobode - df, θ, φφ

φφ = N - 1 = N - 1 φφ - broj nezavisnih poredjenja - broj nezavisnih poredjenja

xx11 i x i x22 nezavisne vrednosti, nezavisne vrednosti, φφ = 2 = 2

321

321

xxxx33

xxxx

Page 28: Numeričke deskriptivne veličine

282009/2009

Standardna devijacija - SdStandardna devijacija - Sd

Podaci:Podaci: 4,9 6,34,9 6,3 7,7 8,9 10,3 11,77,7 8,9 10,3 11,7

2,5236,3681N

)XN(XSd

22

Page 29: Numeričke deskriptivne veličine

292009/2009

Sd - grupisani podaciSd - grupisani podaci

μmol/L4,093Sd

12

Ki

f

)x(f xf = Sd

222s

Page 30: Numeričke deskriptivne veličine

302009/2009

Standardna devijacija iz razlike parovaStandardna devijacija iz razlike parova

par x1 x2 d d2

1. 4,5 4,7 0,2 0,04

2. 6,7 6,9 0,2 0,04

3. 5,6 5,3 0,3 0,09

4. 7,8 7,8 0 0

5. 5,3 5,2 0,1 0,01

6. 4,5 4,8 0,3 0,09

7. 8,4 8,5 0,1 0,01

8. 6,3 6,1 0,2 0,04

9. 5,7 5,8 0,1 0,01

10. 9,2 9,6 0,4 0,16

11 4,3 4,2 0,1 0,01

12. 5,9 6,2 0,3 0,09

ukupno - - 0,59

N2

dSd

2

mmol/L 0,157 = 0,024583 = 24

0,59 = Sd

U 12 uzoraka seruma određena U 12 uzoraka seruma određena glukoza u duplikatuglukoza u duplikatu

Page 31: Numeričke deskriptivne veličine

312009/2009

Značenje standardne devijacijeZnačenje standardne devijacije

mala standardna devijacija

velika standardna devijacija

Page 32: Numeričke deskriptivne veličine

322009/2009

Poređenje standardnih devijacijaPoređenje standardnih devijacija

sr. vrednost = 15.5SD = 3,338

11 12 13 14 15 16 17 18 19 20 21

11 12 13 14 15 16 17 18 19 20 21

grupa B

grupa A

sr. vrednost = 15.5Sd = 0,926

11 12 13 14 15 16 17 18 19 20 21

sr. vrednost = 15.5Sd = 4,567

grupa C

Page 33: Numeričke deskriptivne veličine

332009/2009

Osobine varijanse i standardne devijacijeOsobine varijanse i standardne devijacije

Svaka vrednost se koristi u izračunavanjuSvaka vrednost se koristi u izračunavanju razlika u odnosu na raspon i interkvartilni rasponrazlika u odnosu na raspon i interkvartilni raspon

Veliki uticaj ekstremnih vrednostiVeliki uticaj ekstremnih vrednosti izračunava se kvadrat odstupanja od srednje vrednostiizračunava se kvadrat odstupanja od srednje vrednosti

Page 34: Numeričke deskriptivne veličine

342009/2009

Koeficijent varijacije - KvKoeficijent varijacije - Kv

Mera relativne Mera relativne varijacije (u odnosu na srednju varijacije (u odnosu na srednju vrednost)vrednost)

Uvek se izražava u %Uvek se izražava u % Omogućava poredjenje više grupaOmogućava poredjenje više grupa podataka, čak i podataka, čak i

kada su izraženi u različitim jedinicamakada su izraženi u različitim jedinicama

100 x

Sd = Kv

Page 35: Numeričke deskriptivne veličine

352009/2009

Poređenje koeficijenata varijacijePoređenje koeficijenata varijacije

GrupaGrupa A: A: srednja vrednostsrednja vrednost = 50 = 50 sstandardtandardnana devi devillaacijacija = 5 = 5

GrupaGrupa B: B: srednja vrednostsrednja vrednost = = 101000 sstandardtandardnana devi devillaacijacija = 5 = 5

5%100%100

5100%

x

SdvK B

%01100%50

5100%

x

SdvK A

Page 36: Numeričke deskriptivne veličine

362009/2009

Asimetrija raspodeleAsimetrija raspodele

Pokazuju kako su podaci distribuiraniPokazuju kako su podaci distribuirani zakrivljenost i zašiljenostzakrivljenost i zašiljenost

desnostranadesnostranalevostranalevostrana simetričnasimetrična

MeMe MoMo MoMo MeMe = Me = Mo= Me = Mox xx

Page 37: Numeričke deskriptivne veličine

372009/2009

Numeričke mere za populaciju i uzorakNumeričke mere za populaciju i uzorak

Statistički parametri koji se izračunavaju iz Statistički parametri koji se izračunavaju iz populacijepopulacije opisuju osobine populacijeopisuju osobine populacije

Statistički parametri koji se izračunavaju iz Statistički parametri koji se izračunavaju iz uzorkauzorka opisuju osobine uzorkaopisuju osobine uzorka

Srednja vrednost populacije – Srednja vrednost populacije – μμ Srednja vrednost uzorka –Srednja vrednost uzorka –

Standardna devijacija populacije –Standardna devijacija populacije – σσ Standardna devijacija uzorkaStandardna devijacija uzorka –– Sd Sd

x

Page 38: Numeričke deskriptivne veličine

382009/2009

Z-score –Standardni skorZ-score –Standardni skor

Odstupanje posmatrane vrednosti od Odstupanje posmatrane vrednosti od x izraženo x izraženo u broju Sdu broju Sd

Z=(x -Z=(x -x)/Sdx)/Sd

Mera relativnog odstupanjaMera relativnog odstupanja Z pozitivan – veći od većine vrednosti u skupuZ pozitivan – veći od većine vrednosti u skupu Z negativan – manji od većine vrednosti u skupuZ negativan – manji od većine vrednosti u skupu

Page 39: Numeričke deskriptivne veličine

392009/2009

Z-score Z-score

Page 40: Numeričke deskriptivne veličine

402009/2009

Z-score primerZ-score primer

Kontrolom kvaliteta težine tableta dobijeno je 120 Kontrolom kvaliteta težine tableta dobijeno je 120 vrednosti iz kojih su izračunate srednja vrednost vrednosti iz kojih su izračunate srednja vrednost 500.5 mg i Sd 3 mg. Koliki je Z-score za tablete 500.5 mg i Sd 3 mg. Koliki je Z-score za tablete težine 496 mg?težine 496 mg?

Rešenje (496-500.5)/3=-1.5Rešenje (496-500.5)/3=-1.5

Page 41: Numeričke deskriptivne veličine

412009/2009

Devojka je visoka 160 cm i ima z-score 0.7 u Devojka je visoka 160 cm i ima z-score 0.7 u odnosu na odnosu na x visinu grupe koja iznosi 168 cm. x visinu grupe koja iznosi 168 cm. Kolika je Sd?Kolika je Sd?

Z-score primer 2 Z-score primer 2