45
Katedra za medicinsku statistiku i informatiku MEDICINSKA STATISTIKA OSNOVNI STATISTIČKI POJMOVI, SREĐIVANJE I OPISIVANJE PODATAKA Integrisane akademske studije medicine 2013/2014

Osnove statistike

Embed Size (px)

DESCRIPTION

Statistika

Citation preview

Page 1: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

MEDICINSKA STATISTIKA

OSNOVNI STATISTIČKI POJMOVI, SREĐIVANJE I OPISIVANJE PODATAKA

Integrisane akademske studije medicine 2013/2014

Page 2: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Podatak / podaci

• Podatak je predmet statistike (a svaka oblast ako je nauka mora da ima svoj predmet pored svog metoda a ona ga ima – statistički metod).

• Podatak je bilo koja činjenica ili zapažanje (opservacija)

• Model podataka:

jedinica posmatranja

šta se meri

kolika je vrednost

kada je izmereno

Page 3: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Variranje, varijabilitet podataka

• Variranje, varijabilitet, varijacija, neizvesnost, nesigurnost

• Izvori varijabiliteta

Biološki - varijacije među individuama

Sredinski

Analitički

Nepotpuno znanje

Dijagnostički

Terapijska i prognostička neizvesnost

Page 4: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Obeležja / Varijable i tipovi varijabli

• Obeležje je bilo koja kvantitativna ili kvalitativna karakteristika, svojstvo ili osobina jedinica posmatranja.

• Obeležja:

Konstantna

Varijabilna (varijable)

• Kvantitativna (numerička)

– Prekidna

– Neprekidna

• Kvalitativna (atributivna)

Page 5: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Osnovni skup

Uzorak Statistički zaključak o populaciji sa određenim stepenom nesigurnosti

Statistička analiza

Osnovni skup / Populacija, jedinice posmatranja, uzorak

Osnovni skup (populacija) je kompletan skup (u teorijskom smislu beskonačan ) svih mogućih rezultata merenja posmatranog obeležja objekata koji dele neku zajedničku karakteristiku.

Jedinice posmatranja – elementi osnovnog skupa koji poseduju karakteristike od interesa.

Uzorak – (reprezentativni) podskup osnovnog skupa. Cilj i primena u statistici: ispitivanje određene osobine i generalizacija zaključka na osnovni skup

Page 6: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Statistika

• Statistika je: – nauka o generisanju informacija i znanja kroz prikupljanje, analizu i

interpretaciju podataka koji su podložni slučajnom variranju.

– nauka o odlučivanju u uslovima nesigurnosti.

– opšti intelektualni metod koji se primenjuje kad god postoje podaci sa osobinama variranja i slučajnošću pojavljivanja.

• Najčešća podela je na deskriptivnu i inferencijalnu (analitičku) statistiku tj. statistiku zaključivanja.

• Medicinska statistika / Biostatistika je: – statistika primenjena u oblastima povezanim sa zdravljem i bolešću

(biomedicinske i javnozdravstvene nauke), kao i nauka koja razvija nove alate i metode za istraživanje ovih oblasti.

– nauka o odlučivanju u uslovima nesigurnosti u oblastima povezanim sa zdravljem i bolešću.

Page 7: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Kreiranje medicinskih podataka

• Merenje - proces dodeljivanja brojeva ili drugih simbola specifičnim karakteristikama jedinica posmatranja (objekata, osoba ili događaja) – Instrumenti merenja: uređaj/aparat, opservacija, intervju, upitnik,..

– Greške merenja: sistematske i slučajne

• Podaci mogu biti: –Primarni podaci – kroz istraživanja – kreiranje medicinskog znanja

–Sekundarni podaci (medicinska / zdravstvena dokumentacija, medicinske baze

podataka) – medicina kao primena medicinskog znanja u konkretnim slučajevima i okolnostima

• Kvalitet podataka. –Valjanost / tačnost

–Pouzdanost / preciznost

• Skale merenja – nominalna, ordinalna, intervalna, omerna

Page 8: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Tipovi podataka

• Kvalitativni (kategorijalni, atributivni)

– Nominalni

– Ordinalni

• Kvantitativni (numerički)

– Diskretni (prekidni)

– Kontinuirani (neprekidni)

Page 9: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Sažimanje podataka

• Potreba za sažimanjem podataka

• Važne karakteristike podataka (centralna tendencija, variranje, oblik raspodele)

• Kako sažimati podatke? – Sređivanje podataka (Grupisanje podataka i njihovo prikazivanje),

– Apsolutni i relativni brojevi, i

– Statističke deskriptivne mere:

• mere centralne tendencije,

• mere varijabiliteta, i

• mere oblika raspodele

Page 10: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Sređivanje podataka

• Sređivanje podataka obuhvata njihovo grupisanje i tabelarno i grafičko prikazivanje – Grupisanje je proces razvrstavanja (organizovanja, klasifikovanja)

jedinica posmatranja prema vrednostima posmatranih varijabli

– Učestalost (frekvencija) • Apsolutne učestalosti (frekvencije) – nastaju prebrojavanjem jedinica posmatranja

po grupama ili klasnim intervalima.

• Relativne učestalosti (frekvencije) -nastaju deljenjem apsolutnih učestalosti ukupnim brojem jedinica posmatranja. Mogu biti iskazane u vidu proporcija ili procentualno.

• Parcijalne učestalosti – učestalosti pojedinačnih kategorija ili klasnih intervala

• Kumulativne učestalosti – sukcesivni zbirovi učestalosti pojedinih kategorija ili klasnih intervala

– Raspodela učestalosti (distribucija frekvencija, empirijska raspodela frekvencija) – rezultat procesa grupisanja koji predstavlja niz učestalosti po grupama: kategorijama, diskretnim vednostima ili klasnim intervalima. Prikazuje se tabelarno ili grafički.

Page 11: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Grupisanje podataka

Tip podataka Grupisanje prema Grafički prikaz

Nominalni Kategorijama Kružni dijagram ili stubičasti dijagram

Ordinalni Kategorijama Kružni dijagram ili stubičasti dijagram

Numerički diskontinuirani

Diskretnim vrednostima ili

klasnim intervalima Štapićasti dijagram

Numerički kontinuirani

Klasnim intervalima Histogram ili poligon

frekvencija

Page 12: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Prikazivanje nominalnih podataka

Tabelarni prikaz raspodele učestalosti

Navika pušenja n %

Pušači 23 46

Nepušači 27 54

Ukupno 50 100

n – apsolutne frekvencije

% - relativne frekvencije

Grafički prikaz: kružni dijagram

23, 46% 27,

54%

Pušači Nepušači

Page 13: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Prikazivanje ordinalnih podataka

Tabelarni prikaz raspodele učestalosti

Grafički prikaz: stubičasti dijagram

Zadovoljstvo

zdravstvenom

zaštitom

Parcijalne

frekvencije

Kumulativne

frekvencije

n % n %

Vrlo

nezadovoljan

4 8 4 8

Nezadovoljan 6 12 10 20

Neutralan 20 40 30 60

Zadovoljan 16 32 46 92

Vrlo zadovoljan 4 8 50 100

Ukupno 50 100

n – apsolutne frekvencije

% - relativne frekvencije

46

20

16

4

0

5

10

15

20

25

Vrlo

nez

adov

oljan

Nez

adov

olja

n

Neu

tralan

Zadov

oljan

Vrlo

zad

ovol

jan

Uče

sta

lost

Page 14: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Prikazivanje numeričkih diskontinuiranih podataka

Tabelarni prikaz raspodele učestalosti

Grafički prikaz: štapićasti dijagram

Broj

respiratornih

infekcija

Parcijalne

frekvencije

Kumulativne

frekvencije

n % n %

0 13 26 13 26

1 12 24 25 50

2 10 20 35 70

3 10 20 45 90

4 3 6 48 96

5 2 4 50 100

Ukupno 50 100

n – apsolutne frekvencije

% - relativne frekvencije

1312

10 10

32

0

2

4

6

8

10

12

14

0 1 2 3 4 5

Broj respiratornih infekcija

Uče

sta

lost

Page 15: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Prikazivanje numeričkih kontinuiranih podataka Starost

(god)

Parcijalne

frekvencije

Kumulativne

frekvencije

n % n %

15-19 2 4 2 4

20-24 6 12 8 16

25-29 7 14 15 30

30-34 16 32 31 62

35-39 5 10 36 72

40-44 5 10 41 82

45-49 5 10 46 92

50-54 4 8 50 100

Ukupno 50 100

n – apsolutne frekvencije

% - relativne frekvencije

2

67

16

5 5 54

0

2

4

6

8

10

12

14

16

18

15-1

9

20-2

4

25-2

9

30-3

4

35-3

9

40-4

4

45-4

9

50-5

4

Starost (godine)

Uče

sta

lost

2

67

16

5 5 54

0

2

4

6

8

10

12

14

16

18

15-1

9

20-2

4

25-2

9

30-3

4

35-3

9

40-4

4

45-4

9

50-5

4

Starost (godine)

Uče

sta

lost

Tabelarni prikaz raspodele učestalosti

Grafički prikaz: histogram frekvencija

Grafički prikaz: poligon frekvencija

Page 16: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Statističko opisivanje podataka

Page 17: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Apsolutni i relativni brojevi

• Apsolutni brojevi

• Relativni broj se dobija kao količnik dva apsolutna broja:

gde je Vr računska vrednost - vrednost koju poredimo sa baznom vrednošću, a Vb bazna vrednost - osnova za poređenje

• Množenje relativnog broja sa k (obično neka dekadna jedinica)

b

rb

V

VR

Page 18: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Proporcija

• Proporcija je specifičan tip odnosa gde je brojilac deo imenioca – odnos apsolutne frekvencije (x) jedinica opservacije sa datom karakteristikom i totalnog broja (n) jedinica opservacije: p=x/n. Vrednosti proporcije su ograničene na interval od 0.0 do 1.0. Ova relativna frekvencija može biti interpretirana ekvivalentno verovatnoći i može se iskazati u procentima p(%)=100*x/n.

Page 19: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Indeksi

• Indeksi strukture (kvote, pokazatelji strukture) - pokazuju odnos dela i celine

• Indeksi dinamike - pokazuju relativnu promenu obeležja u vremenu – bazni indeksi dinamike

– lančani indeksi dinamike

Page 20: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Statistički koeficijenti

• Statistički koeficijenti su relativni brojevi kojima poredimo intenzitet dve raznoimene pojave od kojih je bar jedna masovna.

• U statističke koeficijente spadaju mnogi zdravstveni i demografski pokazatelji, npr. natalitet i mortalitet, kao i dva zdravstvena pokazatelja koji se odnose na oboljevanje (morbiditet) – stopa incidencije i stopa prevalencije:

1000St

RN

gde je N – natalitet, R – broj živorođene dece na određenoj teritoriji za godinu dana, M – mortalitet, U – broj umrlih osoba na određenoj teritoriji za godinu dana, I – stopa incidencije, ON – broj novih slučajeva od određene bolesti na 100000 stanovnika u određenom periodu, P – stopa prevalencije, OU – ukupan broj slučajeva od određene bolesti na 100000 stanovnika u određenom periodu, St – broj stanovnika na toj teritoriji sredinom vremenskog intervala.

1000St

UM 100000

St

OI N 100000

St

OP U

Page 21: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Statističke deskriptivne mere / parametri i statistike

• Statistička deskriptivna (zbirna) mera je statistički metod koji može da sažme i opiše neku od važnih osobina skupa podataka (centralnu tendenciju, variranje ili oblik raspodele npr.).

• Parametar je statistička mera izračunata u populaciji (koriste se slova grčkog alfabeta).

• Statistika je statistička mera izračunata na uzorku (koriste se latinična slova).

Page 22: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Deskriptivne zbirne statističke mere

Jedna varijabla merena na jedinicama posamatranja iz uzorka

1. Mere centralne tendencije

2. Mere varijabiliteta

3. Mere oblika raspodele

Dve ili više varijabli merenih na istim jedinicama posmatranja iz uzorka

1. Mere centralne tendencije

2. … i mere (zajedničkog) varijabiliteta

3. … i mere oblika (zajedničke) raspodele

4. Mere povezanosti

Page 23: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Mere centralne tendencije

Mere centralne tendencije su statističke mere koje opisuju srednju ili centralnu tačku ili najtipičniju vrednost, oko koje postoji tendencija grupisanja podataka. Mere centralne tendencije su najbolji reprezenti skupa podataka - omogućavaju da se svi podaci predstave jednim brojem.

Osobine srednjih vrednosti: • Ne mogu biti veće od najveće, niti manje od najmanje pojedinačne vrednosti u

datom skupu podataka.

• Spadaju u apsolutne mere jer se iskazuju u istim mernim jedinicama u kojima su iskazani i podaci za koje se izračunavaju.

• Mogu imati vrednost koja uopšte ne postoji u skupu podataka.

• Mogu biti iskazane i decimalnim brojem, bez obzira da li su u pitanju numerički kontinuirani ili diskontinuirani podaci.

Page 24: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Mere centralne tendencije

Prema načinu izračunavanja srednje vrednosti dele se na:

• Računske srednje vrednosti – izračunavaju se na osnovu

svih vrednosti:

– aritmetička sredina

• Pozicione (lokacione) srednje vrednosti – određuju se na

osnovu položaja u nizu podataka i raspodeli učestalosti:

– medijana

– mod (modus, tipična vrednost)

Page 25: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Aritmetička sredina

Aritmetička sredina (prosečna vrednost, prosek) je količnik zbira svih vrednosti i njihovog ukupnog broja: populaciona uzoračka

aritmetička sredina aritmetička sredina

gde je xi pojedinačan podatak, a n broj podataka. • Prednosti:

• jednostavno izračunavanje i odslikavanje svih vrednosti u skupu podataka

• Nedostaci: • ne može se koristiti sa nominalnim i ordinalnim podacima • pod značajnim je uticajem ekstremnih vrednosti - na malom broju podataka

samo jedna ekstremna vrednost može učiniti aritmetičku sredinu nereprezentativnom.

Page 26: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Ponderisana aritmetička sredina

Ponderisana aritmetička sredina izračunava se tako što se svakom podatku daje određeni ponder (težinski koeficijent). Ponderisana aritmetička sredina najčešće se koristi za (1) izračunavanje aritmetičke sredine grupisanih podataka, i za (2) izračunavanje objedinjene aritmetičke sredine dve ili više grupa.

f predstavlja frekvenciju klasnog intervala, a x sredinu klasnog intervala. Kada se ponderisana aritmetička sredina koristi za izračunavanje objedinjene aritmetičke sredine dve ili više grupa, u toj formuli f predstavlja veličinu grupe, a x aritmetičku sredinu grupe

𝑥 = 𝑓𝑥

𝑓

Page 27: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Medijana

• Centralna vrednost, srednja poziciona vrednost. • Centralna vrednost u nizu podataka poređanih po veličini. • Deli distribuciju na dva jednaka dela. 50% vrednosti se nalazi

ispod medijane, a 50% vrednosti iznad medijane.

• Prednost: • može da se izračuna kod ordinalnih podataka • manje je pod uticajem ekstremnih vrednosti u odnosu na aritmetičku

sredinu

• Nedostaci (u odnosu na aritmetičku sredinu): • manje je pogodna za dalje statističke analize, • ignoriše relativan uticaj svake pojedinačne vrednosti, uključujući i

ekstremne vrednosti, tako da nije pogodna kada želimo da srednja vrednost reflektuje svaku vrednost iz skupa podataka

Page 28: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Mod

Tipična vrednost. Vrednost sa najvećom frekvencijom. Pogodan za primenu kod nominalnih i ordinalnih podataka Prednosti: • pogodan za primenu kod nominalnih podataka - to jedina mera centralne

tendencije koja se može primeniti kod nominalnih podataka • nije pod uticajem ekstremnih vrednosti

Nedostaci: • može postojati više od jednog moda u datom skupu podataka, što

otežava interpretaciju • ne može se odrediti ako ne postoje bar dva podataka sa istim

vrednostima, • nije pogodan za dalje statističke analize • ignoriše relativan uticaj svake pojedinačne vrednosti.

Page 29: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Odnos mera centralne tendencije

Uzajamni odnosi srednjih vrednosti najviše zavise od oblika raspodele učestalosti. Kod simetrične raspodele aritmetička sredina, medijana i mod imaju slične vrednosti. Kod desno (pozitivno) iskošene raspodele, aritmetička sredina je veća od medijane i moda, a kod kod levo (negativno) iskošene raspodele, aritmetička sredina je manja od medijane i moda

Page 30: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Primer izračunavanja mera centralne tendencije

Za podatke 1, 7, 1, 5, 1, 3 i 6 mere centralne tendencije iznose:

3.437

6315171x

Aritmetička sredina:

Medijana: Niz podataka poređanih po veličini: 1, 1, 1, 3, 5, 6, 7. Centralni podatak je četvrti podatak u nizu. Vrednost tog podatka je vrednost medijane: Med = 3.

Mod: Vrednost sa najvećom frekvencijom javljanja je 1 (tri puta). Prema tome Mod = 1.

Page 31: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Varijabilitet

Promenljivost obeležja posmatranja od jedinice do jedinice posmatranja

Page 32: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Mere varijabiliteta

Mere varijabiliteta (mere varijacije, mere disperzije, mere raspršenja) opisuju variranje vrednosti skupa podataka, u smislu udaljenosti od srednjih vrednosti i opsega međusobnih razlika.

• Apsolutne mere varijacije – Interval (raspon) varijacije

– Interkvartilni opseg

– Varijansa

– Standardna devijacija

• Relativne mere varijacije – Koeficijent varijacije

– Standardizovane (normalizovane) vrednosti

Page 33: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Interval varijacije

Interval varijacije je razlika najveće i najmanje vrednosti u skupu podataka

minmax xx

Interval varijacije je najjednostavnija i najmanje informativna mera disperzije. Pruža opšte i elementarne informacije koje služe za orijentacionu procenu varijabilnosti / homogenosti obeležja. Nedostaci: • zavisi od postojanja ekstremnih vrednosti • ne daje informaciju o grupisanju unutar intervala • njegova vrednost raste sa povećanjem uzorka

Page 34: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Varijansa i standardna devijacija Varijansa je srednje kvadratno odstupanje od aritmetičke sredine (populaciona se označava grčkim slovom sigma na kvadrat a uzoračka se

obeležava sa sd, s ili SD na kvadrat) . Izračunava se po formuli: populaciona uzoračka

gde je xi je vrednost pojedinačnog podatka, i su aritmetičke sredine, a N i n su brojevi podataka u osnovnom skupu i uzorku.

Standardna devijacija (populaciona se označava grčkim slovom sigma a

uzoračka se obeležava sa sd, s ili SD) i izračunava se kao kvadratni koren iz varijanse: populaciona uzoračka

x m

𝑠𝑑2 = 𝑠2 = 𝑆𝐷2 = (𝑥𝑖 − 𝑥)

2

𝑛 − 1 2 =

(𝑥𝑖 − µ)2

𝑁

= (𝑥𝑖 − µ)

2

𝑁 𝑠𝑑 = 𝑠 = 𝑆𝐷 =

(𝑥𝑖 − 𝑥)2

𝑛 − 1

Page 35: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Zašto delimo sa n-1?

• A zašto to nismo radili kada je u pitanju bila aritmetička sredina?

• A zašto to ne radimo kada su u pitanju osnovni skupovi?

• Trošenje / iscrpljivanje uzoračkih podataka

• Koncept broja stepena slobode

Page 36: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Varijansa i standardna devijacija Standardna devijacija je najvažnija i najčešće primenjivana mera varijacije. Može se interpretirati kao srednje odstupanje od aritmetičke sredine. Što je standardna devijacija manja, manje je i odstupanje vrednosti podataka oko aritmetičke sredine. Prednost varijanse i standardne devijacije: reflektuju sve vrednosti skupa

podataka

Nedostaci varijanse i standardne devijacije: • osetljivost na ekstremne vrednosti • nepodesne za podatke sa asimetričnom raspodelom • mogu se primeniti samo sa numeričkim podacima

Nedostatak varijanse, u odnosu na standardnu devijaciju, je taj što je ona iskazana kvadriranim mernim jedinicama.

Page 37: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Koeficijent varijacije Koeficijent varijacije (CV) je relativna mera varijacije. Izračunava se kao količnik standardne devijacije i aritmetičke sredine, i obično je iskazan u procentima:

• Koeficijent varijacije pokazuje relativan iznos varijacije u odnosu na aritmetičku sredinu

• Pogodan je za poređenja varijabiliteta različitih skupova podataka, čak i kada su oni mereni potpuno različitim mernim jedinicama

100x

sdCV

Page 38: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Zed vrednost Zed vrednost (zed skor, standardizovana vrednost) je odstupanje od aritmetičke sredine iskazano u standardnim devijacijama. Uzoračka z vrednost se izračunava pomoću formule:

gde je xi aktuelna vrednost za koju se izračunava zed vrednost. Zed vrednost je pokazatelj relativne pozicije neke vrednosti u skupu podataka. Predznak zed vrednosti pokazuje da li je neka konkretna vrednost manja (negativna zed vrednost) ili veća (pozitivna zed vrednost) od aritmetičke sredine

sd

xxz i

i

Page 39: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Kvantili Kvantili – deljenje raspodele učestalosti na jednake uređene podgrupe. Npr., tri kvartila (Q1, Q2, Q3) dele raspodelu na četiri podgrupe. Decili dele raspodelu na deset podgrupa, a percentili na sto podgrupa.

Page 40: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Grafikon kutije (“boxplot”)

• Prikazuje minimalnu i maksimalnu vrednost (produžeci), kvartile (dužina kutije) i medijanu (linija koja preseca kutiju)

Page 41: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Oblik empirijske raspodele

• Osnovne informacije o obliku empirijske raspodele se mogu dobiti iz grafičkih prikaza (histogram, poligon frekvencija, štapićasti dijagrm, stubičasti dijagram) a potpune uz izračunavanje modalnih vrednosti i mera asimetrije i spljoštenosti.

• Oblik se obično klasifikuje kao unimodalan, bimodalan ili multimodalan. Unimodalan oblik može biti simetričan ili asimetričan (pozitivno ili desno iskošen, negativno ili levo iskošen).

Unimodalna raspodela Bimodalna raspodela

Page 42: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Asimteričan oblik raspodele

Vrednost mere asimetričnosti veća od 1 ukazuje na desnu iskošenost, a vrednost manja od -1 na levu iskošenost. Uzoračka mera asimetričnosti je:

Desna iskošenost Leva iskošenost

Page 43: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

“Zašiljenost” / “zaravnjenost” raspodele

• Vrednosti mere spljoštenosti veće od 1 ukazuju na šiljatu raspodelu, a manje od -1 ukazuju na zaravnjenu raspodelu. Uzoračka mera spljoštenosti je:

Mezokurtična Leptokurtična Platikurtična

“Zašiljena” “Zaravnjena”

Page 44: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

Deskriptivna statistika – umesto zaključka

• Deskriptivna statistika je oblast statistike koja kvantitativno iskazuje glavne karakteristike skupa podataka.

• Cilj joj je sažimanje podataka (po pravilu o uzorku).

• Rezultati su joj u obliku jednostavnih zbirnih mera. Zajedno sa grafičkom analizom osnova je svake kvantitativne analize podataka.

Page 45: Osnove statistike

Katedra za medicinsku

statistiku i informatiku ∑

A kuda dalje?

POPULACIJA

UZORAK

2.VEROVATNOĆA

3.INFERENCIJALNASTATISTIKA

1.DESKRIPTIVNASTATISTIKA