31
Statistika 2018/19 Deskriptivna statistika

Statistika...Deskriptivna statistika •Grupisanje i sređivanje statističkih podataka •Prikazivanje statističkih podataka –Tabelarno i grafički •Izračunavanje ... Grupisanje

  • Upload
    others

  • View
    28

  • Download
    0

Embed Size (px)

Citation preview

Statistika2018/19

Deskriptivna statistika

Deskriptivna statistika

• Grupisanje i sređivanje statističkih podataka

• Prikazivanje statističkih podataka

– Tabelarno i grafički

• Izračunavanje osnovnih karakteristika statističkih serija

– Srednje vrednosti

– Mere varijacije

– Mere oblika rasporeda

Grupisanje i sređivanje statističkih podataka

• Prema mestu razlikuje se centralizovano, decentralizovano i kombinovano.

• Cilj: Formiranje statističke serije

– uređeni skup varijacija obeležja posmatrane statističke mase.

Tabelarno prikazivanje statističkih podataka

• Statistička tabela - uokvirena površina u koju se unosi statistička serija.

• Prema sadržaju razlikujemo proste, složene i kombinovane tabele.

Ključni elementi statističke tabele

Broj i naziv tabele

naziv obeležja

naziv frekvencije

vrednost ili modalitet obeležja

Ukupno:

fi

Primedba

izvor

k

i

if1

Zaglavlje

Zbirni red

Pretkolona

X

• Svako polje statističke tabele mora biti popunjeno!

• Univerzalni znakovi:– nema pojave,

… ne raspolaže se podatkom,

prosečna vrednost,

( ) nepotpun, nedovoljno proveren podatak,

* ispravljen podatak,

↑← obuhvadeno podatkom u pravcu strelice.

O

Grafičko prikazivanje statističkih podataka

• Tačkasti– Dijagram rasturanja

• Površinski– Kružni dijagram, Bar dijagram, Histogram

• Linijski– Poligon frekvencija, Polarni dijagram

• Prostorni– Stereogram

• Kartogrami

• Grafikoni se ucrtavaju u koordinatni sistem koji čine: horizontalna (apscisna) osa, vertikalna (ordinatna) osa.

• Uz svaku osu treba navesti naziv, simbol i jedinicu mere.

• Kumulanta - poligon koji predstavlja kumulaciju ispod.

• Ogiva - poligon koji predstavlja kumulaciju iznad.

• Presek kumulante i ogive pokazuje medijanu statističke serije

Izračunavanje osnovnih karakteristika statističkih serija

Prvi korak:

Razumeti podatke koji su predmet analize

– Šta je obeležje?

– Osnovni skup ili uzorak?

– Grupisani ili negrupisani?

– Koliko iznosi broj podataka?

Srednje vrednosti

• Kako reprezentovati celokupnu statističku masu?

• Kakav je odnos srednjih vrednosti prema minimalnoj i maksimalnoj vrednosti obeležja?

• Da li srednja vrednost mora biti vrednost obeležja?

– Da li se može izraziti decimalnim brojem bez obzira na tip podataka?

Srednje vrednosti

Izračunate

•Aritmetička sredina

•Geometrijska sredina

Po položaju

•Modus

•Medijana

•Kvartili

•Decili

•Percentili

Aritmetička sredina

Podaci predstavljaju Osnovni skup Uzorak

Formula

N

xN

i

i 1

n

x

x

n

i

i 1

Prosečna vrednost obeležja

Primer 1

• 12 studenata izabranih na slučajan način anketirano je o broju sati nedeljno koje provedu za računarom:

20, 14, 21, 20, 10, 20, 15, 25, 50, 35, 40, 30

Geometrijska sredina

Relativni ili proporcionalni pokazatelji, geometrijska progresija

Formula n

n

i

ixG

1

Primer 2

• Kamatna stopa prve godine iznosi 3%, druge 20%, a trede 40%.

Koliko iznosi prosečna kamatna stopa tokom 3 godine?

Modus

Najčešda vrednost obeležja

Bimodalne i multimodalne serije podataka

Kada modus ne može da se odredi?

Medijana

Kakva je serija podataka? Neparan broj podataka Paran broj podataka

Formula2

1 nxMe2

122

nn xxMe

Centralna poziciona vrednost

Kvartili

Kakvi su podaci? Formula

Neparan broj podataka

Paran broj podataka

411 nxQ

2

1

144

nn xxQ

Dele neopadajudu seriju podataka na 4 jednaka dela

MeQ 2

MeQ 2

4

)1(33 nxQ

2

1

34

34

3

nn xx

Q

Percentili

Dele neopadajudu seriju podataka na 100 jednakih delova

Primer 3

• 10 studenata izabranih na slučajan način anketirano je o broju osoba sa kojim dnevno komuniciraju:

1, 3, 5, 5, 5, 10, 10, 10, 10, 10.

• Koja srednja vrednost najbolje opisuje podatke?

Primer 4

• 10 studenata izabranih na slučajan način anketirano je o broju broju sati nedeljno u čitanju informativnih sajtova:

1, 1, 2, 2, 5, 5, 10, 10, 20.

• Koja srednja vrednost najbolje opisuje podatke?

• Da li se odgovor menja ako se 20 zameni sa 50?

Mere varijacije

• Pokazatelji apsolutnih i relativnih odstupanja vrednosti obeležja od aritmetičke sredine

Interval varijacije

Varijansa

Standardna devijacija

Koeficijent varijacije

Normalizovano odstupanje

Primer 1

• 12 studenata izabranih na slučajan način anketirano je o broju sati nedeljno koje provedu za računarom:

20, 14, 21, 20, 10, 20, 15, 25, 50, 35, 40, 30

Interval varijacije

Formulaminmax xxI

Varijansa

Podaci predstavljaju Osnovni skup Uzorak

Formula

N

xN

i

i

1

2

2

)(

1

)(1

2

2

n

xxn

i

i

u

Varijansa

Standardna devijacija

Podaci predstavljaju Osnovni skup Uzorak

Formula2

2

uu

Koeficijent varijacije

Podaci predstavljaju Osnovni skup Uzorak

Formula 100

V 100

xV u

u

Podaci predstavljaju Osnovni skup Uzorak

Formula

Normalizovano odstupanje

XZU

u

uu

xXZU

Mere oblika rasporeda

• Koeficijent

asimetrijeNegativna asimetrija

Simetričan raspored

Pozitivna asimetrija

)0( 3

3

)0( 3

)0( 3

MoMex

MoMex

xMeMo

asimetrija jaka

asimetrija srednja

asimetrija mala

50,0||

50,0||25,0

25,0||

3

3

3

Mere oblika rasporeda

• Koeficijent spljoštenosti

Više spljošten Normalno spljošten Više izdužen

4

Napomena: α4 se u literaturi često poredi sa vrednošdu 3.

)0( 4 )0( 4 )0( 4