35
Sreñivanje i grafičko prikazivanje podataka 2012. Beograd Predavanje 2 / 1 Doc. Dr Slañana Spasić E-mail: [email protected] STATISTIKA

Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Embed Size (px)

DESCRIPTION

j

Citation preview

Page 1: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Sreñivanje i grafi čko prikazivanje podataka

2012. Beograd Predavanje 2 / 1

Doc. Dr Sla ñana Spasi ćE-mail:[email protected]

STATISTIKA

Page 2: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Negrupisani podaci

2012. Beograd Predavanje 2 / 2

• Podaci zapisani po redosledu prikupljanja, pre nego što se urede po veličini ili grupišu na neki način zovu se neureñeni, negrupisani ili sirovi podaci .

• Skupovi neureñenih podataka sreñuju se u vidu tabela i prikazuju pomoću grafikona .

• Podaci mogu biti kvantitativni (numerički) ikvalitativni (ili kategorijski, atributni).

Page 3: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Sreñivanje i grafi čko prikazivanje kvalitativnih podataka

2012. Beograd Predavanje 2 / 3

• Primer : Studenti IV godine Singidunum Univ. su se izjašnjavali gde bi želeli da se zaposle posle diplomiranja.

44Privatne firme

10Ne zna

20Sopstvena firma

26Državni oragani vlasti

Broj studenataVrsta zaposlenja

Kategorijaili modalitet

Kvalitativna promenljiva

frekvencija

Tabela raspodele frekvencija

N=100

Page 4: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Grafičko prikazivanje kvalitativnih grupisanih podataka

Grupisani kvalitativni podaci se mogu grafički prikazati pomoću:• štapi ćastog dijagrama• strukturnog kruga (pite )

2012. Beograd Predavanje 2 / 4

Page 5: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

0

5

10

15

20

25

30

35

40

45

50

P riva tn e f irm e D rž av n i o ra ga n iv las ti

S o ps tv en a f irm a N e z n a

V rs ta z ap o s le n ja

Fre

kven

cija

Štapi ćasti dijagram je grafikon u kome se na apscisi nalaze kategorije, a na ordinati frekvencije ili relativne frekvencije odreñenih kategorija.

Štapićasti dijagram

2012. Beograd Predavanje 2 / 5

Page 6: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Strukturni krug (pita)

2012. Beograd Predavanje 2 / 6

Strukturni krug ili pita je vrsta grafikona u vidu kruga podeljenog na kružne isečke od kojih svaki predstavlja relativnu frekvenciju ili procentualno učešće svake kategorije u osnovnom skupu ili uzorku.

Privatne firme, 44, 44%

Ne zna, 10, 10%

Sopstvena firma, 20, 20%

Državni oragani vlasti,

26, 26%

Krug ima 360 stepeni. Da bi smo prikazali učešće ili relativnu frekvenvciju kao kružne isečke, 360 množimo sa relativnom frekvencijom svake kategorije. Npr. 0,44·360°=158, 4°

β=0,26·360°=93,6°

α=158,4°

δ=0,10·360°=36° γ=0,20·360°=72°

Page 7: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

ISTORIJSKE ZANIMLJIVOSTI

Florens Najtingejl(Florence Nightingale,1820 - 1910)

Kada su Britanija, Francuska i Turska objavile rat Rusiji (Krimski rat,1854-56) F. Najtingejl je imenovana za britanskog izaslanika za poboljšanje medicinske nege u opštoj bolnici u Konstantinopolju (Istanbulu).Ona je prikupljala i organizovala statističke podatke trudeći se da poboljša stanje u civilnim i vojnim bolnicama.

Koristeći zavidno znanje matematike, prvi put upotrebila polarni dijagram ili ”coxcombs”kako ga je sama nazvala. Njime je grafički prikazala statističke podatke o stopi smrtnosti britanskih vojnika od zaraznih bolesti tokom Krimskog rata.

2012. Beograd Predavanje 2 / 7

Page 8: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Sreñivanje i grafi čko prikazivanje (numeri čkih) kvantitativnih podataka

2012. Beograd Predavanje 2 / 8

• Primer : Data je raspodela frekvencija za starosnu strukturu svih 50 zaposlenih u jednoj firmi.

1218 - 30

557 - 69

1444 - 56

1931 - 43

Broj zaposlenihStarost

Drugi grupni interval

Kvantitativna promenljiva

Frekvencijadrugog grupnog intervala

Frekvencije

Donja granica četvrtog grupnog intervala

Gornja granica četvrtog grupnog intervala

Page 9: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

2012. Beograd Predavanje 2 / 9

Raspodela frekvencija numeri čkih podatakaRaspodela frekvencija numeričkih podataka je tabelarni prikaz dva niza podataka: vrednosti promenljive prikazane grupnim intervalima i njima odgovarajući brojevi jedinica posmatranja (frekvencije). Ovako prikazani podaci su grupisani podaci .

Grani čna vrednost grupnog intervala predstavlja aritmetičku sredinu gornje granice jednog grupnog intervala i donje granice narednog grupnog intervala.

Širina grupnog intervala = gornja granična vrednost - donja granična vrednost

Sredina grupnog intervala = ( donja granica + gornja granica ) / 2

Page 10: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Raspodela frekvencija

2012. Beograd Predavanje 2 / 10

5

14

19

12

Frekvencija intervala

56,5 – 69,5

43,5 - 56,5

30,5 – 43,5

17,5 – 30,5

Granična vrednost intervala

13

13

13

13

Širinaintervala

2418 - 30

6357 - 69

5044 - 56

3731 - 43

Sredina grupnog intervala

Donja -gornja granica

Širina 1. intervala = 30,5 – 17,5 = 13

Granična vrednost 1. intervala = (30 + 31)/2 = 30,5

Sredina 1. intervala = (18 + 30)/2 = 24

Page 11: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Relativna frekvencija grupnog intervala

Frekvencija grupnog intervala

Zbir svih frekvencija=

Raspodela relativnih frekvencija i procentualna raspodela

2012. Beograd Predavanje 2 / 11

• Na osnovu tabele raspodele frekvencija možemo izračunati raspodelu relativnih frekvecija i procentualnu raspodelu.

Procentualno učešće = Relativna frekvencija X 100

Page 12: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Uvod u teoriju unformacija

I Pauza !

2012. Beograd Predavanje 2 / 12

Page 13: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Grafičko prikazivanje grupisanih podataka

Grupisani numerički podaci se mogu grafički prikazati pomoću:• histograma • poligona• strukturnog kruga (pite )

2012. Beograd Predavanje 2 / 13

Page 14: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Grafičko prikazivanje grupisanih podataka

Histogram se koristi za grafičko prikazivanje raspodele frekvencija, raspodele relativnih frekvencija i procentualne raspodele.

Histogram je dijagram koji se sastoji od niza spojenih pravougaonika čije su osnovice grupni intervali naneti na x-osu, a visine su frekvencije grupnog intervala (ili relativne frekvencije ili procentualna učešća) nanete na y-osu.

2012. Beograd Predavanje 2 / 14

Page 15: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Grafičko prikazivanje grupisanih podataka

HISTOGRAM

Histogram frekvencija

0

5

10

15

20

1

Starosni intervali

Fre

kven

cija

18 - 30 31-43 44-56 57-69

2012. Beograd Predavanje 2 / 15

Page 16: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Grafičko prikazivanje grupisanih podataka

HISTOGRAM

Histogram relativnih frekvencija

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

1

Starosni intervali

Rel

ativ

ne fr

ekve

ncije

18-30 31-43 44-56 57-69

2012. Beograd Predavanje 2 / 16

Page 17: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Grafičko prikazivanje grupisanih podataka

HISTOGRAM

Histogram u češća

0%

5%

10%

15%

20%

25%

30%

35%

40%

1

Starosni intervali

Učešće

18-30 31-43 44-56 57-69

2012. Beograd Predavanje 2 / 17

Page 18: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

2012. Beograd Predavanje 2 / 18

Oblici histograma

Histogram može biti:

1.Simetričan

2.Asimetričan

3.Uniformni ili pravougaoni.

Page 19: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

2012. Beograd Predavanje 2 / 19

Oblici histograma

0

5

10

15

20

25

30

35

1 Promenljiva

Fre

kven

cija

Simetri čan histogram

Page 20: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Oblici histograma

2012. Beograd Predavanje 2 / 20

Simetri čan histogram

0123456789

1

Promenljiva

Fre

kven

cija

Page 21: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Oblici histograma

2012. Beograd Predavanje 2 / 21

Histogram asimetri čan ulevo

0

5

10

15

20

25

30

35

1

Promenljiva

Fre

kven

cija

Page 22: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Oblici histograma

2012. Beograd Predavanje 2 / 22

Histogram asimetri čan udesno

0

2

4

6

8

10

12

1

Promenljiva

Fre

kven

cija

Page 23: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Oblici histograma

2012. Beograd Predavanje 2 / 23

Uniformni (pravougaoni) histogram

0

2

4

6

8

10

12

1

Promenljiva

Fre

kven

cija

Page 24: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

II Pauza !

2012. Beograd Predavanje 2 / 24

Page 25: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

2012. Beograd Predavanje 2 / 25

Deskriptivna statistika grafi čke metode - histogram

Definicija: Frekvencija fi neke odreñene vrednosti xi obeležja X je broj pojavljivanja te vrednosti u posmatranom skupu podataka.

11 16 9 10 15 17 10 2010 16 11 14 11 17 11 1217 12 10 16 15 12 13 1614 17 14 4 15 14 7 1415 17 15 10 15 18 15 1615 9 13 16 11 18 11 6

Neureñeni statistički skup

120019218517616815514213312611510290817160514fixi

raspodela frekvencija

Page 26: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

120019218517616815514213312611510290817160514fixi

∑=i

ifNsvi

Deskriptivna statistika grafi čke metode - histogram

N = 48

2012. Beograd Predavanje 2 / 26

2.10.021200019

4.20.0421810.40.1041712.50.1251616.70.1671510.40.104144.20.042136.30.0631212.50.1251110.40.104104.20.0429008

2.10.02172.10.0216005

2.10.0214fri (%)frixi

N

ff i

ri =

Definicija: Relativna frekvencija fri neke vrednosti xi obeležja Xje frekvencija fi podeljena sa ukupnim brojem podataka N.

Page 27: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Empirijska raspodela -histogram

2012. Beograd Predavanje 2 / 27

Crtanje histograma (za diskretnu raspodelu):1. odrediti frekvencije ili relativne frekvencije2. na apscisi označiti moguće vrednosti obeležja X3. nacrtati pravougaonik visine fi ili fri koja je data na

ordinati

0 2 4 6 8 10 12 14 16 18 200

1

2

3

4

5

6

7

8

9

f i

xi

Page 28: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Grafičko prikazivanje grupisanih podataka

2012. Beograd Predavanje 2 / 28

POLIGON

Poligon je dijagram koji se dobija spajanjem tačaka čije su koordinate sredine grupnih intervala na x-osi i frekvencije intervala na y-osi.

Kada je reč o dugačkoj seriji podataka i sa povećanjem broja grupnih intervala, a smanjenjem njihove širine poligon frekvencija postaje glatka kriva. Ova kriva se naziva kriva raspodele frekvencija .

Poligon u kojem se na y-osi nalaze relativne frekvencije nazivase poligon relativnih frekvencija , a poligon sa učešćima prikazanim na y-osi naziva se poligon u češća.

Page 29: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Grafičko prikazivanje grupisanih podataka

2012. Beograd Predavanje 2 / 29

POLIGON

Poligon frekvencija

02468

101214161820

0 18 - 30 31 - 43 44 - 56 57 - 69 71-

Starosni intervali

Frek

venc

ija

Page 30: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

2012. Beograd Predavanje 2 / 30

Raspodela kumulativnih frekvencija

Raspodela kumulativnih frekvencija ” manje od ”prikazuje ukupan broj jedinica posmatranja koje imaju vrednost ispod gornje granice svakog grupnog intervala.

Raspodela kumulativnih frekvencija ” veće od ”prikazuje ukupan broj jedinica posmatranja koje imaju vrednost iznad donje granice svakog grupnog intervala.

Page 31: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

2012. Beograd Predavanje 2 / 30

Kumulanta

Kumulanta je kriva koja pokazuje raspodelukumulativnih frekvencija i dobija se kada spoje tačkekoje odgovaraju gornjim (donjim) granicama grupnihintervala i kumulativnim frekvencijamaodgovarajućih grupnih intervala.

Moguće je nacrtati i kumulantu za raspodelu kumulativnih relativnih frekvencija i za kumulativnu procentualnu raspodelu.

Page 32: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Raspodela kumulativnih frekvencija ”manje od”

2012. Beograd Predavanje 2 / 32

5

14

19

12

Frekvencija

56,5 – 69,5

43,5 - 56,5

30,5 – 43,5

17,5 – 30,5

Granična vrednost intervala

12+19+14+5=50

12+19+14=45

12+19=31

12

Kumulativna frekvencija

12/50=0,2418 - 30

50/50=1,0057 - 69

45/50=0,9044 - 56

31/50=0,6231 - 43

Kumulativna relativna

frekvencija

Donja -gornja granica

Page 33: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Kumulanta

2012. Beograd Predavanje 2 / 33

Kumulanta za raspodelu kumulativnih frekvencija

0

10

20

30

40

50

60

17,5 30,5 43,5 56,5 69,5

Starost radnika u godinama

Kum

ulat

ivna

frek

venc

ija

Granična vrednost intervala

Page 34: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

2012. Beograd Predavanje 2 / 34

Kumulanta za kumulativnu procentnu raspodelu

0

20

40

60

80

100

120

17,5 30,5 43,5 56,5 69,5

Starost radnika u godinama

Kum

ulat

ivna

fr

ekve

ncija

Page 35: Statistika Predavanje 2 Sredivanje i Graficko Prikazivanje Podataka

Hvalana pažnji !

2012. Beograd Predavanje 2 / 35