30
Josipa Perkov, prof., pred. 1 4. MJERE DISPERZIJE 4. MJERE DISPERZIJE

4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 1

4. MJERE DISPERZIJE4. MJERE DISPERZIJE

Page 2: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 2

� Kod mnogih mjerenja se može opaziti da se rezultati grupiraju i skupljaju oko jedne srednje vrijednosti

� Srednja vrijednost dobro reprezentira rezultate ako su vrijednosti gusto grupirane (malo se razlikuju) oko srednje vrijednosti

� Srednja vrijednost loše reprezentira rezultate ako su vrijednosti minimalno grupirane oko srednje vrijednosti

� srednju vrijednost prikupljenih podataka potrebno je nadopuniti pokazateljem njihove raspršenosti (disperzije)

� mala vrijednost pokazatelja disperzije znači da je izračunata srednja vrijednost bolji reprezentant skupa podataka i obrnuto

Page 3: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 3

� najpoznatije mjere disperzije:

(1) apsolutne mjere disperzije:

� raspon varijacije obilježja

� varijanca i standardna devijacija

� interkvartil

(2) relativne mjere disperzije:

� koeficijent varijacije

� koeficijent kvartilne devijacije

Page 4: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 4

4.1. RASPON VARIJACIJE (RV)

� Najjednostavnija mjera disperzije (koriste se samo 2 vrijednosti)

� Za niz od N negrupiranih kvantitativnih podataka RV dan je izrazom:

� RV jednak je nuli kad nema disperzije

� RV u distribuciji frekvencija diskretne numeričke varijable je razlika između posljednje i prve vrijednosti

max minxR x x= −

1x kR x x= −

Page 5: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 5

� RV distribucije frekvencija s razredima može se odrediti ako je poznata najveća i najmanja vrijednost varijable

� raspon se aproksimira kao razlika gornje granice posljednjeg i donje granice prvog razreda ili kao razlika razredne sredine posljednjeg i prvog razreda

� kod takvih distribucija frekvencija određivanje RV je nepouzdano

Page 6: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 6

PRIMJER 1.

Prilikom dva puta po 10 mjerenja neke pojave, dobivena su 2 niza rezultata (rezultati su poredani po veličini)

1. mjerenje: 8 8.5 8.5 9 9 9 9 9.5 9.5 10

2. mjerenje: 1 2 3 5 9 9 13 15 16 17

Izračunajte aritmetičku sredinu i raspon varijacije za oba mjerenja. Interpretirajte rezultat.

Page 7: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 7

4.2. INTERKVARTIL I KOEFICIJENT KVARTILNE DEVIJACIJE

� Kvantili su vrijednosti numeričke varijable koji niz uređen po veličini dijele na q jednakih dijelova

� Broj kvantila p je za jedan manji od njegova reda q , pr. medijan je kvantil reda q = 2 ⇒ p = 1 (dovoljna je jedna vrijednost da se niz podijeli u dva jednakobrojna dijela)

� Kvartili su kvantili koji dijele niz na 4 jednaka dijela,

decili su kvantili reda 10, percentili su kvantili reda 100, ...

Page 8: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 8

Q1 Me Q3

25% 25%

Xmin Xmax

N/4 N/2 3N/4

Postoje 3 kvartila: prvi (donji) kvartil, drugi kvartil (medijan) i treći (gornji) kvartil

Page 9: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 9

� TUMAČENJE KVARTILA:

� Donji kvartil je vrijednost varijable koja članove niza dijeli u dvije skupine� U 1. skupini se nalazi ¼ (25%) elemenata s vrijednostima varijable koja

je jednaka ili manja od kvartila

� U 2. skupini su ¾ (75%) članova s većim vrijednostima od kvartila

� Treći kvartil je vrijednost varijable koja dijeli niz na 2 dijela� U 1. skupini se nalazi ¾ (75%) elemenata s vrijednostima varijable

koja je jednaka ili manja od kvartila

� U 2. skupini su ¼ (25%) članova s većim vrijednostima od kvartila

� Drugi kvartil jednak je medijanu

Page 10: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 10

� ODREĐIVANJE KVARTILA:

1. Uređivanje niza po veličini,

2. Pronalaženje članova s određenim rednim brojevima

donji kvartil:

gornji kvartil:

1

1

, , 14 4

, , 2 4 4

r

r r

N Nx INT r INT

Qx x N N

INT r+

≠ = +

= +

= =

3

1

3 3, , 1

4 4

3 3, ,

2 4 4

r

r r

N Nx INT r INT

Qx x N N

INT r+

≠ = +

= +

= =

INT je oznaka za “cijeli dio razlomka”

Page 11: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 11

PRIMJER 2.

Promatramo dob zaposlenih u poduzeću X, stanje 31.12.2007.

xi : 28 23 59 25 23 20 31 48 32 god.

Odredite donji i gornji kvartil.

Page 12: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 12

Donji kvartil:N = 9 ⇒ 9 / 4 ≠ INT ⇒ Q1= xr , r = INT(9/4) + 1 = 2 + 1 = 3Dakle, prvi kvartil je x3 , odnosno 23 godine (25% zaposlenih jemlađe ili jednako dobi od 23 godine, a 75% zaposlenih je starije ilijednako dobi od 23 godine)

Gornji kvartil:N = 9 ⇒ (3N / 4) ≠ INT ⇒ Q3= xr , r = INT(27/4) + 1 = 6 + 1 = 7Gornji kvartil je x7 , odnosno 32 godine (75% zaposlenih je mlađeili jednako dobi od 32 godine, a 25% zaposlenih je starije ili jednako dobi od 32godine)

Uredimo prvo zadani niz:20 23 23 25 28 31 32 48 59

Page 13: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 13

1

1 1var

4

k

Nf

Q L if

= + ⋅

∑ 1

3 1var

3

4

k

Nf

Q L if

= + ⋅

Izraz za određivanje gornjeg kvartila

distribucije frekvencija

Izraz za određivanje donjeg kvartila

distribucije frekvencija

L1 označava donju granicu razreda u kojemu se nalazi donji (gornji) kvartil,

Σ f1 označava zbroj frekvencija do kvartilnog razreda,

f kvar je oznaka za frekvenciju kvartilnog razreda

Page 14: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 14

PRIMJER 3.

Tabela. Gradovi prema broju izgrađenih stanova

26Ukupno

5

8

6

4

2

1

50 – 150

150 – 250

250 – 350

350 – 450

450 – 550

550 – 650

Broj gradovaBroj izgrađenih

stanova

Odredite donji i gornji kvartil. Interpretirajte rezultate.

Page 15: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 15

-

5

13

19

23

25

26

Kumulativni niz

“manje od”

-

100

200

300

400

500

600

Razredna

sredina

26Ukupno

5

8

6

4

2

1

50 – 150

150 – 250

250 – 350

350 – 450

450 – 550

550 – 650

Broj gradovaBroj izgrađenih

stanova

Donji kvartil: 26/4 ≠ INT ⇒ r = INT(26/4) + 1 = 6 + 1 = 7

Gornji kvartil: r = INT (3·26 / 4) + 1 = 19 + 1 = 20

Page 16: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 16

� Interkvartil (oznaka: Iq) je apsolutna mjera disperzije koja pokazuje veličinu raspona varijacije središnjih 50% podataka uređenog numeričkog niza – iz razmatranja se isključuje po 25% najmanjih i najvećih vrijednosti obilježja

� Računa se kao razlika između gornjeg i donjeg kvartila

Iq = Q3 – Q1

� Nije potpuna mjera disperzije jer se za njegovo računanje koriste samo dvije vrijednosti

Što je interkvartilbrojčano manji disperzija će biti manja i obrnuto

Page 17: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 17

� Može se izračunati i koeficijent kvartilne devijacije (oznaka Vq)

� Disperzija je to manja što je Vq bliže nuli, a relativno veća

što se više približava jedinici

� Izračunajte interkvartil i koeficijent kvartilne devijacije u primjeru 3. Interpretirajte rezultat.

3 1

3 1

, 0 1q q

Q QV V

Q Q

−= ≤ ≤

+

Page 18: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 18

4.3. VARIJANCA, STANDARDNA DEVIJACIJA 4.3. VARIJANCA, STANDARDNA DEVIJACIJA I KOEFICIJENT VARIJACIJEI KOEFICIJENT VARIJACIJE

� Razlike između vrijednosti numeričke varijable i njezine AS pokazivat će stupanj varijacije (što su razlike veće veći je i stupanj varijabilnosti i obrnuto)

� Varijanca je aritmetička sredina kvadrata odstupanja vrijednosti numeričke varijable X od njezine aritmetičke sredine, a za negrupirane podatke računamo je po formuli:

Napomena: Umjesto apsolutnih, pri računanju varijance dopuštena je upotreba i relativnih frekvencija

2

2 2

1 1

1 1N N

i i

i i

x xN N

σ

= =

= −

∑ ∑

ili 2

2 2 2

1 1

1 1N N

i i

i i

b d dN N

σ

= =

= −

∑ ∑

Page 19: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 19

� Radi lakše prosudbe stupnja varijabilnosti obilježja definira se standardna devijacija kao pozitivni drugi korijen iz varijance:

� Standardna devijacija je prosječno odstupanje vrijednosti

numeričke varijable od njezine aritmetičke sredine – smije se

računati samo uz AS

2

2

1 1

1 1N N

i i

i i

x xN N

σ

= =

= −

∑ ∑ ili

2

2

1 1

1 1N N

i i

i i

b d dN N

σ

= =

= −

∑ ∑

kao brza kontrola nam može poslužiti odnos između raspona i standardne devijacije: taj odnos gotovo nikad nije manji od 2 ili veći od 6.5

Page 20: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 20

� Varijanca distribucije frekvencija diskretne numeričke varijable je vagani prosjek kvadrata odstupanja vrijednosti te varijable od njezine AS:

� Varijanca i iz nje izvedena standardna devijacija je najvažnija

mjera disperzije (potpuna mjera disperzije) – kad su poznate AS i

standardna devijacija nekih rezultata, onda su ti rezultati potpuno

definirani

2

2 2

1 1

1 1N N

i i i i

i i

f x f xN N

σ

= =

= −

∑ ∑ ili

2

2 2 2

1 1

1 1N N

i i i i

i i

b f d f dN N

σ

= =

= −

∑ ∑

Simbol xi označava originalne vrijednosti obilježja (ako su formirane grupe) ili njihove procjene, tj. vrijednosti razrednih sredina

Page 21: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 21

� Kad su nam poznate aritmetička sredina i standardna devijacija nekih rezultata tada ih možemo uspoređivati s drugim rezultatima – koeficijent varijacije

� Koeficijent varijacije je omjer standardne devijacije i

aritmetičke sredine pomnožen sa sto, tj. pokazuje koliki postotak

vrijednosti AS iznosi vrijednost standardne devijacije:

� Koeficijent varijacije je relativna mjera disperzije

100Vx

σ= ⋅

Reprezentativnost AS je vrlo velika

ako je koef. varijacije ispod 20%

Page 22: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 22

PRIMJER 4.

Statistički skup čini 30 učenika jednog razreda, a promatrano obilježje je uspjeh učenika. Dobiveni su ovi podaci:

4 3 4 3 1 3 4 3 3 32 4 1 5 3 4 1 3 3 13 5 4 3 1 4 5 4 1 3

a) Sastavite tablicu distribucije frekvencijab) Nacrtajte histogram frekvencijac) Izračunajte aritmetičku sredinu, varijancu, standardnu

devijaciju i koeficijent varijacije

Page 23: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 23

PRIMJER 5.

godine starosti broj radnikax i f i

18 - 20 220 - 22 522 - 28 628 - 32 4

Izračunajte prosječnu starost radnika poduzeća X, varijancu i standardnu devijaciju za podatke navedene u tabeli:

Page 24: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 24

4.4. STANDARDIZIRANA VARIJABLA. 4.4. STANDARDIZIRANA VARIJABLA. PRAVILO PRAVILO ČČEBIEBIŠŠEVAEVA

� Da bi se utvrdio položaj numeričkog podatka u nizu primjenjuje se standardizirana vrijednost varijable ( z – obilježje)

� Standardizirano obilježje je odstupanje vrijednosti numeričkog obilježja od aritmetičke sredine izraženo u jedinicama standardne devijacije:

� Budući da standardizirano obilježje ne ovisi o mjernim jedinicama, može poslužiti za usporedbu položaja podataka u raznovrsnim nizovima

, 1, 2,...,i

i

x xz i N

σ

−= =

Page 25: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 25

Prosječna plaća u poduzeću A iznosi 6.000,00 kn s prosječnim

odstupanjem od 1.000,00 kn. U poduzeću B prosječna plaća

iznosi 10.000,00 kn s prosječnim odstupanjem od 2.000,00 kn.

Usporedite relativni položaj osobe s plaćom 8.000,00 kn u poduzeću A s položajem osobe s plaćom od 11.500,00 kn u poduzeću B

PRIMJER 6.

Page 26: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 26

� Usporedimo relativni položaj osobe s plaćom od 8.000,00 kn u poduzeću A s položajem osobe s plaćom od 11.500,00 kn u poduzeću B

8000 60002

1000AA

A

x xz

σ

− −= = =

Obje osobe imaju iznadprosječnu plaću. Osoba iz poduzeća A u relativno je povoljnijem položaju na platnoj listi od osobe B, jer njezina plaća odstupa od prosjeka za + 2 standardne devijacije

75.02000

1000011500=

−=

−=

σ

BBB

xxz

Page 27: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 27

Prosječni ostvareni ukupni godišnji prihod iznosio je 200

milijuna kn s prosječnim odstupanjem od 10 milijuna kn.

Prosječna stopa dobiti za skupinu iznosi 9.8 s prosječnim

odstupanjem od 2.2.

Prihod odabranog poduzeća iznosi 185 milijuna kn, a stopa

dobiti 5.6. Kakav je položaj poduzeća u skupini s obzirom na:

a) prihod,

b) stopu dobiti ?

PRIMJER 7.

Page 28: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 28

� Standardizirana varijabla poprima različite vrijednosti, koje po predznaku mogu biti pozitivne i negativne

� Pravilo Čebiševa:

pojas od obuhvaća najmanje 75% svih podataka,

pojas od obuhvaća najmanje 88.89% svih podataka

2x σ±

3x σ±

Page 29: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 29

Uzmimo osnovni skup od 20.000 žiro-računa komitenata jedne

banke. Prosječno kvartalno stanje sredstava iznosi 500.000,00 kn s

prosječnim odstupanjem od 100.000,00 kn

Pomoću pravila Čebiševa procijenite broj računa s

prosječnim stanjem kvartalnih stanja između 300.000,00 i

700.000,00 kn.

PRIMJER 8.

Page 30: 4. MJERE DISPERZIJE · Kad su nam poznate aritmeti čka sredina i standardna devijacija nekih rezultata tada ih mo žemo uspore đivati s drugim rezultatima – koeficijent varijacije

Josipa Perkov, prof., pred. 30

PITANJA ZA USMENI DIO ISPITAPITANJA ZA USMENI DIO ISPITA

1. Objasnite pojam raspršenosti. Nabrojite najvažnije mjere disperzije.

2. Koje su relativne mjere disperzije? Navedite njihova svojstva.

3. Koje su apsolutne mjere disperzije? Navedite njihova svojstva.

4. Što je standardizirano obilježje? Navedite pravilo Čebiševa.