13
1 Osnovni pojmovi u statistici Predmet statistike su masovne pojave odnosno pojave koje obuhvataju veliki broj elemenata sa nekim zajedničkim obeležjem (tj. svojstvom). Statistika objašnjava načine prikupljanja i grupisanja podataka, a zatim razrađuje metode proučavanja tih podataka s obzirom na postavljeni cilj ispitivanja. Mere centralne tendencije Brojne karakteristike koje slučajnu veličinu u nizu problema dovoljno reprezentuju su poznate pod imenom mere centralne tendencije. Tu spadaju sledeće brojne karakteristike: 1. Aritmetička srednja vrednost slučajne veličine predstavlja najvažniju meru centralne tendencije. Ona se obeležava znakom x (,,iks srednje", ,,iks bar") i izračunava jednačinom: n x n x .... x x x n i i n 1 2 1 ili, kada se radi o grupisanim vrednostima: n i i n i i i n n n f x f f .... f f x f .... x f x f x 1 1 2 1 2 2 1 1 tj. 1 n x f x n i i i gde je: xi - uopštena oznaka svojstva odnosno veličine, fi - učestalost svojstva odnosno veličine, n - obim svojstva odnosno veličine (npr. broj uzoraka za ispitivanje). Nedostatak srednje vrednosti je ta što ona uzima u obzir sve podatke, i one najekstremnije, pa se tako gubi predstava tendencije te pojave. Ali, jednostavno izračunavanje ove vrednosti je doprinelo da se ona najviše koristi. 2. Geometrijska srednja vrednost, npr. dva broja, jednaka je drugom korenu proizvoda ta dva broja. Geometrijska sredina tri broja jednaka je trećem korenu iz proizvoda ta tri broja itd. Prema tome, geometrijska srednja vrednost g x se definiše kao n-ti koren iz proizvoda n - varijanata (brojeva): n n g x ..... x x x 2 1 3. Harmonijska srednja vrednost predstavlja odnos obima probe (uzorka) prema sumi (zbiru) recipročnih vrednosti svih varijanti uzorka, tj.:

Mere centralne tendencije - tfzr.uns.ac.rs

  • Upload
    others

  • View
    10

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Mere centralne tendencije - tfzr.uns.ac.rs

1

Osnovni pojmovi u statistici

Predmet statistike su masovne pojave odnosno pojave koje obuhvataju veliki broj

elemenata sa nekim zajedničkim obeležjem (tj. svojstvom). Statistika objašnjava načine

prikupljanja i grupisanja podataka, a zatim razrađuje metode proučavanja tih podataka s obzirom

na postavljeni cilj ispitivanja.

Mere centralne tendencije

Brojne karakteristike koje slučajnu veličinu u nizu problema dovoljno reprezentuju su

poznate pod imenom mere centralne tendencije. Tu spadaju sledeće brojne karakteristike:

1. Aritmetička srednja vrednost slučajne veličine predstavlja najvažniju meru centralne

tendencije. Ona se obeležava znakom x (,,iks srednje", ,,iks bar") i izračunava jednačinom:

n

x

n

x....xxx

n

ii

n

121

ili, kada se radi o grupisanim vrednostima:

n

ii

n

iii

n

nn

f

xf

f....ff

xf....xfxfx

1

1

21

2211

tj.

1

n

xf

x

n

iii

gde je: xi - uopštena oznaka svojstva odnosno veličine,

fi - učestalost svojstva odnosno veličine,

n - obim svojstva odnosno veličine (npr. broj uzoraka za ispitivanje).

Nedostatak srednje vrednosti je ta što ona uzima u obzir sve podatke, i one

najekstremnije, pa se tako gubi predstava tendencije te pojave. Ali, jednostavno izračunavanje

ove vrednosti je doprinelo da se ona najviše koristi.

2. Geometrijska srednja vrednost, npr. dva broja, jednaka je drugom korenu proizvoda ta

dva broja. Geometrijska sredina tri broja jednaka je trećem korenu iz proizvoda ta tri broja itd.

Prema tome, geometrijska srednja vrednost gx se definiše kao n-ti koren iz proizvoda n -

varijanata (brojeva):

nng x.....xxx 21

3. Harmonijska srednja vrednost predstavlja odnos obima probe (uzorka) prema sumi

(zbiru) recipročnih vrednosti svih varijanti uzorka, tj.:

Page 2: Mere centralne tendencije - tfzr.uns.ac.rs

2

1

1

ili 1

1

1

n

x

x

x

nx

n

i i

hn

i i

h

4. Srednja kvadratna vrednost predstavlja drugi koren količnika zbira kvadrata svih

varijanata i obima uzorka:

ili 1

2

1

2

n

xf

xn

x

x

n

iii

kv

n

ii

kv

Prva jednačina odnosi se na negrupisane, a druga jednačina na grupisane merne

vrednosti.

5. Srednja kubna vrednost predstavlja treći koren količnika zbira kubova svih varijanata i

obima uzorka:

3

1

3

31

3

ili n

xf

xn

x

x

n

iii

kub

n

ii

kub

6. Modus (modalna vrednost) predstavlja varijantu sa najvećom učestalošću xmod.

7. Medijana predstavlja vrednost varijante statističkog skupa ili mase koja deli varijacioni

niz na dva dela jednaka po obimu xmed.

Mere varijacije

Za ispitivanje bilo kog obeležja potrebno je poznavanje ne samo brojne karakteristike

mera centralne tendencije, već i stepen variranja elemenata oko srednje vrednosti nekog

statističkog skupa ili mase. Najpoznatije mere varijacije su:

1. Raspon je razlika između maksimalne i minimalne varijante u ispitivanom uzorku

R = xmax - xmin

Raspon kao mera varijacije koristi se za brzo, ali ne potpuno tačno određivanje rasipanja

u slučaju kada je n 10. Može se obeležiti i sa I (interval promene).

2. Linearno odstupanje od srednje vrenosti, ili samo odstupanje od srednje vrednosti se

dobija kao apsolutna vrednost od razlike svake vrednosti za xi i srednje vrednosti x :

xxΔx i

3. Srednje linearno (apsolutno) odstupanje predstavlja srednju vrednost linearnih

odstupanja:

Page 3: Mere centralne tendencije - tfzr.uns.ac.rs

3

n

xxf

ΘQn

xx

n

Δx

ΘQ

n

iii

n

ii

n

ii

111 ili

4. Koeficijent linearne neravnomernosti predstavlja odnos između srednjeg linearnog

odstupanja i srednje aritmetičke vrednosti:

100x

ΘN (%)

5. Disperzija prestavlja srednju vrednost kvadrata odstupanja pojedinačnih vrednosti od

srednje vrednosti. Obeležava se sa 2 ili D i ima dimenzije kao i slučajna veličina na kvadrat. Za

uzorke obima n 20 izračunava se po formuli:

1

11

2

1

2

n

xx

n

Δx

D

n

ii

n

ii

ili

11

2

n

xxf

D

n

iii

Ako je uzorak obima n > 20, onda je:

n

i

n

iiiii Δxf

nΔxf

nD

1 1

22 1

1-

1

tj.

n

xxf

D

n

iii

1

2

gde je: xxx ii .

6. Standardna devijacija ili srednje kvadratno odstupanje karakteriše stepen odstupanja

slučajne veličine od njene srednje vrednosti i ima iste dimenzije kao i slučajna veličina.

Obeležava se sa ili SD.

DSD

7. Koeficijent varijacije CV predstavlja relativno statističko merilo rasipanja slučajne

veličine oko srednje vrednosti:

(%) 100 x

SDCV

Statistička sigurnost

Karakteristično je da svaki statistički zaključak na osnovu uzorka obima n obično nije

sasvim pouzdan, već mu pripada samo određena verovatnoća ili određena statistička sigurnost S.

Statistička sigurnost izražava se procentima.

Za neku metodu, po kojoj se donosi zaključak na osnovu uzorka, kaže se da ima sigurnost

od 95 %, ako u 95 % slučajeva dovodi do ispravnih zaključaka a u preostalih 5 % slučajeva do

pogrešnih zaključaka.

Page 4: Mere centralne tendencije - tfzr.uns.ac.rs

4

U praksi ispitivanja tekstila najpogodnije je upotrebljavati statističke sigurnosti 95 %,

99 %, 99,9 % ili 95,44 % i 99,73 %. Ove vrednosti važe samo za Gausovu normalnu raspodelu

ili za raspodelu koja se ne razlikuje mnogo od normalne Gausove raspodele.

Ocena mera srednje vrednosti, standardne devijacije i koeficijenta varijacije

Tačnost aritmetičke sredine x ocenjuje se intervalom poverenja ili praktičnom granicom

greške.

Poznato je da se zaključak o ispitivanom skupu date statističke mase donosi na osnovu

uzorka pa je zato potrebno odrediti praktične granice odstupanja X , to jest:

xp pxX

gde je: X - srednja vrednost ispitivanog svojstva materijala u partiji,

px - srednja vrednost ispitivanog svojstva materijala u probi, odgovara srednjoj vrednosti

ispitivanog svojstva x ,

xp - greška srednje aritmetičke vrednosti probe.

Greška srednje vrednosti (praktična granica greške) određuje se iz jednačine:

n

SDpx

gde je: - faktor koji zavisi od statističke sigurnosti i ima vrednost:

kod S = 68,26 % = 1,000

kod S = 95 % = 1,960

kod S = 99 % = 2,576

kod S = 99,99 % = 3,291

U slučaju velikog broja merenja, faktor zamenjuje se faktorom t, pa je tada:

n

SDtpx

gde je: t - faktor koji zavisi od statističke sigurnosti i broja stepena slobode ns (ns = n - 1) čije su

vrednosti date u tabeli.

U praksi, veličina greške xp izražava se kao relativna greška srednje vrednosti izražena u

procentima:

(%) 100 x

pp x

r

Interval poverenja standardne devijacije SD kod uzoraka obima n 30, tj. greška

standardne devijacije, određuje se iz jednačine:

n

SDpSD

2

Page 5: Mere centralne tendencije - tfzr.uns.ac.rs

5

Za uzorke obima n 30 granica poverenja se određuje iz jednačine:

n

SDpSD

2

2

Interval poverenja koeficijenta varijacije CV određuje se iz jednačine:

1-

2

2

nc

n

n

CVp

n

CV

gde je: cn - koeficijent koji zavisi od broja merenja i može imati sledeće vrednosti:

n = 10 cn = 0,973

n = 15 cn = 0,982

n = 20 cn = 0,987

n 30 cn 1

Za uzorke obima n 30 koristi se takođe i jednačina:

n

CVpCV

2

2

Tabela. Vrednosti faktora t u zavisnosti od statističke sigurnosti i broja stepena slobode ns S = 70 % S = 80 % S = 90 % S = 95 % S = 99 % S = 99,9 %

1 1,96 3,08 6,31 12,71 63,66 636,62

2 1,39 1,89 2,92 4,30 9,92 31,60

3 1,25 1,64 2,35 3,18 5,84 12,94

4 1,19 1,53 2,13 2,78 4,60 8,61

5 1,16 1,48 2,02 2,57 4,03 6,86

6 1,13 1,44 1,94 2,45 3,71 5,96

7 1,12 1,42 1,90 2,37 3,50 5,41

8 1,11 1,40 1,86 2,31 3,36 5,04

9 1,10 1,38 1,83 2,26 3,25 4,78

10 1,09 1,37 1,81 2,23 3,17 4,59

14 2,15 2,98 4,14

19 2,09 2,86 3,88

24 2,064 2,797 3,745

29 2,045 2,756 3,659

30 2,042 2,750 3,646

100 1,984 2,626 3,390

200 1,972 2,601 3,340

300 1,968 2,592 3,324

400 1,966 2,588 3,315

500 1,965 2,586 3,310

1000 1,962 2,581 3,300

1,960 2,576 3,291

Linearna ili Uster-Sommerova metoda

Do nedavno, Uster-Sommer-ova metoda se skoro isključivo primenjivala u ispitivanju

tekstila i kontroli ravnomernosti pojedinih obeležja vlakana, traka, pređa ili gotovih proizvoda.

Sve brojne vrednosti dobijene pri merenju nekog obeležja se svrstavaju u dve grupe: gornju i

donju. U gornju grupu ulaze vrednosti veće od aritmetičke srednje vrednosti uključujući i one

koje su brojno jednake srednjoj vrednosti. Preostale vrednosti tj. brojne vrednosti manje od

Page 6: Mere centralne tendencije - tfzr.uns.ac.rs

6

aritmetičke sredine pripadaju donjoj grupi vrednosti. Ako se zbir u odgovarajućoj grupi podeli

brojem vrednosti u njoj, dobija se gornji, odnosno donji prosek. Na osnovu aritmetičke sredine,

gornjeg i donjeg proseka izračunava se odstupanje naviše, odnosno naniže, čija se aritmetička

sredina naziva prosečno odstupanje ili neravnomernost po Someru. Kada se ta vrednost oduzme

od 100 dobija se tzv. ravnomernost po Someru.

Odstupanje naviše je odnos razlike gornjeg proseka ( gx ) i srednje vrednosti ( x ) prema

aritmetičkoj sredini svih vrednosti izraženo u procentima tj.:

100

x

xxO

g

g (%)

Odstupanje naniže predstavlja odnos razlike srednje vrednosti ( x ) i donjeg proseka ( dx )

prema aritmetičkoj sredini svih vrednosti, tj.:

100

x

xxO d

d (%)

Neravnomernost po Someru NS se određuje iz jednačine:

2

dg

S

OON

(%)

a ravnonernost RS iz razlike:

SS NR 100 (%)

Prema Someru, ukoliko je neravnomernost ispitivanog obeležja nekog materijala do

10 %, onda se isti smatra vrlo ravnomernim, od 10÷15 % ravnomernim, a preko 15 %

neravnomernim.

I pored toga što je linearna metoda najjednostavnija i najstarija ona ima više nedostataka:

- ravnomernost razmatra jednostrano, tj. posebno gornje od donje grupe vrednosti, pa

time ne daje celokupnu ocenu ravnomernosti,

- uključivanjem vrednosti merenja koje su jednake aritmetičkoj sredini u gornju grupu

uvećana je ravnomernost gornje grupe na račun donje,

- simetričnost rezultata, koja je veoma važna linearna metoda, se narušava tj. različita su

odstupanja.

- Somerova metoda ne reaguje osetljivo (precizno) na uvećanje pojedinih odstupanja.

Grafički prikaz

Rezultati merenja jednog svojstva mogu se prikazati i grafički. U ispitivanju tekstila

najveće primene imaju sledeći grafici:

1. Poligon učestalosti se konstruiše tako da se na x-osu (apscisa) nanose vrednosti

ispitivanog svojstva (odnosno srednje vrednosti grupa) a na y-osu (ordinata) odgovarajuća

učestalost tih vrednosti (odnosno grupa).

2. Histogram se konstruiše tako što se na x-osu nanose granice grupa sa određenim

intervalom, a nad njima se crtaju pravougaonici sa visinom učestalosti tih grupa (y-osa).

3. Kumulativna kriva raspodele učestalosti se konstruiše tako što se na x-osu nanosi

kumulativna (zbirna) učestalost, a na y-osu vrednost svojstva.

Page 7: Mere centralne tendencije - tfzr.uns.ac.rs

7

Zadaci

1. Merenjem podužne mase pamučnih vlakana dobijene su sledeće vrednosti u dtex: 1,71;

1,73; 1,72; 1,69; 1,7; 1,71; 1,73; 1,71; 1,72; 1,7. Izračunati sve srednje vrednosti podužnih masa.

Neuređeni statistički

skup podataka, Ttvl (dtex)

Uređeni statistički skup

Ttvl (dtex)

Skraćeno predstavljanje uređenog statističkog skupa

Podužna masa Ttvl (dtex) Učestalost fi

1,71 1,69 1,69 1

1,73 1,7 1,7 2

1,72 1,7 1,71 3

1,69 1,71 1,72 2

1,7 1,71 1,73 2

1,71 1,71 xmod = 1,71 dtex

705,12

71,17,1

medx dtex

1,73 1,72

1,71 1,72

1,72 1,73

1,7 1,73

712,110

73,1272,1271,137,1269,11

n

Tf

T

n

iitvli

tvl dtex

dtex 712,173,173,172,172,171,171,171,17,17,169,1

10

21

gtvl

nntvltvltvlgtvl

T

T..... T TT

712,1

73,1

12

72,1

12

71,1

13

7,1

12

1,69

1

10

1

1

n

i itvl

i

htvl

Tf

nT dtex

712,110

73,1272,1271,137,1269,1

222221

2

n

Tf

T

n

iitvli

kvtvl dtex

712,110

73,1272,1271,137,1269,13

333333

1

3

n

Tf

T

n

iitvli

kubtvl dtex

2. Ispitivana je prekidna sila pamučne pređe dveju partija u cN. I partija: 98, 98, 98, 196,

196, 196 cN; II partija: 98, 98, 196, 196, 294, 294 cN. Potrebno je oceniti koja je partija

ravnomernija po prekidnoj sili.

- srednja vrednost

1476

19639831I

n

Ff

F

n

iaii

a cN

1966

29421962982II

aF cN

Page 8: Mere centralne tendencije - tfzr.uns.ac.rs

8

- koeficijent neravnomernosti

Iz 100x

N

i n

xxfn

iii

1 1001

xn

xxf

N

n

iii

(%)

33,331001476

1471963147983100

I

1I

I

a

n

iaaii

Fn

FFf

N %

33,331001966

19629421961962196982II

N %

Koeficijent neravnomernosti nije sigurna ocena varijacije. Zato se primenjuju disperzija,

standardna devijacija i koeficijent varijacije:

- disperzija

2,288116

1471963147983

1

22

1

2

I

n

Ff

D

n

iaii

cN2

2,768316

19629421961962196982222

II

D cN2

- standardna devijacija

67,532881,2 II DSD cN

65,877683,2 II SD cN

- koeficijent varijacije

% 36,51100147

53,67100

I

I a

I

F

SDCV

% 72,44100196

87,65II CV

Kao što se vidi CVI < CVII a to znači da je prva pređa ravnomernija po prekidnoj sili.

3. Pri ispitivanju dužine kratkih i finih vunenih vlakana jedne partije, iz uzete probe su

dobijene sledeće vrednosti dužine u mm: 50, 20, 70, 60, 30, 90, 50, 60, 10 i 60 mm. Izračunati:

srednju aritmetičku dužinu, srednje linearno odstupanje, koeficijent neravnomernosti, disperziju,

standardnu devijaciju, koeficijent varijacije, srednju vrednost dužine vlakana u partiji, relativnu

grešku srednje vrednosti pri statističkoj sigurnosti od 95 %.

- srednja aritmetička dužina

Page 9: Mere centralne tendencije - tfzr.uns.ac.rs

9

5010

901701603502301201101 1

n

lf

l

n

iii

mm

- srednje linearno odstupanje

mm 1810

509050705060350502503050205010

1

n

llfn

iii

- koeficijent neravnomernosti

3610050

18100

lN

%

- disperzija

2

2222222

1

2

mm 78,577

110

509050705060350502503050205010

1

D

D

n

lf

D

n

iii

- srednje kvadratno odstupanje (standardna devijacija)

04,2478,577 DSD mm

- koeficijent varijacije

08,4810050

04,24100

l

SDCV %

- srednja vrednost dužine vlakana u partiji (S = 95 %)

Za S = 95 % faktor je = 1,96

9,1410

24,041,96

n

SDp

l

mm

9,1450lp plL mm

gde je: ll p .

Page 10: Mere centralne tendencije - tfzr.uns.ac.rs

10

- relativna greška srednje vrednosti

8,2910050

9,14 100

l

pp l

r %

4. Pri merenju podužne mase pamučne pređe dobijene rezultate iz tabele predstaviti

grafički.

Granica grupe

podužnih masa (tex)

Učestalost,

fi

1012

1214

1416

1618

1820

2022

2224

2

8

9

12

10

5

4

Za lakše prikazivanje poslužiće sledeća tabela:

Granica grupe

(tex)

Srednja vrednost

(tex)

Apsolutna

učestalost

Relativna učestalost

fi (%)

Kumulativna

učestalost fi (%)

1012

1214

1416

1618

1820

2022

2224

11

13

15

17

19

21

23

2

8

9

12

10

5

4

4

16

18

24

20

10

8

4

20

38

62

82

92

100

50 100

Relativna učestalost za prvi red: % 410050

2if

10 12 14 16 18 20 22 24

0

5

10

15

20

25

f i (%

)

Tt (tex) Poligon raspodele podužne mase pređe Histogram raspodele podužne mase pređe

Page 11: Mere centralne tendencije - tfzr.uns.ac.rs

11

Kumulativna kriva raspodele podužne mase pređe

5. Pri ispitivanju dužine srednje dugih pamučnih vlakana jedne partije, iz uzete probe su

dobijene sledeće vrednosti dužine u mm: 14,5; 19,8; 22,6; 25,4; 16,1; 16; 23,9; 27; 27,7; 20,9;

21,3; 19,6; 23,1; 17; 21,9; 24,4; 28; 17,7; 23,1; 18,7; 19,1; 25,4; 20,5; 22,7; 23; 15,5; 27,1; 25;

18; 22,7; 18,5; 21,5; 19,9; 21,6; 24,1; 22; 20,1; 18,3; 24; 23,7. Rezultate klasirati prema klasnim

intervalom od 2 mm. Zatim izračunati: srednju aritmetičku dužinu, srednje linearno odstupanje,

koeficijent linearne neravnomernosti, disperziju, standardnu devijaciju, koeficijent varijacije,

srednju vrednost dužine vlakana u partiji pri statističkoj sigurnosti od 95 %, relativnu grešku

srednje vrednosti, poligon i histogram raspodele vlakana po dužini.

Granica

grupe (mm)

Broj vlakana u

grupi li (mm) ni (fi) li ni ai ll iai nll iai nll

2

1416

1618

1820

2022

2224

2426

2628

׀ ׀ ׀

׀ ׀ ׀ ׀

׀ ׀ ׀ ׀ ׀ ׀ ׀

׀ ׀ ׀ ׀ ׀ ׀ ׀ ׀

׀ ׀ ׀ ׀ ׀ ׀ ׀ ׀ ׀

׀ ׀ ׀ ׀ ׀

׀ ׀ ׀ ׀

15

17

19

21

23

25

27

3

4

7

8

9

5

4

45

68

133

168

207

125

108

6,35

4,35

2,35

0,35

1,65

3,65

5,65

19,05

17,4

16,45

2,8

14,85

18,25

22,6

120,9675

75,69

38,75

0,98

24,5025

66,6125

127,69

40 854 111,4 456,1925

- srednja aritmetička dužina

35,2140

854 1

n

ln

l

n

iii

mm

- srednje linearno odstupanje

785,240

4,1111

n

llnn

iii

mm

- koeficijent linearne neravnomernosti

0445,1310035,21

785,2100

lN

%

- disperzija (n 20)

Page 12: Mere centralne tendencije - tfzr.uns.ac.rs

12

21

2

i

mm 4048,1140

1925,456l

n

ln

D

n

ii

- srednje kvadratno odstupanje (standardna devijacija)

3771,34048,11 DSD mm

- koeficijent varijacije

8178,1510035,21

3771,3100

l

SDCV %

- srednja vrednost dužine vlakana u partiji (S = 95 %)

Za S = 95 % faktor je = 1,96

0466,140

3,37711,96

n

SDp

l

mm

0466,135,21 lp plL mm

gde je: ll p .

- relativna greška srednje vrednosti

9021,410035,21

0466,1 100

l

pp l

r %

6. Ispitivanjem broja uvoja vunene pređe dobijene su sledeće vrednosti u m-1: 650, 690,

620, 650, 660, 630, 650, 640, 660, 630 m-1. Odrediti ravnomernost pređe prema broju uvoja

Somerovom metodom.

Page 13: Mere centralne tendencije - tfzr.uns.ac.rs

13

64810

64801

n

Tf

T

n

iii

m-1

Merne vrednosti broja

uvoja T (m-1)

Grupe mernih vrednosti (m-1)

gornja donja

650 650

690 690

620 620

650 650

660 660

630 630

650 650

640 640

660 660

630 630

Σ 6480 Σ 3960 Σ 2520

648x 660gx 630dx

6606

39601

n

Tf

T

n

iii

g m-1

6304

25201

n

Tf

T

n

iii

d m-1

85,1100648

648660100

T

TTO

g

g %

77,2100648

630648100

T

TTO d

d %

31,22

77,285,1

2

dgS

OON %

69,9731,2100100 SS NR %

Tmax = 690 m-1, Tmin = 620 m-1,

Ispitivana pređa u pogledu ravnomernosti broja uvoja je vrlo ravnomerna jer je NS manje

od 10 % (2,31 %).