Transcript
Page 1: Osnovi inzenjerske statistike

PREDGOVOR

Ova knjiga predstavlja uvod u statistiku i namenjena je pre svega studentima primenjenih i tehničkih nauka, kao i inženjerima. Pisali smo je sa ciljem da pomognemo zainteresovanom čitaocu da razume i pravilno koristi osnovne statističke metode pri donošenju zaključaka na osnovu rapoloživih eksperimentalnih podataka, kao i da mu pružimo dobru osnovu za dalje proširivanje znanja u oblasti primenjene statistike. Pri tom smo nastojali da teorijska izlaganja budu onoliko stroga koliko je, shodno postavljenom cilju, neophodno, ali sa minimalnim matematičkim aparatom, kojim se inače ovladava u okviru osnovnih kurseva više matematike na tehničkim fakultetima. Dat je znatan broj primera, kao i zadataka za samostalno rešavanje, radi provere znanja.

Osnovni pojmovi teorije verovatnoće, neophodni za izučavanje statistike dati su u prve tri glave. Prva glava je osmišljena tako da čitaoca upozna sa osnovnim idejama teorije verovatnoće i postupcima izračunavanja verovatnoća slučajnih događaja. Kroz primere su izložene i osnovne ideje primene teorije verovatnoće pri analizi pouzdanosti tehničkih sistema. Predmet druge glave su slučajne veličine i modeli jednodimenzionalnih raspodela verovatnoća, najčešće korišćeni u praksi kao i u izvođenjima kinetičke teorije i statističke fizike (ca ciljem da zainteresavanom čitaocu pomogne u razumevanju ovih izvođenja). Bivarijabilne raspodele verovatnoće su izložene u trećoj glavi, da bi se obezbedila neophodna osnova za dublje razumevanje statističke analize međuzavisnosti slučajnih promenljivih.

U četvrtoj glavi su ukratko izloženi osnovni zadaci statistike, ukjučujući elemente opisne (deskriptivne) statistike i teorije ocenjivanja srednje vrednosti i disperzije (tačkaste ocene) kao najvažnijih parametara neke slučajne promenljive. Intervalne ocene tih parametara su objašnjene i diskutovane u šestoj glavi.

Peta glava je posvećena statističkoj analizi grešaka neposrednih i posrednih merenja u fizici, hemiji i tehnici, koja je najčešće predmet posebnih udžbenika i priručnika. Definisani su osnovni pojmovi kao što su vrste grešaka pri merenju , ponovljivost i preciznost merne metode itd. i izloženi postupci dobijanja reprezentativnog rezultata neposrednih ponovljenih merenja i njegove greške. Konačno, objašnjen je i postupak procenjivanja grešaka posrednih merenja.

Testiranje statističkih hipoteza kao metod objektivnog zaključivanja na osnovu raspoloživih eksperimentalnih podataka, predmet je sedme glave. Učinjen je napor da se čitaocu što bolje objasne osnovni pojmovi i ideje, formulisanje i statistička osnova testa, neizbežni rizici i njihovo procenjivanje. Dat je skroman izbor, najčešće korišćenih, parametarskih testova, osmišljen ustvari kao prikaz izloženih principa i metodologije testiranja. Od neparametarskih testova dat je čuveni Pirsonov test saglasnosti, kao i za eksperimentatore vrlo koristan, kriterijum odbacivanja sumnjivih merenja.

Ispitivanje značajnosti linearne međuzavisnosti dve slučajne promenljive (korelaciona analiza) izloženo je u osmoj, a formulisanje i statistička analiza linearnih empirijskih zavisnosti devetoj glavi.

Page 2: Osnovi inzenjerske statistike

U poslednjoj desetoj glavi izložene su osnove statističke kontrole kvaliteta sa naglaskom na obrazlaganju postupaka kontrole, na osnovu principa i metoda izloženih u četvrtoj, šestoj i sedmoj glavi.

Smatramo da bi se u okviru jednosemestralnog kursa statistike, sa ukupnim nedeljnim fondom od 4 časa, mogao obraditi izloženi materijal, izuzimajući treću, petu i desetu glavu. Mada, s obzirom na postavljeni glavni cilj, nismo uključili primenu statističkog softvera, pretpostavljamo da se pri realizaciji kursa svakako koristi softverska podrška (Excel, Mathcad ili neki od velikog broja statističkih paketa), da bi se student rasteretio mukotrpnih i za razumevanje nevažnih računanja.

Dugujemo veliku zahvalnost recenzentima Prof. dr Dušanki Perišič, Prof. dr Dragoslavu Stoiljkoviću i Prof. dr Zvonimiru Suturoviću kao i kolegama mr Mirjani Brdar i dr Aleksandru Takaču na veoma korisnim predlozima u toku uobličavanja ovog materijala.

Ratomir Paunović i Radovan Omorjan,

Tehnološki fakultet u Novom Sadu

Page 3: Osnovi inzenjerske statistike

1

1 Elementi teorije verovatnoće

Teorija verovatnoće proučava zakonitosti koje važe za slučajne pojave i slučajne

eksperimente, tj. pojave čiji se tok ne može sa sigurnošću predvideti, odnosno eksperimente čiji se rezultati ne mogu sa sigurnošću predvideti. Razlika između pojave i eksperimenta je ta što pojavu samo pratimo dok eksperiment izvodimo.

Primeri slučajnih pojava su:

• kretanje temperature vazduha u nekom mestu tokom vremena, • pojava neispravnih proizvoda u procesu proizvodnje, • promena sastava prirodnih sirovina, itd.

Primeri slučajnih eksperimenata su:

• bacanje kocke ili novčića, • eksperimenti koje izvodimo u laboratorijama radi proučavanja nekih slučajnih

pojava u hemijsko-tehnološkim procesima.

Pod slučajnim eksperimentom ili opitom u teoriji verovatnoće podrazumeva se eksperiment koji se može neograničen broj puta obaviti pod istim uslovima, ali čiji ishod se ne može sa sigurnošću predvideti. Rezultate (ishode) takvog eksperimenta zvaćemo slučajnim događajima. Uzmimo popularan primer slučajnog eksperimenta: bacanje kocke sa brojevima 1 – 6. Neki slučajni događaji koji mogu nastupiti u tom slučajnom eksperimentu su recimo:

• dobijanje parnog broja, • pojavljivanje broja manjeg od 5, • dobijanje šestice.

Prva dva događaja u datom primeru se mogu ostvariti na više načina. Tako se prvi realizuje ako je rezultat bacanja 2, 4 ili 6, dok se drugi realizuje ako je rezultat 1,2,3 ili 4. Dakle, prvom događaju odgovara skup 6,4,2 , dok drugom možemo da dodelimo skup

4,3,2,1 . Za razliku od prva dva događaja, treći se može ostvariti samo na jedan način

i zato ga zovemo elementaran događaj i odgovara mu jednočlani skup 6 . Prva dva događaja možemo zvati složenim. Složenom događaju odgovaraju višečlani skupovi

Page 4: Osnovi inzenjerske statistike

2

čiji su elementi pojedini elementarni događaji , čije nastupanje povlači ili uklju čuje ostvarivanje datog složenog događaja.

Uopšte, ako neki događaj (elementaran ili složen) povlači realizaciju nekog drugog događaja, znači da je skup elementarnih ishoda, koji odgovara prvom događaju, podskup skupa elementarnih ishoda za drugi događaj. Na primer, događaj da se bacanjem kocke dobije 1 ili 3, kome odgovara skup 3,1 , povlači ostvarivanje

događaja da se bacanjem kocke dobija neparan rezultat, kome odgovara skup 5,3,1 .

Veza između skupova je: 5,3,13,1 ⊂ .

1.1 KLASIČNA DEFINICIJA VEROVATNO ĆE

Skup svih mogućih elementarnih događaja za neki eksperiment zvaćemo prostor elementarnih događaja.

Klasična definicija verovatnoće je primenljiva na slučajne eksperimente kod kojih je prostor elementarnih događaja konačan, tj. sadrži n elementarnih događaja i pri tome svaki od njih ima jednaku mogućnost da nastupi. Tipični primeri su bacanje kocke ili novčića bez ikakvih “trikova” sa ciljem dobijanja željenog rezultata.

Zamislimo dakle neki eksperiment kod koga je podjednako moguće nastupanje bilo kog od ukupno n elementarnih događaja . Verovatnoća nastupanja nekog događaja A jednaka je količniku broja povoljnih ishoda, m, tj. broja elementarnih događaja koji povlače ostvarenje događaja A, i broja svih mogućih ishoda n .

( )n

mAP = (1.1)

Primer 1a Kolika je verovatnoća dobijanja parnog broja pri bacanju kocke?

Rešenje Elementarni događaji koji povlače nastupanje posmatranog složenog događaja, A su dobijanje 2, 4 ili 6 ima ih 3, m = 3.Ukupan broj svih elementarnih događaja je ovde 6, n = 6 . Prema formuli:

2

1

6

3)( ==AP

Primer 1b Slučajni eksperiment se sastoji u izvlačenju jedne od kuglica iz kese koja

sadrži 64 kuglice, od toga:

8 crvenih 15 belih 24 crne 17 narandžastih

Kolika je verovatnoća događaja A - izvlačenje crvene kuglice?

Page 5: Osnovi inzenjerske statistike

3

Rešenje

Broj povoljnih događaja, izvlačenja bilo koje crvene kuglice, jednak je broju crvenih kuglica, m = 8. Ukupan broj mogućih ishoda je 64:

8

1

64

8)( ==AP

Vidimo da događajima koji se češće javljaju kao ishod eksperimenta pripada i veća

verovatnoća. Tako, verovatnoću nekog događaja možemo da posmatramo kao meru mogućnosti da taj događaj nastupi. Iz samog značenja bojeva m i n sledi da je nm ≤ , što kao posledicu ima:

( ) 10 ≤≤ AP

Ako je neki događaj nemoguć, odgovara mu prazan skup elementarnih događaja tj. imamo m = 0 i njegova verovatnoća – mogućnost da nastupi, jednaka je nuli : P(Φ) = 0, gde smo sa Φ označili nemoguć događaj .

Naprotiv, ako svaki od n mogućih ishoda povlači ostvarenje nekog događaja, kažemo da je on siguran događaj, E i pošto je m = n, njegova verovatnoća je jednaka jedinici : P(E) = 1.

Da bi se računala verovatnoća po klasičnoj definiciji (1.1), u složenijim slučajevima, neophodno je poznavanje kombinatorike. 1.2 PERMUTACIJE, KOMBINACIJE I VARIJACIJE

Kombinatorika se bavi problemom izdvajanja podskupova iz konačnih skupova i rasporedom elemenata u njima.

Varijacije bez ponavljanja

Neka je dat skup A = a1, a2, . . ., an od n elemenata. Varijacija k - te klase bez ponavljanja od n elemenata je uređeni podskup, odnosno niz od k (1 ≤ k ≤ n) različitih elemenata skupa A . Dakle, dve varijacije pošto predstavljaju nizove od k elemenata, se međusobno razlikuju ,

• po elementima koje sadrže (ako je k < n) ili

• po njihovom redosledu. Primer 1.2 Od cifara 1, 2, 3 i 4 obrazovati sve trocifrene brojeve sa različitim ciframa.

Rešenje

Skup A je 1,2,3,4. Traženi brojevi, pošto se razlikuju među sobom ili po ciframa ili po rasporedu istih cifara, predstavljaju varijacije treće klase od 4 elementa:

Page 6: Osnovi inzenjerske statistike

4

123 213 312 412 124 214 314 413 132 231 321 421 134 234 324 423 142 241 341 431 143 243 342 432

Imamo 4 različita izbora za prvu cifru (1, 2, 3, 4). Za odabranu prvu cifru imamo 3 mogućnosti za izbor druge (nije dozvoljeno ponavljanje cifara), a za svaki od izbora prve i druge cifre, kojih očigledno ukupno ima 34 ⋅ , preostaju dva izbora za poslednju cifru. Dakle, ukupan broj trocifrenih brojeva je 24234 =⋅⋅ .

Uopšte, može se dokazati da je broj varijacija klase k od n elemenata jednak:

)!(

!)1)(2(...)1(

kn

nknknnnV n

k −=+−+−−= (1.2)

Permutacije bez ponavljanja

Svaki mogući raspored od n različitih elemenata nazivamo permutacijom. Dakle, permutacija ustvari predstavlja varijaciju n-te klase. Tako iz (1.2), za n = k, dobijamo broj permutacija bez ponavljanja n elemenata:

!nPn = (1.3)

Primer 1.3 Obrazovati sve permutacije elemenata 1, 2, 3 .

Rešenje

Tri elementa je moguće poređati na 3! = 6 različitih načina. Tih 6 permutacija su:

123, 132, 213, 231, 312, 321 Kombinacije

Svaki podskup od k (1 ≤ k ≤ n) različitih elemenata skupa A = a1, a2, . . ., an nazivamo kombinacija klase k od n elemenata. Dakle, kao podskupovi (a ne nizovi) dve kombinacije se razlikuju po izboru elemenata koje sadrže, dok njihov redosled nije bitan. Pošto od svake kombinacije možemo da obrazujemo, promenom redosleda, odnosno permutovanjem elemenata, k! različitih varijacija (Jedn. 1.3), to je u skladu sa (1.2), broj kombinacija k-te klase od n elemenata:

=−==

k

n

knk

n

k

VC

nkn

k )!(!!

! (1.4)

Page 7: Osnovi inzenjerske statistike

5

Primer 1.4 U skupu od 50 proizvoda nalazi se 40 dobrih i 10 neispravnih. Na koliko načina se može obrazovati uzorak od 5 proizvoda, ali tako da u njemu budu 3 dobra i 2 neispravna (loša) proizvoda ? Rešenje

Pošto za uzorak nije bitan poredak elemenata već samo njegov sadržaj, u pitanju su kombinacije. Tri od ukupno 40 dobrih proizvoda, moguće je odabrati na 40

3C

načina.

98806

403938!37!3

!403

40403 =⋅⋅=⋅=

=C

Dva od 10 loših elemenata moguće je uzeti na 102C načina:

452109

!8!2!10

2

10102 =⋅=⋅=

=C

Pri obrazovanju uzorka od 5 elemenata (3 dobra i 2 loša), svaki podskup od 3 dobra elementa moguće je kombinovati sa svakim od podskupova defektnih, pa je ukupan broj traženih uzoraka:

4446002

10

3

40102

403 =

=⋅CC

Varijacije i permutacije sa ponavljanjem

Mogu se posmatrati i nizovi od k elemenata, uzeti iz skupa A = a1, a2, . . ., an, kod kojih članovi ne moraju biti obavezno različiti . Tada se radi o varijacijama ili permutacijama sa ponavljanjem. Na primer, varijacije 2 klase od 4 elementa 1, 2, 3, 4 sa ponavljanjem su: 11 21 31 41 12 22 32 42 13 23 33 43 14 24 34 44 i ima ih ukupno 42 = 16.

Broj varijacija sa ponavljanjem klase k on n elemenata jednak je:

knk nV = (1.5)

Ako sa nkkk n

P ,...,, 21označimo broj svih permutacija sa ponavljanjem elemenata

skupa A kod kojih se element a1 ponavlja k1 puta, a2, k2 puta, …, an, kn puta, tada je:

!!!

)!...(

21

21,...,, 21

n

nnkkk kkk

kkkP

n

+++= (1.6)

Page 8: Osnovi inzenjerske statistike

6

Brojilac bi, prema formuli (1.3), bio broj permutacija kada bi zamislili da se svi elementi a1 razlikuju među sobom, kao i elementi a2, ..., an . S druge strane, od svake permutacije, u kojoj se neki element ai ponavlja ki puta, može se napraviti tačno ki! permutacija, ako bi zamislili da se elementi ai razlikuju. Tako, polazeći od (1.3), izvodimo gornju formulu.

Primer 1.5 Koliko ima permutacija niza: aabbb? Rešenje

Ovde je k1 = 2, k2 = 3, k1+k2 = 5 pa je odgovor: 10!3!2

!553,2 ==P

To su:

aabbb baabb bbaab bbbaa ababb babab bbaba abbab babba abbba Primetimo, da idući po vrstama, svaki naredni raspored je dobijen cikličnim permutovanjem prethodnog, sa pomeranjem elemenata u desno. Idući po kolonama, svaka naredna permutacija je od prethodne dobijena zamenom mesta dva susedna elementa.

1.3 PRIMERI RAČUNANJA VEROVATNO ĆA

Primer 1.6 Isporučioc garantuje da u pošiljci od 300 njegovih proizvoda nema više od 30 neispravnih. Ako pretpostavimo da se u pošiljci nalazi tačno 30 neispravnih proizvoda, kolika je verovatnoća događaja A da se u uzorku od 4 komada nađu 3 loša?

Rešenje Broj svih mogućih ishoda u posmatranom slučajnom eksperimentu jednak je broju načina na koji je moguće od 300 proizvoda uzeti uzorak od 4 komada:

2529914929724

300299298297!296!4

!3004

3003004 ⋅⋅⋅=⋅⋅⋅==

== Cn

Broj povoljnih ishoda m, dobijamo na sledeći način. Tri od ukupno 30 neispravnih komada moguće je uzeti na 30

3C načina, a jedan dobar od ukupno

270, koliko ih ima u pošiljci, na 2701C načina. Pošto se svaki izbor od tri loša

može kombinovati sa svakim izborom od jednog dobrog, ukupan broj mogućnosti, tj. broj povoljnih ishoda za posmatrani događaj je:

270529282703

302701

303 ⋅⋅⋅=

=⋅= CCm

Tako je tražena verovatnoća događaja A:

0033.025299149297

27052928)( ≈

⋅⋅⋅

⋅⋅⋅==

n

mAP

Page 9: Osnovi inzenjerske statistike

7

Primer 1.7 Bacaju se dve kocke za igru. Naći verovatnoću događaja A da zbir brojeva koji padnu bude jednak 7?

Rešenje

Rezultat bacanja dve kocke je uređen par (i, j). Povoljni ishodi su: (1, 6), (6, 1), (2, 5), (5, 2), (3, 4), (4, 3). Dakle, m = 6. Ukupan broj mogućih ishoda predstavlja, očigledno, broj varijacija druge klase sa 6 elemenata (dva elementa se uzimaju iz skupa 1, 2, 3, 4, 5, 6) i to sa ponavljanjem:

262 6==Vn

6

1)( ==

n

mAP

Primer 1.8 U kutiji je a belih i b crnih kuglica. Naći verovatnoću da će obe izvučene kuglice biti bele boje ako se,

a) A - izvlače odjednom dve kuglice, ili jedna pa druga, ali bez vraćanja prve u kutiju;

b) B - izvuče prva, vrati u kutiju, a onda izvuče druga.

Rešenje

a) Ukupan broj mogućnosti se može dobiti kao broj varijacija druge klase od ukupno (a + b) elemenata:

n = (a + b)(a + b - 1)

Onda će broj povoljnih mogućnosti biti broj varijacija druge klase od a elemenata:

m = a(a - 1)

)1)((

)1()(

−++

−=

baba

aaAP

Pošto ovde redosled elemenata nije bitan, problem bi mogli da rešimo i pomoću kombinacija:

2/)1(2

2/)1)((2

−=

=

−++=

+=

aaa

m

bababa

n

b) Zbog vraćanja prve izvučene kuglice u kutiju ona može biti dvaput izvučena, pa su u pitanju varijacije druge klase od (a + b) elemenata, sa ponavljanjem:

n = (a + b)2

Razmišljajući na isti način, m = a2, pa je:

2

2

)()(

ba

aBP

+=

Page 10: Osnovi inzenjerske statistike

8

Primer 1.9 Iz špila od 32 karte se na slučajan način izvlače jedna za drugom 4 karte. Kolika je verovatnoća događaja A - da su sve karte iste boje i događaja B - da su sve karte različite boje, ako se izvlačenje obavlja:

a) sa vraćanjem,

b) bez vraćanja izvučene karte

Rešenje

a) Broj mogućih ishoda izvlačenja je 4324 32==Vn .

Svaka od 4 boje se u špilu javlja 8 puta, pa je broj povoljnih ishoda za događaj A jednak 4 × (broj mogućih načina da se od 8 karata izvuku 4, sa ponavljanjem):

64

1

32

84)(

844

4

4

484

=⋅

=

⋅=⋅=

AP

Vm

Broj povoljnih ishoda za događaj B jednak je (broj povoljnih mogućnosti ako se utvrdi redosled boja) × (broj mogućih redosleda četiri boje). Broj povoljnih mogućnosti za utvrđen redosled boja, pošto u svakoj boji ima po 8 karata je:

8

4488888 V==⋅⋅⋅

Broj mogućih redosleda četiri boje je jednak P4, pa je:

323

32!48

)(

!48

4

4

44

84

=⋅

=

⋅=⋅=

BP

PVm

b) Sada su, zbog uslova da se karte nakon izvlačenja ne vraćaju u špil, u pitanju varijacije klase 4 bez ponavljanja:

324Vn =

Za događaj A,

844 Vm ⋅=

0078.02931

729303132567844

)( 324

84 ≈

⋅=

⋅⋅⋅

⋅⋅⋅⋅==

V

VAP

Za događaj B, broj povoljnih mogućnosti je jednak kao u a):

m = 84· 4!

114.029303132

!48)(

4

≈⋅⋅⋅

⋅=BP

Kako i u ovom slučaju redosled karata pri izvlačenju nije bitan, problem bi se mogao rešiti i pomoću kombinacija, odnosno:

Page 11: Osnovi inzenjerske statistike

9

!4

567844

!4

29303132

84

324

⋅⋅⋅⋅=⋅=

⋅⋅⋅==

Cm

Cn

1.4 STATISTIČKA DEFINICIJA VEROVATNO ĆE

Kod mnogih slučajnih pojava ili eksperimenata nije moguće unapred – apriori,

pomoću klasične definicije (1.1) odrediti verovatnoću nekog događaja. Na primer, u nekom tehnološkom procesu ne može se teorijski, tj. unapred odrediti verovatnoća pojave škarta.

Posmatrajmo sada poznati eksperiment bacanja kocke. Formula (1.1) za verovatnoću događaja A da se pri bacanju kocke pojavi, recimo, broj 6 daje:

.167.06

1)( ≈==

n

mAP

To znači, da ako bacamo kocku n puta, možemo da očekujemo da ćemo šesticu dobiti približno m = n/6 puta. Na primer, u n = 600 bacanja očekujemo da ćemo šesticu dobiti oko 100 puta.

Broj ostvarivanja nekog događaja m u n ponovljenih eksperimenata zvaćemo (apsolutna) učestalost ili frekvenca događaja. U posmatranom primeru, u n ponovljenih eksperimenata, očekivana frekvenca dobijanja šestice jednaka je n/6. Isto tako, ako zamislimo da smo nekako došli do verovatnoće pojave neispravnog proizvoda p, u nekoj serijskoj proizvodnji, recimo p = 0.1, tada u uzorku od 100 komada možemo očekivati 10 neispravnih, ali stvarno taj broj može biti 8, 9, 10, 12 itd., dakle neki broj “oko” broja 10. Dakle, očekivana učestalost pojave škarta u uzorku od 100 komada je m = 10.

Koli čnik učestalosti m i broja ponavljanja eksperimenta, n naziva se relativna učestalost (frekvenca) događaja A:

n

mA =ω )(

Možemo očekivati da će relativna učestalost dobijanja šestice pri bacanju kocke biti približno 1/6, odnosno ω(A) ≈ P(A). Naravno, u nekih n bacanja kocke ω će imati jednu vrednost, a u n narednih bacanja neku drugu vrednost. Ono što iskustvo pokazuje je da ako je n dovoljno veliko, relativne učestalosti nekog događaja u različitim serijama od po n izvođenja eksperimenata malo se razlikuju među sobom. Šta više, kada n raste, frekvence ostvarene u pojedinim serijama se sve manje među sobom razlikuju. Tako, ako bi kocku bacali 600, 6000, 60000 i 120000 puta, mogli bi dobiti sledeće učestalosti pojavljivanja šestice:

105, 983, 10150, 20215

odnosno relativne učestalosti:

0.175, 0.164, 0.170, 0.168

Page 12: Osnovi inzenjerske statistike

10

Primećujemo da se relativna učestalost približava “teorijskoj” verovatnoći posmatranog događaja (1/6 ≈0.168) kada se n uvećava.

Svojstvo relativnih frekvenci slučajnog događaja da se grupišu oko nekog broja kada se broj ponavljanja slučajnih eksperimenata neograničeno povećava, u skladu je sa tzv. zakonom velikih brojeva, i omogućuje da se verovatnoća slučajnog događaja definiše preko relativnih frekvenci, budući da je broj oko koga se relativne frekvence grupišu upravo jednak verovatnoći:

( ) veliko)(nn

mAP ≈ (1.7)

Daćemo, bez dokaza, Bernulijev (Bernulli) zakon velikih brojeva, na kome se zasniva formula (1.7) za određivanje verovatnoće događaja nakon realizacije eksperimenata (aposteriori). Kada n → ∞, relativna učestalost događaja A, nmA /)( =ω teži po verovatnoći stvarnoj verovatnoći događaja:

1)(lim =

<−∞→

εAPn

mP

n (1.8)

za proizvoljno mali broj ε. U kraćoj notaciji:

)()(.

APn

mA

verov

n ∞→→=ω (1.8a)

Znači da će za dovoljno veliko n, relativna učestalost (gotovo) sigurno biti, dobra aproksimacija stvarne verovatnoće događaja P(A). Primer 1.10 U dužem vremenskom intervalu utvrđeno je da mašina za automatsko pakovanje hrane daje 2% paketa ispod propisane težine. Kontrolor je uzeo slučajan uzorak od 50 paketa. Odrediti očekivani broj neispravnih paketa.

Rešenje

Podatak 0.02 (2%) predstavlja relativnu frekvencu pojave defektnog paketa (A) i u skladu sa (1.7) usvojićemo ga kao procenu verovatnoće pojave defektnog paketa:

P(A) = ω(A) = 0.02 Očekivani broj defektnih paketa u n = 50 komada biće jednak apsolutnoj frekvenci:

102.050)( =⋅=ω= Anm

1.5 ALGEBRA DOGAĐAJA. VEROVATNO ĆE SLOŽENIH DOGAĐAJA

Page 13: Osnovi inzenjerske statistike

11

Događaji u teoriji verovatnoće se kao što smo videli definišu kao skupovi elementarnih događaja. Tako se mogu definisati algebarske operacije sa događajima, analogne operacijama sa skupovima i zahvaljujući tome definisati pravila za izračunavanje verovatnoća složenih događaja. Suprotni događaji

Događaj koji se ostvaruje uvek onda kada se događaj A ne ostvaruje, naziva se suprotnim za A i, po analogiji sa skupovima, označava sa A . Na slici je prikazan pomoću Venovog dijagrama, suprotan događaj za proizvoljan slučajan događaj A, gde E predstavlja prostor elementarnih događaja koji sadrži n elementarnih događaja.

A

A

Slika l.1 Suprotan događaj

Iz definicije suprotnog događaja sledi:

AA =

Kako je broj povoljnih ishoda suprotnog događaja, m( A ) jednak:

( ) ( )AmnAm −=

iz formule (1.1) se dobija,

( ) ( )APAP −=1

ili ( ) ( ) 1=+ APAP (1.9) Primeri suprotnih događaja su nemoguć (Φ) i siguran (E) događaj, Φ = E .

Primer 1.11 Skup se sastoji iz 7 dobrih i 5 neispravnih proizvoda. Iz tog skupa uzmemo tri proizvoda. Kolika je verovatnoća da

a) sva tri uzeta proizvoda budu dobra,

b) bar jedan od njih bude neispravan.

Rešenje

a) Problem možemo da rešimo pomoću kombinacija (nije bitan redosled elemenata).

E

Page 14: Osnovi inzenjerske statistike

12

159.044

7

101112

567)(

23

56723

101112

73

123

≈=⋅⋅

⋅⋅=

⋅⋅==

⋅⋅==

AP

Cm

Cn

b) Ako je bar jedan od njih neispravan, znači da nisu sva tri proizvoda dobra (nije nastupio događaj A), pa je u pitanju suprotan događaj događaju A, čija je verovatnoća, prema (1.9):

( ) ( ) 841.01 =−= APAP Zbir i proizvod događaja

Zbirom događaja A i B nazivamo događaj koji se ostvaruje tačno onda kada se ostvari bar jedan od događaja A i B, i označavamo ga sa A+B. Skup elementarnih događaja koji odgovara zbiru događaja (A+B) predstavlja uniju skupa elementarnih događaja koji odgovara događaju A i skupa koji odgovara događaju B (Sl. 1.2)

A

B

E

Slika 1.2 Zbir događaja

Na primer, pri bacanju kocke, neka je A pojavljivanje parnog broja, 6,4,2=A , a B

pojavljivanje broja deljivog sa 3, 6,3=B . Događaju (A+B) pripadaju elementarni

događaji 2, 3, 4, 6, dakle 6,4,3,2=+ BA

Ako slučajni događaji A i B ne mogu da nastupe zajedno, tj. ako ne postoji nijedan elementaran događaj koji bi povukao realizaciju oba događaja, kažemo da se međusobno isklju čuju ili da su nesaglasni, ili da su nespojivi. Događaji A i B iz prethodnog primera nisu međusobno isključivi jer pojava rezultata 6 znači istovremeno nastupanje i A i B. Nesaglasnim događajima odgovaraju istoimeni disjunktni skupovi (Sl. 1.3), pa se u literaturi sreće i termin disjunktni događaji.

Page 15: Osnovi inzenjerske statistike

13

E

B

A

Slika 1.3. Nesaglasni događaji Verovatnoća zbira dva nesaglasna događaja A i B, tj. verovatnoća da će se

dogoditi jedan ili drugi od njih, jednaka je u skladu sa (1.1): ( ) ( ) ( )BPAPBAP +=+ (1.10)

Zaista, broj elementarnih događaja, ( )BAm + koji povlače nastupanje zbira događaja

A+B jednak je: ( ) ( ) ( )BmAmBAm +=+ (broj elemenata unije dva disjunktna skupa) i deljenjem sa brojem mogućih ishoda n, dobijamo formulu (1.10)

Može se definisati zbir više događaja: NAAA +++ ...21 . Tada, ako su događaji

NiAi ,,1, …= nesaglasni, važi,

∑∑==

=

N

ii

N

ii APAP

11

)()( (1.11)

Ako zbir nesaglasnih događaja predstavlja siguran događaj, E = ∑ Ai, kažemo da oni čine potpun sistem događaja. Tako, za potpun sistem događaja važi:

( ) 1)(1

==∑=

EPAPN

ii (1.12)

Primer potpunog sistema događaja je prostor elementarnih događaja. Drugi primer: događaj A i njemu suprotan događaj A .

Primer 1.12 Bacaju se dve kocke. Neka je događaj A da kocke pokažu brojeve čiji je proizvod 12, a događaj B da pokažu brojeve čiji je zbir 6. Odrediti verovatnoću nastupanja događaja (A+B).

Rešenje

Događaji A i B sadrže sledeće elementarne događaje:

A: (2, 6), (6, 2), (3, 4), (4, 3), m(A) = 4

B: (1, 5), (5, 1), (3, 3), (2, 4), (4, 2), m(B) = 5

Očigledno je da su skupovi elementarnih događaja disjunktni, tj. da su A i B nesaglasni. Pošto je ukupan broj mogućih ishoda za oba događaja, 26

2 6==Vn ,

4

1)()()(,

36

5)(,

9

1

6

4)( 2 =+=+=== BPAPBAPBPAP

Page 16: Osnovi inzenjerske statistike

14

Za događaj čije se ostvarivanje sastoji u istovremenom nastupanju događaja A i B kažemo da predstavlja proizvod događaja A i B i označavamo ga sa AB. Proizvodu dva događaja AB odgovara presek skupova, definisanih događajima A i B (Sl. 1.4).

A

B AB

E

Slika 1.4. Proizvod dva događaja

Proizvod dva nesaglasna događaja je, očigledno, nemoguć događaj, jer je presek disjunktnih skupova prazan skup. Na primer, ( ) ( ) 0=Φ= PAAP .

Proizvod nekog događaja A i sigurnog događaja je događaj A: AAE = , u što se lako uveriti pomoću Venovog dijagrama. (vidi Sl. 1.1)

Sada možemo da izračunamo verovatnoću nastupanja zbira dva događaja A i B koji se ne isključuju. Kako je,

( ) ( ) ( ) ( )ABmBmAmBAm −+=+

iz (1.1) dobijamo:

( ) ( ) ( ) ( )ABPBPAPBAP −+=+ (1.13) Uopšte, za verovatnoću zbira više događaja, važi: ∑∑ ≤

ii

ii APAP )()( (1.14)

gde jednakost važi ako su događaji Ai nesaglasni. Primer 1.13 Dokazati De Morgano-ve formule

BAABBABA +=⋅=+ ,

Rešenje

BA + se ostvaruje kada se ne ostvari BA + (A ili B), a to znači kada se ne ostvari ni A (tj. ostvari A ) ni B (tj. ostvari B ), odnosno, kada se ostvariBA . Slično dokazujemo drugu formulu.

Primer 1.14 Iz serije proizvoda izvučena su tri.

a) Neka su događaji:

Page 17: Osnovi inzenjerske statistike

15

A - sva tri izvučena proizvoda su ispravna B - bar jedan od njih je neispravan C - dva su ispravna, a jedan neispravan.

Izraziti opisane složene događaje preko događaja Di (i = 1, 3) da je i-ti izvučeni proizvod ispravan.

b) Opisati događaje: BA + , AB ?

Rešenje

a)

Događaj A je prozvod događaja Di: 321 DDDA =

Događaj B je suprotan događaju A: 321321 DDDDDDAB ++===

C predstavlja zbir tri događaja: )()()( 321321321 DDDDDDDDDC ++=

b)

BA + je siguran događaj jer,

EBBBBBA =+=+=+

AB je nemoguć događaj jer je

Φ== BBAB

(vidi Sl. 1.1)

Primer 1.15 Reaktor (a) i destilaciona kolona (b) vezani su na red (šema 1):

a b

Šema 1.

Radi povećanja pouzdanosti postrojenja (smanjena verovatnoća ispada) mogu se instalirati dva reaktora i dve kolone, u dve paralelne linije (šema 2).

a1 b1

a2 b2

Šema 2. Treća šema obezbeđuje povezivanje svakog od dva reaktora, po potrebi, sa svakom od dve kolone:

Page 18: Osnovi inzenjerske statistike

16

a1 b1

a2 b2

Šema 3. Neka je A događaj da reaktor a u nekom periodu vremena funkcioniše ispravno, a B događaj da je u tom periodu vremena ispravna kolona b. Tako događaj Ai, i = 1,2 znači ispravan rad reaktora ai, dok je Bi, i = 1,2, događaj da kolona bi bude ispravna u istom periodu. Formulisati događaje S1, S2, S3 da šeme 1, 2 i 3 funkcionišu ispravno u datom vremenskom periodu. Rešenje

Da bi šema 1 radila, moraju biti obe komponente a i b ispravne, pa imamo:

ABS =1

Da bi šema 2 fukcionisala, potrebno je i dovoljno da bar jedna od dve paralelne linije fukcioniše, pa je:

)()( 22112 BABAS +=

Da bi šema 3 funkcionisala, potrebno je i dovoljno da je ispravan bar jedan od reaktora i bar jedna od kolona:

( )( )21213 BBAAS ++=

Primer 1.16 Jedan tehnički sistem se sastoji od elemenata a, b, c, d, e i f:

Ako su ispadi (kvarovi) ovih elemenata, događaji A, B, C, D, E, i F respektivno, formulisati događaj S da je sistem ispravan.

Page 19: Osnovi inzenjerske statistike

17

Rešenje

Da bi sistem bio ispravan mora a biti ispravno (A ) i dva podsistema, koji predstavljaju paralelne šeme, vezane sa a na red. Da bi prvi podsistem bio ispravan potrebno je i dovoljno da bar jedan od elemenata b, c i d radi, pa je događaj da je prvi podsistem ispravan: DCB ++ . Analogno, događaj da je drugi podsistem ispravan je: FE + . Tako, konačno imamo,

EFBCDAFEDCBAS )()()( =+++= S obzirom da su događaji definisani skupovima, jasno je da će zakoni koji važe za operacije sa skupovima (unija i presek) važiti i za operacije sabiranja i množenja događaja:

AAAAAA ==+ ,

BAABABBA =+=+ ,

( ) ( ) ( ) ( )CABBCACBACBA =++=++ ,

( ) ))(()(),()( CABABCABCACCBA ++=++=+

pri čemu se, slično kao i u klasičnoj algebri, smatra da množenje ima prednost u odnosu na sabiranje tj: BCABCA +⇔+ )(

1.6 USLOVNA VEROVATNOĆA

Ako pri određivanju verovatnoće nekog događaja B ne postoje nikakva ograničenja, onda se takva verovatnoća naziva bezuslovna ili apsolutna. Nekada smo, međutim, u situaciji da razmatramo verovatnoću nastupanja događaja B pod pretpostavkom ili uslovom da je prethodno nastupio događaj A. Verovatnoća nastupanja slučajnog događaja B pod uslovom da se ostvario događaj A naziva se uslovna verovatnoća događaja B u odnosu na događaj A i označava sa P(B/A).

Posmatrajmo primer da se iz kutije sa 8 crvenih, 15 belih, 24 crne i 17 narandžastih kuglica izvlače dve kuglice i to tako što se posle prvog izvlačenja:

a) izvučena kuglica vraća u kutiju,

b) ne vraća u kutiju.

Kolika je verovatnoća da se u drugom izvlačenju izvuče bela kuglica, uz uslov da je u prvom izvlačenju izvučena crvena kuglica? Ako sa A označimo događaj - izvlačenje crvene kuglice, a sa B događaj - izvlačenje bele kuglice, imaćemo u skladu sa (1.1),

u slučaju a):

)(64

15)/( BPABP ==

a u slučaju b):

Page 20: Osnovi inzenjerske statistike

18

)(63

15)/( BPABP ≠=

gde P(B) predstavlja apsolutnu verovatnoću događaja B, kada nije uslovljeno da se događaj A prethodno ostvario, pa je ona jednaka verovatnoći nastupanja događaja B u prvom izvlačenju. Primećujemo da,

• u slučaju a) nastupanje događaja A nema uticaja na verovatnoću nastupanja događaja B,

• u slučaju b) uslov da se događaj A ostvario, izmenio je verovatnoću nastupanja događaja B.

Sada možemo da definišemo uzajamnu nezavisnost događaja. Za dva događaja A i B koji nisu međusobno isključivi , kažemo da su nezavisni ako važi:

( ) ( )BPABP =/ (1.15a)

ili što je ekvivalentno,

( ) ( )APBAP =/ (1.15b)

Dakle, ako je događaj B nezavisan od A (1.15a) tada je i A nezavisan od B (1.15b) -uzajamna nezavisnost, što ćemo kasnije strogo pokazati. Ako jednakosti (1.15 a,b) ne važe, kažemo da su posmatrani događaji zavisni.

Da bi smo izveli formulu za izračunavanje uslovne verovatnoće, razmotrimo sledeći model. U jednom skupu imamo n osoba, muškaraca i žena, od kojih neki puše, a neki ne puše. Označimo sa A događaj da je slučajno “izvučena” osoba iz skupa muškarac, a sa B da je pušač. Neka imamo sledeću strukturu skupa:

m1 + m2 + k1 + k2 = n

Odredimo verovatnoće da će slučajno izvučena osoba biti:

• muškarac (A) • pušač (B) • muškarac koji puši (AB)

Iz formule (1.1):

n

mmAP 21)(

+=

n

kmBP 11)(

+=

n

mABP 1)( =

A (muškarci)

A (žene)

B (pušači) m1 k1

B (nepušači) m2 k2

∑ m1+m2 k1+k2

Page 21: Osnovi inzenjerske statistike

19

B

(m1+m2)

B

AA A

A

B

A

(m1+k1)

A

AB

A

(m1)

Odredimo sad verovatnoću da će neka osoba biti pušač, ako znamo da je (pod uslovom da je) muškarac. Znači da treba da odredimo verovatnoću da je slučajno “izvučeni” muškarac pušač. U pitanju je uslovna verovatnoća P(B/A). S obzirom na postavljeni uslov, pri određivanju verovatnoće P(B/A) kao prostor elementarih događaja posmatramo podskup potpunog skupa elementarnih događaja, koji sadrži muškarce:

A

B

E=A

(m1)

(m1+m2)

Dakle, pod datim uslovom, broj mogućih događaja je n = m1+m2. Broj povoljnih ishoda je očigledno m1 pa imamo,

)(

)(

/)(

/)/(

21

1

21

1

AP

ABP

nmm

nm

mm

mABP =

+=

+=

Došli smo do sledeće relacije za uslovnu verovatnoću događaja B u odnosu na događaj A:

( ) ( )( )AP

ABPABP = (1.16a)

Analogno izvodimo,

( ) ( )( )BP

ABPBAP = (1.16b)

Verovatnoća proizvoda i uslov nezavisnosti događaja

Iz formula (1.16a,b) sledi formula za verovatnoću proizvoda dva neisključiva događaja:

( ) ( ) ( ) ( ) ( )BAPBPABPAPABP // == (1.17)

Formula se može uopštiti i recimo za tri događaja A, B i C glasi:

( ) ( ) ( ) ( )ABCPABPAPABCP = (1.18)

Page 22: Osnovi inzenjerske statistike

20

Iz definicije (1.15a) i formule (1.17) izvodimo: Događaji A i B su nezavisni ako i samo ako važi: ( ) ( ) ( )BPAPABP = (1.19)

Ako je B nezavisno od A, dakle ako važi (1.15a), tada iz jednakosti (1.17) sledi (1.15b), odnosno A je takođe nezavisno od B. Treba primetiti da su isklju čivi događaji , za koje je P(AB) = 0, uvek zavisni. Zaista, budući da su su verovatnoće dva moguća događaja različite od nule, uslov nezavisnosti (1.19) ne može biti ispunjen.

Uslov nezavisnosti se ne može neposredno proširiti na slučaj više od dva događaja. Naime, uslov:

( ) ( ) ( ) ( )nn APAPAPAAAP 2121 = (1.20)

je samo potreban, ali ne i dovoljan da bi događaji bili potpuno nezavisni. Događaji

nAAA ,...,, 21 su potpuno nezavisni, ako je svaki od njih nezavisan od svakog od

preostalih, kao i od svih proizvoda koji se mogu formirati od više njih. Ako su događaji

nAAA ,...,, 21 potpuno međusobno nezavisni važi (1.20), ali ako važi (1.20) to ne znači i da su oni potpuno nezavisni.

Primer 1.17 Pokazati da, ako su događaji A i B nezavisni, takođe su nezavisni i događaji BA i .

Rešenje

Posmatrajmo događaje BAAB i . Oni su očigledno nespojivi, a njihov zbir jednak je događaju A:

( ) AAEBBABAAB ==+=+

Tako imamo:

( ) ( ) ( ) ( )BAPABPBAABPAP +=+=

Pošto su A i B nezavisni, umesto ( )ABP stavljamo ( ) ( )BPAP i dalje:

( ) ( ) ( ) ( ) ( ) ( )( ) ( ) ( )BPAPBPAPBPAPAPBAP =−=−= 1

što je traženi dokaz. Dakle, za nezavisne događaje A i B važi:

( ) ( ) ( )APBAPBAP ==

ili rečima: verovatnoća jednog od njih ostaje ista bez obzira da li se drugi dogodio ili ne.

Primer 1.18 Kolika je verovatnoća p da se pri izvlačenju dve kuglice, izvuče jedna crvena i jedna bela kuglica iz kutije, koja sadrži 8 crvenih, 15 belih, 24 crne i 17 narandžastih kuglica?

Rešenje Problem ćemo rešiti na dva načina:

a) preko definicije verovatnoće (1.1) i b) kao verovatnoću složenog događaja.

Page 23: Osnovi inzenjerske statistike

21

a) Kutija sadrži ukupno N = 64 kuglice.

252

15

)1(

1582

158,2

)1(2

151

812

=−⋅⋅=

⋅=⋅=−=

==

NNp

CCmNNN

Cn N

b) Eksperiment je ekvivalentan - ima istu verovatnoću - onom pri kome bi izvlačili jednu pa drugu kuglicu bez vraćanja prve u kutiju. Događaj da smo pri tome izvukli jednu belu i jednu crvenu kuglicu biće ostvaren ako u prvom izvlačenju izvučemo belu, a u drugom crvenu kuglicu (događaj C), ili ako u prvom izvlačenju izvučemo crvenu, a u drugom belu kuglicu (događaj D). U pitanju je, očigledno, zbir dva međusobno isključiva događaja P(CD) = 0, pa u skladu sa pravilom sabiranja verovatnoća nespojivih događaja (1.10) imamo:

( ) ( )DPCPDCP +=+ )(

C i D predstavljaju proizvode dva događaja, a ako sa A označimo događaj - izvlačenje bele, a sa B - izvlačenje crvene kuglice, biće prema (1.17):

( ) ( ) ( ) ( ) ( ) ( )BAPBPDPABPAPCP == ,

i konačno,

( ) ( ) ( ) ( )BAPBPABPAPDCP +=+ )(

Potrebne verovatnoće su prema (1.1):

1

15)/(,

8)(,

1

8)/(,

15)(

−==

−==

NBAP

NBP

NABP

NAP

i posle smene:

252

15

)1(

1582

)1(

158

)1(

815)( =

⋅⋅=

⋅+

⋅=+=

NNNNNNDCPp

Primer 1.19 Verovatnoće tri potpuno nezavisna događaja su:

7

2)(,

5

1)(,

8

1)( === CPBPAP

Izračunati verovatnoće da nastupe:

a) sva tri događaja istovremeno

b) događaji A i B, ali ne i C

c) samo događaj B

d) A ili B, ali ne i C

Rešenje a) U pitanju je proizvod ABC nezavisnih događaja, pa važi pravilo množenja verovatnoća (1.20):

Page 24: Osnovi inzenjerske statistike

22

140

1)()()()( == CPBPAPABCP

b) U pitanju je događaj CAB :

56

1))(1)(()()()()()( =−== CPBPAPCPBPAPCABP

c) Tražimo verovatnoću događaja CBA :

8

1))(1)(())(1()( =−−= CPBPAPCBAP

d) Tražimo verovatnoću događaja ( )CBA+ . Kako su događaji A,B,C potpuno

nezavisni oni se ne isključuju (da se isključuju bili bi zavisni!), tako da je bilo koja

verovatnoća proizvoda ovih događaja različita od nule. Tako je:

( ) )()()()()( CABPCBPCAPCBCAPCBAP −+=+=+

uz činjenicu da je CCC = . Dalje je:

14

3))(1))((()()()((

)())()()()(()()()(

=−−+=

−+=−+

CPBPAPBPAP

CPBPAPBPAPCABPCBPCAP

Primer 1.20 Jedna torba sadrži 3 crvene, 5 crnih, a druga 4 zelene i 7 belih kuglica. Jedna kuglica se izvlači iz prve torbe, a dve iz druge. Odrediti verovatnoće ishoda:

a) jedna crvena i dve bele kuglice b) nijedna zelena kuglica c) ili jedna crna i dve zelene, ili jedna crna i dve bele kuglice

Rešenje a) Označimo događaje: A - crvena kuglica iz prve torbe

B - bela kuglica iz druge torbe

U pitanju je složeni događaj A(BB) gde BB označava složen događaj uzastopnog izvlačenja dve bele kuglice iz druge torbe bez vraćanja kuglica nakon izvlačenja.

( ) ( ) ( ) )/()()(,)( BBPBPBBPABBPAPBBAP ==

Pošto su događaji A i B pa prema tome A i BB nezavisni:

( ) ( ) ( ) ( ) ( ) ( )BBPBPAPBBPAPABBPBBAP === )()(

10

6)/(,

11

7)(,

8

3)( === BBPBPAP

P(ABB) = 63/440

b)

Ako označimo događaje:

Page 25: Osnovi inzenjerske statistike

23

A - zelena kuglica iz prve torbe B - zelena kuglica iz druge torbe C - bela kuglica iz druge torbe

u pitanju je događaj: BBA , ili pošto su B i C suprotni događaji: CCA

10

6)/(,

11

7)(,1)(1)(

)/()()()()()(

===−=

==

CCPCPAPAP

CCPCPAPCCPAPCCAP

55

21)( =CCAP

c)

Neka su događaji: A - crna kuglica iz prve torbe B - zelena kuglica iz druge torbe C - bela kuglica iz druge torbe

tražimo P(ABB + ACC)

Pošto su posmatrana dva događaja ABB i ACC međusobno isključivi:

( ) ( ) ( )ACCPABBPACCABBP +=+

Dalje, pošto su A, BB i A, CC parovi nezavisnih događaja:

( ) ( ) ( ) ( ) ( ) ( )BBPBPAPBBPAPABBP ==

( ) ( ) ( ) ( ) ( ) ( )CCPCPAPCCPAPACCP ==

( ) ( ) ( ) ( ) ( ) ( )[ ]CCPCPBBPBPAPACCABBP +=+

88

27)(

106

)/(,103

)/(,117

)(,114

)(,85

)(

=+

=====

ACCABBP

CCPBBPCPBPAP

Primer 1.21 U dužem vremenskom intervalu utvrđeno je da mašina za automatsko pakovanje hrane daje 2% paketa ispod propisane težine. Kontrolor je uzeo slučajan uzorak od 50 paketa. Odrediti verovatnoću da nijedan paket u uzorku nije defektan.

Rešenje

Za verovatnoću pojave defektnog paketa (događaj A) uzećemo datu relativnu frekvencu (Primer 1.10). Verovatnoća pojave ispravnog paketa (B) predstavlja verovatnoću suprotnog događaja:

( ) ( ) 98.01 =−= APBP

Događaj da nijedan paket u uzorku nije defektan (C), složen je događaj i sastoji se u tome da 50 puta nastupi događaj B:

Page 26: Osnovi inzenjerske statistike

24

×

=

50

... BBBC

Pošto su u pitanju nezavisni događaji.

364.098.0)()( 5050≈== BPCP

1.7 BAJESOVA TEOREMA

Neka su događaji nHHH ,...,, 21 nespojivi i neka čine potpun sistem događaja za

dati eksperiment. Neka je A proizvoljan događaj u okviru istog eksperimenta (tj. istog prostora elementarnih događaja). Kako se pri realizaciji eksperimenta mora ostvariti neki od događaja nHHH ,...,, 21 , to će se događaj A ostvariti istovremeno bar sa jednim od

njih:

( ) AHAHAHAHHHEAA nn +++=+++== ...... 2121

Pri tom se događaji koji se sabiraju, niAH i ,...,1, = međusobno isključuju (Sl. 1.5), pa

je prema (1.14):

( ) ( )∑=

=

n

ii AHPAP

1

odnosno, koristeći formulu (1.17) dobijamo jednačinu:

( ) ( ) ( ) ( )∑∑==

==

n

iii

n

ii HAPHPAHPAP

11

(1.21)

Jednačina (1.21) je u literaturi poznata pod nazivom formula potpune verovatnoće

i ona daje verovatnoću da će se događaj A ostvariti u posmatranom eksperimentu. Formula zahteva poznavanje verovatnoća pojedinih nespojivih događaja Hi, koji se nazivaju hipoteze, a njihove verovatnoće, P(Hi) - apriorne verovatnoće.

H1

H2

H3

H4

H6

A

H8

H5

H7

Slika 1.5 – Ilustracija uz Bajesovu teoremu

E

Page 27: Osnovi inzenjerske statistike

25

Primer 1.22 Rešimo sledeći problem. Dva automobila idu noću jedan drugom u susret. Poznata je verovatnoća da je bilo koji od dva vozača pospan: p = 0.1. Poznate su i sledeće verovatnoće: • ako vozači nisu pospani, automobili će se bezbedno mimoići sa verovatnoćom

0.999 • ako je samo vozač 1 pospan, verovatnoća bezbednog mimoilaženja je 0.7 • ako je samo vozač 2 pospan, verovatnoća bezbednog mimoilaženja je 0.8 • ako su oba vozača pospana, mimoići će se bezbedno sa verovatnoćom 0.4

Kolika je verovatnoća da se automobili mimoiđu bezbedno?

Rešenje

Potpun sistem događaja Hi, ovde čine događaji:

H1 – nijedan od vozača nije pospan, H2 – pospan je samo vozač 1, H3 – pospan je samo vozač 2, H4 – oba vozača su pospana

Imajući u vidu da je događaj da je vozač 1 pospan, nezavisan od događaja da je pospan vozač 2, potrebne verovatnoće hipoteza računamo kao:

( ) ( ) ( ) ( ) ( ) ( ) 2432

21 ,1,1 pHPppHPHPpHP =−==−=

Proverimo,

( ) ( ) ( ) ( )[ ] 11121 222 =+−=+−+−=∑ ppppppHP i

Brojne vrednosti su:

( ) ( ) ( ) ( ) 01.0,09.0,81.0 4321 ==== HPHPHPHP

Posmatrani događaj A u ovom eksperimentu je: A – bezbedno mimoilaženje dva automobila. Imamo i verovatnoće njegovog nastupanja pod pretpostavkom da se dogodio neki od događaja Hi, i = 1,4 :

( ) ( ) ( ) ( ) 4.0,8.0,7.0,999.0 4321 ==== HAPHAPHAPHAP

Konačno, iz formule totalne verovatnoće, dobijamo traženu verovatnoću bezbednog mimoilaženja:

( ) 984.04.001.08.009.07.009.0999.081.0 ≈⋅+⋅+⋅+⋅=AP

Primer 1.23 U nekoj fabrici se ostvaruje 40% na mašini 1, 20% na mašini 2 i na mašini 3 ostatak prozvodnje. Ako mašina 1 daje 1.5% škarta, 1.2% škarta mašina 2, i 1.7% škarta mašina 3, kolika je verovatnoća škarta, odnosno verovatnoća da slučajno odabran proizvod bude neispravan?

Rešenje

Identifikujmo hipoteze: Hi, (i = 1,3) - neki proizvod je izrađen na mašini i.

Posmatramo događaj A – dobijen je neispravan proizvod. Prema podacima,

Page 28: Osnovi inzenjerske statistike

26

( ) ( ) ( ) 2.0,4.0 231 === HPHPHP

Date su verovatnoće da je neispravan proizvod dobijen na mašini 1, 2 ili 3, redom:

( ) ( ) ( ) 017.0,012.0,015.0 321 === HAPHAPHAP

Traženu verovatnoću škarta dobijamo iz formule totalne verovatnoće:

( ) 0152.0017.04.0012.02.0015.04.0 =⋅+⋅+⋅=AP

U praktičnim problemima je važno, ako se posmatrani događaj A ostvario, naći kolika je verovatnoća da je to posledica ostarivanja neke od hipoteza Hi, i = 1,n. Odgovor daje Bajesova teorema. Interesuje nas uslovna verovatnoća ( )AHP i i dobijamo je iz

formule (1.16a):

( ) ( )( )AP

AHPAHP i

i =

i formule (1.21) za verovatnoću P(A):

( ) ( ) ( )( ) ( )

niHAPHP

HAPHPAHP

n

iii

iii ,...,1,

1

==

∑=

(1.22)

Jednačina (1.22) je Bajesova teorema ili formula. Vidimo da će najveću verovatnoću imati ona od hipoteza, čiji je doprinos totalnoj verovatnoći ostvarivanja događaja A, jednak ( ) ( )ii HAPHP , najveći.

Primer 1.24 Ako podacima u prethodnom primeru dodamo i podatak da je slučajno odabran predmet neispravan, potrebno je odrediti verovatnoće da je proizveden na mašini 1, 2 ili 3.

Rešenje

Koristimo Bajesovu formulu (1.22):

( )( )( ) 447.0

0152.0

017.04.0

158.00152.0

012.02.0

395.00152.0

015.04.0

3

2

1

≈⋅

=

≈⋅

=

≈⋅

=

AHP

AHP

AHP

Prema očekivanju, najverovatnije je proizvod izrađen na mašini 3, čiji je doprinos verovatnoći nastajanja škarta najveći:

012.02.0015.04.0017.04.0 ⋅>⋅>⋅

Page 29: Osnovi inzenjerske statistike

27

ZADACI

1.1 U jednom uzorku od 25 proizvoda nalazi se 5 sa greškom.

a) Kolika je verovatnoća da prvi nasumce uzet proizvod bude sa greškom? b) Ako iz uzorka uzmemo odjednom pet proizvoda, kolika je verovatnoća da među

njima budu dva neispravna?

1.2 Iz kutije sa a belih i b crnih kuglica izvlačimo dve, i to: a) odjednom b) jednu po jednu, s tim što se prva izvučena vraća u kutiju.

Izračunati verovatnoću da će izvučene kuglice biti različite boje.

1.3 Iz slova A, B, C, D, E i F slučajnim izborom sastavljamo reč od 4 slova. Kolika je verovatnoća da se u toj reči nađu slova A i D?

1.4 Kolika je verovatnoća da tri kocke pokažu različite brojeve?

1.5 Iz niza brojeva 1, 2, 3, 4, 5, 6, 7, 8, 9 uzmemo nasumično dva broja. Kolika je verovatnoća da jedan bude manji od 5, a drugi veći od 5?

1.6 Lutrija ima 40 kuglica numerisanih od 1 do 40. a) Ako izvlačimo dve kuglice, kolika je verovatnoća da će prva kuglica imati

oznaku 2 a druga oznaku 5? b) Ako izvučemo pet kuglica, kolika je verovatnoća da se među njima nađu 2 i 5?

1.7 Dat je niz brojeva 1, 2, 3, 4, 5, 6, 7, 8. a) Ako nasumično izvučemo tri broja, kolika je verovatnoća da oni budu veći ili

najmanje jednaki 3? b) Ako iz niza uzmemo broj 3 i još dva broja slučajnim izborom, kolika je

verovatnoća da broj 3 bude manji od dva izvučena broja?

1.8 Bačena su tri novčića. a) Izračunaj verovatnoću da sva tri padnu na grb. b) Kolika je verovatnoća da će bar jedan pasti na pismo?

1.9 U skupu od 8 proizvoda nalaze se tri loša (L) i 5 dobrih (D). Kolika je verovatnoća da u tri uzastopna izvlačenja (bez vraćanja) dobijemo rezultat LDD ili DLD?

1.10 Skup se sastoji od 8 dobrih i 3 loše osovine i 5 dobrih i 4 loša ležaja. Slučajnim izborom uzmemo dva ležaja i jednu osovinu i sastavimo sklop. Kolika je verovatnoća da se u sklopu nađu dva loša ležaja i dobra osovina?

1.11 Za pošiljku od 500 proizvoda, proizvođač tvrdi da ne sadrži više od 25 loših komada. Ako je ova tvrdnja tačna, kolika je verovatnoća da u uzorku od 3 proizvoda ne bude nijedan loš?

1.12 U nekom eksperimentu događaj A nastupa sa verovatnoćom p = 1/3. Koliko je opita neophodno izvršiti da bi smo sa verovatnoćom od 0,99 mogli očekivati bar jedno pojavljivanje događaja A?

1.13 Tehnički sistem se sastoji iz elemenata ai, i =1,...,5. Ako su verovatnoće otkaza elemenata (pi, i=1,..,5) redom: 0.5, 0.3, 0.3, 0.4 i 0.6, odrediti verovatnoću otkaza sistema pod pretpostavkom da su kvarovi pojedinih elemenata međusobno nezavisni.

Page 30: Osnovi inzenjerske statistike

28

1.14 U proizvodnom sistemu povezano je na red n mašina Mi, i =1,...,n. Da bi se povećala pouzdanost sistema (verovatnoća da on ispravno radi u toku nekog perioda vremena), on je dupliran sa još n mašina mi, i =1,...,n i to na dva načina:

a)

b)

Ako je verovatnoća da mašina Mi radi ispravno u datom vremenskom intervalu P(Mi), a da mašina mi radi ispravno P(mi), kolike su pouzdanosti sistema a) i b)?

1.15 Poznate su verovatnoće ( ) ( )3

1,

4

1=+= BAPAP . Odrediti verovatnoću ( )BPp =

a) ako su događaji A i B nesaglasni b) ako je događaj A deo događaja B c) ako su događaji A i B nezavisni

1.16 Date su verovatnoće: ( ) ( ) ( )4

1,

2

1,

8

3=== ABPBPAP . Naći

a) ( )BAP +

b) ( ) ( )BPAP i

c) ( )BAP

d) ( )BAP +

e) ( ) ( )ABPBAP i

Page 31: Osnovi inzenjerske statistike

29

f) ( ) ( )ABPBAP i g) ( )[ ]BBAP +

1.17 Letilica se gađa dva puta. U prvom gađanju, verovatnoća pogotka je 0.3, a u drugom 0.6. Jednom pogođena letilica se ruši sa verovatnoćom 0.2, a dva puta pogođena, sa verovatnoćom 0.9. Primenom formule ukupne verovatnoće odrediti verovatnoću da se letilica obori.

1.18 U jednoj velikoj seriji, 96% proizvoda ima propisan kvalitet. Proizvodi se podvrgavaju gruboj kontroli, koja proglašava proizvod dobrim sa verovatnoćom 0.98, ako je proizvod stvarno dobar, a sa verovatnoćom 0.05, ako je on stvarno loš.

a) Kolika je verovatnoća da kontrola proglasi neki proizvod dobrim? b) Ako je kontrola proglasila proizvod dobrim, kolika je verovatnoća da je on

stvarno dobar?

Page 32: Osnovi inzenjerske statistike

31

2 Slučajna promenljiva

Ako se svakom ishodu nekog slučajnog eksperimenta može pripisati neki broj iz nekog skupa brojeva, onda se ti brojevi mogu smatrati mogućim vrednostima jedne promenljive veličine X, koju zovemo slučajna promenljiva ili slučajna veličina. Slučajne promenljive označavamo velikim slovima X, Y, …, a njihove vrednosti odgovarajućim malim slovima x1, x2,…, y1, y2,…

Primetimo da se unapred, pri izvođenju eksperimenta, ne može tvrditi koju vrednost će slučajna veličina X uzeti, već se može samo govoriti o verovatnoći da X uzima ovu ili onu vrednost ili verovatnoću da će njena vrednost pasti u neki interval.

Slučajne veličine možemo da klasifikujemo na diskretne i neprekidne ili kontinualne. Za slučajnu veličinu kažemo da je diskretna ako može da uzima samo konačno ili prebrojivo mnogo različitih vrednosti: x1, x2, . . ., xn. Ako je skup vrednosti slučajne promenljive interval na brojnoj pravoj (konačan ili beskonačan) kažemo da je ona neprekidna.

Primeri diskretnih slučajnih veličina su rezultati bacanja kocke, broj neispravnih proizvoda u nekom uzorku, itd. Primeri kontinualne slučajne promenljive su rezultati merenja temperature. Na primer, temperatura vazduha se ne može unapred tačno predvideti pa je rezultat njenog merenja slučajan, a on može biti bilo koji broj iz nekog intervala, recimo (-25 0C, 45 0C). I rezultat merenja temperature u nekom uređaju u procesu, iako se ona drži pod kontrolom, je strogo govoreći, takođe slučajna veličina jer sadrži nezaobilaznu grešku merenja, koja je slučajna veličina.

2.1 DISKRETNE SLUČAJNE PROMENLJIVE

Svaku od niza vrednosti x1, x2,...,xn, diskretna slučajna promenljiva uzima sa određenom verovatnoćom.

n,i xpxX P p iii ...,1)()( ====

Page 33: Osnovi inzenjerske statistike

32

Funkcija p(x) = P(X = x) definisana samo za x = xi, i = 1,...,n naziva se zakon raspodele verovatnoće ili kratko raspodela (verovatnoće) diskretne slučajne promenljive.

Očigledne su sledeće osobine zakona raspodele:

0)( xp > (2.1a)

1)(11∑∑==

==

n

ii

n

ii pxp (2.1b)

Naime, događaji: X = x1, X = x2, . . ., X = xn predstavljaju potpun sistem događaja. Zakon raspodele (xi,pi), i = 1,...,n se prikazuje najčešće na tri načina:

• tabelom • trakastim dijagramom (bar graph) • poligonom raspodele (line graph) Tablični način prikazivanja. Uzmimo na primer da su radi kontrole rada

mašine za pakovanje u određenim vremenskim razmacima uzimani uzorci od po 50 proizvoda i za svaki uzorak je ustanovljeno koliko sadrži neispravnih proizvoda. Za 100 takvih uzoraka dobijeni su sledeći podaci:

Ako relativne frekvence u skladu sa statističkom definicijom verovatnoće (1.7) usvojimo kao procene verovatnoća, onda prva i treća kolona daju zakon raspodele, tačnije govoreći empirijski zakon raspodele broja defektnih proizvoda u uzorku:

Na Sl. 2.1 je dat jedan način grafičkog prikazivanja - trakasti dijagram . Visina vertikalne trake na poziciji xi jednaka je pi.

broj neispravnih proizvoda

xi

broj uzoraka sa xi neispravnih

proizvoda mi

relativna frekvenca

neispravnih proizvoda

ωi 0 10 10/100 1 35 35/100 2 40 40/100 3 10 10/100 4 5 5/100 ∑ 100 1

xi 0 1 2 3 4 pi 0.1 0.35 0.40 0.10 0.05

Page 34: Osnovi inzenjerske statistike

33

Slika. 2.1 Trakasti dijagram

Poligon raspodele je drugi grafički način prikazivanja. Dobija se spajanjem tačaka

(xi, pi) linijama. Za posmatrani primer, poligon raspodele je dat na Sl. 2.2:

Slika 2.2 Poligon raspodele Kod poligona raspodele treba uvek imati u vidu da je u pitanju diskretna slučajna

veličina koja ne uzima vrednosti između tačaka xi, (i = 1,...,n), što nije tako očito kao kod trakastog.

Funkcija raspodele

Funkcija:

) ( )( xXPxF <= (2.2)

0 1 2 3 4 0.0

0.1

0.2

0.3

0.4

x

p

0 1 2 3 4 0.0

0.1

0.2

0.3

0.4

x

p

Page 35: Osnovi inzenjerske statistike

34

definisana na celom intervalu -∞ < x < ∞, naziva se funkcijom raspodele (verovatnoće) slučajne promenljive X, ili kumulativni zakon raspodele.

Iz definicije (2.2) sledi:

0)( = ∞-F (2.3a)

1)( = ∞F (2.3b)

Za diskretnu slučajnu promenljivu X, koja uzima vrednosti x1,x2,...,xn, funkcija raspodele se iz zakona raspodele (xi, pi), i=1,...,n dobija kao:

∑<

= xx

i

i

pxF )( (2.4)

Odnosno,

n

nnn

xx

xxx

xxx

xxx

xx

ppp

pp

p

xF

>≤<

≤<≤<

+++

+ = −−

za

za

za

za

za

1

0

)(

1

32

21

1

121

21

1

Iz (2.4) i (2.1a) sledi da je funkcija raspodele monotono neopadajuća funkcija. Njen grafik je dat na Sl. 2.3.

Slika 2.3. Funkcija raspodele

Funkcija raspodele je u svakoj tački neprekidna s leve strane, a u tačkama xi, i = 1,...,n ima prekide (skokove) s desne strane. Veličina skoka u tački xi je tačno pi, odnosno:

)()()( 1 iii xFxFxp −= + (2.5)

Konačno, može se izvesti praktična relacija:

Page 36: Osnovi inzenjerske statistike

35

)()()( aFbFbXaP −=<≤ (2.6) Primer 2.1 Strelac koji ima ukupno 4 metka gađa u cilj dok ga ne pogodi, ili dok ne potroši metke. Verovatnoća pogotka pri svakom gađanju je 0.6. Definisati zakon i funkciju raspodele verovatnoće za slučajnu promenljivu - broj neutrošenih metaka.

Rešenje

Označimo događaj da je strelac pogodio metu sa A. Suprotan događaj - promašaj biće A i:

0.6 )( == pAP , 4.01)( - p = = q = A P

Možemo da formiramo sledeću tabelu:

Proverimo da li je ispunjen neophodan uslov (2.1b)

1

1

1

1

)1(

44

44

432432

=+−

=+−

−=

++++=++++

qp

qpq

q

qp

qqqqpqpqpqqpp

Tako su, zakon i funkcija raspodele promenljive X:

x 0 1 2 3

p(x) 0.064 0.096 0.240 0.600

>≤<≤<≤<

=

4 za1

32 za400.0

21 za160.0

10 za064.0

0 za0

)(

x

x

x

x

x

xF

Broj preostalih metaka, x:

Događaj Opis događaja Verovatnoća događaja

3 A Pogodak u prvom pokušaju

p = 0.6

2 A A Prvi pokušaj - promašaj, a drugi pogodak

qp = 0.24

1 A A A Prvi i drugi pokušaj su promašaji, a treći pogodak

q2p = 0.096

0 A A A A + A A A A

Prva tri pokušaja su promašaji, a četvrti ili pogodak ili promašaj

q3p + q4 = 0.064

Page 37: Osnovi inzenjerske statistike

36

2.2 NEPREKIDNE SLUČAJNE PROMENLJIVE

Za razliku od diskretne slučajne promenljive verovatnoća da neprekidna slučajna promenljiva X uzme baš neku određenu vrednost x iz intervala mogućih vrednosti jednaka je nuli , P(X = x) = 0, što je logično jer se radi o jednoj od neprebrojivo mnogo mogućih vrednosti. Zato je ovde logično govoriti o verovatnoći da vrednost slučajne promenljive padne u neki interval .

I za neprekidnu slučajnu promenljivu definiše se funkcija raspodele, F(x) jednačinom (2.2). Pri uvećanju broja mogućih vrednosti neke diskretne slučajne promenljive, broj skokova stepenaste krive F(x) raste, a sami skokovi se smanjuju. Tako, pri prelazu diskretne slučajne promenljive u neprekidnu, stepenasti oblik funkcije F(x) (Sl. 2.3) prelazi u neprekidnu krivu. Na Sl. 2.4 dat je prikaz funkcije raspodele neprekidne slučajne veličine za slučajeve kada je oblast mogućih vrednosti X:

(1) ograničen interval [a, b] (2) neograničen interval (-∞, ∞)

U slučaju (b) funkcija raspodele ima horizontalne asimptote: F(x) = 0, F(x) = 1

Slika 2.4 Funkcija raspodele Gustina raspodele

Ako je, pored toga što je neprekidna, funkcija raspodele F(x) i diferencijabilna, može se definisati gustina raspodele f(x).

dx

xdFxf

)()( = (2.7)

Iz monotonosti funkcije F(x) i (2.7) sledi:

0)( ≥xf (2.8)

Page 38: Osnovi inzenjerske statistike

37

Na Sl. 2.5 skiciran je grafik gustine raspodele - kriva gustine raspodele u slučaju neograničene oblasti mogućih vrednosti slučajne promenljive.

Diferencijal f(x)dx se zove diferencijal verovatnoće ili element verovatnoće i predstavlja, u skladu sa Jedn. (2.6) verovatnoću da slučajna promenljiva primi vrednost iz intervala (x, x+dx):

( )

dxxfxdFxFdxxFdxxXxPdxxXxP )()()()()()(6.2

==−+=+<≤=+<<

Geometrijski, element verovatnoće predstavlja površinu elementarnog pravougaonika visine f(x) i širine dx (Sl. 2.5)

f(x)dx

x x+dx

f(x)

Slika 2.5 Kriva gustine raspodele

Sada možemo da odredimo verovatnoću )( bXaP << da vrednost slučajne promenljive padne u interval (a,b), pomoću gustine raspodele. U pitanju je zbir elementarnih verovatnoća na intervalu (a,b), odnosno integral:

∫=<<b

adxxfbXaP )()( (2.9)

Geometrijski, to je površina ispod krive gustine, nad intervalom (a,b) - vidi Sl. 2.6

a b

f(x)

x Slika 2.6 Geometrijska interpretacija Jedn. (2.9)

Page 39: Osnovi inzenjerske statistike

38

Kako je po definiciji,

)()()( xXPxXPxF <<−∞=<=

gustina f(x) i funkcija raspodele F(x) su povezane relacijom:

RxdttfxFx

∈= ∫∞−

,)()( (2.10)

konzistentnom sa (2.7). Na Sl. 2.7 dat je i geometrijska interpretacija.

x

f(x)

F(x)

Slika 2.7 Veza između gustine i funkcije raspodele

S obzirom da je F(∞) = 1, iz (2.10) sledi

1)( =∫∞∞−

dxxf (2.11)

Dakle, površina ispod krive gustine f(x) (Sl. 2.7) jednaka je jedinici .

Konačno, da bi smo obrazložili naziv “gustina verovatnoće” za f(x), navešćemo sledeću analogiju. Zamislimo žicu dužine L čija je masa jednaka m = 1 kg i ima promenljivu linijsku gustinu ρ(x) (kg/m)

∞<<∨<<−∞≤≤=∆

∆=ρ →∆

)()0(0

0lim)( 0

xLx

Lxdx

dm

x

mx x

Masu žice dobijamo kao integral

∫∫ ∞

∞−

=ρ=ρ= 1)()(0

dxxdxxmL

i očigledna je analogija između f(x) i gustine ρ(x).

Page 40: Osnovi inzenjerske statistike

39

Primer 2.2 Slučajna promenljiva X ima gustinu raspodele:

π≤≤π−=

x

xxaxf

vrednosti ostale sve za022

zacos)(

a) Naći konstantu a i funkciju raspodele.

b) Kolika je verovatnoća da X bude manje od π

6?

c) Kolika je verovatnoća

π≤<4

0 XP ?

d) Odrediti verovatnoću

π>4

XP .

Rešenje

a) Konstantu a ćemo naći iz uslova (2.11)

2

112sin

0cos0)(

2/

2/

2/

2/

2/

2/

=⇒===

++=

π

π−

π

π

π−

π−

∞−

∞−

∫∫∫∫aaxa

dxdxxadxdxxf

Grafik gustine f(x) i funkcije raspodele F(x)

Funkciju raspodele nalazimo iz (2.10). Ona je, zbog ograničene oblasti mogućih vrednosti slučajne promenljive X, definisana sa 3 izraza (vidi sliku uz primer):

,2π−<x

( ) ( ) 00 === ∫∫∞−∞−

dtdttfxFxx

Page 41: Osnovi inzenjerske statistike

40

,22 π≤≤π− x

( ) ( ) ( ) ( )

2

sin1sin

2

1cos0

22

2

2

xtdtta

dttfdttfdttfxF

xx

xx

+==+=

+==

π−π−

π−

π−

∞−∞−

∫∫∫∫

2π>x ,

( ) ( ) ( ) ( ) ( ) 10102

2

2

2

=++=++== ∫∫∫∫π

π

π−

π−

∞−∞−

dttfdttfdttfdttfxFxx

Dakle,

( )

π>π≤<π−+

π−≤=

21

222

sin120

x

xx

x

xF

b)

4

3

26

sin1

66=

π+=

π=

π< FXP odnosno

4

3sin

2

1

cos2

10)(

66/

2/

6/

2/

2/6/)10.2(

==

+==

π<π

π−

π

π−

π−

∞−

π

∞−

∫∫∫x

dxxdxdxxfXP

c)

4

2

2

0sin1

24

sin1)0(

440 =+−

π+=−

π=

π≤< FFXP odnosno

354.04

2sin

2

1)(

40

4/

0

4/

0

)9.2( ≈===

π≤<π

π∫ xdxxfXP

d)

4

22

24

sin11

41

41

4

−=π+

−=

π−=

π≤−=

π> FXPXP odnosno

Page 42: Osnovi inzenjerske statistike

41

146.04

22sin

2

11

cos2

11

44/

2/

4/

2/

≈−=−=

−=

π>π

π−

π

π−

∫x

xdxXP

ili

∫∫ π

π

π

π

π

−====

π>2/

4/

2/

4/4/ 4

22sin

2

1cos

2

1)(

4|xxdxdxxfXP

Vrednost slučajne promenljive, u kojoj gustina njene raspodele ima maksimum zove se najverovatnija vrednost ili moda. Kako treba razumeti pojam najverovatnije vrednosti neke neprekidne slučajne veličine? Verovatnoća da neprekidna slučajna veličina uzme najverovatniju vrednost jednaka je nuli (kao što je verovatnoća bilo koje određene vrednosti jednaka nuli). Zato ima smisla govoriti o intervalu oko najverovatnije vrednosti i može se reći da je najverovatnije da će se vrednosti slučajne promenljive grupisati oko te tzv. najverovatnije vrednosti.

Raspodela slu čajnih grešaka merenja

Mada su zakoni fizike egzaktni, instrumenti ne daju egzaktne (tačne) vrednosti merene fizičke veličine (dužina, masa, temperatura itd.). Razlika između izmerene i tačne vrednosti neke fizičke veličine, naziva se greška merenja. I u slučaju kada se otklone sistematske i grube greške (Pogl.5.1), preostaju neizbežne greške, koje zovemo slučajne greške merenja. One su rezultat delovanja velikog broja činioca, koji imaju slučajan karakter :

• male, nekontrolisane promene fizičkih uslova u kojima se izvodi merenje (napr. uticaj atmosfere)

• nepreciznost instrumenta • nepreciznosti onog koji izvodi merenja (subjektivni slučajni faktor)

Teorijski model raspodele verovatnoće slučajnih grešaka merenja, ili kraće raspodele slučajnih grešaka je Gausova ili normalna raspodela (Pogl. 2.8). Nju je teorijskiski izveo Laplas (Laplace), 1783 godine, a Gaus (Gauss) kasnije dokazao. Gustina raspodele slučajnih grešaka, X (Gausova raspodela) je:

2

2

2

1)(

−=

σ

πσ

x

exf (2.12)

Parametar raspodele σ se naziva standardno odstupanje (Pogl.2.4). Gustina raspodele greške je simetrična u odnosu na y - osu (parna funkcija), ima zvonast oblik, sa maksimumom u nuli i prevojnim tačkama x = ± σ. “Spljoštenost” zvona, odnosno “razvučenost” raspodele je utoliko veća ukoliko je standardno odstupanje σ veće (Sl. 2.8)

Page 43: Osnovi inzenjerske statistike

42

Slika 2.8 – Rapodela slučajnih grešaka merenja

Najverovatnija vrednost slučajne greške merenja je nula. Dakle, slučajne greške ponovljenih merenja neke fizičke veličine grupišu se oko nule i to uz približno jednak broj negativnih i pozitivnih grešaka. Naime, za gustinu raspodele, zbog simetričnosti ( ( ) ( )xfxf −= ), važi:

∫∫ ∞

∞−

=

0

0

)()( dxxfdxxf

Zaista,

∫∫∫∫∫ ∞∞

∞∞

−=

∞−

==−=−−=

00

00)(0

)()()())(()( dxxfdttfdttfdttfdxxfxt

Iz (2.9) i (2.11) onda sledi:

2

1)0()0( =∞<<=<<−∞ XPXP

odnosno,verovatnoća da slučajna greška merenja bude pozitivna, jednaka je verovatnoći da bude negativna. Drugim rečima, u nekom broju ponovljenih merenja, približno pola od njih će dati veće vrednosti merene veličine od tačne, a druga polovina će “podbacivati”.

Standardno odstupanje σ, odnosno razvučenost raspodele u vezi je sa stepenom rasipanja slučajnih grešaka oko nule, odnosno sa preciznošću merenja. Ukoliko je standardno odstupanje veće, utoliko su verovatnije veće greške po apsolutnoj vrednosti, tj. utoliko je veće rasipanje grešaka. To znači veće rasipanje rezultata merenja oko tačne vrednosti merene veličine i kažemo da je merenje manje precizno, odnosno instrument manje precizan. Zaista, poredeći šrafirane površine na Sl.2.8, vidimo da je verovatnoća da greške upadnu u neki interval čiji je centar bliži nuli veća, ako je razvučenost raspodele manja, odnosno standardno odstupanje manje. S druge strane, verovatnoća da greška padne u neki interval čiji je centar udaljeniji od nule (veće rasipanje) je veća ako je razvučenost veća, odnosno σ veće.

Page 44: Osnovi inzenjerske statistike

43

Raspodela brzina molekula gasa

Zbog neprestanog sudaranja velikog broja molekula u masi gasa, nije moguće tačno odrediti brzine pojedinih molekula. Dakle, brzina molekula gasa je slučajna veličina i predmet istraživanja u molekularnoj fizici je funkcija raspodele verovatnoće za brzine molekula u masi gasa. Gustinu raspodele brzina jednoatomnog idealnog gasa definisao je 1860 g. Maksvel (Maxwell). Maksvelova gustina raspodele intenziteta brzina molekula gasa (Sl.2.9) glasi:

( ) 0,4 2

3

2

≥π

=

−vve

uvf u

v

(2.13)

gde je

m

kTu

2= (2.13a)

v - intenzitet brzine molekula gasa (m/s)

m - masa molekula (kg)

T - apsolutna temperatura gasa (K)

k - Bolcmanova (Boltzmann) konstanta, 1.380658×10-23 (J/K)

Element verovatnoće f(v)dv predstavlja udeo u ukupnom broju molekula gasa n, onih molekula čija se brzina kreće u intervalu (v, v+dv).

dvvfn

dn)(=

To sledi iz statističke definicije verovatnoće: verovatnoća da neki molekul ima brzinu u intervalu (v, v+dv) jednaka je količniku broja molekula čija je brzina u datom intervalu dn i ukupnog broja molekula n.

Slika 2.9 Maksvelova raspodela brzina molekula

Korisno je odrediti modu raspodele, odnosno najverovatniju brzinu molekula vm. Nalazimo je iz uslova maksimuma gustine raspodele:

Page 45: Osnovi inzenjerske statistike

44

018

88)(

2

3

5

3

3

2

22

=

−π=π−π=

u

ve

u

v

eu

ve

u

v

dv

vdf

u

v

u

v

u

v

Dakle,

m

kTuvm

2== (2.14)

Za razliku od Gausove, Maksvelova raspodela nije simetrična, odnosno površina sa desne strane mode vm je uvek veća od površine sa leve strane. To znači da je na datoj temperaturi u gasu veći broj molekula sa brzinom većom od vm nego onih čija je brzina manja od vm. Kao što se sa Sl. 2.9 vidi, sa povećanjem temperature, a to znači sa povećanjem parametra u (2.14), maksimum krive brzine se pomera ka većim brzinama, i istovremeno povećava razvučenost raspodele. Povećanje razvučenosti raspodele, kao što smo se na primeru slučajnih grešaka uverili, znači porast verovatnoće većih vrednosti slučajne promenljive. Drugim rečima, broj molekula sa većim brzinama je utoliko veći ukoliko je temperatura gasa veća, što je u skladu sa fizičkim značenjem temperature.

Raspodela vremena ispravnog rada tehni čkog ure đaja

Vreme ispravnog rada, T nekog tehničkog uređaja ili elementa uređaja je slučajna veličina. To je momenat u kome se desi kvar, računato od momenta startovanja uređaja. Iskustvo je pokazalo da verovatnoća da je uređaj i nakon nekog vremena t od početka rada i dalje ispravan opada eksponencijalno sa t. Drugim rečima, udeo uređaja u odnosu na ukupan broj uređaja istog tipa, koji su u momentu t i dalje u radu, eksponencijalno opada sa t počev od jedinice za t = 0 (u startu su svi uređaji ispravni), asimptotski se približavajući nuli (nakon dugog perioda rada, praktično svi uređaji će se pokvariti). U pitanju je verovatnoća da je vreme ispravnog rada veće od t (u periodu vremenu t nije došlo do kvara). Tako, imajući u vidu i da je verovatnoća jedne određene vrednosti neprekidne slučajne promenljive jednaka nuli, imamo:

( ) ( ) ( ) 0, ≥=≥=>= λ− tetTPtTPtR t (2.15)

Funkcija R(t), koja daje verovatnoću da posmatrani uređaj neće otkazati za vreme t zove se funkcija pouzdanosti (reliability function) datog uređaja. Funkcija raspodele, po definiciji, predstavlja verovatnoću da slučajna promenljiva uzme vrednost manju od date, pa je funkcija raspodele vremena ispravnog rada uređaja:

( ) ( ) ( ) 0,11 ≥−=−=<= λ− tetRtTPtF t

Imajući u vidu da je po definiciji funkcija raspodele definisana na celom intervalu (-∞, ∞) važi izraz

Page 46: Osnovi inzenjerske statistike

45

( )

≥−<= λ− 0 za1

0 za0

te

ttF t (2.16)

gde je λ(h-1) parametar raspodele koji se u literaturi sreće pod nazivom intenzitet otkaza.

Slika 2.10 Funkcija raspodele vremena ispravnog rada

Diferenciranjem funkcije raspodele dobijamo gustinu raspodele vremena ispravnog rada uređaja:

( )

≥λ<= λ− 0 za

0 za0

te

ttf t (2.17)

Slika 2.11 Eksponencijalna raspodela

U literaturi se funkcija (2.17) naziva eksponencijalna raspodela (Sl. 2.11). Očigledno je da se “razvučenost” raspodele povećava sa opadanjem intenziteta otkaza λ, a to znači da se povećava udeo uređaja u ukupnom broju uređaja istog tipa, koji imaju duže vreme ispravnog rada.

Primer 2.3 Vreme ispravnog rada nekog uređaja ima eksponencijalnu raspodelu (2.17), sa intenzitetom otkaza λ = 0.001dan-1. Kolika je verovatnoća da će a) uređaj ispravno raditi 180 dana ? b) do otkaza doći u toku 365 dana ?

Rešenje

a) Tražimo verovatnoću da je vreme ispravnog rada bar 180 dana:

Page 47: Osnovi inzenjerske statistike

46

( ) ( ) 835.0180180 18.0180 ≈===> −λ− eeRTP

b) Verovatnoću da je T manje od 365 dobijamo kao vrednost funkcije raspodele:

( ) ( ) 306.01365365 365 ≈−==< λ−eFTP

2.3 SREDNJA VREDNOST SLUČAJNE PROMENLJIVE

Raspodela verovatnoće slučajne promenljive sadrži sve informacije o posmatranoj promenljivoj. Iz nje je korisno izvući neke opšte odlike u vidu brojnih (numeričkih) parametara koji karakterišu bitne crte raspodele. Te sumarne ili numeričke karakteristike raspodele se mogu podeliti na:

• parametre koji reprezentuju vrednosti slučajne promenljive - pokazatelje centra vrednosti

• parametre koji predstavljaju pokazatelje rasipanja mogućih vrednosti oko reprezentativne vrednosti (centra).

Najvažnija numerička karakteristika koja ukazuje na centar vrednosti slučajne veličine, odnosno na izvestan način reprezentuje sve moguće njene vrednosti, naziva se srednja vrednost (mean value) ili očekivana vrednost (expected value) slučajne promenljive ili matematičko očekivanje. Srednja vrednost slučajne promenljive X, koju ćemo označavati sa M(X) ili kraće sa µx definisana je kao:

=µ=∫∑∞

∞−

=

)(upromenljivneprekidnuza)(

)(upromenljivdiskretnuza

)(1

bdxxxf

apx

XM

n

iii

x (2.18)

Do jednačine (2.18b) možemo da dođemo polazeći od (2.18a), ako zamislimo da diskretna slučajna promenljiva prelazi u neprekidnu. Tada verovatnoće pi zamenjujemo elementima verovatnoće ii dxxf )( , a suma prelazi u integral.

Srednja vrednost je u vezi sa prosečnom vrednošću ili aritmeti čkom sredinom, koju računamo pri statističkoj obradi rezultata merenja neke fizičke veličine. Da bi smo dobili što pouzdaniju procenu tačne vrednosti neke fizičke veličine, izvodimo ponovljena merenja pod istim uslovima. Za reprezentativnu vrednost (onu koju smatramo da predstavlja traženu veličinu) uzimamo sumu svih izmerenih vrednosti, podeljenu sa ukupnim brojem merenja, N tj. aritmetičku sredinu. Pretpostavimo da smo u N merenja, m1 puta dobili vrednost x1, m2 puta vrednost x2, ,..., mn puta vrednost xn,. Prema datoj definiciji, aritmetička sredina izmerenih vrednosti, x će biti:

nnn mmmN

N

xmxmxmx

++=+++

= 212211 ,

odnosno,

nn x

N

mx

N

mx

N

mx +++= 2

21

1

Page 48: Osnovi inzenjerske statistike

47

Ako je broj ponovljenih merenja dovoljno veliki, količnici Nmi , i = 1,...,n se

približavaju verovatnoćama pojedinih vrednosti,

( ) iii pxXP

N

m==≈

a aritmetička sredina se približava srednjoj vrednosti (2.18a). Dakle aritmetičku sredinu možemo da smatramo procenom srednje vrednosti iz raspoloživih vrednosti slučajne promenljive. Osobine srednje vrednosti

Navešćemo sledeće osobine srednje vrednosti:

• Srednja vrednost konstante c jednaka je samoj konstanti:

M(c) =c (2.19)

• Srednja vrednost linearne kombinacije više slučajnih promenljivih jednaka je linearnoj kombinaciji njihovih srednjih vrednosti:

)(...)()()...( 22112211 nnnn XMcXMcXMcXcXcXcM +++=+++ (2.20)

• Iz (2.19) i (2.20) sledi posebno,

M(cX) = cM(X) (2.21)

M(X + Y) = M(X) + M(Y) (2.22)

• Ako je raspodela simetrična u odnosu na pravu x = a, odnosno ako je (kod neprekidne slučajne promenljive):

( ) ( )xafxaf +=−

za bilo koju realnu vrednost x, srednja vrednost je jednaka a:

( ) aXM = (2.23)

Primer 2.4 Dokazati osobine (2.19) i (2.21).

Rešenje

Ako je u pitanju konstanta c, to znači da ona uzima tu jednu jedinu vrednost c sa verovatnoćom p = 1. Iz (2.18a) dobijamo,

M(c) = x1p1 = c⋅1 = c

Ako diskretna slučajna promenljiva X uzima vrednosti x1, x2 ,..., xn, sa verovatnoćama p1, p2 ,..., pn redom, tada očigledno slučajna promenljiva cX uzima vrednosti cx1, cx2, ..., cxn sa istim verovatnoćama. Tako (2.18a) daje:

( ) ( ) ( ) )()( 2211 XcMpxcpcxpcxpcxcXM iinn ==+++= ∑

Analogno, ako je gustina verovatnoće neprekidne slučajne promenljive X jednaka f(x), istu gustinu verovatnoće ima i promenljiva cX, pa (2.18b) daje:

Page 49: Osnovi inzenjerske statistike

48

( ) )()()()( xcMdxxxfcdxxfcxcXM === ∫∫ ∞

∞−

∞−

Primer 2.5 Zadata je raspodela diskontinualne slučajne promenljive:

a) Izračunati verovatnoće P(X < 4) i P(X ≤ 4).

b) Izračunati srednju vrednost slučajne promenljive.

c) Izračunati srednju vrednost slučajne promenljive 2X - 3.

Rešenje

a)

P(X < 4) = F(4) = P(2) + P (3) = 7/30

P (X ≤ 4) = F(5) = P (2) + P (3) + P (4) = 15/30

b)

5.430

135

30

27

30

56

30

85

30

84

30

53

30

22 ==+++++=µx

Primetimo da srednja vrednost diskontinualne slučajne promenljive, koja u nekom smislu, reprezentuje slučajnu promenljivu može da bude različita od bilo koje njene moguće vrednosti. Tako, u ovom primeru, slučajna promenljiva ne može imati vrednost 4.5.

U posmatranom primeru, srednja vrednost je smeštena tačno na sredini intervala kome pripadaju moguće vrednosti slučajne promenljive, što je posledica simetričnosti zakona raspodele (vidi 2.23). Dalje je:

5.0)5()5()5.4()( ==<=≤=µ≤ FXPXPXP x

Uopšte, za sve simetrične raspodele važi:

5.0)(1)( =µ>−=µ≤ xx XPXP

c) Prema (2.20):

63)(2)3()(2)32( =−=−=− XMMXMXM

Primer 2.6 Ako promenljiva ima eksponencijalnu raspodelu (2.17), odrediti

a) njenu očekivanu vrednost; b) očekivano vreme ispravnog rada uređaja iz Primera 2.3; c) verovatnoću da posmatrani uređaj neće otkazati u toku očekivanog vremena ispravnog rada.

x 2 3 4 5 6 7 p(x) 2/30 5/30 8/30 8/30 5/30 2/30

Page 50: Osnovi inzenjerske statistike

49

Rešenje

a) Primenjujemo formulu (2.18b),

( ) ( ) ( ) ( ) ∫∫∫∫ ∞λ−

∞−

∞−

+=+==00

0

0 dtteλdtttfdtttfdtttfTM t

Vrednost nesvojstvenog integrala dobijamo metodom parcijalne integracije

dtedvtu tλ−== ,

∫ λ−λ−

λ−== tt edtev

1

tt

tt

eλλ

tedte

λλte

vduuv λ−λ−

λ−λ−

−−=+−=− ∫∫ 2

11

∞λ−

λ−∞λ−

−−=∫

0

20

1 tt

t eλλ

tedtte

Imajući u vidu:

0limlim ==λ−

∞→λ−

∞→t

t

t

ttee

za integral dobijamo konačno:

2

0

20

11

λe

λλte

dtte tt

t =

−−=

∞λ−

λ−∞λ−∫

a za traženu srednju vrednost,

( )λ

= 1TM

b) ( ) dana1000001.0/11 ==λ=TM

c) U pitanju je verovatnoća ( )( )TMTP > , a to je odgovarajuća vrednost funkcije pouzdanosti uređaja (2.18):

( )( ) ≈=> −1eTMTP 0.368

Za razliku od simetrične raspodele (raspodela slučajnih grešaka npr.), gde je verovatnoća da vrednost slučajne promenljive bude veća od srednje vrednosti jednaka 0.5, u ovom slučaju ona je manja od 0.5 zbog asimetričnosti raspodele.

Srednja vrednost funkcije slu čajne promenljive

Ako je Y = ϕ(X) funkcija slučajne promenljive X, verovatnoća da ona uzme vrednost ϕ(x), tačno je jednaka verovatnoći da slučajna promenljiva X uzme vrednost x:

( )[ ] ( )xXPxYP ==ϕ=

Page 51: Osnovi inzenjerske statistike

50

Tako je srednja vrednost funkcije slučajne promenljive, u skladu sa (2.18 a,b), jednaka

( )[ ]( )( )

ϕ

ϕ=µ=ϕ=∫∑∞

∞−

=

)(upromenljiv neprekidnu za)(

)(upromenljivdiskretnuza

)(1

bdxxfx

apx

XMYM

n

iii

y (2.23)

Tačna i očekivana vrednost merene fizi čke veli čine

Rezultat merenja X predstavlja, pod uslovom da ne postoje sistematske i grube greške, zbir tačne vrednosti posmatrane veličine, x* i slučajne greške ∆X:

XxX ∆+= * (2.24)

pa i sam predstavlja slučajnu veličinu. Šta je, onda, srednja ili očekivana vrednost rezultata merenja? Prema (2.22) i (2.19), uzimajući u obzir da je x* konstanta za dato merenje:

( ) ( ) ( ) ( ) ( )XMxXMxMXxMXM ∆+=∆+=∆+= *** (2.25)

Budući da je raspodela slučajnih grešaka simetrična oko nule, uzimajući u obzir (2.23) zaključujemo,

• očekivana vrednost slučajne greške merenja jednaka je nuli tj. 0)( =∆XM

• očekivana vrednost (srednja vrednost) rezultata merenja jednaka je tačnoj vrednosti merene veličine tj. *)( xXM x =µ=

Srednje vrednosti brzine i kineti čke energije molekula gasa

U kinetičkoj teoriji gasova, značajnu primenu imaju srednja brzina i srednja kinetička energija molekula gasa. Ako imamo u vidu da je gustina raspodele f(v) definisana na celom intervalu -∞ < x < ∞ kao:

( )

≥π

<=

0 za4

0 za0

2

3

2

v veu

v

vf u

v

primenom formule (2.18b) dobijamo:

( ) ( ) ∫∫ ∞

−∞

∞− π==

0

3

3

2

4dvve

udvvvfVM u

v

Page 52: Osnovi inzenjerske statistike

51

Metodom parcijalne integracije, za vrednost integrala dobijamo:

2

4

0

3

2

udvve u

v

=∫∞

što za srednju brzinu, uz izraz za u (2.13a) daje poznatu formulu u kinetičkoj teoriji gasova:

( )m

kTuVMv π=

π==µ 82

Kinetička energija molekula gasa je funkcija njegove brzine:

2

2

1mVEk =

pa njenu srednju vrednost dobijamo kao srednju vrednost funkcije slučajne veličine V (2.23b)

( ) ∫∫ ∞

−∞

∞− π==

=0

4

3

22

2

2

22

1)( dvve

u

mdvvf

mvmVMEM u

v

k

Vrednost integrala se može dobiti [Hadžić O., Đ. Takači, 2000.] dvostrukom parcijalnom integracijom i primenom poznatog rezultata iz matematičke analize

∫∞ − π=

0 2

2

dxe x

Tako je:

5

0

4

8

32

udvve u

v

π=∫∞

Smenom ovog izraza u jednačinu za srednju vrednost M(Ek) dobijamo poznati izraz:

kTEM k 2

3)( =

2.4. DISPERZIJA, STANDARDNO ODSTUPANJE I

KOEFICIJENT VARIJACIJE

Srednja vrednost je najvažnija numerička karakteristika raspodele slučajne

promenljive. Ipak ona nije dovoljna za sagledavanje bitnih karakteristika slučajne promenljive. Ako dve slučajne promenljive imaju istu srednju vrednost, vrednosti jedne od njih mogu da se više “rasipaju” oko srednje vrednosti nego vrednosti druge. Na primer, nije svejedno da li se slučajne greške merenja manje ili više rasipaju oko nulte vrednosti, odnosno da li se izmerena vrednost manje ili više razlikuje od tačne. Najšire

Page 53: Osnovi inzenjerske statistike

52

prihvaćeni pokazatelj rasipanja vrednosti slučajne promenljive oko njene srednje vrednosti je disperzija. Disperzija D(X) predstavlja srednju vrednost kvadrata odstupanja 22 )())(( xXXMX µ−=−

])[()( 2xXMXD µ−= (2.24)

Pozitivna vrednost korena disperzije zove se standardno odstupanje (standard deviation) σx:

)(XDx =σ (2.25)

Pošto standardno odstupanje ima iste dimenzije kao slučajna promenljiva X, ono je pogodnije kao pokazatelj odstupanja vrednosti X od srednje vrednosti nego disperzija. U skladu sa definicijom, disperzija se određuje kao:

µ−

µ−==σ∫∑∞

∞−

=

)(upromenljivneprekidnuza)()(

)(upromenljivdiskretnuza)(

)(2

1

2

2

bdxxfx

apx

XD

x

n

iixi

x (2.26)

Izvešćemo iz (2.24) prakti čniju formulu za izračunavanje disperzije:

22222 )(2)(]2[])[()( xxxxx XMXMXXMXMXD µµµµµ +−=+−=−=

22)()( xXMXD µ−= (2.27)

Osnovne osobine disperzije su:

• Disperzija konstante jednaka je nuli:

D(c) = 0 (2.28)

• Disperzija zbira konstante i slučajne promenljive X jednaka je disperziji za X:

D(X + c) = D(X) (2.29)

• Disperzija proizvoda konstante i slučajne promenljive X jednaka je proizvodu kvadrata konstante i disperzije X:

D(cX) = c2D(X) (2.30)

Primer 2.7 Dokazati osobinu (2.30) disperzije.

Rešenje

[ ] )()()(

]))([(]))([()(22222

22

XDcXMcXcM

XcMcXMcXMcXMcXD

xx =µ−=µ−=−=−=

Page 54: Osnovi inzenjerske statistike

53

Primer 2.8 Izračunati disperziju slučajne promenljive X iz primera 2.5. kao i slučajne promenljive 2X - 3.

Rešenje

Pogodno je koristiti formulu (2.27):

30

659

30

249

30

536

30

825

30

816

30

59

30

24

)( 22

=⋅+⋅+⋅+⋅+⋅+⋅=

=∑ ii pxXM

60

103

30

135

30

659)()(

222 =

−=µ−= xXMXD

Dalje, primena osobina (2.29-30) daje:

87.615

103)(2)32( 2

≈==− XDXD

Često se kao relativna mera rasipanja slučajne promenljive oko njene srednje vrednosti koristi koeficijent varijacije koji predstavlja odnos standardnog odstupanja i srednje vrednosti

x

xx µ

σ=δ (2.31)

Naravno, kada je srednja vrednost jednaka nuli (npr. za slučajnu grešku meranje) tada koeficijent varijacije nije definisan. Pri korišćenju koeficijenta varijacije, treba biti obazriv ako je srednja vrednost neke slučajne promenljive bliska nuli jer je tada on jako osetljiv na promene standardnog odstupanja.

Disperzija slu čajne greške merenja

Za disperziju slučajne greške merenja (2.12) se primenom (2.26b) dobija:

222

2

2

2)( σ=

πσ=σ= ∫∞

∞−

σ−

dxex

XDx

x

koristeći metod parcijalne integracije i poznati rezultat iz matematičke analize:

∫∞∞− − π=dxe x2

Dakle, parametar σ u normalnom zakonu raspodele (2.12) predstavlja upravo standardno odstupanje σx. Tako, standardno odstupanje ovde ima značenje pokazatelja greške neke merne metode ili mernog instrumenta. Kao maksimalna vrednost slučajne greške merenja može se usvojiti trostruka vrednost standardnog odstupanja (tzv. “pravilo tri sigme”). Naime u Pogl. 2.8 ćemo pokazati da je verovatnoća da apsolutna vrednost slučajne greške prekorači granicu od 3σ vrlo mala,

Page 55: Osnovi inzenjerske statistike

54

( ) 0026.03 ≈σ>XP

Standardizovana slučajna promenljiva

Ako je X slučajna promenljiva sa srednjom vrednošću µx i standardnim odstupanjem σx, slučajna veličina

x

xXZ

σµ−= (2.32)

se naziva standardizovana ili normirana slučajna promenljiva. Ona nema dimenzija, a iz osobina srednje vrednosti i disperzije izvodimo:

1,0 =σ=µ zz (2.33)

Normalizovana slučajna promenljiva ima nultu srednju vrednost i jediničnu disperziju.

2.5 MOMENTI SLU ČAJNE PROMENLJIVE

Srednja vrednost i disperzija predstavljaju specijalne slučajeve parametara koji se nazivaju momenti. Pod centralnim momentom k-tog reda slučajne promenljive X podrazumeva se očekivana vrednost:

])[( kxk XM µν −= (2.34)

Početni moment reda k se definiše kao očekivana vrednost:

)( kk XMm = (2.35)

Jasno je da je srednja vrednost µx početni moment prvog reda, a da je disperzija σx2

centralni moment drugog reda:

µx = m1, σx2 = ν2

Koeficijenti asimetrije i spljoštenosti

Koeficijent asimetrije slučajne promenljive X je numerička karakteristika koja daje informaciju o stepenu asimetričnosti njene raspodele. Definisan je kao količnik centralnog momenta trećeg reda i standardnog odstupanja:

33

1 σν=γ (2.36a)

Page 56: Osnovi inzenjerske statistike

55

Koeficijent asimetrije (skewness) γ1 je bezdimenzioni parametar koji je jednak nuli za simetričnu raspodelu (ν3 = 0), a njegova negativna ili pozitivna vrednost ukazuje da je raspodela asimetrična (Sl. 2.12a).

x

f(x)

γ1 > 0 γ1 = 0

γ1 < 0

2.12a. Gustine raspodele sa različitim koeficijentima asimetrije

Koeficijent spljoštenosti (kurtosis) se definiše kao

344

2 −σν=γ (2.36b)

i za datu slučajnu promenljivu pokazuje stepen spljoštenosti njene raspodele koji je jednak nuli za normalnu raspodelu. Tako se ovaj koeficijent može posmatrati kao mera odstupanja od normalne raspodele po visini - krive gustine sa oštrijim vrhom imaju pozitivan koeficijent spljoštenosti a spljoštenije krive imaju negativan koeficijent spljoštenosti (Sl. 2.12b)

x

f(x)

γ2 = 0

γ2 > 0

γ2 < 0

2.12b. Gustine raspodele sa različitim koeficijentima spljoštenosti

2.6 BINOMNA RASPODELA

Page 57: Osnovi inzenjerske statistike

56

Ova diskretna raspodela ima veliku primenu u kontroli kvaliteta proizvoda (pogl

10.2 ) Posmatrajmo niz nezavisnih eksperimenata (u literaturi poznat kao Bernulijeva šema) tj. za svaki od njih važi da je njegov ishod nezavisan od ishoda ostalih opita. Neka je za svaki od eksperimenata vezan događaj A i neka je verovatnoća njegovog nastupanja jednaka p, P(A) = p. Binomni zakon daje verovatnoću da će se u n eksperimenata ili proba posmatrani događaj A dogoditi x puta. Dakle, broj nastupanja događaja A u n proba je slučajna veličina X, koja ima binomnu raspodelu verovatnoće.

Uzmimo sledeći primer. Zamislimo da iz torbe sa veoma velikim brojem kuglica, od kojih je 10% crvenih, izvlačimo 5 kuglica. Ako je broj kuglica mnogo veći od 5, neće biti značajno da li kuglice nakon izvlačenja vraćamo u torbu (da bi izvlačenja bila nezavisna) ili ne. Kolika je verovatnoća da će od pet izvučenih kuglica dve biti crvene? Ovde je događaj A izvlačenje crvene kuglice u bilo kom izvlačenju i njegova verovatnoća je konstantna i jednaka:

10

1)( == pAP

Označimo verovatnoću suprotnog događaja A (nije izvučena crvena kuglica) sa q, q = 1 - p. Treba nam verovatnoća da će u 5 ponovljenih eksperimenata (n = 5), događaj A nastupiti dva puta (x = 2), odnosno verovatnoća događaja B: od pet izvučenih kuglica dve su crvene. Događaj B se može realizovati na 10 različitih i međusobno isključivih načina, pa predstavlja zbir 10 nesaglasnih događaja definisanih u prvoj koloni tabele. Pošto je verovatnoća svakog od njih, budući da je u pitanju proizvod nezavisnih događaja, jednaka p2q3 (dva puta događaj A i tri puta događaj A ) imamo:

p(B) = 10p2q3 ≈ 0.0729

Faktor 10 možemo dobiti kao broj načina da iz skupa od 5 elementa (izvlačenja: 1, 2, 3, 4, 5.) izaberemo 2 (ona izvlačenja u kojima je dobijena crvena kuglica), dakle kao broj kombinacija druge klase od 5 elementa.

Tabela uz Primer izvlačenja 5 kuglica

Događaj Izvlačenja u kojima se

događaj A realizovao Komentar

A AA A A 1,2 Crvene kuglice u prva dva izvlačenja

A A A A A 1,3 Crvene kuglice u 1. i 3. izvlačenju

A A A A A 1,4

A A A A A 1,5

A A AA A 2,3

A A A A A 2,4

A A A A A 2,5

A A A AA 3,4

A A A A A 3,5

A A A A A 4,5

Kombinacije su date u drugoj koloni tabele.

Page 58: Osnovi inzenjerske statistike

57

Možemo sada da izvedemo binomni zakon. Tražimo verovatnoću, b(x,n,p) da u n opita posmatrani događaj A nastupi x puta. Verovatnoća svakog od događaja u kome je A u n proba nastupio x puta je:

pxqn - x

a ukupan broj takvih, međusobno isključivih događaja jednak je broju kombinacija klase x od n elemenata. Tako je,

nxqpx

npnxbxXP xnx ,...,2,1,0,),,()( =

=== − (2.37)

Za slučajnu promenljivu, čiji je zakon raspodele dat jednačinom (2.37), kažemo da je raspodeljena po binomnom zakonu.

Naziv “binomni” potiče od toga što je

nxqpx

n xnx ,...,2,1,0, =

(x + 1) - vi član u razvoju binoma (p + q)n po binomnoj formuli :

∑=

=+ n

x

xnxn qpx

nqp

0

)(

Kako je p + q = 1, imamo:

1),,(00

=

=∑∑

=

=

n

x

xnxn

x

qpx

npnxb

tj. ispunjen je uslov (2.1b). Podsetimo se da za binomne koeficijente važi:

−=

kn

n

k

n (2.38a)

10

=

=

n

nn (2.38b)

nn

nn =

−=

11 (2.38c)

Primer 2.9 Neka mašina proizvodi 1000 komponenata/h i tokom dužeg perioda svakih 30 minuta je uzimano po 10 uzoraka radi kontrole. Tako je uočeno da je procenat škarta 20%. Kolika je verovatnoća da u slučajnom uzorku od 6 komponenata: a) bude 4 neispravna b) ne bude više od 3 neispravna c) ne bude nijedan neispravan Rešenje

Prepoznajemo binomni model (2.37). Događaj A je dobijanje neispravne komponente, a njegova verovatnoća, dobijena empirijski, je

Page 59: Osnovi inzenjerske statistike

58

5

41,5/1

100

20=−=== pqp

Broj opita, n = 6. Dati su tabela i poligon raspodele.

xi 0 1 2 3 4 5 6 pi 0.2621 0.3932 0.2458 0.0819 0.0154 1.54×10-3 6.4×10-5

0 1 2 3 4 5 6

0.0

0.1

0.2

0.3

0.4

p

x

a) ( ) 0154.0312548

54

51

!2!4!6

4

6)

51

,6,4(424

24 ≈=

=

=== qpbXP

b) U pitanju je zbir događaja:

( )983.0

3125

307220156

3

6

2

6

1

6

0

6),6,(3

334256

33425603

0

≈=+++=

=

+

+

+

==≤ ∑=

qpqppqq

qpqppqqppxbXPx

c) Znači da je x = 0 pa imamo

( ) 262.0156254096

0

6),6,0(0 66 ≈==

=== qqpbXP

Primer 2.10 Paketi hrane se pune automatski i udeo paketa, čija je težina ispod nominalne, u veoma velikom uzorku je p. Uzorak od n paketa je uzet slučajno. a) Koji zakon raspodele ima slučajna veličina - broj defektnih paketa u posmatranom uzorku? b) Kolika je verovatnoća da je više od 1 paketa u uzorku defektno, ako je p = 2%, a veličina uzorka n = 100?

Page 60: Osnovi inzenjerske statistike

59

Rešenje a) Binomna raspodela: b(x, n, p)

b) U pitanju je događaj suprotan događaju da je najviše 1 paket defektan:

( ) [ ] [ ] 597.01),,1(),,0(11 1 ≈+−=+−=> −nn npqqpnbpnbXP

Srednja vrednost i disperzija Srednju vrednost slučajne promenljive sa binomnom raspodelom računamo kao:

∑∑∑=

=

=

=

===µ n

x

xnxn

x

xnxn

xx qp

x

nxqp

x

nxpnxxbXM

100

),,()(

Kako je,

[ ]

−−=−−−−

−=−=

1

1

)!1(!)1(1

)!1(

!)!(

!

x

nn

xxn

nn

xxn

nx

x

nx

dalje imamo: inin

i

xixnx

n

xx qp

i

nnpqp

x

nnp −−

=

−=−−−−

=

∑∑

−=

−−=µ )1(

1

0

)1()1(11

1

1

1

1

Prepoznajemo (n-1) – vi stepen binoma:

npqpnp nx =+=µ −1)(

Sličnim postupkom se iz definicije dobija i disperzija. Tako su srednja vrednost i disperzija slučajne promenljive sa binomnom raspodelom (parametri binomne raspodele):

npx =µ (2.39)

qnpq xx µσ ==2 (2.40)

Primer 2.11 Odrediti očekivani broj neispravnih paketa u uzorku od 100 komada ako je verovatnoća pojave neispravnog paketa p = 0.02 (Primer 2.9). Rešenje µx = np = 100⋅0.02 = 2 Primer 2.12 Detaljnom proverom kvaliteta ampula punjenih tečnošću utvrđeno je da je na 100 ampula 75 ispravnih. a) Odrediti zakon raspodele verovatnoće slučajne promenljive: broj ispravnih ampula u

slučajnom uzorku od 6 ampula. b) Odrediti očekivanu vrednost i disperziju slučajne promenljive. c) Koji broj ispravnih ampula u uzorku od 6 komada je nejverovatniji?

Page 61: Osnovi inzenjerske statistike

60

Rešenje

a) U pitanju je binomni zakon: )4

3,6,(xb ,

6,...,2,1,0,4

1

4

36)

4

3,6,()( 6 =⋅

===−

xx

xbxXP x

x

Slede tabelarni i grafički prikaz zakona raspodele:

0 1 2 3 4 5 6

0.0

0.1

0.2

0.3

0.4

p

x

b) µx = np = 4.5, D(X) = npq = 1.125

c) Najverovatniji broj ampula u uzorku je 5. Vidimo da je taj broj blizak očekivanoj vrednosti.

Najverovatnija vrednost

Kao što se iz prethodnog primera vidi, binomna raspodela ima maksimum, tj. modu. Za najverovatniju vrednost ili modu xm slučajne promenljive X, koja ima binomnu raspodelu važi:

( ) ( ) ( )pnxbpnxbpnxb mmm ,,1,,,,1 +><−

i iz tog uslova se izvodi interval u kome leži najverovatnija vrednost:

np - q ≤ xm ≤ np + p (2.41)

Primer 2.13 Automat daje 8% neispravnih komada. Proizvodi se, bez kontrole, pakuju u kutije od po 30 komada. Koliko će neispravnih komada biti najčešće u kutiji?

xi 0 1 2 3 4 5 6 pi 0.0002 0.0041 0.0330 0.1318 0.2966 0.3558 0.1779

Page 62: Osnovi inzenjerske statistike

61

Rešenje Broj neispravnih komada u kutiji ima binomnu raspodelu sa n = 30 i p = 0.08. Tražimo najverovatniju vrednost xm:

48.248.1

08.04.292.04.2

4.28.030

<<

+≤≤−

=⋅=

m

m

x

x

np

Dakle u kutiji će se najčešće naći 2 neispravna komada.

Deobom jednačine (2.41) sa n dobijamo:

n

pp

n

x

n

qp m +≤≤−

Vidimo da kada n neograničeno raste, najverovatnija vrednost relativne frekvence posmatranog događaja A se približava njegovoj verovatnoći p. Ovo je u skladu sa zakonom velikih brojeva i statističkom definicijom verovatnoće (Pogl. 1.4).

2.7 POASONOVA RASPODELA

Poasonov (Poisson) zakon raspodele se može dobiti kao granični slučaj binomnog modela, kada obim uzorka n teži beskonačnosti uz uslov da pri tom proizvod obima uzorka i verovatnoće posmatranog događaja,

µ = np

ostane ograničen. Tako se Poasonov model koristi za opisivanje verovatnoće retkih (p je malo), međusobno nezavisnih (uslov za binomni zakon) događaja kao što su:

• radioaktivni raspad nekih izotopa, tj. emitovanje radioaktivnih čestica • incidenti u dobro regulisanom saobraćaju • smetnje u telefonskom saobraćaju i prenosu podataka • greške u računarskim sistemima

Slučajna promenljiva je broj nastupanja retkog događaja u vremenskom intervalu date dužine (vidi Primer 7.11).

Izvešćemo sada Poasonov zakon polazeći od binomnog, kao njegovu granicu, kada 0, →∞→ pn , a pri tom proizvod np = µ ostaje konstantan.

)(0)(0

lim),,(lim

constnp

xnx

pnconstnpp

nqp

x

npnxb

=

→∞→=→

∞→

=

Umesto p i q zamenjujemo:

p = µ/n, q = 1 - µ/n

Page 63: Osnovi inzenjerske statistike

62

x

n

x

n

x

n

x

constn

constpn

n

nn

x

nx

n

nnx

xnnnpnxb

µ−

µ−

−−

−µ=

µ−

µ−

µ+−−=

∞→

=µ∞→

=µ→∞→

1

11

11

11!

lim

1

1

!)1()1(

lim),,(lim)()(0

Kako su,

µ−∞→

∞→

∞→

=

µ−

=

µ−

=

−−

en

n

n

x

nn

n

n

x

n

n

1lim

11lim

11

12

11

1lim …

imamo:

µ−

∞→∞→

µ=

µ−µ= exnx

pnxbxn

n

x

n !1lim

!),,(lim

S obzirom da smo n uzeli neograničeno veliko, jasno je da diskretna slučajna promenljiva X ima beskonačno mnogo vrednosti, x = 0, 1, 2,… (podskup celih brojeva). Da zaključimo da slučajna promenljiva X ima Poasonovu raspodelu ako je njen zakon raspodele

,...2,1,0,!

),(P)( =µ=µ== µ− xex

xxXPx

(2.42)

gde je µ neki pozitivan broj. Srednja vrednost i disperzija

Očekivanu vrednost i disperziju za Poasonovu raspodelu možemo dobiti kao granične vrednosti tih parametara za binomnu raspodelu, kada n → ∞, p → 0, (µ = const):

µ==−=σµ==µ

=→∞→

nppnpnp

constnppnxx )1(lim,

0

2

Dakle, srednja vrednost i disperzija slučajne promenljive X raspodeljene po Poasonovom zakonu su:

µ=σ=µ 2xx (2.43)

Page 64: Osnovi inzenjerske statistike

63

Aproksimacija binomne raspodele Poasonovom

Računanje verovatnoća je znatno obimnije kod binomne nego kod Poasonove raspodele. Za dovoljno veliko n i malo p binomna raspodela se može aproksimirati Poasonovom. Praktični kriterijum za primenljivost takve aproksimacije je [Chatfield C., 1983.]: 5,20 <=µ> npn (2.44)

Primer 2.14 Procenat škarta pri proizvodnji komponenata u nekoj fabrici je 2%. Odrediti verovatnoću da je u uzorku od 60 komponenata neispravno: a) 3 komada; b) ne više od 3; c) bar dva. Rešenje

U pitanju je binomni zakon. Pošto je n = 60 > 20 i µ = np = 60⋅0.02 = 1.2 < 5 ispunjen je uslov (2.44) i možemo rešavanje problema znatno uprostiti zamenjujući binomni zakon Poasonovim. a)

0867.0!3

2.1

!3),3(P(3))3( 2.1

33)42.2(

≈=µ=µ=== −µ− eepXP

b)

( )

9662.0)62

1(

),3(P),2(P),1(P),0(P

)3()2()1()0(3

32

≈µ+µ+µ+=

µ+µ+µ+µ=+++=≤

µ−e

ppppXP

c) ( ) ( ) [ ][ ] [ ] 3374.01),1(P),0(P1

)1()0(1212

≈µ+−=µ+µ−=+−=<−=≥

µ−µ− ee

ppXPXP

Primer 2.15 Automat daje 4% neispravnih proizvoda. Proizvodi se pakuju u kutije po 10 komada. U kom procentu kutija će se naći najviše jedan neispravan proizvod.?

Rešenje

Traženu relativnu frekvencu ω ćemo, u skladu sa statističkom definicijom verovatnoće (ω ≈ p), naći kao verovatnoću da se u slučajnom uzorku od 10 komada nađe najviše jedan defektan proizvod. U pitanju je slučajna promenljiva sa binomnom raspodelom b(x, 10, 0.04), pa imamo:

ω = P(X ≤1) = p(0) + p(1) = b(0, n, p) + b(1, n, p)

%2.949418.096.004.01096.010 910910 ==⋅⋅+=⋅⋅+=ω qpq

Pokušaćemo problem približno da rešimo aproksimirajući binomni zakon Poasonovim, mada prvi od uslova (2.44) nije ispunjen:

Page 65: Osnovi inzenjerske statistike

64

[ ] [ ] %8.939384.04.011),1(P),0(P)1()0( 4.0 ==+=µ+=µ+µ=+=ω −µ− eepp

Dobili smo ipak dobru procenu, koja se od tačne vrednosti razlikuje manje od 1%.

2.8 NORMALNA RASPODELA

Ovo je najvažnija raspodela za primene u statističkoj obradi eksperimentalnih podataka u društvenim, prirodim i tehničkim naukama. Sa njom smo se već delimično upoznali kroz diskusiju slučajnih grešaka merenja (Pogl. 2.2 i 2.4). Za neprekidnu slučajnu promenljivu X kažemo da ima normalnu ili Gausovu raspodelu sa parametrima µ i σ, što kratko označavamo sa

X : N(µ,σ)

ako je njena gustina:

0,,2

1)(

2

2

1

>σµπσ

=

σµ−− x

exf (2.45)

Srednja vrednost i disperzija

U odnosu na Gausovu krivu raspodele slučajnih grešaka (Pogl. 2.2), kriva gustine (2.45) je pomerena u desno za µ jedinica, pa je simetrična u odnosu na pravu x = µ, te u skladu sa svojstvom srednje vrednosti za simetričnu raspodelu (2.23), srednja vrednost normalno raspodeljene slučajne veličine X jednaka je parametru µ:

µ=µ= xxM )( (2.46)

Drugim rečima, slučajna promenljiva µ−= XY , ima raspodelu identičnu raspodeli slučajnih grešaka merenja (sa nultom srednjom vrednošću) i u skladu sa osobinama srednje vrednosti (2.22) i (2.19):

( ) ( ) ( ) ( ) µ=µ+=µ+= MYMYMXM

U skladu pak sa osobinom (2.29) disperzije i rezultatom (2.31):

( ) ( ) ( ) 2σ==µ+= YDYDXD

Dakle, disperzija normalno raspodeljene slučajne veličine jednaka je kvadratu parametra σ, ( ) 22 σ=σ= xXD (2.47)

Standardizovana normalna raspodela i Laplasova funk cija

Page 66: Osnovi inzenjerske statistike

65

Može se pokazati (Primer 2.22) da ako je X slučajna promenljiva sa normalnom raspodelom X:N(µ,σ), tada slučajna promenljiva Y, koja je dobijena linearnom transformacijom ,

0, ≠+= abaXY

ima takođe normalnu raspodelu. Dakle, standardizovana (2.32) normalno raspodeljena slučajna promenljiva,

σµ−= X

Z

koja ima nultu srednju vrednost i jediničnu disperziju (2.33) ima takođe normalnu raspodelu, koja se zove standardizovana normalna raspodela, Z:N(0,1) sa gustinom:

20

2

2

1)(

z

ezf−

π= (2.48)

i funkcijom raspodele,

dtezZPzFz t∫∞−

π=<= 2

0

2

2

1)()( (2.49)

Za praktične proračune potrebne su vrednosti funkcije standardizovane normalne raspodele, F0(z). Pokazaćemo da se one mogu dobiti iz Laplasove funkcije, Φ(z) definisane kao:

5.0)(2

1)( 0

0

2

2

−=π

=Φ ∫ −

zFduezz u

(2.50)

Laplasova funkcija predstavlja verovatnoću da vrednost normalizovane slučajne promenljive Z bude u intervalu (0,z):

5.0)()0()()0()( 000 −=−=<<=Φ zFFzFzZPz

Geometrijski, ona predstavlja površinu ispod krive gustine standardizovane normalne raspodele, f0(z), nad intervalom [0,z]

Page 67: Osnovi inzenjerske statistike

66

Slika 2.13 Geometrijski prikaz Laplasove funkcije

S obzirom da je standardizovana normalna raspodela simetrična, važi:

F0(-z) = 1 - F0(z)

(vidi Sl. 2.14) pa je:

( ) ( ) ( ) ( ) ( )zzFzFzFz Φ−=−=−−=−−=−Φ 000 5.05.015.0

Slika 2.14 Prikaz relacije F0(-z) = 1 - F0(z) Pokazali smo da je Laplasova funkcija, Φ(z) neparna funkcija i zato je u ona u tablicama (Prilog A, Tab. A1) data samo za pozitivne vrednosti argumenta z.

Nalaženje vrednosti funkcije raspodele F(x) neke slučajne promenljive sa normalnom raspodelom X:N(µ,σ), u okviru izračunavanja verovatnoća, svodi se na nalaženje vrednosti Laplasove funkcije Φ(z) jer je

( )zFzZPxX

PxXPXF 0)()()( =<=

σµ−<σ

µ−=<=

i uzimajući u obzir (2.50)

( ) 5.0)(0 +Φ= zzF (2.51)

Neka se na primer traži verovatnoća da vrednost normalno raspodeljene slučajne promenljive X bude u intervalu (x1, x2) . Pošto je,

( )

σµ−−

σµ−=

σµ−<<σ

µ−=<< 10

20

6.221

21 )(x

Fx

Fx

Zx

PxXxP

ako iskoristimo relaciju (2.51), traženu verovatnoću računamo iz odgovarajućih vrednosti Laplasove funkcije, nađenih u tabeli:

σµ−Φ−

σµ−Φ=<< 12

21 )(xx

xXxP (2.52)

Page 68: Osnovi inzenjerske statistike

67

Apsolutno odstupanje od srednje vrednosti (pravilo tri sigme)

Apsolutno odstupanje vrednosti slučajne promenljive od njene srednje vrednosti, X∆ je slučajna promenljiva:

µ−=−=∆ XXMXX )( (2.53)

U praktičnim problemima je često zanimljivo naći kolika je verovatnoća da apsolutno odstupanje (2.53) bude manje od zadate granice ε, odnosno da vrednost slučajne promenljive X padne u interval poluširine ε, oko srednje vrednosti ?

?)()( =ε+µ<<ε−µ=ε<∆ XPXP

Imajući u vidu ekvivalenciju,

σε<

σµ−⇔ε<µ− X

X

tražena verovatnoća je jednaka:

σε−Φ−

σεΦ=

σε<<σ

ε−=

σε<=ε<∆ ZPZPXP )(

Konačno, ako uzmemo u obzir da je Laplasova funkcija neparna:

σεΦ=ε<∆ 2)( XP (2.54)

Nameće se ideja da se kao poluširina intervala ε oko srednje vrednosti kao centra, uzme celobrojni umnožak standardnog odstupanja, σ. Dakle pitamo se kolika je verovatnoća da vrednost posmatrane slučajne veličine padne u interval

σ±µσ±µσ±µ 3,2, itd Iz formule (2.54) i odgovarajućih tabelarnih vrednosti Laplasove funkcije nalazimo:

6826.03413.02)1(2)( =⋅=Φ=σ<∆XP (2.55a)

9544.04773.02)2(2)2( =⋅=Φ=σ<∆XP (2.55b)

9974.04987.02)3(2)3( =⋅=Φ=σ<∆XP (2.55c)

Tako, na osnovu dobijenih verovatnoća možemo da zaključimo da u slučaju velikog broja ponovljenih merenja neke fizičke veličine sa normalnom raspodelom,

• oko 2/3 svih vrednosti pada u interval σ±µ

• oko 95% svih vrednosti pada u interval σ±µ 2

• oko 99.7% svih vrednosti pada u interval σ±µ 3 Ako posmatramo pak verovatnoće suprotnih događaja, (0.3174, 0.0456, 0.0026), zapažamo da se vrednost koja od srednje vrednosti odstupa,

• više od σ, javlja približno jednom u tri merenja

Page 69: Osnovi inzenjerske statistike

68

• više od 2σ, javlja približno jednom u 20 merenja (5%) • više od 3σ, javlja približno jednom u 400 merenja (0.25%)

Dakle događaj da izmerena vrednost odstupi od tačne vrednosti (srednja vrednost) više od 3σ, ili drugim rečima da slučajna greška merenja bude po apsolutnoj vrednosti veća od 3σ je vrlo redak (verovatnoća manja od 0.3%), pa se kao maksimalna slučajna greška merenja može usvojiti trostruko standardno odstupanje. To je poznato pravilo tri sigme.

Primer 2.16 Odstupanje, ∆X debljine proizvedene glazirane keramičke pločice, X od nominalne vrednosti µ, ∆X = X - µ se može aproksimirati slučajnom veličinom sa normalnom raspodelom, ∆X : N(0, 0.3). Odrediti:

a) Očekivani škart u 1000 proizvedenih komada, ako se kao ispravne prihvataju pločice čija debljina odstupa od nominalne najviše ε = 0.5 mm.

b) Očekivani broj pločica u 1000 komada čije su debljine: X ≤ µ - 0.2 ili X ≥ µ + 0.5

c) Očekivani broj pločica u 1000 komada čije su debljine u intervalu: µ - 0.3 ≤ X ≤ µ + 0.4 Rešenje

a) Verovatnoću da odstupanje ∆X bude veće od 0.5 dobićemo preko verovatnoće suprotnog događaja

)67.1(215.0

21)5.0(1)5.0()54.2( Φ−=

σΦ−=≤∆−=>∆ XPXP

U tablici vrednosti Laplasove funkcije nalazimo Φ(1.67) = 0.4525, pa je

095.0905.01)5.0( =−=>∆XP

Ako imamo verovatnoću događaja - pojava defektne pločice, p = 0.095, onda je u skladu sa binomnim zakonom (ili u skladu sa statističkom definicijom verovatnoće) očekivani broj defektnih pločica m, u slučajnom uzorku od 1000 komada jednak:

m = pn = 1000⋅0.095 = 95

b) Kako su to dva isključiva događaja, imamo: ( ) ( )( ) )5.0()2.0(5.02.0 +µ≥+−µ≤=+µ≥+−µ≤ XPXPXXP

2514.05.02486.0)2.0(

2486.0)67.0()667.0(2.02.0

5.02.0

)2.0()2.0()51.2(

=+−=−µ≤−=Φ−≈Φ−=

σΦ−=

σ−Φ

+

σ−Φ=−µ=−µ≤

XP

FXP

0475.04525.05.0)67.1(5.0

5.05.0

1)5.0(1)5.0()51.2(

=−=Φ−=

+

σΦ−=+µ<−=+µ≥ XPXP

Page 70: Osnovi inzenjerske statistike

69

Tako je tražena verovatnoća

2989.00475.02514.0 =+=p

a očekivani broj pločica

2999.298 ≈== pnm

c)

7495.03413.04082.0

)1()33.1(3.04.0

3.04.0)4.03.0(

)52.2(

=+=Φ+Φ=

σΦ+

σΦ=

σ−Φ−

σΦ=+µ≤≤−µ XP

7505.749 ≈== pnm

Primer 2.17 Odrediti simetričan interval oko srednje vrednosti µ u koji vrednost normalno raspodeljene slučajne promenljive, X : N(µ, σ) pada sa verovatnoćom a) 95% b) 99%

Rešenje

Rešavamo problem, koji je obrnut onome iz prethodnog primera: imamo zadatu verovatnoću, treba naći odgovarajući interval vrednosti slučajne promenljive, čija je sredina µ. Poluširina traženog intervala, ε predstavlja granicu apsolutnog odstupanja (2.53) i definisana je jednačinom (2.54):

σεΦ=ε<∆ 2)( XP

a) Zadata je verovatnoća p = 0.95, tražimo ε iz jednačine,

475.02==

σεΦ p

U Tab. A1 nalazimo da Laplasova funkcija ima datu vrednost 0.475 za vrednost argumenta 1.96. Dakle,

σ=ε=σε 96.1,96.1

i traženi interval je:

( )σ+µσ−µ 96.1,96.1

b) Laplasova funkcija uzima vrednost 0.99/2 = 0.495, za vrednost argumenta približno jednaku 2.58, pa je traženi interval:

( )σ+µσ−µ 58.2,58.2

Page 71: Osnovi inzenjerske statistike

70

Primer 2.18 Vek trajanja elektronske lampe, h u časovima ima normalnu raspodelu X:N(100,5)

a) Naći verovatnoću da nova elektronska lampa istog tipa traje najmanje 105 časova. b) Ako je jedna elektronska lampa već izdržala 90 časova, kolika je verovatnoća da će izdržati još 15?

Rešenje

a) Izračunaćemo traženu verovatnoću iz verovatnoće suprotnog događaja,

1587.03413.05.0)1(5.0

5.05

1001051)105(1)105(

=−=Φ−=

+

−Φ−=<−=≥ XPXP

b) Traži se uslovna verovatnoća: verovatnoća da će nastupiti događaj, 105>X pošto je nastupio događaj, 90>X i računamo je pomoću formule (1.16a):

[ ]

)90(

)105(

)90(

)90)(105()90/105(

>

>=

>

>>=>>

XP

XP

XP

XXPXXP

9773.04773.05.0)2(5.0)2(5.0

5.05

100901)90(1)90(

=+=Φ+=−Φ−=

+

−Φ−=≤−=> XPXP

1624.0)90(

)105(

9973.0

1587.0)90/105( =

>

>==>>

XP

XPXXP

Kao što se moglo očekivati, dobijena je nešto veća verovatnoća nego u a).

Primer 2.19 Neka fabrika margarina pakuje margarin u pakovanja, propisane mase, 500 g. Zbog neizbežnih slučajnih grešaka mašine za pakovanje, mase pakovanja odstupaju od propisane. Kontrolom tokom dužeg vremenskog perioda je utvrđeno da 10% pakovanja ima masu manju od 500 g, dok 5% pakovanja ima masu jednaku ili veću od 508 g. a) Pretpostavljajući da mase pakovanja margarina imaju normalnu raspodelu, izračunati sa preciznošću od 2 decimalna mesta srednju vrednost i standardno odstupanje. b) Izračunati očekivane dnevne troškove proizvodnje margarina, ako su troškovi po jednom pakovanju, dati formulom:

( ).10719.610485.975.16 273 komdinxx −− ⋅−⋅⋅+ x – masa pakovanja, g a dnevna prozvodnja fabrike je 175000 pakovanja.

Rešenje

a) Na osnovu podataka,

( ) ( ) ( )1.05.0

500500500

51.2 =+

σµ−Φ==< FgXP

( ) ( ) ( )05.0

5085.05081508

51.2 =

σµ−Φ−=−=> FgXP

odnosno,

Page 72: Osnovi inzenjerske statistike

71

4.0500 −=

σµ−Φ

45.0508 =

σµ−Φ

Negativna vrednost Laplasove funkcije, ukazuje na negativan argument (vidi sl. 2.13) i imajući u vidu da je ona neparna, prvu jednačinu ćemo zameniti ekvivalentnom:

4.0500 =

σ−µΦ

Iz tabele vrednosti Laplasove funkcije nalazimo, koristeći (inverznu) linearnu interpolaciju, vrednosti argumenata za dve date vrednosti funkcija: 0.4 i 0.45,

( ) ( ) 288.14.04015.03997.04015.0

28.129.128.14.0 =−

−−+=⇒=Φ tt

( ) 645.12

65.164.145.0 =+=⇒=Φ tt

Tako dobijamo dve jednačine sa dve nepoznate:

500288.1288.1500

=σ−µ⇒=σ−µ

508645.1645.1508

=σ+µ⇒=σ

µ−

Rešenje sistema jednačina, sa zadatom preciznošću, je:

gg 73.2,51.503 =σ=µ

b) Očekivane troškove po jednom pakovanju, t dobijamo kao očekivanu vrednost slučajne promenljive definisane datom jednačinom troškova:

( )

( ) ( )273

273

10719.610485.975.16

10719.610485.975.16

XMXM

XXMt−−

−−

⋅−⋅+=

⋅−⋅+=

Pošto je ( ) ,µ=XM a u skladu sa Jedn. (2.27),

( ) 222 σ+µ=XM

za očekivane troškove po pakovanju margarina dobijamo:

( )2273 73.251.50310719.651.50310485.975.16 +⋅−⋅⋅+= −−t

komdint 53.21=

pa su očekivani dnevni troškovi proizvodnje margarina,

Page 73: Osnovi inzenjerske statistike

72

dan

din

kom

din

dan

komT 376775053.21175000 =⋅=

2.9 PRIMENE NORMALNE RASPODELE

Normalna raspodela je najvažnija kontinualna raspodela u teoriji i primeni matematičke statistike. Razlog za to je što su mnoge slučajne promenljive raspodeljene približno po normalnom zakonu.

Fizičko-hemijska merenja

Rezultati mnogih fizičko-hemijskih merenja se mogu dobro aproksimirati normalnom raspodelom. Takvih merenja ima dva tipa:

• merenja kod kojih su rasipanja rezultata merenja posledica slučajne greške merenja

• merenja kojima se prate slučajne pojave (npr. atmosferske prilike, prinos poljoprivrednih proizvoda, razne pojave u biologiji i sl.) u kojima postoje prirodne varijacije

Log – normalna raspodela

Neke slučajne promenljive (koje uzimaju samo pozitivne vrednosti) nemaju normalnu raspodelu, a njihova funkcija gustine je asimetrična sa pozitivnim koeficijentom asimetrije (Jedn. 2.36, Sl. 2.12). Ako se, međutim, njihove vrednosti logaritmuju, a dobijena gustina raspodele je približno simetrična, moguća je dobra aproksimacija takve raspodele normalnim zakonom. Drugim rečima, ako slučajna promenljiva X ima normalnu raspodelu X:N(µ,σ) tada promenljiva Y = eX ima tzv. Log-normalnu raspodelu Y:logN(µ,σ) sa pozitivnim koeficijentom asimetrije. Znači da slučajna promenljiva Y logaritmovanjem postaje normalna, tj. promenljiva lnY ima normalnu raspodelu.

Za funkciju gustine Log-normalne raspodele, postupkom opisanim u Pog. 2.10 se može izvesti:

( )

≤>πσ=

σ

µ−−

00

02

12yln

2

1

y

yeyyf

Srednja vrednost i disperzija raspodele su:

2

2

)(σ+µ

=µ= eYM y

Page 74: Osnovi inzenjerske statistike

73

( ) 22 21)( σ+µσ −=σ= eeYD y

Log-normalna raspodela, i njene modifikacije, takođe ima značajnu primenu u nauci i tehnici. Kako su normalna i Log-normalna raspodela usko povezane, za proračun verovatnoća Log-normalne raspodele se može koristiti standardizovana normalna raspodela (Pog. 2.10):

σ

µ−=

σ

µ−<=<=<=<= yF

yZPyXPxXPyYPyF

lnln)ln()()()( 0

Aproksimacija binomne raspodele

Može se pokazati da je normalna raspodela dobra aproksimacija binomne za velike vrednosti n pod uslovom da p nije blisko ni jedinici ni nuli . Na primer za n > 20 aproksimacija je dobra za 0. 3 < p < 0.7 i što je n veće, širi je i dozvoljen opseg za p [Chatfield C., 1983.]. Kao kriterijume dobre aproksimacije, Pavlić [Pavlić I., 1971.] navodi:

9,11

1>

+<<

+npq

n

np

n (2.56)

pri čemu, za datu binomnu raspodelu odgovarajuća normalna raspodela ima parametre

µ = np, σ2 = npq

Primer 2.20 Kocka se baca 120 puta. Naći verovatnoću da će se četvorka pojaviti manje od 15 puta. Rešenje

U pitanju je tipičan problem binomne raspodele sa n = 120, 6

1=p , pa je rešenje:

0847.06

5

6

1120),,()15(

12014

0

14

0

=

==<−

==

∑∑xx

xx xpnxbXP

koje zahteva obiman račun. Zato ćemo približno rešenje dobiti zamenom binomne normalnom raspodelom sa parametrima, pošto su zadovoljeni kriterijumi (2.56). Parametri normalne raspodele su:

08.4,67.166

5

6

1120,20 2 =σ===σ==µ npqnp

Moramo da rešimo sledeći praktični problem vezan za aproksimaciju diskretne slučajne promenljive kontinualnom. Znamo da je za X sa binomnom raspodelom:

Pb(X ≤ 14) = Pb(X < 15)

gde indeks b označava binomnu raspodelu. Postavlja se pitanje da li traženu verovantoću dobiti približno kao: PN(X ≤ 14) ili PN(X < 15), gde N označava

Page 75: Osnovi inzenjerske statistike

74

normalnu raspodelu, jer će se dobiti dva različita rezultata. Može se postupiti tako što će se kao rezultat usvojiti aritmetička sredina dva rezultata:

2/))15()14(()15( <+≤≈< XPXPXP NN

ili što će se kao rezultat usvojiti verovatnoća dobijena za granicu koja je aritmetička sredina između dve diskretne vrednosti:

( ) ( )5.1415 <≈< XPXP N

Usvojićemo ovaj drugi način koji zahteva manje računa. Koristićemo Jedn. (2.51):

0885.0

4115.05.0)35.1(5.05.0)35.1(

5.008.4

205.14

08.4

205.14)5.14(

=−=Φ−=+−Φ=

+

−Φ=

−<=< ZPXPN

Linearna kombinacija slučajnih veličina

Može se pokazati da slučajna promenljiva Y, koja predstavlja linearnu kombinaciju,

nnXcXcXcY +++= 2211 (2.57)

međusobno nezavisnih slučajnih veličina niX i ,...,2,1, = sa normalnom raspodelom

N (µi,σi), i = 1,..., n, ima takođe normalnu raspodelu sa parametrima:

∑∑ σ=σµ=µi

iii

ii cc 222, (2.58)

To svojstvo se, na primer, primenjuje pri kontroli kvaliteta složenih proizvoda čije komponente odlikuje normalna raspodela. Primer 2.21 Mašina pakuje proizvode čija je masa X normalno raspoređena oko µx = 50 g, sa standardnim odstupanjem σx = 0.4 g. Masa omota Y je raspodeljena po normalnoj raspodeli sa µy = 5 g i σ2

y = 0.04 g2. Odrediti granice u kojima će biti masa 95.44 % punih kutija u koje se pakuje po 10 opisanih paketa, a čija masa Z, kad su prazne, ima raspodelu N(30 g, 1 g). Rešenje

Masa punih kutija, V predstavlja sledeći zbir:

V = Z + 10X + 10Y

i ima normalnu rapodelu sa sledećim parametrima (2.58):

gyxzv 5805105010301010 =⋅+⋅+=µ+µ+µ=µ

g

g

v

yxzv

58.421

2104.010016.01001100100 22222

==σ

=⋅+⋅+=σ+σ+σ=σ

Page 76: Osnovi inzenjerske statistike

75

Prema (2.55b),

9544.0)2( =σ<µ− vvVP

tj. 95.44 % punih kutija imaće masu u granicama: 580 ± 9.2 g

Zbir velikog broja slu čajnih promenljivih

Uopšte, normalan zakon raspodele se pojavljuje kad god se radi o slučajnoj promenljivoj koja nastaje kao rezultat uticaja velikog broja činioca, tj. kada predstavlja zbir velikog broja promenljivih, pri čemu je uticaj svakog pojedinačnog činioca neznatan u odnosu na ukupno dejstvo svih činiloca zajedno. Ova tvrdnja se zasniva na centralnoj graničnoj teoremi [Vukadinović S., 1990.]. Tipičan primer su slučajne greške merenja, koje su rezultat delovanja velikog broja nekontrolisanih faktora od kojih nijedan nema dominantan uticaj.

U teoriji informacija se pokazuje da normalna raspodela sadrži minimalnu količinu informacija u odnosu na bilo koju drugu koja ima istu disperziju, pa se pri aproksimaciji neke raspodele normalnom ne precenjuje tačnost posmatranja.

2.10 FUNKCIJA SLUČAJNE PROMENLJIVE

Neka poznajemo gustinu raspodele f(x) neke slučajne promenljive, X. Kako definisati

gustinu raspodele g(y) slučajne promenljive Y, koja je neka funkcija od X:

( )XY ϕ= (2.59)

Ograničićemo se na slučaj da je funkcija ϕ(x) u intervalu mogućih vrednosti slučajne promenljive X strogo monotono opadajuća ili monotono rastuća, i neka se njene vrednosti kreću u intervalu (m, M), (koji može biti i neograničen):

MYm <<

Pretpostavka monotonosti obezbeđuje uzajamno jednoznačnu korespondenciju između vrednosti x i y, odnosno egzistenciju inverzne funkcije,

( ) ( )yyx ψ=ϕ= −1 (2.60)

Verovatnoća da vrednost Y padne u beskonačno mali interval (y, y + dy) jednaka je,

( ) ( )dyygdyyYyP =+<<

Tačno tolika je verovatnoća da X uzme vrednost iz intervala širine dx i to:

(x, x + dx) za 0>dx (funkcije ϕ i ψ rastuće)

Page 77: Osnovi inzenjerske statistike

76

(x + dx, x) za 0<dx (funkcije ϕ i ψ opadajuće)

gde vrednost x odgovara vrednosti y,

( )yx ψ=

a dx je priraštaj promenljive X, kada vrednost promenljive Y poraste za dy. Dakle, jednaki su odgovarajući elementi verovatnoće:

( ) ( ) ( )( ) 0, >ψ== dydxyfdxxfdyyg

Odnos priraštaja dy i dx daje prvi izvod,

( )ydy

dx ψ′=

pa imamo,

( ) ( )( ) ( ) 0, >ψ′ψ= dydyyyfdyyg

i konačno dobijamo traženu gustinu raspodele za Y:

( ) ( )( ) ( )

≥∨≤<<′=

Mymy

Mymyyfyg

0

ψψ (2.61)

Primer 2.22 Pokazati da, ako slučajna promenljiva X ima normalnu raspodelu N(µ,σ), slučajna promenljiva,

0, ≠+= abaXY

ima takođe normalnu raspodelu. Rešenje Data je gustina raspodele promenljive X:

σµ−−πσ=

2

2

1exp

2

1)(

xxf

a funkcija ( ) baxx +=ϕ je ili rastuća ( 0>a ) ili opadajuća 0<a . Inverzna funkcija je,

( )a

byy

−=ψ

definisana na celom intervalu ( )∞+∞− , . Treba nam njen prvi izvod:

( )a

y1=ψ′

Formula (2.61) daje,

Page 78: Osnovi inzenjerske statistike

77

( ) ( )( ) ( )

( )( )

( )( )

σ+µ−−πσ=

σ+µ−−πσ=

σ

µ−−−πσ=ψ′ψ=

22

2

2

2

1exp

2

1

2

1exp

2

1

1

2

1exp

2

1

a

bay

aa

bay

a

aa

by

yyfyg

i poredeći sa normalnom raspodelom, zaključujemo da je u pitanju normalna raspodela sa parametrima:

σ=σ+µ=µ aba yy ,

Primer 2.23 Polazeći od Maksvelove raspodele brzina molekula idealnog gasa, izvesti raspodelu kinetičkih energija molekula idealnog gasa.

Rešenje

Maksvelova raspodela za brzinu molekula gasa, V data je jednačinom (2.13):

( )

≤>

=−

00

0,2

4 22

2/3 2

v

vvekT

mvf

kT

mv

π

Kinetička energija je rastuća funkcija brzine molekula

2

2

1mVEk =

Inverzna funkcija, definisana na intervalu ek ≥ 0 i njen izvod su

0,2

1)(',

2)( ≥=ψ=ψ= k

k

kk

k eme

em

eev

Prema formuli (2.61),

( )( ) ( )k

kkT

e

kkmem

ee

kT

meef

k

2

12

2

42/3

=′π

ψψ

pa je tražena gustina raspodele

( )

≤>π=

00

02

)( 2/3

k

kkkT

e

k

e

eeekTeg

k

Page 79: Osnovi inzenjerske statistike

78

ZADACI 2.1 U kutiji se nalaze 4 bele i 3 crvene kuglice. Uzima se slučajan uzorak od 3 kuglice. a) Definisati zakon raspodele za slučajnu promenljivu: broj belih kuglica u uzorku b) Izračunati srednju vrednost i disperziju

2.2 Uzorak veličine n uzima se na slučajan način iz osnovnog skupa sa N elemenata u kome je udeo elemenata koji imaju neku karakteristiku jednak p (na primer dobri proizvodi), dok ostali elementi nemaju tu karakteristiku (loši proizvodi). Zakon raspodele koji definiše verovatnoću da će se u uzorku naći x elemenata koji imaju posmatranu karakteristiku zove se Hipergeometrijski zakon. Izvesti ga.

2.3 Verovatnoća da je neki proizvod iz serije proizvoda defektan je konstantna i jednaka p. Izvesti zakon raspodele p(x) za slučajnu promenljivu X, koja predstavlja redni broj prvog defektnog proizvoda u seriji (x = 1,2, ...) i proveriti da li je ispunjen uslov

11

=∑=

n

iip .

2.4 Događaj A nastupa u nekom eksperimentu sa verovatnoćom p = 0.3. Neka je X broj nastupanja događaja A u nizu od 5 opita. a) Kako glasi zakon verovatnoće za X, b) Izračunati P(X ≤ 3), c) Izračunati srednju vrednost i disperziju.

2.5 Odrediti, a) Verovatnoću da se u 8 bacanja kocke šestica pojavi 3 puta b) Očekivani broj šestica u 180 bacanja kocke?

2.6 Verovatnoća pogotka cilja u jednom gađanju je p = 0.2. Koliko gađanja treba izvesti da bi sa verovatnoćom ne manjom od 0.9 cilj bio pogođen bar jednom?

2.7 U seriji proizvoda ima 1% škarta. Koliki treba da je uzorak pa da verovatnoća pojave bar jednog škarta u uzorku ne bude manja od 0.95?

2.8 Kvalitet proizvedenih komponenata se ispituje na uređaju čija je pouzdanost 90% (u 10% slučajeva pogrešno razvrstava proizvode). Da bi se povećala pouzdanost kontrole, svaka komponenta se testira 5 puta i smatra ispravnom ako je rezultat testa pozitivan 3 ili više puta. Kolika je verovatnoća pogrešne klasifikacije?

2.9 Slučajna promenljiva X ima Poasonovu raspodelu sa µx = 3. Naći verovatnoću da X a) bude manje od srednje vrednosti b) bude pozitivno.

2.10 Automat daje 4% defektnih proizvoda. Proizvodi se pakuju u kutije po 50 komada. a) U koliko će se posto kutija nalaziti najviše jedan defektan komad? b) Postiže li se Poasonovom raspodelom zadovoljavajuća aproksimacija, ako se dozvoljava maksimalna greška rezultata od 1.5%?

Page 80: Osnovi inzenjerske statistike

79

2.11 Složeni mehanizam se sastoji od 2000 podjednako pouzdanih elemenata. Verovatnoća kvara svakog od njih je 0.0005. Naći verovatnoću da mehanizam otkaže, ako otkazivanje nastupa kada otkaže bar jedan od elemenata.

2.12 Za odvijanje jednog procesa neophodno je da istovremeno radi 10 istovetnih mašina. Pouzdanost svake od njih je 95%. a) U kom procentu slučajeva bi proces bio prekinut, ako ne bi bilo rezervnih mašina? b) Koliko rezervnih mašina je neophodno pa da se sa verovatnoćom 99% može očekivati da neće biti prekida procesa?

2.13 Jedna velika serija sadrži 4% defektnih proizvoda. Proizvodi se bez prethodne kontrole i izdvajanja loših pakuju u kutije od 50 komada. a) Koliko će defektnih proizvoda sadržavati najveći broj kutija? b) Koliki je procenat takvih kutija?

2.14 Ako je u proizvodnji nekih artikala 2% neispravnih, naći verovatnoću da se u uzorku od 100 artikala nađu a) tri neispravna; b) najmanje tri neispravna.

2.15 Automat daje u proseku 12% defektnih proizvoda. U kojim će se granicama kretati broj defektnih proizvoda u uzorcima od 200 proizvoda, sa verovatnoćom 95%?

2.16 Dužine klinova koje proizvodi neka fabrika imaju normalnu raspodelu sa µ = 3.007 in, σ = 0.011 in. Klinovi kraći od 2.983 in ili duži od 3.021 in smatraju se defektnim. Odrediti očekivani broj prekratkih i predugačkih klinova u uzorku od 300 komada.

2.17 Mašina proizvodi metalne šipke dužine 24 cm sa tolerancijom ε = 0.05 cm. Na osnovu dužeg posmatranja utvrđeno je da je σ = 0.03 cm. a) Koliki broj šipki će biti u intervalu tolerancije? b) Kolika bi trebalo da bude tolerancija da bi proizvodnja dala 95% metalnih šipki sa dužinom u intervalu tolerancije?

2.18 Slučajne greške merenja imaju normalnu raspodelu sa µ = 0, σ = 8 mm. Naći verovatnoću da od tri greške međusobno nezavisnih merenja a) bar jedna ne bude veća od 4 mm, b) bar jedna, po apsolutnoj vrednosti, ne bude veća od 4 mm.

2.19 Slučajna promenljiva ima normalnu raspodelu N(3,4). Izračunati ( )9>XP

i ( )5/9 >> XXP

2.20 Neki proizvođač deterdženta ima mašinu za pakovanje po 500 g deterdženta u jednu kutiju. Dužom kontrolom proizvoda utvrđeno je da je srednja masa deterženta u kutiji 506 g, sa standardnim odstupanjem 12 g. Uz pretpostavku da mase deterdženta u kutijama imaju normalnu raspodelu, a) Izračunati procenat kutija koje sadrže više od propisane količine deterdženta., b) Izračunati onu srednju vrednost i standardno odstupanje raspodele masa deterdženta, koji bi prepolovili procenat prepunjenih kutija i u isto vreme obezbedili da najviše 1% kutija sadrži manje od 497 g. c) Kolika bi se prosečna ušteda u deterdžentu (%) postigla?

2.21 U pogonu za pasterizaciju mleka, pasterizovano mleko se automatski puni u tetrapak-pakovanje, zapremine 1 l. Dužim posmatranjem, konstatovano je da 8%

Page 81: Osnovi inzenjerske statistike

80

pakovanja sadrži manje od propisane količine mleka, dok 30% pakovanja sadži više od 1.05 l. Ako se pretpostavi da količina mleka u tetra pakovanju ima normalnu raspodelu, a) Izračunati srednju vrednost i standardno odstupanje sa preciznošću od tri decimale. b) Izračunati očekivanu visinu troškova proizvodnje 1 l pasterizovanog mleka, ako je formula za izračuvanje troškova proizvodnje x litara mleka:

200151.0673.03.11 xxt −+= (din)

2.22 Otpor električnih otpornika ima normalnu raspodelu N(5Ω, 0.2Ω). Slučajnim izborom uzmemo dva takva otpornika i vežemo ih na red. Kolika je verovatnoća da taj spoj ima otpor između 9.5 i 10.5Ω ?

2.23 Verovatnoća da jedna sijalica traje duže od t časova jednaka je 0, >−

ue u

t

. a) Definisati gustinu verovatnoće i očekivanu vrednost vremena trajanja sijalice. b) Ako je srednje vreme trajanja sijalica 1500 h, sa kolikim rizikom možemo da očekujemo da će sijalica trajati bar 3000 h? c) Koje srednje vreme trajanja obezbeđuje da najviše jedna od hiljadu sijalica toga tipa pregoreva pre 5 sati upotrebe?

2.24 Ako slučajna promenljiva ima eksponencijalnu raspodelu, definisati gustinu raspodele, g(y) za slučajnu promenljivu: a) 23 += XY b) XeY = U oba slučaja proveriti uslov:

( ) 1=∫∞∞−

dyyg

2.25 Slučajna promenljiva X ima raspodelu N(µ, σ). Ako je XeY = , pokazati da Y ima raspodelu:

( )

≤>πσ=

σ

µ−−

00

02

12yln

2

1

y

yeyyf

Kako se zove ova raspodela?

Page 82: Osnovi inzenjerske statistike

81

3 Dvodimenzionalna slučajna promenljiva

Često je u praksi neophodno da se paralelno prate vrednosti više slučajnih promenljivih. Na primer, pri praćenju kvaliteta proizvedenih keramičkih pločica, kontrolišu se sve tri dimenzije. Sistem od n slučajnih promenljivih (X1, X2, . . ., Xn) naziva se i n - dimenzionalna slučajna promenljiva ili n - dimenzionalni slučajni vektor . Ograničićemo razmatranja na dvodimenzionalne slučajne veličine.

3.1 DISKONTINUALNA SLU ČAJNA PROMENLJIVA ( X,Y)

Pretpostavimo da, u okviru istog eksperimenta ili pojave, slučajna promenljiva X može da uzima vrednosti xi, i=1,...,n, a slučajna promenljiva Y, vrednosti yi, i=1,...,m. Funkcija,

m, jn, ,, i p y, YxX P ,yxp ijjiji ...,1...,1)()( ====== (3.1)

kojom se svakom paru vrednosti (xi,yj) slučajne promenljive (X,Y) pridružuje odgovarajuća verovatnoća pij, predstavlja zakon raspodele verovatnoće dvodimenzione diskontinualne promenljive (X,Y). Jasno je da mora biti zadovoljen uslov:

11 1

=∑∑= =

n

i

m

jijp (3.1a)

Raspodelu verovatnoća po pojedinim parovima (xi, yj), koju ćemo kratko zvati dvodimenzionalna raspodela, pogodno je prikazati tabelom, tj. matricom koja se dobija kada se (n×m) matrica verovatnoća (3.1),

mnijp ,][=P (3.1b)

proširi kolonom sa vrednostima promenljive X i vrstom sa vrednostima promenljive Y (Tab. 3.1).

Page 83: Osnovi inzenjerske statistike

82

Tabela 3.1 - Raspodela verovatnoća diskretne dvodimenzionalne promenljive

Sume verovatnoća po pojedinim vrstama date su u poslednjoj koloni:

nippm

jijxi

,...,1,1

==∑=

(3.2)

a sume verovatnoća po pojedinim kolonama, u poslednjoj vrsti tabele:

mjppn

iijyi

,...,1,1

==∑=

(3.3)

U skladu sa (3.1a):

111

==∑∑==

m

jy

n

ix ji

pp

Funkcija raspodele

Funkcija raspodele F(x,y) dvodimenzionalne slučajne promenljive (X, Y) predstavlja verovatnoću istovremene realizacije događaja: X < x, Y < y:

F(x,y) = P(X < x, Y < y) (3.4)

Drugim rečima, ona daje verovatnoću da slučajna tačka (X,Y) u ravni xOy padne u beskonačan kvadrat sa gornjim desnim temenom u tački (x,y). Jasno je da je: • F(x,y) neopadajuća funkcija po oba argumenta • ( ) ( ) 1,,0, =∞∞=−∞∞− FF

Primer 3.1: Data je raspodela dvodimenzionalne slučajne promenljive:

y x

0 1 2

2 3/18 2/18 1/18 6/18 3 1/18 3/18 2/18 6/18 4 1/18 1/18 4/18 6/18 5/18 6/18 7/18 1

a) Kolika je verovatnoća događaja: X = 3, Y = 2?

y1 y2 … yj … ym

x1 p11 p12 … p1j … p1m 1x

p

x2 p21 p22 … p2j … p2m 2xp

xi pi1 pi2 … pij … pim ixp

xn pn1 pn2 … pnj … pnm nxp

1yp

2yp … jyp …

myp 1

Page 84: Osnovi inzenjerske statistike

83

b) Odrediti vrednosti funkcije raspodele: F(0,4), F(10,0), F(5,3), F(2.5,0.5), F(3.5,2) .

Rešenje

a) ( ) 1822,3 3,2 ==== pYXP

b) Pošto slučajne promenljive ne uzimaju negativne vrednosti

( )( ) 0)0,10(0,10

0)4,0(4,0

=<<=

=<<=

YXPF

YXPF

Pošto sve moguće slučajne tačke (X, Y) pripadaju oblasti 3,5 << yx

( ) 1)3,5(3,5 =<<= YXPF

U oblasti 5.0,5.2 << yx leži samo jedna moguća slučajna tačka, sa koordinatama (2,0), pa je

( ) 183)1,3()1,3(5.0,5.2 1,1 ==<<== pYXPFF

F(3.5, 2) predstavlja zbir svih elemenata podmatrice matrice P, (3.1b) koju obrazuju prva i druga vrsta (x < 3.5 < 4) i prva i druga kolona (y < 2):

=== 18/318/1

18/218/3][ 2,1,2,1, jijip F(3.5, 2) = 9/18=1/2

Marginalne raspodele

U skladu sa pravilom sabiranja verovatnoća, apsolutna verovatnoća da slučajna promenljiva X uzme vrednost xi bez obzira koju će vrednost uzeti druga slučajna promenljiva Y, jednaka je

ixp (Jedn.3.2). Tako parovi (xi,ixp ), i = 1,...,n (Tab. 3.1)

definišu jednodimenzionalnu raspodelu slučajne promenljive X, koja se zove marginalna raspodela promenljive X,

( ) nippxpm

jijxix i

,...,1,1

=== ∑=

(3.5a)

Slično, parovi (yj,jyp ), j = 1,...,m definišu marginalnu raspodelu promenljive Y.

( ) mjppypn

iijyjy j

,...,1,1

=== ∑=

(3.5b)

Tabela 3.2. - Marginalne raspodele

X x1 x2 … xn px

1xp

2xp … nxp

Y y1 y2 … ym py

1yp 2yp …

myp

Page 85: Osnovi inzenjerske statistike

84

Marginalna raspodela promenljive X data je prvom i poslednjom kolonom tabele Tab. 3.1, a marginalna raspodela za Y prvom i poslednjom vrstom i otuda potiče naziv marginalne (ivične).

Iz date definicije sledi definicija marginalnih funkcija raspodele. Ako drugom argumentu, y u funkciji (3.4) dodelimo vrednost ∞ (znači, bilo koja vrednost y), dobijamo marginalnu funkciju raspodele promenljive X,

( ) ( ) ( )∞=∞<<= ,, xFYxXPxFx (3.6a)

Analogno definišemo marginalnu funkciju raspodele promenljive Y

( ) ( ) ( )yFyYXPyFy ,, ∞=<∞<= (3.6b)

Primer 3.2 Za dvodimenzionalnu raspodelu datu u prethodnom primeru,

a) Odrediti verovatnoću događaja X = 3 (bez obzira koju vrednost uzme Y)? b) Formirati marginalne raspodele px(xi) i py(yj).

Rešenje

a) P(X = 3) = p2,1 + p2,2 + p2,3 = 1/18 + 3/18 + 2/18 = 6/18

b)

px(xi) dobijamo kao zbirove elemenata pojedinih vrsta matrice P (3.1b), a py(yj) kao zbirove elemenata pojedinih kolona te matrice. Vidimo da slučajna promenljiva X ima ravnomernu raspodelu verovatnoće ( .constp

ix = )

3.2 NEPREKIDNA SLUČAJNA PROMENLJIVA ( X,Y)

Ako je funkcija raspodele F(x,y) (3.4) neprekidne slučajne promenljive (X,Y), neprekidna i diferencijabilna, može se definisati gustina dvodimenzionalne neprekidne raspodele:

0),(

),(2

≥∂∂

∂=yx

yxFyxf (3.7)

Geometrijski, funkcija f(x, y) predstavlja površ u trodimenzionalnom prostoru (Sl. 3.1). Verovatnoća da slučajna tačka sa koordinatama (X,Y) padne u neku oblast D, data je integralom:

[ ] ∫∫=∈)(

),(),(D

dxdyyxfDYXP (3.8)

Ona predstavlja zbir elementarnih verovatnoća f(x,y)dxdy da slučajna tačka (X,Y) padne u pravougaonik sa jednim temenom u tački (x, y) i stranicama dx i dy (Sl. 3.2).

x 2 3 4 px 6/18 6/18 6/18

y 0 1 2 py 5/18 6/18 7/18

Page 86: Osnovi inzenjerske statistike

85

Slika 3.1 Dvodimenzionalna raspodela

Slika 3.2 Element verovatnoće

Očigledna je, na osnovu Jedn. (3.8), sledeća veza između gustine i funkcije raspodele:

∫ ∫∞− ∞−

=<<=x y

dudvvufyYxXPyxF ),(),(),( (3.9)

kao i uslov:

1),( =∫ ∫∞

∞−

∞−

dxdyyxf (3.10)

Geometrijski, uslov(3.10) znači da je zapremina tela ograničenog sa ravni xOy i površi f(x,y) (vidi Sl. 3.1) jednaka jedinici.

Primer 3.3 Data je sledeća raspodela (dvodimenzionalna eksponencijalna raspodela):

≥≥=

+−

ecina0

0,0za),(

)(

yxeyxf

yx

a) Proveriti uslov (3.10). b) Izračunati verovatnoću P(1 < X < 2, 0 < Y < 2) c) Izračunati verovatnoću P(X > Y) d) Naći funkciju raspodele F(x, y).

Page 87: Osnovi inzenjerske statistike

86

Rešenje

a) 1),(2

0000 0

)( ====∞

−∞

−∞

−∞ ∞

+−∞

∞−

∞−∫∫∫ ∫∫ ∫ xyxyx edyedxedxdyedxdyyxf

b)

20.0)1)((

),()20,21(

2122

0

2

1

2

0

)(2

1)(

≈−−==

===<<<<

−−−−−

+−

∫∫∫∫∫∫

eeedyedxe

dyedxdxdyyxfYXP

yx

yx

D

c) ( ) ( )( )∫∫=>D

dxdyyxfYXP ,

gde je oblast D beskonačan trougao, ograničen x-osom i pravom y = x

( ) [ ] ( )[ ] 1138.0

21

2

1

000

00

00 0

2

≈π

−=π

−−=−=

−=−==>

∞−

∞−

∞−

∞−−−

∞−

∞−−

∫∫∫∫∫ ∫

xxx

xxx

yxx

yx

edxedxe

dxeeedxedyedxeYXP

d)

)(

000 0

)()(

1)1)(1(

),(

yxyxyx

yv

xu

x yvu

x yyx

eeeee

dveduedudvedudveyxF

+−−−−−

−−+−

∞− ∞−

+−

+−−=−−=

=== ∫∫∫ ∫∫ ∫

≥≥+−−=

+−−−

ecina0

0,01),(

)(

yxeeeyxF

yxyx

Primer 3.4 Potrebno je

a) Izvesti praktičnu formulu:

),(),(),(),(),( 111221222121 yxFyxFyxFyxFyYyxXxP +−−=<<<<

b) Koristeći formulu, rešiti problem b) u prethodnom primeru

Rešenje

a)

Page 88: Osnovi inzenjerske statistike

87

),(),(),(),(

),(),(

),(),(),(

),(),(

11122122

12

12

2)7.3(

2121

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

2

1

yxFyxFyxFyxF

dxyxx

Fdxyx

x

F

dxyxx

Fyx

x

Fyx

x

Fdx

dyyx

FdxdyyxfdxyYyxXxP

x

x

x

x

x

x

y

y

x

x

x

x

y

y

x

x

y

y

+−−=∂∂−∂

∂=

∂∂−∂

∂=

∂∂=

∂∂∂==<<<<

∫∫∫∫

∫ ∫∫ ∫

b)

20.0

)11(

)11()1()1(

)0,1()0,2()2,1()2,2()20,21(

1234

0

11

0

22321422

≈+−−=

+−−+

++−−−+−−−++−=

+−−=<<<<

−−−−

−−

−−−−−−−−

eeee

ee

eeeeeeee

FFFFYXP

Marginalne raspodele

Marginalna funkcija raspodele Fx(x), definisana jednačinom (3.6a), može se u slučaju neprekidne slučajne promenljive (X,Y) izraziti preko gustine dvodimenzionalne raspodele,

∫∫ ∞

∞−∞−

=∞= dyyxfdxxFxFx

x ),(),()(

Diferenciranjem marginalne funkcije raspodele Fx(x) (izvod određenog integrala po gornjoj granici), definišemo gustinu marginalne raspodele za X:

dyyxfdx

xdFxf x

x ∫∞∞−

== ),()(

)(

Sličan postupak možemo da sprovedemo na marginalnoj funkciji raspodele promenljive Y. Tako dolazimo do definicija:

• Pod marginalnom raspodelom promenljive X, podrazumeva se ona raspodela čija je gustina:

∫∞∞−

= dyyxfxfx ),()( (3.11a)

• Pod marginalnom raspodelom promenljive Y, podrazumeva se raspodela čija je gustina:

∫∞∞−

= dxyxfyf y ),()( (3.11b)

Page 89: Osnovi inzenjerske statistike

88

Primer 3.5 Za dvodimenzionalnu eksponencijalnu raspodelu iz Primera 3.3 naći marginalne raspodele.

Rešenje

Primenom (3.11a), za x ≥ 0 dobijamo,

xyxyxyxx eeedyeedyedyyxfxf −

∞−−

∞−−

∞+−

∞−

=−==== ∫∫∫000

)( )(),()(

pa je,

<≥=

00

0)(

x

xexf

x

x

Slično, iz (3.11b) dobijamo,

<≥=

00

0)(

y

yeyf

y

y

Dvodimenzionalna normalna raspodela

Dvodimenzionalna raspodela, koja u teoriji i praksi ima najviše primena, je normalna raspodela:

σµ−+σ

µ−σµ−ρ−

σµ−

ρ−−

ρ−σπσ=

22

22

)1(2

1

212

1),(

y

y

y

y

x

x

x

xyyxx

yx

eyxf (3.12)

koja je definisana sa 5 parametara: ρσσµµ ,,,, yxyx .

Marginalne raspodele jedne i druge slučajne promenljive dobijamo primenom jednačina (3.11a, b):

)(2

1)(

)(2

1)(

2

2

2

1

2

1

beyf

aexf

y

y

x

x

y

y

y

x

x

x

σµ−−

σµ−−

πσ=

πσ=

(3.13)

Dakle, X i Y, posmatrane nezavisno, imaju normalne raspodele N(µx,σx) i N (µy,σy).

Page 90: Osnovi inzenjerske statistike

89

3.3 MOMENTI I KOVARIJANSA

Važne numeričke karakteristike dvodimenzionalnih slučajnih promenljivih su momenti.

Početni moment reda (r,s) slučajne promenljive (X,Y), definisan je kao očekivana vrednost,

( )srrs YXMm =

odnosno,

=∫ ∫∑∑∞

∞−

∞−

= =

)(rasp.neprek.za),(

)(rasp. diskont.za1 1

bdxdyyxfyx

apyx

msr

n

i

m

jij

sj

ri

rs (3.14)

Potražimo početne momente reda (1,0) i (0,1) na primeru neprekidne promenljive (X,Y):

yy

b

xx

a

dyyyfdxyxfydydxdyyxyfm

dxxxfdyyxfxdxdxdyyxxfm

µ====

µ====

∫∫∫∫ ∫∫∫∫∫ ∫∞

∞−

∞−

∞−

∞−

∞−

∞−

∞−

∞−

∞−

∞−

)(),(),(

)(),(),(

)11.3(

01

)11.3(

10

Dakle, početni momenti m10 i m01 predstavljaju srednje vrednosti promenljivih X i Y, redom.

Centralni moment reda (r,s) dvodimenzionalne slučajne promenljive definisan je kao očekivana vrednost,

])()[( sy

rxrs yxM µ−µ−=ν

odnosno,

µ−µ−

µ−µ−=ν∫ ∫∑∑∞

∞−

∞−

)(.rasp neprek.),()()(

)(rasp.diskont.)()(

bdxdyyxfyx

apyx

syj

rxi

i jij

syj

rxi

rs (3.15)

Nije teško utvrditi da su centralni momenti reda (2,0) i (0,2) disperzije promenljivih X i Y. Na primer, za diskontinualnu raspodelu:

222

)3.3(2

220

)(])[()()(

)(

xxi

xxij

iji

xi

iji j

xi

XDxMpxpx

px

iσ==µ−=µ−=µ−=

µ−=ν

∑∑∑∑∑

Slično dobijamo: 2

02 )( yYD σ==ν

Page 91: Osnovi inzenjerske statistike

90

Sada možemo da dokažemo relaciju (2.22), da je srednja vrednost zbira dve slučajne veličine jednaka zbiru njihovih srednjih vrednosti. Izvešćemo dokaz na slučaju neprekidnih promenljivih, a analogan je dokaz za diskontinualnu promenljivu. Po definiciji srednje vrednosti:

)()()()(

),(),(

),(),(

),()()(

YMXMdyyyfdxxxf

dxyxfydydyyxfxdx

dxdyyxyfdxdyyxxf

dxdyyxfyxYXM

yx +=+=

+=

+=

+=+

∫∫∫∫∫∫

∫ ∫∫ ∫∫ ∫

∞−

∞−

∞−

∞−

∞−

∞−

∞−

∞−

∞−

∞−

∞−

∞−

Kovarijansa

U statistici poseban značaj ima centralni moment reda (1,1), koji se zove kovarijansa dve slučajne promenljive i koga ćemo označiti sa σxy:

µ−µ−

µ−µ−=σ

∫ ∫∑∑∞

∞−

∞−

)(rasp.kont.za),())((

)(rasp.diskont.za))((

bdxdyyxfyx

apyx

yjxi

i jijyjxi

xy (3.16)

Koristeći osobine srednje vrednosti, možemo da izvedemo praktičniji izraz za izračunavanje kovarijanse:

)()()()()()()(

][)])([(

YMXMXMYMYMXMXYM

XYXYMYXM yxyxyxxy

+−−=µµ+µ−µ−=µ−µ−=σ

yxxy XYM µµ−=σ )( (3.17)

3.4 USLOVNE RASPODELE

Pri analizi dvodimenzionalne slučajne promenljive (X,Y), marginalne raspodele promenljivih X i Y, po svojoj definiciji, ne daju nikakvu informaciju o njihovoj međusobnoj zavisnosti. Međutim, proučavanje pojava okarakterisanih sa dve ili više slučajnih promenljivih ne može se svesti na proučavanje svake slučajne promenljive posebno, već se moraju ispitati i međusobne zavisnosti.

Pretpostavimo da, na osnovu podataka uzetih od velikog broja ljudi, proučavamo raspodelu dvodimenzionalne slučajne promenljive, gde prva promenljiva X predstavlja visinu neke osobe, a druga promenljiva, Y njenu masu. Marginalna raspodela prve promenljive daje raspodelu visina, a druge, raspodelu masa ljudi, ali se iz njih ne može

Page 92: Osnovi inzenjerske statistike

91

dobiti nikakva informacija o neospornoj vezi između visine i mase čoveka. Da bi analizirali tu vezu, neophodno je posmatrati raspodele masa osobe, Y pri različitim, odabranim visinama, X. Te raspodele, dobijene iz dvodimenzionalne raspodele, zovemo uslovne, jer su izvedene pod uslovom da je vrednost druge promenljive zadata.

Slučaj diskontinualne promenljive

Posmatramo, dakle, verovatnoće različitih vrednosti jedne od promenljivih, pri fiksiranoj vrednosti one druge. Tako, verovatnoća da promenljiva X uzme vrednost xi, uz uslov da je Y = yj, tj. verovatnoća događaja X = xi, pod uslovom da je nastupio događaj Y = yj pretstavlja uslovnu verovatnoću, )( ji yxp :

)()( jiji yYxXPyxp ===

Prema formuli (1.16a) traženu verovatnoću dobijamo kao:

jyjiji pyxpyxp /),()/( = (3.18a)

Analogno, definišemo verovatnoću da Y uzme vrednost yj pri uslovu X = xi

ixjiij pyxpxyp /),()/( = (3.18b)

Uslovne raspodele slučajne promenljive X pod uslovom Y = yj, j = 1,...,m definisane su jednačinom (3.18a) za i = 1,...,n, j = 1,...,m, a uslovne raspodele slučajne promenljive Y date su jednačinom (3.18b) za i = 1,...,n, j = 1,...,m. Primer 3.6 Iz dvodimenzionalne raspodele u Primeru 3.1 formirati uslovne raspodele.

Rešenje

Koristeći definicionu jednačinu (3.18a) dobijamo:

3,2,1),18/6/()/(,18/6)1( 222==== ipyxppp iiyy

Na primer: p(x1/y2) = p1,2 / (6/18) = 2/6

Slično, 3,2,1),18/6/()/(,18/6)4( 333

==== jpxyppp jjxx

Neprekidne promenljive

U skladu sa Jedn. (1.16a), uslovna verovatnoća da vrednost X bude u intervalu (x,

x+dx), pošto je vrednost Y već pala u inteval (y, y+dy), biće:

xi 2 3 4 p(xi/y2) 2/6 3/6 1/6

yj 0 1 2 p(yj/x3) 1/6 1/6 4/6

Page 93: Osnovi inzenjerske statistike

92

)(

),()/(

dyyYyP

dyyYydxxXxPdyyYydxxXxP

+<<

+<<+<<=+<<+<<

U brojiocu imamo elementarnu verovatnoću f(x, y)dxdy, a u imeniocu fy(y)dy, pa je:

dxyf

yxf

dyyf

dxdyyxfdyyYydxxXxP

yy )(

),(

)(

),()/( ==+<<+<<

Pošto je u pitanju elementarna verovatnoća, funkcija koja množi priraštaj dx predstavlja gustinu verovatnoće koju ćemo zvati gustina uslovne verovatnoće promenljive X i označavati sa f(x/y):

)(/),()/( yfyxfyxf y=

Slično izvodimo:

dyxyfdyxf

yxfdxxXxdyyYyP

x

)/()(

),()/( ==+<<+<<

Dakle, uslovne raspodele promenljivih X i Y date su jednačinama:

)(

),()/(

yf

yxfyxf

y

= (3.19a)

)(

),()/(

xf

yxfxyf

x

= (3.19b)

Primer 3.7 Gustina dvodimenzionalne raspodele promenljive (X,Y) glasi:

≥≥=

+−

ecina0

0,0),(

)1(

yxxeyxf

xy

Odrediti uslovne raspodele.

Rešenje

Prvo ćemo naći marginalne raspodele.

0,)1(

1

1

1

1)(

0,1

)(

2

0

)1(

0

)1(

000

)1(

≥+=

+++−==

≥=

−===∞

=

+−∞+−

=

−−−∞

−−∞

+−

∫∫∫

yyy

xy

edxxeyf

xeex

xedyexedyxexf

x

yxyx

y

x

y

xyxxyxyxx

Primenom Jedn. (3.19a, b) dalje dobijamo:

≥≥+==

+−

ecina0

0,0)1(

)(

),()/( 2

)1(

yxy

xe

yf

yxfyxf

yx

y

≥≥==

ecina0

0,0

)(

),()/(

yxxe

xf

yxfxyf

xy

x

Page 94: Osnovi inzenjerske statistike

93

3.5 MEĐUSOBNO NEZAVISNE SLUČAJNE PROMENLJIVE

U skladu sa definicijom međusobne nezavisnosti dva događaja (1.15a,b) za slučajnu

promenljivu X kažemo da je nezavisna od slučajne promenljive Y, ako raspodela verovatnoće promenljive X ostaje ista za bilo koju vrednost druge promenljive, Y. Znači, slučajne promenljive X i Y su međusobno nezavisne ako važi

• za diskretne promenljive,

mjnipxyppyxpji yijxji ,...,1,,...,1,)/(,)/( ==== (3.20)

• za neprekidne promenljive,

)()()()( y f y/x, fx f x/yf yx == (3.21)

Iz jednačina (3.20, 3.18a,b) i (3.21, 3.19a,b) sledi potreban i dovoljan uslov međusobne nezavisnosti:

• za diskretne promenljive,

mjnipppji yxij ,...,1,,...,1, === (3.22)

• za neprekidne promenljive,

)()()( yfx f x, yf yx= (3.23)

Primer 3.8 Data je raspodela dvodimenzionalne diskretne promenljive (X,Y):

Ispitati zavisnost promenljivih X i Y.

Rešenje

Formiraćemo marginalne raspodele u vidu dodatne kolone i vrste:

Pošto za sve vrednosti i i j važi: ji yxij ppp = promenljive su u skladu sa

kriterijumom (3.22) nezavisne. Primetimo da u Primeru 3.1 to nije slučaj jer je:

1111 1,11,1 ,18/5,18/6,18/3 yxyx pppppp ≠===

y x

1 2 3 4

1 1/24 1/12 1/12 1/24 2 1/12 1/6 1/6 1/12 3 1/24 1/12 1/12 1/24

1 2 3 4 px 1 1/24 1/12 1/12 1/24 6/24 2 1/12 1/6 1/6 1/12 1/2 3 1/24 1/12 1/12 1/24 1/4 py 1/6 1/3 1/3 1/6

Page 95: Osnovi inzenjerske statistike

94

Primer 3.9 Ispitati zavisnost neprekidnih promenljivih X i Y a) iz Primera 3.3 b) iz Primera 3.7

Rešenje

a) Očigledno je,

fx(x) fy(y) = e-(x+y) = f(x,y) (vidi Primer 3.5)

pa su u skladu sa kriterijumom (3.23) X i Y međusobno nezavisni.

b) U ovom primeru,

),()1(

)()( 2 yxfy

eyfxf

x

yx ≠+

=−

(vidi Primer 3.7)

pa su promenljive zavisne.

Srednja vrednost proizvoda nezavisnih slučajnih promenljivih

Tražimo M(XY) za međusobno nezavisne, neprekidne promenljive X i Y:

yxyx

yx

YMXMdyyfydxxfx

dxdyyfxxyfdxdyyxxyfXYM

µµ===

==

∫∫∫ ∫∫ ∫

∞−

∞−

∞−

∞−

∞−

∞−

)()()()(

)()(),()()23.3(

Pokazali smo da je srednja vrednost proizvoda dve nezavisne slučajne veličine jednaka proizvodu njihovih srednjih vrednosti. Uopšte, to važi za proizvod n nezavisnih slučajnih promenljivih,

( ) ( ) ( ) ( )nn XMXMXMXXXM 2121 = (3.24)

Kovarijansa nezavisnih slučajnih promenljivih

Ako su slučajne promenljive X i Y nezavisne, njihova kovarijansa je jednaka nuli,

0=σxy (3.25)

što zaključujemo na osnovu prethodne teoreme (3.24) i formule (3.17). Treba da naglasimo, da obrnuto, u opštem slučaju ne važi. Dakle, potreban uslov nezavisnosti dve slučajne veličine X i Y je nulta vrednost njihove kovarijanse,. Drugim rečima, ako je kovarijansa dve slučajne veličine različita od nule, onda su one međusobno zavisne.

Disperzija linearne kombinacije slučajnih promenljivih

Page 96: Osnovi inzenjerske statistike

95

Potražimo disperziju sume dve slučajne veličine, koristeći pri tom osobine srednje

vrednosti (Pogl.2.3):

( )[ ] ( )[ ][ ][ ] [ ] [ ]

xyyx

yyxx

yyxx

yx

YMYXMXM

YYXXM

YXMYXMYXMYXD

σ+σ+σ=µ−+µ−µ−+µ−=

µ−+µ−µ−+µ−=µ−+µ−=+−+=+

2

)())((2)(

)())((2)(

)()()(

22

22

22

22

Izveli smo,

xyyxYXD σ+σ+σ=+ 2)( 22 (3.26)

Uopšte, može se izvesti za linearnu kombinaciju n nezavisnih promenljivih,

∑ ∑∑= +==

σ+=+++n

i

n

ijijji

n

iiinn ccxDcXcXcXcD

1 11

22211 2)()...( (3.27)

gde je ijji xxxxij σ=σ=σ

Ako su X1, X2, …, Xn nezavisne slučajne veličine, što znači prema (3.25),

njiij ,...,1,,0 ==σ

Jedn. (3.27) se svodi na tzv. pravilo aditivnosti disperzije nezavisnih promenljivih:

∑=

=++n

iiinn XDcXcXcXcD

1

22211 )()...( (3.28)

koje ima važnu primenu u statistici. 3.6 ZAVISNE SLUČAJNE PROMENLJIVE. REGRESIJA

Treba jasno razlikovati funkcionalnu vezu između dve promenljive koja se izučava u

okviru matematičke analize i međuzavisnost dve slučajne promenljive. Da bi se istakla ova razlika, međuzavisnost slučajnih promenljivih se u literaturi naziva stohastička veza. Kod stroge funkcionalne veze, jednoj vrednosti promenljive x odgovara jedna, potpuno određena, vrednost promenljive y. U slučaju stohastičke veze, jednoj vrednosti x slučajne promenljive X, odgovara beskonačno mnogo vrednosti slučajne promenljive Y (ako su promenljive neprekidne), koje imaju određenu raspodelu verovatnoće. Tako se za datu vrednost x ne može predskazati vrednost y, već samo odrediti interval u kome će se ta vrednost nalaziti i to sa određenom verovatnoćom ili pouzdanošću. Na primer, treba da procenimo masu čoveka čija je visina 180 cm. Ako poznajemo dvodimenzionalnu raspodelu (visina(X), masa(Y)), možemo uz pomoć uslovne raspodele mase, Y proceniti, sa željenom verovatnoćom, interval kome pripada tražena masa. Recimo, sa zadatom verovatnoćom od 90 %, traženi interval masa je [70 kg, 98 kg].

Page 97: Osnovi inzenjerske statistike

96

Funkcije regresije Posmatrajmo raspodelu neprekidne dvodimenzionalne slučajne promenljive (X,Y). Za

uslovne raspodele (3.19a,b), kao za bilo koju jednodimenzionalnu raspodelu, mogu se odrediti srednja vrednost i disperzija koje zovemo uslovna srednja vrednost i uslovna disperzija slučajnih promenljivih X i Y. Tako se uslovne srednje vrednosti dobijaju kao,

)()/()/(

)()/()/(

/

/

bdxyxxfYXM

adyxyyfXYM

yx

xy

∫∫∞

∞−

∞−

==µ

==µ (3.29)

a uslovne disperzije kao,

)()/()()/(

)()/()()/(

2/

2/

2/

2/

bdxyxfxYXD

adyxyfyXYD

yxyx

xyxy

∫∫∞

∞−

∞−

µ−==σ

µ−==σ (3.30)

Kako se u raspodeli f(y/x), ukoliko nije zadovoljen uslov nezavisnosti (3.23), x pojavljuje kao parametar (vidi 3.19b), uslovna srednja vrednost µy/x će zavisiti od x:

( )xxy 1ϕ=µ (3.31a)

Slično,

( )yyx 2ϕ=µ (3.31b)

Definisali smo funkcije regresije,

• funkcija ( )x1ϕ se zove funkcija regresije Y u odnosu na X.

• funkcija ( )y2ϕ se zove funkcija regresije X u odnosu na Y.

Dakle, funkcija regresije pokazuje kako uslovna srednja vrednost jedne promenljive zavisi od druge promenljive. Primetimo da je u pitanju strogo funkcionalna veza, jer srednja vrednost nije slučajna promenljiva. Interval vrednosti y oko uslovne srednje vrednosti µy/x, za datu vrednost x, procenjujemo pomoću uslovne raspodele f(y/x). Ako je to, na primer, normalna raspodela N(µy/x,σ y/x), interval dobijamo koristeći postupak opisan u Pogl. 2.8 Primer 3.10 Za raspodelu iz Primera 3.7 naći funkciju regresije µy/x(x).

Page 98: Osnovi inzenjerske statistike

97

Rešenje

0,1

1

)/(

/

0

00

/

>=µ

+−=

===µ∞

=

∞−

∞−

∞−

∫∫∫

xx

xy

x

ex

dyyexdyyxedyxyyf

xy

y

xy

xyxyxy

3.7 KOEFICIJENT KORELACIJE. LINEARNA REGRESIJA

Veoma važna veličina u proučavanju stohastičke veze X i Y je koeficijent korelacije promenljivih X i Y, ρxy definisan kao:

yx

xyxy σσ

σ=ρ (3.32)

Za razliku od kovarijanse, koeficijent korelacije je bezdimenzionalna veličina. Jasno je da je koeficijent korelacije nezavisnih promenljivih X i Y jednak nuli .

Pretpostavimo da slučajna promenljiva (X,Y) ima dvodimenzionalnu normalnu raspodelu (3.12). Naći ćemo kovarijansu za X i Y pomoću formule (3.17). Dajemo rezultat bez izvođenja:

yxyxxy dxdyyxxyf σρσ=µµ−=σ ∫ ∫∞

∞−

∞−

),( (3.33)

Na osnovu poređenja sa (3.32) zaključujemo da je parametar ρ u dvodimenzionalnoj normalnoj raspodeli (3.12) upravo koeficijent korelacije ρxy za promenljive X i Y. Za σxy = 0, tj. ρ = 0, gustina dvodimenzione raspodele (3.12) se svodi na:

)()(2

1

2

1exp

2

1),(

22

yfxfyx

yxf yxy

y

x

x

yx

=

σµ−−

σµ−−σπσ=

Dakle, u slučaju normalne raspodele nulta vrednost kovarijanse, odnosno koeficijenta korelacije nije samo potreban (3.25) nego i dovoljan uslov međusobne nezavisnosti slučajnih promenljivih X i Y. Linearna regresija

U slučaju normalne dvodimenzionalne raspodele, za uslovne raspodele promenljivih X i Y se izvodi:

Page 99: Osnovi inzenjerske statistike

98

)()1(2

1exp

12

1)/(

)()1(2

1exp

12

1)/(

2

22

2

22

byx

yxf

axy

xyf

y

yxy

x

x

xyxyx

x

xxy

y

y

xyxyy

σµ−ρ−σ

µ−ρ−−ρ−σπ=

σµ−ρ−σ

µ−ρ−−ρ−σπ=

(3.34)

Nije teško utvrditi da su one normalne. Na primer, izraz za f(y/x) se može preurediti,

ρ−σ

µ−σσρ+µ−

−ρ−σπ=

2

222 1

)(

2

1exp

)1(2

1)/(

xyy

xx

yxyy

xyy

xy

xyf

i poređenjem sa izrazom za gustinu normalne raspodele nalazimo uslovnu disperziju i uslovnu srednju vrednost promenljive Y:

)()(

)()1(

/

222/

bx

a

xx

yxyyxy

xyyxy

µ−σσ

ρ+µ=µ

ρ−σ=σ (3.35)

Slično se za parametre uslovne raspodele promenljive X dobija:

)()(

)()1(

/

222/

by

a

yy

xxyxyx

xyxyx

µ−σσρ+µ=µ

ρ−σ=σ (3.36)

Iz jednačina (3.35a) i (3.36a) sledi da je apsolutna vrednost koeficijenta korelacije najviše jednaka jedinici, odnosno

-1 ≤ ρxy ≤ 1 (3.37)

Funkcije regresije (3.35b) i (3.36b) su linearne, odnosno u slučaju da je raspodela dvodimenzionalne promenljive (X,Y) normalna i σxy ≠ 0, između X i Y postoji linearna stohastička veza koju zovemo linearna regresija.

Iz svojstva normalne raspodele proizilazi (vidi Jedn. 2.52b) da 95.44% svih mogućih vrednosti promenljive Y, koje mogu da se pojave u paru sa fiksiranom vrednošću za X, leže u intervalu [µy/x - 2σy/x, µy/x + 2σy/x] odnosno, verovatnoća događaja:

22 12)(12)( xyyxx

yxyyxyyx

x

yxyy xYx ρ−σ+µ−σ

σρ+µ≤≤ρ−σ−µ−σσρ+µ

jednaka je 0.9544. Tako, paralelne prave sa jednačinama

2

/2

2/1

12)()(

12)()(

xyyxy

xyyxy

xxy

xxy

ρ−σ+µ=

ρ−σ−µ=

Page 100: Osnovi inzenjerske statistike

99

gde je µy/x dato jednačinom (3.35b), ograničavaju traku u ravni xOy u koju pada 95.44 % svih vrednosti promenljive Y koji odgovaraju zadatoj vrednosti, x (Sl.3.3)

Slika 3.3 Linearna regresija Y u odnosu na X

Širina trake je

2/ 144 xyyxyd ρ−σ⋅=σ= (3.38)

i opada sa povećanjem koeficijenta korelacije. Prema tome, koeficijent korelacije ρxy predstavlja meru jačine linearne stohastičke veze između promenljivih X i Y.

Za jediničnu apsolutnu vrednost koeficijenta korelacije, ρxy = ±1 je σy/x = 0 tj. granične prave y1(x) i y2(x) se poklapaju i nema rasipanja vrednosti za Y za dato x, odnosno između slučajnih promenljivih Y i X postoji linearna funkcionalna veza:

)()( xx

yy xxy µ−σ

σ±µ= (3.39)

koja se može tuma;iti kao granični slučaj linearne stohastičke veze. Nije teško pokazati da se pri ρxy = ±1 linearna regresiona jednačina (3.36b) takođe svodi na (3.39), dakle regresione prave (3.35b) i (3.36b) se poklapaju, što inače (|ρ| < 1) nije slučaj. Kada koeficijent korelacije opada po apsolutnoj vrednosti, širina trake rasipanja (3.38) raste, dakle jačina stohastičke veze slabi, da bi u graničnom slučaju nulte vrednosti ρxy = 0, bilo:

µy/x = µy, µx/y = µx

odnosno Y i X su nezavisne.

Što se znaka koeficijenta korelacije tiče, jasno je iz (3.35b) i (3.36b) da

Page 101: Osnovi inzenjerske statistike

100

• za ρxy > 0, porast vrednosti X praćen je porastom uslovne srednje vrednosti za Y, što nazivamo pozitivnom korelacijom

• za ρ xy < 0, uslovna srednja vrednost za Y opada sa porastom X, što nazivamo negativnom korelacijom

Primer 3.11 Dvodimenzionalna slučajna promenljiva (X,Y) ima normalnu raspodelu sa parametrima: 78.0,2.39.2,34,28 −=ρ=σ=σ=µ=µ xyyxyx

a) Formulisati regresione funkcije: Y u odnosu na X i X u odnosu na Y i nacrtati njihove grafike. b) Odrediti poluširinu intervala vrednosti slučajne promenljive Y, oko njene srednje vrednosti, iz uslova da je verovatnoća da se neka vrednost Y nađe u tom intervalu jednaka 0.95. c) Proceniti sa pouzdanošću od 95% vrednost Y, za X = 10. d) Proceniti sa pouzdanošću od 95% vrednost X, za Y= 20.

Rešenje

a) Prema formuli (3.35b),

( ) bxaxxy +=µ /

gde su nagib i odsečak regresione prave,

10.58288607.034

,8607.09.2

2.378.0

=⋅+=µ−µ=

−=−=σσρ=

xy

x

yxy

ba

b

Tako, jednačina regresione prave Y u odnosu na X je,

xy 8607.01.58 −=

Slično, nagib i odsečak regresione prave (3.36b) su,

03.52347069.028

,7069.02.3

9.278.0

=⋅+=µ−µ=

−=−=σσρ=

yx

y

xxy

ba

b

pa je jednačina regresione prave X u odnosu na Y:

yx 7069.003.52 −= ili

xx

y 415.160.737069.0

03.52−=

−=

Dakle, regresione prave se ne poklapaju i seku se u tački sa koordinatama, ( )yx µµ , , M(28, 34)

Page 102: Osnovi inzenjerske statistike

101

b) Poluširinu traženog intervala definiše marginalna raspodela promenljive Y i ona je (vidi Primer 2.17) jednaka

272.696.1 =σ=δ y

To je interval

27.4073.27, <<δ+µ<<δ−µ YY yy

c) Traži se interval u koga vrednosti Y za dato X padaju sa verovatnoćom 0.95 i on je definisan uslovnom raspodelom:

xyxyxyxy Y σ+µ<<σ−µ 96.196.1/

odnosno uslovnom srednjom vrednošću koju dobijamo iz regresione funkcije,

49.49607.81.588607.01.58 =−=−==µ xyxy

i uslovnom disperzijom, koju računamo formulom (3.35a):

002.278.012.31 22/ =−=ρ−σ=σ xyyxy

Sa pouzdanošću od 95%, možemo da tvrdimo da vrednost Y, pri X = 10 pripada intervalu:

41.5357.45,96.196.1/ <<σ+µ<<σ−µ YY xyxyxyxy

Primetimo da je rasipanje vrednosti slučajne promenljive Y, koje se mogu naći u paru sa zadatom vrednošću slučajne promenljive X, oko uslovne srednje vrednosti, xyµ manje od rasipanja svih vrednosti Y oko njene srednje vrednosti

yµ , što je posledica stohastičke veze dve promenljive.

d) Interval dobijamo iz parametara uslovne raspodele fx(x/y) ,

89.37207069.003.527069.003.52 =⋅−=−==µ yxyx

815.178.019.21 22/ =−=ρ−σ=σ xyxyx

Za vrednost X, pri Y = 20 možemo da tvrdimo sa pouzdanošću od 95%, da pada u interval:

45.4133.34,96.196.1 // <<σ+µ<<σ−µ XX yxyxyxyx

Page 103: Osnovi inzenjerske statistike

102

ZADACI

3.1 Gustina raspodele dvodimenzionalne slučajne promenljive (X,Y) je:

( ) <<<<=

ecina0

10,10,

yxkxyyxf

a) Odrediti konstantu k b) Naći funkciju raspodele F(x,y) c) Naći marginalnu gustine raspodele slučajne promenljive Y d) Naći uslovnu gustinu raspodele ( )yxf e) Ispitati međuzavisnost X i Y f) Odrediti verovatnoću ( )5.00,15.0 ≤<<≤ yXP

3.2 Data je uslovna raspodela slučajne promenljive Y,

( ) <<<<=

ecina0

0,102

2

xyxx

yxyf

i marginalna raspodela slučajne promenljive X,

( ) <<=

ecina0

107 6

xxxfx

Naći, a) Dvodimenzionalnu raspodelu f(x,y) b) Marginalnu raspodelu fy(y) c) Ispitati zavisnost slučajnih promenljivih d) Izračunati verovatnoću ( )YXP 2>

3.3 Data je dvodimenziona raspodela

( ) ( )

≥≥=

+λ−

ecina0

0,0,

yxceyxf

yx

Potrebno je,

a) Skicirati grafik gustine raspodele, f(x,y) b) Naći funkciju raspodele, F(x,y) c) Naći marginalne raspodele d) Ispitati zavisnost slučajnih promenljivih e) Izračunati verovatnoće: ( )10 ≤≤ XP , ( )110 =≤≤ YXP , ( )10,10 ≤≤≤≤ YXP

3.4 Gustina dvodimenzionalne raspodele je,

( ) 2

22

,yx

keyxf+

=

a) Odrediti k i kovarijansu σxy

b) Odrediti a iz uslova da slučajna tačka (X,Y) pada u kvadrat: aYaX ≤≤ , , sa

verovatnoćom od 95 %

3.5 Ako dvodimenzionalna slučajna promenljiva ima normalnu raspodelu sa parametrima 8.0,2,1 =ρ=σ=σ=µ=µ xyyxyx , naći ( )4>XP i ( )34 => YXP

Page 104: Osnovi inzenjerske statistike

103

3.6 Na osnovu merenja visina i masa velikog broja odraslih muškaraca u nekoj državi, određeni su parametri dvodimenzionalne normalne raspodele slučajne promenljive (X,Y) gde je X – visina, a Y masa muške osobe:

78.0,2.713.0,9.69,78.1 =ρ=σ=σ=µ=µ xyyxyx kgmkgm

a) Kolike su prosečna visina i prosečna masa muškaraca u toj državi? b) Koji je procenat muškaraca niži od 1.6 m? c) Koji procenat muškaraca ima masu veću od 90 kg? d) Proceniti sa pouzdanošču od 90 % masu muškarca, koji je visok 1.95 m e) Proceniti sa pouzdanošču od 90 % visinu muškarca mase 75 kg

Page 105: Osnovi inzenjerske statistike

105

4 Osnovni zadaci statistike

Videli smo da teorija verovatnoće proučava slučajne pojave. Najčešće se ishodi slučajnih događaja u okviru neke pojave ili eksperimenta mogu povezati sa brojnim vrednostima - tipični primeri su fizičko-hemijska merenja ili praćenje škarta u proizvodnji. Tako je uveden pojam slučajne promenljive. Odabrana raspodela verovatnoće te slučajne promenljive (npr. Poasonova ili normalna raspodela) predstavlja matematički model posmatranog problema. Recimo, kao matematički model pri analizi rezultata merenja neke neprekidne fizičke veličine (gustina, temperatura, pritisak itd.), u odsustvu grubih i sistematskih grešaka, usvaja se normalan zakon raspodele. Pri analizi rezultata merenja broja impulsa u radiometriji (diskretna slučajna veličina), najčešće se kao model usvaja Poasonova raspodela. Da bi model, tj raspodelu primenili, moramo znati brojne vednosti parametara, koji figurišu u modelu - recimo parametar µ u Poasonovoj, ili parametre µ i σ u normalnoj raspodeli. Statistika se često posmatra kao primenjena teorija verovatnoće pri čemu procenjivanje parametara odabrane raspodele neke slučajne veličine, na osnovu raspoloživih eksperimentalnih podataka, predstavlja jedan od osnovnih zadataka statistike. Širi problem koji rešava statistika uključuje i izbor samog modela tj. tipa teorijske raspodele, formulisane u teoriji verovatnoće. 4.1 OSNOVNI POJMOVI

Statistika, kao naučna disciplina, izučava masovne pojave u društvu, prirodi, nauci i tehnici. Za masovne pojave je karakteristično da pojedinačni slučajevi manje ili više odstupaju od onog što se može smatrati njenom karakteristikom. Na primer, prosečni životni vek stanovništva neke države predstavlja važnu karakteristiku od koje, manje ili više, odstupaju dužine života pojedinih građana. Drugi primer su rezultati merenja neke fizičke veličine, koja sama, za razliku od životnog veka, nije slučajna veličina (na primer gustina gasa na datoj temperaturi i pritisku). Rezultati ponovljenih merenja se međutim razlikuju među sobom, kao i od tražene tačne vrednosti merene veličine, zbog slučajne greške merenja.

Page 106: Osnovi inzenjerske statistike

106

Statisti čko obeležje i populacija

Ono što se u teoriji verovatnoće naziva slučajna promenljiva, statističari nazivaju - statističko obeležje. Tako je životni vek građanina (izražen u godinama npr.) neke države primer statističkog obeležja. Statističko obeležje je vezano za jasno definisan elemenat (entitet) koga nazivamo statistička jedinica (na primer osoba - građanin neke države). Obeležja se mogu podeliti na numerička i atributivna (opisna). Numerička obeležja se mogu izraziti brojem (npr. starost, visina, težina) dok atributivna samo opisno (npr. pol, zanimanje). Numerička obeležja često imaju pored broja i pridruženu mernu jedinicu (godine starosti, visina u centimetrima, težina (masa) u kilogramima).

Skup svih elemenata - statističkih jedinica naziva se populacija ili generalni skup ili osnovni skup. Osnovni skup po pravilu ima veliki broj elemenata - statističkih jedinica (masovnost) koji može biti i beskonačan. Važno je naglasiti da statistika izučava numerička obeležja populacije pa se takva obeležja nazivaju i statistička obeležja. Kao i slučajne promenljive, obeležja mogu biti diskretnog ili neprekidnog tipa. Na primer, u posmatranom primeru, populaciju čine svi stanovnici jedne države. U slučaju bacanja dve kocke za igru, statistička jedinica je definisana kao svaka od mogućih položaja dve bačene kocke, statističko obeležje je posmatrani rezultat (recimo suma dobijena dva broja), a osnovni skup je beskonačan jer se može zamisliti beskonačan broj bacanja kocke. Slično, pri kontroli neke procesne veličine (pritisak, temperatura, koncentracija, itd.) može se zamisliti beskonačan broj merenja. U slučaju kontrole kvaliteta proizvoda, svaki test je statistička jedinica. Ako kontrolišemo, recimo, debljine proizvedenih keramičkih pločica, onda je populacija ograničena - broj elemenata jednak je broju proizvedenih pločica u nekom periodu vremena. U slučaju pak praćenja sadržaja sumpora u proizvedenoj gumi, populacija se smatra beskonačnom, odnosno neophodna je izvesna apstrakcija koja kao rezultat ima hipotetičnu beskonačnu populaciju. Zamišljamo naime, beskonačno velik komad gume i beskonačan niz analiza pod istim uslovima.

Statisti čki uzorak

Osnovni zadatak statistike je definisanje raspodele učestalost posmatranog obeležja, tj. raspodele verovatnoće. Pri tome je retko moguće izmeriti obeležja svih statističkih jedinica osnovnog skupa. To je svakako nemoguće u slučaju beskonačnog osnovnog skupa, ali i u slučaju konačnih populacija, to retko dolazi u obzir jer je ili neekonomično ili praktično neizvodljivo. Primeri su demografska ispitivanja i testova kvaliteta proizvoda, koji su destruktivni (proizvod u toku testa biva oštećen). Zato se iz populacije izdvaja jedan konačan podskup statističkih jedinica koji se naziva (statistički) uzorak. Uzorak se ispituje radi donošenja zaključaka o raspodeli slučajne promenljive - obeležja u osnovnom skupu, koja se naziva i teorijska raspodela. Umesto izraza: uzorak iz osnovnog skupa sa pretpostavljenom raspodelom (recimo normalnom) često se koristi kraći termin: uzorak iz pretpostavljene raspodele (npr. normalne).

Jasno je da se ne može očekivati potpuno tačno opisivanje ili reprezentacija populacije na osnovu analize uzorka. Jedno od najvećih ograničenja pri tome je svakako veličina (obim) uzorka pod kojim se podrazumeva broj elemenata populacije izdvojenih u uzorak. Međutim, veličina uzorka nije jedini faktor koji ograničava tačnost

Page 107: Osnovi inzenjerske statistike

107

zaključaka - čak i veliki uzorak može da dovede do pogrešnog modela. Teorija uzoraka kao deo statistike, bavi se problemom izbora takvog uzorka koji će obezbediti dovoljnu pouzdanost zaključaka o populaciji. Takav uzorak, čija se struktura u odnosu na posmatrano obeležje ne razlikuje značajno od strukture osnovnog skupa, naziva se reprezentativan uzorak. Da bi uzorak bio reprezentativan, mora biti tako obrazovan da svaki element populacije ima jednaku šansu da, nezavisno od ostalih, uđe u uzorak. Za takav uzorak kažemo da je slučajan uzorak. Formiranje slučajnog uzorka iz ograničene populacije (recimo stanovništvo), vrši se uz pomoć tablice slučajnih brojeva koji se mogu naći u priručnicima iz statistike, ili se mogu generisati na računaru. Tablica slučajnih brojeva formira se iz dugačkog niza cifara, 0 - 9, koji se “iseče” na brojeve sa istim odabranim brojem cifara (tablice iz literature najčešće sadrže četvorocifrene brojeve). Svaka od cifara 0 - 9 se u polaznom nizu brojeva približno pojavljuje jednak broj puta (dakle, sa relativnom frekvencom 0.1). Najjednostavniji postupak za formiranje slučajnog uzorka je sledeći. Svi elementi populacije se numerišu. Ako recimo osnovni skup ima manje od 100 elemenata, potreban je niz slučajnih dvocifrenih brojeva (ili se svaki četvorocifren broj iz tablice ismatra kao dva dvocifrena). Počev od nasumce odabranog broja u tablici, uzimaju se redom slučajni dvocifreni brojevi i u uzorak uključuju elementi označeni tim brojevima. Ako takav element ne postoji, taj broj iz tablice jednostavno ispuštamo i nastavljamo postupak.

Statisti čka analiza

Zadatak statističke analize je, kao što smo već naveli, da na osnovu podataka iz uzorka izvede neke zaključke o osnovnom skupu. U postupku statističke analize mogu se izdvojiti sledeće faze:

• statističko posmatranje • sređivanje podataka • obrada i analiza rezultata

Statističko posmatranje se sastoji u planskom prikupljanju podataka o statističkim jedinicama putem anketa, posmatranja, merenja itd. Tako na primer, iz slučajnog uzorka obima n dobijamo niz od n vrednosti (xi, i = 1,...,n)

Sređivanje podataka se sastoji u njihovom tabelarnom i grafičkom prikazivanju , da bi smo dobili neku predstavu o raspodeli posmatrane slučajne veličine. Prvi korak pri tome je uređivanje po veličini dobijenog niza od n brojeva, a rezultat je uređen niz koji se u statistici zove varijacioni niz :

nxxx ,,, 21 (4.1)

Obrada i analiza rezultata obuhvata matematičku obradu sređenih podataka i njihovo tumačenje.

4.2 EMPIRIJSKA RASPODELA

Page 108: Osnovi inzenjerske statistike

108

Polazeći od varijacionog niza (4.1), za svaku od vrednosti u nizu može se odrediti (apsolutna) učestalost pojavljivanja, mi. Dobijeni rezultat je empirijska raspodela frekvenci, koja predstavlja niz parova:

( ) ( ) ( ) nkmxmxmx kk ≤,,,,,,, *2

*21

*1 (4.2a)

za koji se takođe kaže da predstavlja grupisane podatke. Primetimo da je:

nmxxxxk

iink === ∑

=

∗∗

111 ,,

Ako se za grupisane podatke izračunaju relativne frekvence ωi = mi/n, dobija se empirijska raspodela relativnih frekvenci u obliku niza parova:

nkxxx kk ≤ωωω ),,(,),,(),,( *2

*21

*1 … (4.2b)

Jasno je da pri tome važi,

1,11

=ω= ∑∑==

k

ii

k

ii nm (4.2c)

Ako su u pitanju vrednosti neke diskretne slučajne promenljive X, tada

empirijska raspodela relativnih frekvenci predstavlja aproksimaciju zakona raspodele verovatnoće slučajne promenljive X tj. teorijske raspodele i može se prikazati tabelarno, u vidu trakastog dijagrama ili poligona raspodele (Pogl. 2.1). Primer 4.1 U grupi od 25 studenata II godine studija su anketiranjem dobijeni podaci o starosti u godinama:

22, 21, 20, 23, 22, 24, 25, 21, 22, 23, 21, 22, 21, 23, 22, 22, 21, 25, 21, 26, 23, 21, 22, 21, 21

Treba formirati empirijsku raspodelu starosti studenata u apsolutnim i relativnim iznosima.

Rešenje

Imamo uzorak obima n = 25. Posmatrano obeležje, X je starost i treba formirati empirijske raspodele frekvenci i relativnih frekvenci obeležja. Najpre formiramo varijacioni niz:

20, 21, 21, 21, 21, 21, 21, 21, 21, 21, 22, 22, 22, 22, 22, 22, 22, 23, 23, 23, 23, 24, 25, 25, 26

a nakon prebrojavanja jednakih vrednosti, formiramo tražene raspodele u obliku tabele i poligona raspodele.

x* 20 21 22 23 24 25 26 m 1 9 7 4 1 2 1 ω 0.04 0.36 0.28 0.16 0.04 0.08 0.04

Page 109: Osnovi inzenjerske statistike

109

Poligon raspodele za Primer 4.1

Intervalno sre đivanje podataka

Ako je uzorak veliki i ako niz (4.1) sadrži veliki broj međusobno različitih vrednosti obeležja X, vrši se tzv. intervalno sređivanje podataka. Intervalno sređivanje se inače praktikuje kada su u pitanju podaci o neprekidnoj slučajnoj promenljivoj. Interval [a, b) kome pripadaju sve vrednosti X za uzorak, deli se na k podintervala:

[a, u1), [ u 1, u 2), [ u 2, u 3), . . ., [ u k-1, b)

koji se nazivaju klase. Obično se uzima da su klase jednake širine. Sredine klasa ćemo označiti sa *

ix :

kiuu

x iii ,...,1,

21* =+

= −

Frekvence mi, i = 1,...,k sada predstavljaju broj vrednosti obeležja X koje pripadaju prvoj, drugoj, …, k-toj klasi. Za broj klasa ne postoji strogo pravilo. Preporučuje se da ono bude od 5 – 21, zavisno od obima uzorka [Vukadinovic S., 1990.], a u literaturi se sreću i empirijske formule za izbor k, [Ahnazarova S., Kafarov V., 1985.]. Tabelarni prikaz intervalno sređenih podataka dat je u Tab. 4.1. Poslednje tri kolone daju empirijsku raspodelu apsolutnih i empirijsku raspodelu relativnih frekvenci.

Tabela 4.1 Intervalno sređeni podaci

klase sredine klasa

frekvence relativne frekvence

1 [a, u1) *1x m1 ω1

2 [ u 1, u 2) *2x m2 ω2

k [ u k-1, b) *kx mk ωk

∑ n 1

Page 110: Osnovi inzenjerske statistike

110

Pored poligona raspodele, kao grafički prikaz intervalno sređenih podataka koristi se histogram empirijske raspodele. To je niz pravougaonika čije su osnove intervali [ui-1, ui), a visine odabrane tako da su im površine jednake relativnim frekvencama. Primer 4.2 Mereno je vreme izvođenja neke radne operacije u sekundama:

24 28 22 26 24 27 26 25 26 23 30 26 29 25 27 24 26 25 24 27

Formirati tabelu intervalno sređenih podataka u 5 klasa i histogram.

Rešenje

U pitanju je neprekidna slučajna promenljiva. Naravno, podaci iz uzorka su uvek diskretni, ali samo obeležje može biti diskretno ili kontinualno (kao što je ovde slučaj). Najmanji interval u kome leže svi podaci, a njegova širina je deljiva sa 5, je interval [22, 32), pa ćemo usvojiti klase širine,

d = (32 - 22)/5 = 2.

Varijacioni niz je:

22, 23, 24, 24, 24, 24, 25, 25, 25, 26, 26, 26, 26, 26, 27, 27, 27, 28, 29, 30

U poslednjoj koloni su izračunate visine pravougaonika za histogram raspodele relativnih frekvenci uzorka.

klase

sredine klasa

frekvence m

relativne frekvence ω

visina pravougaonika

ω/d

1 [22-24) 23 2 0.1 0.05

2 [24-26) 25 7 0.35 0.175

3 [26-28) 27 8 0.4 0.2

4 [28-30) 29 2 0.1 0.05

5 [30-32) 31 1 0.05 0.025

∑ 20 1

Page 111: Osnovi inzenjerske statistike

111

Histogram za Primer 4.2

Ako je u pitanju neprekidna slučajna promenljiva X, onda histogram daje približnu sliku gustine njene raspodele. Ako bi povećavali obim uzorka i istovremeno smanjivali širinu klasa, svojim gornjim rubovima bi histogram sve bolje aproksimirao krivu gustine raspodele.

Empirijska funkcija raspodele

Pretpostavimo da smo grupisanjem podataka iz varijacionog niza xi, i =1,...,n (4.1), dobili empirijsku raspodelu frekvenci: kimx ii ,...,1),,( *

= pri čemu, u slučaju intervalno

sređenih podataka, vrednosti *ix predstavljaju sredine klasa (vidi tabelu 4.2). Neka je x

bilo koja vrednost na x-osi. Ukupan broj tačaka ix , koje leže levo od odabrane tačke

x, zove se kumulativna frekvenca N(x) i dobija se kao suma:

∑<

=

xxi

i

mxN*

)(

Deljenjem kumulativne frekvence za tačku x ukupnim brojem podataka n, dobijamo relativnu kumulativnu frekvencu , )(* xFn ,

∑<

ω==xx

in

in

xNxF

*

)()(* (4.3)

Jednačina (4.3) predstavlja definiciju empirijske funkcije raspodele. Grafik empirijske funkcije raspodele )(* xFn , potpuno je analogan grafiku funkcije raspodele

F(x) za diskretnu slučajnu promenljivu (Sl. 2.3). Empirijska funkcija raspodele predstavlja aproksimacije funkcije raspodele populacije (teorijska funkcija raspodele) i ukoliko je obim uzorka, n veći, aproksimacija će biti bolja. Primer 4.3 Za uzorak iz primera 4.1 nacrtati grafik empirijske funkcije raspodele.

Page 112: Osnovi inzenjerske statistike

112

Rešenje

U tačkama *ix funkcija )(* xFn ima prekide sa desne strane i vrednosti u

poslednjoj koloni *nF ( *

ix +0) predstavljaju vrednosti funkcije sa desne strane tačke

prekida.

Empirijska funkcija raspodele za Primer 4.3

To, na primer, znači da je 0)20(*

=nF ili 68.0)23(*=nF (uporediti sa funkcijom raspodele

F(x) za diskretnu slučajnu promenljivu (Sl. 2.3).

4.3 TAČKASTE OCENE

Prvi zadatak statistike je procenjivanje numeričkih karakteristika ili parametara slučajne promenljive - obeležja X, kao što su srednja vrednost, disperzija itd. iz uzorka. Ti parametri se takođe nazivaju i parametri teorijske raspodele ili parametri populacije. Treba primetiti da je procenjivanje parametara teorijske raspodele za X uži zadatak od definisanja same teorijske raspodele verovatnoće. Za procene parametara teorijske raspodele, koristi se termin ocene parametara raspodele.

vrednost obeležja

frekvenca relativna frekvenca

kumulativna frekvenca

relativna kumulativna frekvenca

x* m ω N(x*+0) *nF (x*+0)

20 1 0.04 1 0.04 21 9 0.36 10 0.40 22 7 0.28 17 0.68 23 4 0.16 21 0.84 24 1 0.04 22 0.88 25 2 0.08 24 0.96 26 1 0.04 25 1.00

Page 113: Osnovi inzenjerske statistike

113

U daljim razmatranjima biće nam potrebne neke definicije. U dosadašnjem izlaganju, uzorak obima n smo definisali kao niz statističkih jedinica (ei, i = 1,...,n). Tako, u primeru 4.1 imamo uzorak od 25 studenata. U skladu sa ovde postavljenim zadatkom (utvrđivanje parametara raspodele), kao uzorak ćemo posmatrati niz vrednosti obeležja X, koje su izmerene na odabranim statističkim jedinicama,

X(e1), X(e2), . . ., X(en)

i koji ćemo označiti sa (xi, i=1,...,n), pri čemu je,

xi = X(ei)

Tako ćemo u primeru 4.1, kao uzorak posmatrati 25 podataka o godinama starosti. Dakle, uzorak se može smatrati kao n ostvarivanja (realizacija) jedne slučajne promenljive X, koja ima neku funkciju raspodele, F(x). Međutim, imajući u vidu da bi u svakom novom izboru n statističkih jedinica, podaci za prvu, drugu i tako redom statističku jedinicu bili drugačiji (slučajne varijacije X(e1), X(e2), . . ., X(en)), jasna je sledeća definicija uzorka koju ćemo koristiti u postupku procenjivanja parametara raspodele osnovnog skupa.

Slučajni uzorak obima n predstavlja jednu realizaciju niza od n statistički nezavisnih slučajnih veličina X1, X2, . . ., Xn, koje sve imaju istu funkciju raspodele F(x).

Ocenu nekog parametra θ teorijske raspodele, označićemo je sa θ*, dobijamo nekim utvrđenim računskim postupkom iz n vrednosti obeležja u uzorku, xi, i=1,...,n. U skladu sa definicijom uzorka, ocena parametra teorijske raspodele je slučajna promenljiva , kao funkcija n slučajnih promenljivih Xi, i = 1,...,n

Θ* = Θ*(X1, X2, . . .,Xn) (4.4)

ili kratko, funkcija uzorka . Naime, izračunata vrednost ocene formulom (4.4), predstavlja samo jednu moguću realizaciju θ*, slučajne promenljive Θ*, koja je dobijena iz datog uzorka xi, i = 1,...,n:

θ*= Θ*(x1, x2, . . ., xn) (4.5)

Za ocenu parametra, ili funkciju uzorka, uopšte, koristi se termin statistika. Za ocenu konkretnog parametra raspodele, tj. konkretnu statistiku, usvojen je termin uzorački parametar (npr. uzoračka srednja vrednost).

Pošto se dobija kao jedan broj (tačka na brojnoj osi), ocena Θ*, definisana formulom (4.4), zove se tačkasta ocena (point estimate) parametra raspodele θ. Kao slučajna veličina, tačkasta ocena, Θ* ima neku svoju raspodelu verovatnoće i parametre koji karakterišu centar njenih vrednosti i rasipanje oko centra, simetričnost raspodele itd. (poglavlja 2.3-2.5).

U daljim izlaganjima ograničićemo se na slučajne uzorke koji potiču iz beskonačnih ili vrlo velikih osnovnih skupova.

Kriterijumi za izbor ocene parametara raspodele

Page 114: Osnovi inzenjerske statistike

114

Za jedan isti parametar populacije θ mogu se konstruisati različite tačkaste ocene iz uzorka, odnosno različite formule Θ*(x1,x2, . . .,xn). Zato su neophodni kriterijumi za izbor što bolje ocene. Zahtevi koje je poželjno da zadovolji ocena Θ* jesu:

• nepristrasnost ili centriranost, • konzistentnost ili saglasnost, • efikasnost.

Za ocenu Θ* = Θ*(X1,X2,...,Xn) parametra θ kažemo da je centrirana ili nepristrasna (unbiased) ako je njena srednja vrednost jednaka traženom parametru:

M(Θ*) = θ (4.6)

Saglasna (consistent) je ona ocena Θ* = Θ*(X1,X2,...,Xn) parametra θ, koja zadovoljava uslov:

1)(lim * =ε<θ−θ∞→

Pn

za proizvoljno malo ε, tj. po verovatnoći teži traženom parametru,

θ→θ∞→

verov.*

n (4.7)

Ocena je utoliko efikasnija ukoliko je manje njeno rasipanje oko tačne vrednosti, pa je mera efikasnosti neke centrirane ocene θ* recipročna vrednost njene disperzije. Tako je najefikasnija ocena ona saglasna i centrirana ocena, koja ima najmanju disperziju.

4.4 METOD MAKSIMALNE VERODOSTOJNOSTI

U literaturi postoje različite metode za dobijanje tačkastih ocena parametara populacije [npr. Vukadinovic S., 1990.]. Jedan od najpoznatijih je metod maksimalne verodostojnosti ili metod maksimalne verovatnoće (maximum likelyhood method).

Neka je X diskontinualna slučajna promenljiva sa zakonom raspodele verovatnoće p(x, θ1, θ2, . . ., θk) gde su θ1, θ2, . . ., θk (nepoznati) parametri raspodele. Neka je dalje x1, x2, . . ., xn slučajan uzorak. Verovatnoća da se dobiju baš te vrednosti u uzorku jednaka je, obzirom na međusobnu nezavisnost slučajnih veličina Xi, i = 1,..., n,

∏=

θθθn

ikixp

121 ),,,,( …

Ako bi vrednosti u uzorku (xi, i=1,...,n) predstavljale pak vrednosti neke neprekidne promenljive X, tada bi mogli da zamislimo, oko svake od tačaka xi, okolinu širine ε,

ε+ε−2

,2 ii xx

i verovatnoća da prva vrednost x1 padne u prvi interval te širine

Page 115: Osnovi inzenjerske statistike

115

ε+ε−2

,2 11 xx

druga vrednost u drugi interval iste širine, itd. jednaka je proizvodu elemenata verovatnoće sa istom širinom intervala ε,

∏=

θθθεn

iki

n xf1

21 ),,,,( …

gde je sada f(xi,θ1, θ2, . . ., θk) gustina raspodele posmatrane neprekidne slučajne promenljive.

Po metodi maksimalne verodostojnosti, nepoznatim parametrima (θi, i = 1,...,k) treba dodeliti one vrednosti za koje je verovatnoća da se dobije baš posmatrani, realizovani uzorak maksimalna. Sada možemo da navedemo sledeće definicije.

Funkcija verodostojnosti L definiše se kao funkcija parametara raspodele θ1, θ2,..., θ k, slučajne promenljive X:

∏=

θθθ=θθθ=n

ikikn xfxxxLL

1212121 ),,,,(),,,,,,,( ……… (4.8)

gde funkcija f predstavlja • gustinu raspodele posmatrane promenljive ako je ona neprekidna, a • zakon raspodele p(xi,θ1,θ2, . . .,θk) ako je ona diskontinualna.

Niz vrednosti (x1,x2, . . ., xn) je uzorak, tj. realizacija n-dimenzionalne slučajne veličine (X1, X 2, . . ., Xn), gde svaka od slučajnih veličina Xi ima raspodelu identičnu posmatranoj raspodeli. Primetimo da su vrednosti (xi, i = 1,...,n) fiksirane, pa je L funkcija samo nepoznatih parametara.

Ocene maksimalne verodostojnosti (najverodostojnije ocene) **2

*1 ,,, kθθθ …

parametara kθθθ ,,, 21 … za dati uzorak x1,x2,..., xn su one vrednosti parametara (θi,

i = 1,...,k) za koje funkcija verodostojnosti L dostiže maksimum.

Ocene kii ,...,1,* =θ se dobijaju iz potrebnog uslova maksimuma, tj. rešavanjem

sistema od k jednačina:

kiL

i

,...,1,0 ==∂θ∂

(4.9)

S obzirom da je funkcija ln x monotono rastuća, traženi maksimum se može dobiti lociranjem maksimuma funkcije ln L tj. rešavanjem ekvivalentnog sistema jednačina:

kiL

i

,...,1,0ln ==∂θ∂

(4.10)

Naime, s obzirom da je:

0,1)(ln >∂θ∂=

∂θ∂

LL

L

L

ii

izvodi

Page 116: Osnovi inzenjerske statistike

116

ii

LL

∂θ∂

∂θ∂

,ln

postaju jednaki nuli u istoj tački.

Ocene koje daje metod maksimalne verodostojnosti:

• su uvek saglasne • su za velike uzorke najefikasnije • mogu biti pristrasne (necentrirane), mada su uvek asimptotski centrirane

(kada n→∞).

Procenimo, na primer, srednju vrednost i disperziju slučajne promenljive X, sa normalnom raspodelom. Smenom:

σµ−−πσ=σµ

2

2

1exp

2

1),,( i

i

xxf

u (4.8) za funkciju maksimalne verodostojnosti dobijamo:

µ−σ−πσ= ∑=

n

iin xL

1

222/2 )(

2

1exp

)2(

1

Nakon logaritmovanja:

∑=

µ−σ

−σ−π−=n

iix

nnL

1

22

2 )(2

1ln

22ln

2ln

Za ∂lnL/∂µ dobijamo:

∑=

µ−σ=∂µ∂ n

iix

L

12 )(

1ln

i iz uslova 0ln =∂µ

∂ L, sledi jednačina:

0)(11

=⋅µ−=µ− ∑∑==

nxxn

ii

n

ii

koju, pošto ne sadrži drugu nepoznatu 2σ (odnosno σ ), možemo da rešimo nezavisno i dobijemo procenu parametra µ iz datog uzorka tj. µ* :

∑=

=µn

iix

n 1

* 1

Dakle, najverodostojnija ocena srednje vrednosti µ promenljive X sa normalnom raspodelom dobija se kao vrednost sledeće statistike:

Page 117: Osnovi inzenjerske statistike

117

∑=

==µn

iiX

nX

1

* 1

za dati uzorak. Prepoznajemo aritmeti čku sredinu uzorka.

Ocenu za 2σ dobijamo anulirajući izvod 2

ln

∂σ∂ L

:

0)(1

2

1ln

1

2222 =

µ−σ−σ−=∂σ

∂ ∑=

n

iixn

L

odnosno, posle smene x=µ* (kao dobijene procene za za µ) dobijamo procenu 2σ tj.

2* )(σ :

∑=

−==σn

ii xx

ns

1

220

2* )(1

)(

Najverodostojnija ocena disperzije slučajne promenljive koja ima normalnu raspodelu je srednji kvadrat odstupanja pojedinih vrednosti iz uzorka od aritmetičke sredine uzorka, odnosno statistika S0

2:

∑=

−==σn

ii XX

nS

1

220

2* )(1

)(

Ovu ocenu smo mogli da izvedemo i jednostavno koristeći princip da najverodostojniju ocenu srednje vrednosti neke slučajne veličine Y dobijamo kao aritmetičku sredinu n vrednosti te veličine u uzorku, niyi ,...,1, = , dakle, po formuli:

∑=

∗ ==µn

iiy Y

nY

1

1

Kako je disperzija (vidi jednačinu 2.24) očekivana vrednost slučajne veličine ( )2xX µ− ,

neposredna primena te formule, uz ( )2∗µ−= xXY , daje ocenu 20S .

4.5 UZORAČKA SREDNJA VREDNOST

Videli smo da je najverodostojnija ocena srednje vrednosti populacije sa normalnom raspodelom njena aritmetička sredina. Uopšte, aritmeti čka sredina uzorka je prihvaćena kao najbolja ocena srednje vrednosti populacije bez obzira na tip raspodele, tj. generalno se usvaja kao uzoračka srednja vrednost, što se moglo i pretpostaviti na osnovu diskusije na početku poglavlja 2.3. Za uzorak x1,x2, . . ., xn aritmetička sredina se dobija po formuli:

∑=

=

n

iix

nx

1

1 (4.11a)

Page 118: Osnovi inzenjerske statistike

118

Ako su podaci u uzorku grupisani, tj. ako je formirana tabela empirijske raspodele frekvenci (Pogl. 4.2), kimx ii ,...,1),,( *

= iz (4.11a) se dobija sledeća formula za

aritmetičku sredinu:

∑∑==

ω==k

iii

k

iii xxm

nx

1

*

1

*1 (4.11b)

Suma,

∑ωi

ii x*

za razliku od “obične” na desnoj strani jednačine (4.11a), predstavlja sumu vrednosti xi*,

pomnoženih faktorima ωi. Takva suma se u statistici naziva ponderisana suma, a faktori u sumi se zovu statističke težine ili ponderi.

Što se preciznosti izračunavanja aritmeti čke sredine tiče, preporuka [Topping J., 1972.] je da se ona izračunava sa jednom ili dve decimale više, no što je broj decimala u vrednostima iz uzorka, xi.

Primer 4.4 Za uzorak iz primera 4.3 izračunati aritmetičku sredinu.

Rešenje

Po formuli (4.11b):

.2.22)261252241234227219201(25

1godx =⋅+⋅+⋅+⋅+⋅+⋅+⋅=

Srednja vrednost i standardna greška uzoračke srednje vrednosti

Kako je aritmetička sredina (uzoračka srednja vrednost) slučajna veličina, koristeći osobinu (2.20), za njenu očekivanu vrednost dobijamo:

µ=µ==

= ∑∑==

nn

XMn

Xn

MXMn

ii

n

ii

1)(

11)(

11

odnosno µ=µ x (4.12a)

Pokazali smo dakle, da je aritmetička sredina nepristrasna ocena srednje vrednosti slučajne promenljive X, bez obzira na njenu raspodelu.

Koristeći osobinu aditivnosti disperzije u slučaju nezavisnih slučajnih promenljivih (3.28), za disperziju uzoračke srednje vrednosti dobijamo:

n

XDn

XDn

nXD

nX

nDXD

n

ii

n

ii

2

21

21

)(1

)()(11

)(σ====

= ∑∑

==

odnosno, standardno odstupanje je:

Page 119: Osnovi inzenjerske statistike

119

n

x

σ=σ (4.12b)

Za standardno odstupanje neke statistike (funkcije uzorka, uzoračkog parametra) koristićemo i termin standardna greška statistike. Standardna greška aritmetičke sredine data je jednačinom (4.12b). Pri procenjivanju standardne greške nekog uzoračkog parametra, broj zadržanih decimala se uzima jednak broju decimala u vrednosti samog parametra [Topping J., 1972.].

Raspodela uzora čke srednje vrednosti

Parametri raspodele (4.12a,b) ne zavise od zakona raspodele slučajne promenljive X. Što se modela raspodele uzoračke srednje vrednosti tiče, može se konstatovati sledeće:

• Ako slučajna promenljiva X ima normalnu raspodelu N( σµ, ), tada uzoračka

srednja vrednost takođe ima normalnu raspodelu N( nσµ, ), kao linearna kombinacija nezavisnih slučajnih promenljivih Xi, i = 1,...,n sa normalnom raspodelom (vidi jednačine 2.57, 58).

• Ako su slučajni uzorci obima n uzeti iz bilo kakve raspodele sa srednjom vrednošću µx i standardnim odstupanjem σx, raspodela uzoračke srednje vrednosti

teži normalnoj raspodeli N( nxx σµ , ), kada obim uzorka n neograničeno

raste (sledi iz centralne granične teoreme). Primer 4.5 Zadata je normalna raspodela N(50,2). U kojim granicama će se, sa verovatnoćom 95%, kretati aritmetička sredina uzorka obima n = 16?

Rešenje

Aritmetička sredina ima normalnu raspodelu sa

5.016

2,50 ==σ=σ=µ=µ

nxx

Koristimo rezultat primera 2.17:

xxxx x σ+µ≤≤σ−µ 96.196.1

odnosno:

98.050±=x .

Primer 4.6 Za uzorak od 400 podataka, izračunata uzoračka srednja vrednost (aritmetička sredina) je 2.62. Ispitati da li se taj uzorak može prihvatiti kao slučajan uzorak iz osnovnog skupa sa parametrima,

Page 120: Osnovi inzenjerske statistike

120

24.1,42.2 =σ=µ xx

Rešenje

Problem je proceniti da li je uočena razlika aritmetičke sredine uzorka i pretpostavljene srednje vrednosti populacije,

=− 42.262.2 0.20

po apsolutnoj vrednosti tako velika, da je vrlo malo verovatno da bi dati uzorak mogao da bude reprezentativan uzorak iz date populacije. Pretpostavimo da je dati uzorak slučajan i da pripada opisanoj populaciji, ili da je izračunata aritmetička sredina, 62.2=x ocena srednje vrednosti, 42.2=µx posmatrane

slučajne veličine, X. Da li nam uočeno odstupanje dve vrednosti daje za pravo da tu pretpostavku ili hipotezu odbacimo (sa neznatnim rizikom da grešimo)? Drugim rečima, da li je ono dovoljno značajno, tako da je vrlo malo verovatno da je rezultat normalnih slučajnih varijacija ocene parametra oko njegove vrednosti? Odgovor možemo da dobijemo na osnovu raspodele verovatnoće ocene. Pri datoj pretpostavci - hipotezi, uzoračka srednja vrednost bi imala, s obzirom da je u pitanju relativno veliki uzorak, tačno ili vrlo približno normalnu raspodelu sa parametrima:

( ) ( )

062.0400

24.1,42.2

12.412.4

==σ=σ=µ=µnx

b

xx

a

x

bez obzira na raspodelu populacije. Tada, u skladu sa pravilom tri sigme (Pogl. 2.4), bilo bi gotovo neverovatno (verovatnoća manja od 0.3%), da izračunata srednja vrednost uzorka, 62.2=x padne izvan intervala xx σ±µ 3 , odnosno da

bude,

3ili3 >σµ−

σ>µ−x

xxx

xx

Kako je,

323.3062.0

20.0 >==σµ−

x

xx

uočeno odstupanje smatramo značajnim i odbacujemo pretpostavku da je dati uzorak slučajan uzorak iz populacije sa datim parametrima raspodele. Rizik, ili verovatnoća da smo pri tome pogrešili je samo oko 0.3%, kolika je približno verovatnoća da se ipak dogodi toliko veliko odstupanje srednje vrednosti uzorka od srednje vrednosti populacije.

4.6 UZORAČKA DISPERZIJA

U slučaju populacije sa normalnom raspodelom, kao najverodostojnija je dobijena statistika S0

2:

∑=

−=

n

ii XX

nS

1

220 )(

1

Page 121: Osnovi inzenjerske statistike

121

Pošto metod maksimalne verodostojnosti ne garantuje nepristrasnost ocene, proverićemo nepristrasnost ocene S0

2. Zato potražimo prvo,

[ ] [ ]

[ ]∑ ∑∑∑∑

µ−+µ−µ−−µ−=µ−−µ−=−

22

22

)())((2)(

))()(()(

XXXXM

XXMXXM

ii

ii

Poslednji član u izrazu je očigledno jednak:

22 )()( µ−=µ−∑ XnX

Što se srednjeg člana tiče imamo:

2)(

)(

))((

)()())((

µ−=

µ−µ−=

µ−µ−=µ−µ−=µ−µ−

∑∑∑∑

Xn

n

XnX

nXX

XXXX

i

i

ii

Nakon smene dva rezultata:

[ ] [ ][ ] [ ][ ] [ ]

)()1(

)()(

)()(

)()(

)()(

)()()(

22

22

222

XDnn

XDnXnD

XnDXnD

XnMXM

XnMXM

XnXMXXM

i

i

ii

−=

−=

−=

−−−=

−−−=

−−−=−

∑∑∑∑

µµ

µµ

µµ

Konačno,

[ ] )(1

)(1

)( 220 XD

n

nXXM

nSM i

−=−= ∑

Znači da statistika S02 ne predstavlja centriranu ocenu disperzije osnovnog skupa, ali je

asimptotski centrirana, tj. “pristrasnost” se gubi za velike uzorke jer:

11

lim =−

∞→ n

nn

Korekcijom statistike S02, može se doći do nepristrasne ocene za D(X). Ako

pomnožimo S02 sa

1−n

n dobićemo:

)()(11

)( 20

20

2 XDSMn

nS

n

nMSM =−=

−=

Tako se kao uzoračka disperzija koristi statistika S2:

∑=

−−

=

n

ii XX

nS

1

22 )(1

1 (4.13)

Page 122: Osnovi inzenjerske statistike

122

Iz konzistentnosti (4.7) najverodostojnije ocene disperzije S02, sledi da je i ocena S2

konzistentna. S02 kao najverodostojnija ocena ima i osobinu da ima najmanju disperziju

(najefikasnija ocena). Pošto je:

)()(1

)( 20

20

22 SDSD

n

nSD >

−=

)( 2SD nije najefikasnija ocena, ali je asimptotski najefikasnija, jer

11

lim =−∞→ n

nn

Prakti čne formule za računanje disperzije uzorka (x1,x2,...,xn) su:

Za negrupisani uzorak:

−−=−−= ∑∑

∑=

=

=

2

1

2

2

1

1

22

1

1]

)([

1

1xnx

nn

xx

ns

n

ii

n

iin

ii (4.14a)

Za grupisani uzorak:

−−=−−= ∑∑

∑=

=

=

2

1

2*

2

1

*

1

2*2

1

1]

)([

1

1xnxm

nn

xmxm

ns

k

iii

k

iiik

iii (4.14b)

Primer 4.7 U tabeli je dat je uzorak sa grupisanim podacima. Proceniti a) srednju vrednost i disperziju osnovnog skupa. b) standardnu grešku uzoračke srednje vrednosti Tabela uz Primer 4.7

Rešenje

a) Statističke ocene srednje vrednosti i disperzije osnovnog skupa su aritmetička sredina (4.11a) i korigovano srednje kvadratno odstupanje (4.13). U sledećoj tabeli prikazan je tok proračuna neophodnih suma za izračunavanje tih statistika prema formulama (4.11b) i (4.14b):

Klase Sredina klasa

Frekvence

x* m 1. 1.45 - 1.95 1.7 2 2. 1.95 - 2.45 2.2 1 3. 2.45 - 2.95 2.7 4 4. 2.95 - 3.45 3.2 15 5. 3.45 - 3.95 3.7 10 6. 3.95 - 4.45 4.2 5 7. 4.45 - 4.95 4.7 3

Page 123: Osnovi inzenjerske statistike

123

( )4857.0

40

5.13675.484

39

1][

1

1

413.340

5.1361

22*2*2

*

=

−=−−=

===

∑∑

n

xmxm

ns

xmn

x

iiiix

ii

Broj zadržanih decimala u krajnjem rezultatu za aritmeti čku sredinu je veći za 2 od broja decimala u polaznim podacima, u skladu sa preporukom o potrebnoj preciznosti statističkih proračuna.

U starijim priručnicima (namenjenim za “ručno” računanje, a ne pomoću računara) preporučuje se linearna transformacija originalne slučajne promenljive X, takva da vrednosti nove promenljive U budu celi brojevi,

U = (X - c)/d

gde je d širina intervala grupisanja, a c jedna od vrednosti sredina intervala x* - obično ona koja leži u blizini sredine intervala ],[ 1

∗∗nxx . Tako se znatno

olakšava proračun, jer se aritmetička sredina i disperzija računaju za novu, celobrojnu promenljivu U, a onda se na osnovu osobina srednje vrednosti i disperzije (poglavlja 2.3, 2.4) iz u i 2

us računaju x i 2xs :

222, ux sdscudx ⋅=+⋅=

Ako odaberemo c = 3.2 (srednja u nizu vrednosti x*), onda, s obzirom da je d = 0.5, nova promenljiva U se računa kao:

U = (X - 3.2)/0.5

U sledećoj tabeli je prikazan proračun za prethodni primer uz pomoć linearne transformacije podataka.

Tok proračuna sa transformisanim podacima

x* m m x* m (x*)2 1.7 2 3.4 5.78 2.2 1 2.2 4.84 2.7 4 10.8 29.16 3.2 15 48.0 153.60 3.7 10 37.0 136.90 4.2 5 21.0 88.20 4.7 3 14.1 66.27 ∑ 40 136.5 484.75

x* m u m u m u2 1.7 2 -3 -6 18 2.2 1 -2 -2 4 2.7 4 -1 -4 4 3.2 15 0 0 0 3.7 10 1 10 10 4.2 5 2 10 20 4.7 3 3 9 27 ∑ 40 17 83

Page 124: Osnovi inzenjerske statistike

124

( )

4857.04125.35.0

413.32.34255.0

9429.140

1783

39

1][

1

1

425.040

171

2222

22*2*2

*

=⋅=⋅==+⋅=+⋅=

=

−=−−=

===

∑∑

ux

iiiiu

ii

sds

cudx

n

umum

ns

umn

u

b) Standardnu grešku aritmetičke sredine procenjujemo tako što u formuli (4.12b) standardno odstupanje osnovnog skupa, zamenjujemo njegovom ocenom

2ss = iz uzorka,

110.040

4857.0===

n

ss x

x

U skladu sa preporukom, broj zadržanih decimala u vrednosti standardnog odstupanja nekog parametra uzorka (ovde standardno odstupanje aritmetičke sredine, 110.0=xs ), jednak je broju zadržanih decimala u vrednosti samog

parametra ( 413.3=x ). Kao delimičan rezultat, procena disperzije 2xs = 0.4857

je, međutim, računata sa jednom decimalom više.

4.7 BROJ STEPENI SLOBODE

Veličina (n - 1) u imeniocu izraza za disperziju uzorka (4.13) naziva se broj stepeni slobode, d pri procenjivanju disperzije populacije, odnosno

1,)(1

1

22−=−= ∑

=

ndxxd

sn

ii

Termin broj stepeni slobode se koristi u računskim problemima uopšte, da označi broj nezavisnih veličina ili podataka u proračunu. Veličine iz kojih se računa uzoračka disperzija s2 su odstupanja od aritmetičke sredine nixxi ,...,1),( =− . Nije teško uveriti

se da je njihova suma jednaka nuli:

0)(11

=−=−=− ∑∑==

xnxnxnxxxn

ii

n

ii

Znači da od n odstupanja, nezavisno može da se izračuna (n - 1), a preostalo n-to odstupanje se dobija kao dopuna do nule, što sledi iz veze koju daje aritmetička sredina. Drugim rečima, između n podataka (xi, i = 1,...,n) iz kojih se računa disperzija uzorka postoji jedna veza, a to je formula za aritmetičku sredinu,

∑=

=

n

iix

nx

1

1

koja, kao prethodno izračunat parametar, takođe figuriše u proračunu disperzije. Broj stepeni slobode d je vrlo važan pojam u statistici i daćemo, u skladu sa njegovim značenjem, postupak određivanja d pri proračunu nekog parametra uzorka.

Page 125: Osnovi inzenjerske statistike

125

Broj stepeni slobode d pri proračunu nekog parametra (funkcije uzorka) θ* jednak je razlici između obima uzorka n i broja prisutnih veza k između podataka

d = n - k (4.15)

Broj veza se može odrediti kao broj ostalih uzoračkih parametara (θi*, i = 1,..., k),

koji figurišu u proračunu posmatranog parametra.

Uzmimo na primer da ocenjujemo uzoračku disperziju uz pretpostavku da je srednja vrednost populacije, µx poznata. Tada bi nepristrasnu i konzistentnu ocenu disperzije, u skladu sa konceptom broja stepeni slobode, računali po formuli za najverodostojniju ocenu,

n

x

d

xss xixi ∑∑ µ−

=µ−

==22

20

2 )()( (4.16)

gde je d = n, jer je k = 0 (ne računa se aritmetička sredina). 4.8 χ2 RASPODELA UZORAČKE DISPERZIJE

Ako je slučajan uzorak uzet iz populacije sa normalnom raspodelom, tada slučajna veličina:

∑=

σ−=σ

−=χ n

i

i XXSn

1

2)13.4(

2

22 )1(

(4.17)

ima raspodelu koja je u literaturi poznatu pod imenom χ2 raspodela. Naime, χ2 je oznaka za sumu na desnoj strani jednačine (4.17), gde eksponent 2 treba da naglasi da je njena vrednost, kao zbira kvadrata, uvek pozitivna.

Za neku promenljivu X kažemo da ima χ2 raspodelu, ako je gustina raspodele:

0,

22

1)( 2

12

2

>

Γ= −−

xexd

xfxd

d (4.18)

gde Γ označava gama funkciju [Bronštajn I., Semendjajev K., 1980.] definisanu kao:

0,)(0

1 >=Γ ∫∞ −− zdtetz tz (4.18a)

χ2 raspodela ima samo jedan parametar, d koji je prirodan broj i zovemo ga broj stepeni slobode raspodele.

Pokazuje se da slučajna veličina χ2, definisana jednačinom (4.17) ima χ2 raspodelu sa brojem stepeni slobode,

d = n – 1

Page 126: Osnovi inzenjerske statistike

126

upravo jednakom broju stepeni slobode, definisanom u prethodnom poglavlju, sa kojim se računa vrednost statistike 2S , kao ocene disperzije populacije, 2σ . Na slici 4.1 date su krive gustine χ2 – raspodele, za različite brojeve stepeni slobode, d.

Slika 4.1 χ2 raspodela

Može se pokazati da su parametri slučajne promenljive χ2 (4.17):

M(χ2) = d, D(χ2) = 2d (4.19)

Raspodela je asimetrična sa pozitivnim koeficijentom asimetrije, γ1 (Pogl. 2.5) koji se približava nuli kada broj stepeni slobode d raste, a pri tom raspodela teži normalnoj raspodeli. Praktično, za d > 30, χ2 - raspodela se može zameniti normalnom [Vukadinovic S., 1990.].

Page 127: Osnovi inzenjerske statistike

127

ZADACI 4.1 Dati su grupisani rezultati merenja:

Klase Frekvence 4.92 - 4.94 2

4.94 - 4.96 7

4.96 - 4.98 14

4.98 - 5.00 10

5.00 - 5.02 6

5.02 - 5.04 3

a) Nacrtati poligon i histogram empirijske raspodele b) Izračunati srednju vrednost i standardno odstupanje uzorka

4.2 Naći najverodostojniju ocenu parametra µ u Poasonovoj raspodeli (2.42).

4.3 Naći najverodostojniju ocenu parametra 1/λ, gde je λ parametar u Eksponencijalnoj raspodeli (2.17).

4.4 Pokazati da, ako su *2

*1 i ΘΘ nepristrasne ocene parametara populacije θ1 i θ2, onda

je statistika *2

*1 Θ+Θ ba nepristrasna ocena parametra 21 θ+θ ba .

4.5 Pokazati da, ako je *Θ nepristrasna ocena parametra θ,

a) Statistika ( )2*Θ nije nepristrasna ocena parametra θ2

b) Nepristasna ocena za θ2 je

( ) 22**θ−Θ S

gde je 2*θS uzoračka disperzija ocene *Θ .

(Pomoć: Jedn. 2.27) 4.6 Pet merenja prečnika kruga (cm) su:

42.1, 42.3, 41.8, 41.9, 42.4

Potrebno je proceniti obim i površinu kruga i diskutovati nepristrasnost procena. Za π uzeti vrednost 3.142. 4.7 Iz osnovnog skupa, čije je standardno odstupanje poznato i iznosi σ = 2.0, uzet je

slučajan uzorak obima n = 16 a) Naći standardnu grešku srednje vrednosti uzorka b) Koliki bi trebalo da bude obim uzorka da bi standardna greška srednje vrednosti bila najviše jednaka 0.2? 4.8 Dva slučajna uzorka obima n1 i n2 su uzeta iz osnovnog skupa sa disperzijom σ2. Njihove srednje vrednosti su 21 i xx . Pokazati da je standardna greška razlike 21 xx − jednaka:

Page 128: Osnovi inzenjerske statistike

128

21

11

nn+σ

4.9 Slučajan uzorak obima 10 je uzet iz standardizovane normalne raspodele. Odrediti vrednosti a i b takve da je:

( ) ( ) 975.0=<=< bxPxaP

Page 129: Osnovi inzenjerske statistike

129

5 Statistička analiza grešaka merenja

Rezultati laboratorijskih i pogonskih merenja mogu da sadrže tri vrste grešaka: grube, sistematske i slučajne.

Grube greške su posledica grubog narušavanja propisanog postupka ili uslova merenja. Uočavaju se po značajnom odstupanju nekog rezultata od ostalih, pri ponavljanju merenja. Objektivnu procenu da li je odstupanje značajno ili ne daje statistika i u poglavlju 7 biće diskutovani statistički testovi za identifikaciju sumnjivih merenja.

Sistematske greške su ili konstantne ili se pravilno menjaju po nekoj zakonitosti i vode do “precenjivanja” ili “potcenjivanja” vrednosti veličine koja se meri. One nisu lako uočljive kao grube greške jer su prisutne ne u pojedinim već u svim rezultatima ponovljenih merenja. Da bi se detektovale neophodno je raspolagati referentnom vrednošću za merenu veličinu, koju smatramo tačnom. I pri identifikaciji sistematskih grešaka koriste se takođe statistički testovi. Pošto se identifikuju, sistematske greške,

• se odstranjuju ako je moguće, ili • se uvode korekcioni faktori - popravke rezultata merenja dobijeni iz tzv.

kalibracionih krivih

Posle uklanjanja grubih i sistematskih grešaka preostaju slučajne greške koje predstavljaju sumu velikog broja malih, nekontrolisanih poremećaja, koji se ne mogu otkloniti i čija je raspodela opisana normalnim zakonom sa nultom srednjom vrednošću (Pogl. 2.3) Kao što smo u poglavlju 2.3 (2.24-25) pokazali tačna vrednost merene veličine predstavlja srednju ili očekivanu vrednost, µx rezultata merenja kao slučajne veličine, X. Odnosno, kako je rezultat merenja X jednak zbiru tačne vrednosti µx i slučajne greške merenja ∆X, tada je:

xxx XMMXMXM µ=∆+µ=∆+µ= )()()()( (5.1)

Pošto je najbolja statistička ocena srednje vrednosti, µx aritmetička sredina uzorka, kao konačan rezultat merenja (reprezentativna vrednost), uzima se aritmeti čka sredina rezultata n ponovljenih merenja (4.11a).

Page 130: Osnovi inzenjerske statistike

130

5.1 REPRODUKTIBILNOST, TA ČNOST I PRECIZNOST

Ponovljena merenja sa ciljem da se dobije što bolja procena merene veličine, moraju zadovoljavati uslov da predstavljaju reprezentativan uzorak, odnosno da svih n ponovljenih merenja x1,x2,...,xn pripadaju istom osnovnom skupu. Statistički, takva merenja predstavljaju realizacije n slučajnih nezavisnih veličina X1,X2,...,Xn sa identičnom raspodelom verovatnoće (Pogl. 4.3).

Da bi se dobio reprezentativan uzorak, merenja moraju biti reproduktibilna , što znači da se mogu ponoviti potreban broj puta pod istim uslovima: aparatura, metod, okolina (koliko je to moguće), operator.

Za rezultat merenja X kažemo da je tačan ako ne sadrži grubu i sistematsku grešku. Tačan rezultat međutim sadrži slučajnu grešku, ali je njegova srednja vrednost, kao slučajne veličine, jednaka tačnoj vrednosti merene veličine (5.1).

Preciznost merenja znači malo rasipanje rezultata ponovljenih merenja [IUPAC Compendium of Chemical Terminology (Gold Book) 2008]. Primetimo da precizna merenja mogu biti netačna (sadrže sistematsku grešku) kao što tačna merenja (nema sistematske greške) mogu biti neprecizna - veliko rasipanje rezultata.

Treba razlikovati: • preciznost metode • preciznost krajnjeg rezultata

Statistička mera preciznosti metode je standardno odstupanje merenja X:

)(XDx =σ

i uobičajen naziv je (standardna) greška metode. Pošto je standardno odstupanje populacije nepoznata, kao greška metode usvaja se njena ocena sx dobijena iz velikog broja merenja (Pogl. 5.2).

Mera preciznosti konačnog rezultata je standardna greška aritmetičke sredine n ponovljenih merenja (4.12b), odnosno, njena ocena:

n

ss x

xx ==σ* (5.2)

koju zovemo i (standardna) greška izmerene veličine.

Kao relativna mera preciznosti usvojenog rezultata koristi se koeficijent varijacije (4.31) aritmetičke sredine:

x

xx µ

σ=δ (5.3)

Njegova procena iz uzorka je:

x

sxx =δ* (5.4)

koja se zove i (standardna) relativna greška izmerene veličine.

Page 131: Osnovi inzenjerske statistike

131

Na slici 5.1a, prikazani su mogući rezultati 8 ponovljenih merenja neke determinisane (neslučajne) veličine (npr. dužina, masa, temperatura) za tri njene (tačne) vrednosti: x = 1,2,3, dobijeni računarskom simulacijom uz sledeće pretpostavke:

• merna metoda ne sadrži sistematsku grešku • obezbeđena je reproduktibilnost merenja • preciznost metode ne zavisi od vrednosti merene veličine • postoji mogućnost grube greške, zbog grubog narušavanja propisanog

postupka ili subjektivne nenamerne greške operatera (npr. pogrešno očitavanje sa instrumenta)

• rezultati merenja, Xexp izuzimajući one sa grubom greškom, imaju normalnu raspodelu

Izmere

na vr

edno

st, xe

xp

Slika 5.1a Ponovljena merenja iste preciznosti u odsustvu sistematske greške

U skladu sa pretpostavkama, srednja vrednost merenja, µx, ako se izuzmu merenja sa grubom greškom, jednaka je tačnoj vrednosti merene veličine x (1, 2 ili 3), a njihova disperzija, σx je jednaka standardnoj greški metode, σ = const. Slika pokazuje da se izmerene vrednosti, xexp rasipaju oko tačne u opsegu x ± 3σ, izuzimajući jednu, za x = 1, čije je odstupanje od aritmetičke sredine ostalih 7 merenja uočljivo. Sa pouzdanošću, većom od 99.7 % za to merenje možemo da tvrdimo da sadrži grubu grešku, pa ga možemo odbaciti.

Page 132: Osnovi inzenjerske statistike

132

Slika 5.1b Ponovljena merenja sa promenljivom preciznošću u odsustvu sistematske greške

Za rezultate na slici 5.1b važe iste pretpostavke, izuzimajući preciznost metode, za koju se pretpostavlja da opada sa povećanjem vrednosti merene veličine. Tako, uzeto je da standardna greška metode, σ linearno raste sa x i uočavamo da je rasipanje merenja najveće za x = 3.

Konačno, slike 5.1c,d ilustruju okolnosti kada metoda nije tačna, tj. sadrži sistematsku grešku koja je konstantna (Sl. 5.1c) ili funkcija vrednosti merene veličine (Sl. 5.1d), a rezultati merenja ne sadrže grubu grešku.

Slika 5.1c Ponovljena merenja iste preciznosti sa konstantnom sistematskom greškom

Slika 5.1d Ponovljena merenja iste preciznosti sa promenljivom sistematskom greškom

Primer 5.1 Sadržaj bakra (%) u nekoj hemikaliji se određuje metodom čija je greška σ = 2%.

a) Koliko ponovljenih merenja je neophodno da bi greška procene stvarnog sadržaja bakra bila manja od 0.6%? b) Ako datu metodu (1) treba zameniti jeftinijom (2) sa duplo manjom preciznošću, koliko puta treba povećati broj ponavljanja merenja?

Rešenje

Page 133: Osnovi inzenjerske statistike

133

a) Broj ponovljenih merenja odredićemo iz uslova

6.0<σ

=σn

x

koji daje:

1.1133.3,33.36.0

2 2 =>=> nn

usvajamo n = 12.

b) Formula (5.2) navodi na zaključak da se može jeftinije dobiti rezultat zadovoljavajuće tačnosti, jeftinijom - manje preciznom metodom uz veći broj merenja, nego preciznijom - skupljom metodom. Pošto je σ2 = 2σ1, iz uslova:

1

1

2

2

nn

σ=

σ

dobijamo:

42

2

1

1

2

1

2

1

2 =

σσ=

σσ=

n

n

Dakle, treba izvršiti 4 puta više merenja. 5.2 OCENA GREŠKE METODE IZ TEKU ĆIH MERENJA

Da bi se što tačnije procenila greška metode σ, neophodno je raspolagati što većim uzorkom (xi, i = 1,...,m) iz koga se, po formuli (4.14a), računa uzoračka disperzija s2 i

onda iz nje greška kao uzoračko standardno odstupanje, 2ss = . Takav postupak bi bio skup i umesto toga greška se može proceniti iz rezultata tekućih merenja na različitim probama* materijala u toku dužeg vremenskog perioda pod pretpostavkom da je greška metode (preciznost) konstantna tj. ne menja sa sa vrednošću izmerene veličine.

U pitanju su uzorci iz populacija sa različitim srednjim vrednostima (tačne vrednosti merene veličine u različitim probama). Sve te populacije karakteriše isti tip raspodele i ista disperzija (pog 2.8), odnosno slučajne veličine rezultata merenja u i-toj probi imaju raspodelu Xi: N(µi,σ) , (i = 1,...,n) gde je n broj proba. Kako je u pitanju ista metoda, greške merenja imaju raspodelu ∆Xi: N(0,σ). Zaista, ako sa µi označimo tačnu, nepoznatu vrednost merene veličine iz i-te probe, a sa ∆Xi slučajnu grešku merenja, u odsustvu sistematskih i grubih grešaka iz (5.1) sledi:

D(Xi) = D(µi + ∆Xi) = D(∆Xi) = σ2

Dakle, disperzija merenja je ista za populacije sa različitim srednjim vrednostima i jednaka disperziji slučajne greške merenja. * Umesto termina proba uobičajeniji je termin uzorak materijala ali je ovde izbegnut jer se pod uzorkom podrazumeva statistički uzorak definisan u pogl.4.1

Page 134: Osnovi inzenjerske statistike

134

Pretpostavimo da je uzeto n proba i za svaku od njih izvršen određen broj ponovljenih merenja: za prvu probu m1, za drugu m2, . . ., za n-tu mn. Tako raspolažemo sa ukupno:

∑=

=

n

iim

1

N

merenja, odnosno sa objedinjenim uzorkom obima N, nastalim spajanjem n opisanih uzoraka. Na osnovu prethodne diskusije, objedinjeni uzorak možemo smatrati uzorkom iz normalne raspodele, N(0,σ) slučajnih grešaka merenja. Ocenu disperzije σ2, tj. uzoračku disperziju objedinjenog uzorka dobićemo kao:

slobodestepenibroj

odstupanjasvihkvadratasuma2=s

d

xx

d

is

n

i

m

jiij

n

i

i∑∑∑= ==

−=

−= 1 1

2

12

)(probutuza

odst.kvad. suma

gde merenja xij, j = 1,...,mi pripadaju i-toj probi, a njihova aritmetička sredina je ix . U

skladu sa postupkom određivanja broja stepeni slobode (Pogl. 4.6), d ćemo dobiti kao:

d = N - n

gde je broj veza jednak broju aritmetičkih sredina ( ix , i = 1,...,n) koje učestvuju u

proračunu. Pošto je

∑∑==

==

n

i

n

ii nm

11

1,N

imamo:

∑∑∑∑====

=−=−=

n

ii

n

ii

n

i

n

ii dmmd

1111

)1(1 (5.5)

Broj stepeni slobode d, pri računanju uzoračke disperzije objedinjenog uzorka

nastalog spajanjem n uzoraka sa različitim srednjim vrednostima, jednak je zbiru brojeva stepeni slobode spojenih uzoraka: Pošto je, u skladu sa jednačina (4.13):

2

1

2)( ii

m

jiij sdxx

i

=−∑=

konačno dobijamo disperziju objedinjenog uzorka kao:

∑=

=

n

iiisd

ds

1

22 1 (5.6)

Dobijeni izraz predstavlja ponderisanu srednju vrednost (aritmetičku sredinu) disperzija pojedinih uzoraka, sa težinama jednakim stepenima slobode uzoraka di .

Primer 5.2 Rezultati kolorimetrijskog određivanja koncentracija (%) P2O5 u sistemu

(NH4)2HPO4 - K2CO3 - H2O, dati su u tabeli. Proceniti grešku kolorimetrijske metode.

Page 135: Osnovi inzenjerske statistike

135

Rešenje

Za svaku od proba izračunavamo, prema jednačina (4.14a):

∑∑

=

=

−= i

i

m

j i

m

jij

ijii m

x

xsd1

2

122

14822

447.0,140.0,010.1

805.1,680.1,610.0,0800.0

620.03

9.8149.2236

1

288

277

266

255

244

233

222

2211

=−=−=−=

===

====

=−=

∑=

n

ii nmnd

sdsdsd

sdsdsdsd

sd

N

Iz (5.6) se dobija: s2 = 0.456, s = 0.675%

5.3 UTICAJ GREŠKE PRI UZIMANJU PROBA

Pri nekim analitičkim određivanjima, prisutne su varijacije pri uzimanju različitih proba materijala. Na primer, pri proceni srednje vrednosti sadržaja šećera u šećernoj repi se kao osnovni skup posmatra sva količina šećerne repe na svim parcelama, kao uzorak uzima određena količina šećerne repe na izabranom broju parcela a kao proba, određen broj šećernih repi sa jedne parcele. U takvim analizama, važno je da postupak uzimanja uzoraka i proba obezbedi da varijacije ispitivanog svojstva budu slučajne tj. da se ostvari reprezentativnost posmatranog statističkog uzorka. U primeru sa šećernom repom, nasumično se biraju parcele (uzorak) i nasumično se sa date parcele biraju šećerne repe (probe).

Pojedinačno merenje, x u uzorcima kod kojih su prisutne varijacije zbog nehomogenosti materijala koji se ispituje, predstavlja realizaciju slučajne veličine X. Ako je obezbeđena reprezentativnost proba, tj. otsutne su sistematske greške probe i ako nema grubih i sistematskih grešaka merenja, posmatrana slučajna veličina predstavlja zbir:

Broj opita

Broj probe

1 2 3 4 5 6 7 8 1 27.9 19.3 4.5 22.3 10.8 16.3 8.8 12.6 2 27.2 19.7 5.2 23.5 8.9 15.8 8.7 13.5 3 26.8 - 4.8 21.7 - 17.2 9.2 13.3

∑ xj 81.9 39.0 14.5 67.5 19.7 49.3 26.7 39.4

∑ xj2 2236.49 760.58 70.69 1520.43 195.85 811.17 237.77 517.90

mi 3 2 3 3 2 3 3 3

Page 136: Osnovi inzenjerske statistike

136

X = µx + ∆XP + ∆XA (5.7)

gde su: µ x - srednja vrednost ispitivanog svojstva, ∆XA - slučajna greška merenja, ∆XP - slučajna varijacija između proba, koju ćemo zvati slučajna greška probe.

Pri tom, za slučajne veličine ∆XA i ∆XP važi:

M(∆XA) = M(∆XP) = 0

Neka je uzeto n proba i za svaku od proba je m puta ponovljeno merenje. Kao procenu srednje vrednosti µx uzimamo aritmetičku sredinu posmatranog slučajnog uzorka sa ukupno N = n m rezultata merenja:

∑∑∑∑

= =

= = ∆+∆+µ==n

i

m

jAPx

n

i

m

jij

jijiXX

mnmn

X

X1 1

1 1 )(1

,,

Za sva ponovljena merenja na jednoj probi (uzorku materijala), slučajna greška probe ima istu vrednost:

miXXXXimiii PPPP ,...,1,

,2,1,=∆=∆==∆=∆ …

pa imamo dalje:

∑∑∑∑∑∑

= ==

= ==

∆+∆+µ=

∆+∆+µ=n

i

m

jA

n

iPx

n

i

m

jA

n

iPx

jii

jii

Xmn

Xn

XXmmnmn

X

1 11

1 11

,

,

11

)(1

Pošto je u pitanju slučajni statistički uzorak, slučajne veličine niX

iP ,...,1, =∆ i

ijAX∆ , i = 1,..., n, j = 1,...,m su nezavisne pa za disperziju srednje vrednosti važi princip

aditivnosti disperzije (3.28):

∑∑∑= ==

∆+∆==σn

i

m

jA

n

iPx jii

XDnm

XDn

XD1 1

221

22 )(

1)(

1)(

,

Kako je:

mjniXD

niXD

AA

PP

ij

i

,...,1,...,1,)(

,...,1,)(2

2

==σ=∆=σ=∆

konačno dobijamo:

mnnAP

x

222 σ

=σ (5.8)

Prodiskutovaćemo racionalan izbor broja proba, n i broja ponavljanja merenja, m za svaku probu, koji će da obezbedi potrebnu tačnost rezultata, tj. srednje vrednosti uzorka, x . Iz jednačine (5.8) je očigledno da pri datom ukupnom broju merenja N = n m, na

Page 137: Osnovi inzenjerske statistike

137

ukupnu grešku rezultata xσ veći uticaj ima broj proba n od broja ponavljanja m pri datim

greškama probe i analize σP i σA, što je naročito izraženo pri relativno velikim greškama probe. Ako odnos 22 i AP σσ označimo sa ξ, onda se jednačina (5.8) može napisati kao:

)1

(222

2

mnnmnAAA

x +ξσ=σ+ξσ=σ (5.8a)

Grafici zavisnosti ukupne disperzije 2xσ od odnosa disperzija greške probe i greške

analize ξ, pri odabranim vrednostima n i m, a za izabrano σA = 1, dati su na slici 5.2. Pri tri probe i tri ponavljanja merenja za svaku od proba (ukupno 9 merenja) greška rezultata je veća nego pri četiri probe i samo dva ponavljanja (ukupno 8 merenja). Pri ukupno samo pet merenja - jedno merenje (m = 1) za svaku od n = 5 proba, greška se smanjuje u odnosu na prvi slučaj (n = 3, m = 3), ako je odnos ξ > 0.65 (presek pravih), a pri ξ > 1.5 i u odnosu na drugi slučaj (n = 4, m = 2).

Slika 5.2 Ukupna disperzija rezultata σ2 u funkciji odnosa disperzija greške probe i greške analize ξ

5.4 PROCENJIVANJE SREDNJE VREDNOSTI IZ MERENJA RAZLIČITIH PRECIZNOSTI

Pretpostavimo da rezultati n merenja, nixi ,...,1, = u reprezentativnom uzorku, nisu

dobijene na istom instrumentu već na više instrumenata različite preciznosti u odsustvu grubih i sistematskih grešaka. Kako dobiti najverodostojniju ocenu tačne vrednosti merene veličine?

Page 138: Osnovi inzenjerske statistike

138

Ponderisana srednja vrednost uzorka U skladu sa pretpostavkama, merenje i predstavlja realizaciju slučajne veličine sa

raspodelom N(µ, σi), gde srednja vrednost µ predstavlja tačnu vrednost merene veličine, a standardno odstupanje σi grešku tog merenja. Tako je funkcija verodostojnosti (4.8) za posmatrani uzorak:

( )

σµ−−

σπ=µ ∑

∏ =

=

n

i i

in

ii

n

xL

12

2

1

2/

)(21

exp)2(

1

Tražimo onu vrednost parametra µ, za koju funkcija L(µ), pri datim vrednostima nixi ,...,1, = i nii ,...,1, =σ ima maksimum, tj. za koju je:

( )

01ln

12

12

12

=σµ−σ=σµ−=∂µ

µ∂ ∑∑∑===

n

i i

n

i i

in

i i

i xxL

Rezultat je ponderisana srednja vrednost uzorka ili ponderisana aritmetička sredina:

∑∑

=

=∗ ==µ n

ii

n

iii

w

xwx

1

1 (5.9)

gde su statističke težine wi jednake ili proporcionalne (konstanta proporcionalnosti se u formuli (5.9) skraćuje) recipročnim disperzijama merenja:

nikwi

i ,...,1,1

2=

σ= (5.10)

gde je k, konstanta proporcionlanosti. Dakle, težina sa kojom vrednost nekog merenja ulazi u sumu pri računanju ponderisane aritmetičke sredine svih ponovljenih merenja, utoliko je veća, ukoliko je to merenje preciznije. Tako se preciznijim informacijama daje veća težina, tj. veći doprinos pri procenjivanju tačne vrednosti merene veličine.

Primer 5.3 Dato je 5 izmerenih vrednosti neke veličine sa odgovarajućim težinama.

Potrebno je proceniti tačnu vrednost merene veličine, a) ne uzimajući u obzir različite preciznosti, tj. težine pojedinih merenja b) uzimajući u obzir date težine merenja.

Rešenje

a) Koristimo jednostavnu formulu za aritmetičku sredinu uzorka (4.11a):

xi 10.25 10.32 10.43 10.27 10.16

wi 1 2 4 3 2

Page 139: Osnovi inzenjerske statistike

139

286.105

5

1 ==

∑=i

ixx

b) Koristimo ponderisanu srednju vrednost uzorka:

12

74.123

23421

16.10227.10343.10432.10225.10

1

1 =++++

⋅+⋅+⋅+⋅+==

∑∑

=

=

n

ii

n

iii

w

xwx

312.10=x

Uočavamo da je vrednost ponderisane aritmetičke sredine, 10.312 bliža rezultatu merenja dobijenom na najpreciznijem instrumentu, 10.43 (sa najvećom usvojenom težinom, 4), no što je vrednost obične aritmetiče sredine, 10.286.

Primer 5.4 Za 10 merenja neke veličine, čija je standardna greška, 05.0=σ x , dobijena

je srednja vrednost 9.52, a za drugih 20 merenja iste veličine sa greškom 08.0=σ x ,

srednja vrednost je 9.49. Proceniti tačnu vrednost merene veličine iz svih 30 merenja, a) ne uzimajući u obzir različite preciznosti merenja b) uzimajući u obzir različite preciznosti merenja

Rešenje

a) Ako n1 = 10 merenja (prvi uzorak), sa srednjom vrednošću 52.91 =x , označimo indeksima 1,2,...,n1,

1,...,1, nixi =

a dodatnih n2 = 20 merenja (drugi uzorak), sa srednjom vrednošću 49.92 =x , indeksima n1+1, n1+2,...,n2,

2,...,1, 1 nnixi +=

aritmetičku sredinu svih (n1+n2) merenja (objedinjeni uzorak) možemo da prikažemo u obliku:

21

2211

21

11

21

1

2

1

121

nn

xnxn

nn

xx

nn

xx

n

nii

n

ii

nn

ii

+

+=

+

+

=+

=∑∑∑+==

+

=

Dakle, srednju vrednost objedinjenog uzorka računamo kao ponderisanu aritmeti čku sredinu srednjih vrednosti pojedinih uzoraka, sa težinama jednakim njihovim obimima. Ukoliko je neki uzorak veći, on daje više informacija o traženoj veličini, pa je logično da se njegovoj srednjoj vrednosti dodeljuje veća težina, jednaka ili srazmerna njegovom obimu. Za date uzorke,

50.92010

49.92052.910=

+

⋅+⋅=x

Page 140: Osnovi inzenjerske statistike

140

b) Svih n1 = 10 merenja iz prvog uzorka imaju istu standardnu grešku, pa im dodeljujemo istu težinu, ω1 obrnuto proporcionalnu njihovoj disperziji (5.10):

40005.0

11

122

11 ==

σ=ω k

Uzećemo konstantu proporcionalnosti 0.01 i usvajamo:

10,...,1,41 ==ω= iwi

Istim postupkom, za težine n2 = 20 merenja drugog uzorka imamo:

15608.0

11

122

22 ≈=

σ=ω k

i sa istom konstantom proporcionalnosti, usvajamo:

30...,,11,6.12 ==ω= iwi

Za ponderisanu srednju vrednost objedinjenog uzorka, imamo:

∑∑∑∑

∑∑∑∑

∑∑

+==

+==

+==

+==

+

=

+

=

ω+ω

ω+ω

=

+

+

==2

1

1

2

1

1

2

1

1

2

1

1

21

21

12

11

12

11

11

11

1

1n

ni

n

i

n

nii

n

ii

n

nii

n

ii

n

niii

n

iii

nn

ii

nn

iii

xx

ww

xwxw

w

xwx

2211

222111

nn

xnxnx

ω+ω

ω+ω=

Uočavamo da je težina sa kojom srednja vrednost nekog uzorka ulazi u proračun srednje vrednosti objedinjenog uzorka, utoliko veća ukoliko je preciznost merenja u tom uzorku veća i ukoliko je sam uzorak veći ili terminima statistike, ukoliko su preciznost i količina informacije veći. U posmatranom primeru težine uz srednje vrednosti uzoraka su:

32206.1,40104 2211 =⋅=ω=⋅=ω nn

i tačnu vrednost merene veličine procenjujemo kao:

51.93240

49.93252.940=

+

⋅+⋅=x

Standardna greška ponderisane uzora čke srednje vrednosti

Prema (5.9), uz pretpostavku da su uzorci reprezentativni, slučajna veličina X je

linearna kombinacija n slučajnih, međusobno nezavisnih slučajnih veličina niX i ,...,1, = :

∑ ∑=

= n

ii

i

i Xw

wX

1

Page 141: Osnovi inzenjerske statistike

141

i pošto tada važi aditivnost disperzije (3.28), za disperziju ponderisane uzoračke srednje vrednosti dobijamo:

∑∑

∑ ∑ =

=

=

σ

=σ n

iii

n

ii

n

ii

i

ix w

ww

w

1

22

2

1

1

2

2

2 1

odnosno,

∑∑ =

=

σ=σn

iiin

ii

x ww 1

22

1

1 (5.11a)

Ako težine odredimo pomoću relacije (5.10), formula prelazi u:

∑= σ

=σn

i i

x

12

1

1 (5.11b)

Primetimo da se formule (5.11a,b) u slučaju jednakih težina, odnosno jednakih disperzija

2iσ , svode na formulu (4.13b).

Primer 5.5 Za sledeće izmerene vrednosti i standardne greške metode, (prve dve vrste tabele), proceniti tačnu vrednost merene veličine i standardnu grešku te procene:

xi 10.1 11.4 12.2 14.9 σi 1.2 2.4 1.3 1.7 wi 0.69 0.17 0.59 0.35

Rešenje

Najpre treba odrediti težine wi, i = 1,…,4. Ako usvojimo da su one jednake recipročnim vrednostima disperzija, 21 iiw σ= dobijamo, zaokružene na dve

decimale, težine date u 3. vrsti tabele. Procena tačne vrednosti merene veličine, tj. ponderisana srednja vrednost je:

84.118.1

32.214

1

4

1 ===

∑∑

=

=

ii

iii

w

xwx

Koristeći formulu (5.11a), za standardnu grešku dobijene ocene računamo:

744.01

,794.1 24

1

224

1

2 =σ=σ ∑∑∑==

ii

ii

ii

i ww

w

i usvajamo:

74.0=σ x

Isti rezultat bi naravno dobili primenom formule (5.11b):

Page 142: Osnovi inzenjerske statistike

142

744.01

1,806.1

14

122∑ ∑=

=σi ii

5.5 GREŠKE POSREDNIH MERENJA

U poglavljima 5.1 - 5.4 posmatrane su greške neposrednih merenja neke veličine. Međutim, vrlo je malo veličina moguće neposredno meriti (osnovna merenja): merenja temperature, mase, dužine, osnovna električna merenja. Najčešće se tražena veličina određuje posredno - iz neposredno izmerenih veličina. Ako se neka veličina određuje kao funkcija više neposredno merenih veličina, kažemo da se njene vrednosti dobijaju posrednim merenjima. Tako se gustina neke tečnosti, ρ dobija iz izmerene mase, m i zapremine, V uzete probe, po formuli:

V

m=ρ

Drugi primer su gravimetrijske i volumetrijske hemijske analize, kod kojih se traženi sadržaj neke supstance u nekoj smeši ili jedinjenju, dobija odgovarajućom formulom iz izmerene količine probe i izmerene dobijene mase taloga (gravimetrija), odnosno izmerene zapremine utrošenog titracionog sredstva (volumetrija).

Osnovni zadatak u vezi sa posrednim merenjima je procenjivanje greške dobijenog rezultata u funkciji od grešaka neposrednih merenja. Funkcija, koja daje vezu između greške posrednog merenja i grešaka neposrednih merenja iz kojih se ono računa se naziva zakon propagacije (prenošenje, povećanje) grešaka.

Linearne formule

Neka je veličina Z, čiju vrednost određujemo posredno, linearna funkcija nekih m neposredno merenih nezavisnih veličina X1, X2, . . ., Xm

Z = c1X1 + c2X2 + . . . + cmXm (5.12)

Za srednju vrednost veličine Z, bez obzira na oblik raspodele merenih veličina, prema (2.20), važi analogna relacija:

∑=

µ=µm

ixiz i

c1

(5.13)

što znači da odsustvo sistematskih grešaka u izmerenim vrednostima xi, i = 1,..., n (srednje vrednosti slučajnih veličina Xi, i = 1,…,m jednake su njihovim pravim - tačnim vrednostima), znači odsustvo sistematske greške u izračunatoj vrednosti z po formuli (5.12), tj. posrednom merenju.

Slučajna greška, σz posrednog merenja, u skladu sa aditivnošću disperzije sume nezavisnih slučajnih veličina, dobija se kao koren ponderisane sume:

Page 143: Osnovi inzenjerske statistike

143

∑=

σ=σn

ixiz i

c1

222 (5.14)

Primer 5.6 Sadržaj gvožđa u leguri bakra određuje se tako što se 5 gr legure podvrgne oksidaciji 0.01N rastvorom kalijumdihromata u višku. Potom se višak dihromata titriše 0.01N rastvorom feroamonijumsulfata. Ako utrošak rastvora dihromata (ml) označimo sa D, u utrošak rastvora feroamonijumsulfata sa F, onda se procenat gvožđa, P u leguri dobija po linearnoj formuli:

P = 0.01117 (D - F) (%)

a) Ako su standardne greške merenih utrošaka D i F: σD = σF = 0.1ml, odrediti standardnu grešku rezultata

b) Za D = 21.0ml i F = 0.8ml odrediti standardnu relativnu grešku rezultata.

Rešenje

a) Iz formule (5.14):

3

622222

1058.1

1050.201.001117.02)(01117.0−

⋅=σ

⋅=⋅⋅=σ+σ=σ

p

FDp

b) Prema formulama (5.2, 5.3) potreban nam je i sam rezultat:

P = 0.0117(21.0 - 0.8) = 0.226

%7.0100=⋅σ

=δP

pp

Ako međusobno nezavisna direktna merenja Xi, i = 1,...,m imaju normalnu raspodelu, tada će i posredno merenje Z, definisano linearnom funkcijom (5.12), imati normalnu raspodelu (Pogl. 2.9).

Nelinearna funkcija jednog neposrednog merenja

Problem određivanja srednje vrednosti i standardne devijacije posrednog merenja Z, definisanog nekom nelinearnom funkcijom direktnog merenja X:

Z = f(X) (5.15)

egzaktno se rešava definisanjem funkcije gustine verovatnoće slučajne promenljive Z (Pogl. 2.10) iz koje se onda dobijaju µz i D(Z). To je, u opštem slučaju, veoma složen matematički problem i zato se problem određivanja µz i D(Z) rešava približno , posmatrajući vrednosti funkcije f(x) u okolini tačke M(X) = µx.

Pretpostavimo da sve varijacije u rezultatima neposrednih merenja potiču od slučajne greške merenja, što znači da je tačna vrednost x jednaka srednjoj vrednosti merenja, µx. Na osnovu relacije (5.15), tačnu vrednost µz posredno merene veličine, onda uzimamo da je jednaka ( )xz f µ=µ . Treba proveriti da li je ta procena ispravna, ili

rečnikom statistike, nepristrasna, odnosno da li iz (5.15) sledi:

( ) ( )( ) ( )( )XMfXfMZM == (5.16)

Page 144: Osnovi inzenjerske statistike

144

Ako relacija (5.16) nije tačna, znači da je pristrasna sledeća ocena srednje vrednosti promenljive Z, dobijena iz raspoloživih rezultata ponovljenih neposrednih merenja

nixi ,...,1, = i formule (5.15):

( )*xz f µ=µ∗ (5.17)

gde je *xµ aritmetička sredina vrednosti nixi ,...,1, = . Da bi smo to proverili

pretpostavićemo da je funkcija f(x) neprekidna i diferencijabilna i razvićemo je u Taylorov red, u okolini tačke µx.

32

2

2

)(2

1)()()( Rx

dx

fdx

x

ffxf xxx

xx

+µ−

+µ−

∂∂+µ=

µµ

gde je R3 ostatak koji se može zanemariti ako su vrednosti (x - µx) dovoljno male, odnosno, ako je standardna greška merenja, σx dovoljno mala. Tada je,

22

2

)(2

1)()()( xxx X

dx

fdX

x

ffXfZ

xx

µ−

+µ−

∂∂+µ≈=

µµ (5.18)

Za M(Z) dobijamo:

( ) 22

2

0

)(2

1))(()()()( xxx XM

dx

fdXM

x

ffXfMZM

xx

µ−

+µ−

∂∂+µ≈=

µµ

22

2

2

1)()( xxz

xdx

fdfZM σ

+µ≈=µ

µ

(5.18a)

Očigledno je da relacija (5.16) nije tačna pa je ocena (5.17) srednje vrednosti posrednog merenja Z pristrasna. Drugim rečima iako su neposredna merenja

nixi ,...,1, = tačna, posredno merenje dobijeno po formuli (5.17) sadrži sistematsku

grešku (bias), približno jednaku:

22

2

2

1xz

xdx

fdd σ

µ

Da su slučajne greške neposrednih merenja jednake nuli, izračunata vrednost, z = f(x) bi bila tačna, pa se može reći da slučajna greška u neposrednim merenjima izaziva sistematsku grešku u posrednom merenju zbog nelinearnosti funkcije (5.15) kojom se dobija posredno merenje. U linearnom slučaju (5.12), nema sistematske greške. Srećom, relativno sistematsko odstupanje zd z / je često vrlo malo (naročito kod

preciznijih merenja) u odnosu na koeficijent varijacije σx/µx, pa se može zanemariti, što ilustruje sledeći primer.

Primer 5.7 Površina kruga se određuje posredno, iz izmerenog poluprečnika r po obrascu:

A = πr2

Kolika je sistematska greška u vrednosti površine A, ako je slučajna relativna greška (koeficijent varijacije) izmerenih vrednosti poluprečnika jednaka %1=δr ?

Page 145: Osnovi inzenjerske statistike

145

Rešenje

Kako je:

π=π= 2,22

2

dr

Adr

dr

dA

za sistematsku grešku površine dobijamo:

2222

1rrAd πσ=πσ=

ili posle smene σr = δrµr:

22rrAd δπµ=

Tako je relativna sistematska greška površine, RA

( ) 222

2

22

2

2 1 rrr

r

rr

r

Ar

AA d

dR δ≈σ+µ

σ=πσ+πµπσ=+πµ=

i za δr = 0.01 dobijamo, RA = 10-4 = 0.01%.

Relativna greška merenja poluprečnika od 1% izaziva sistematsko precenjivanje (dA > 0) površine kruga od samo 0.01%, što se može zanemariti.

Ako zanemarimo sistematsku grešku, koju izaziva slučajna greška neposrednog merenja, propagaciju slučajnih grešaka neposrednog merenja, približno procenjujemo iz (5.18) uz zanemarivanje člana drugog reda, tj. postupkom linearizacije funkcije (5.15):

)()( xx Xdx

dffZ

x

µ−

+µ≈µ

(5.19)

odnosno, iz (5.18a) sledi uz izvesnu grešku:

)( xz f µ=µ (5.19a)

Poštujući osobinu disperzije (2.30), za disperziju posrednog merenja dobijamo:

)()(2

XDdx

dfZD

odnosno usvajamo:

xz

xdx

df σ

=σµ

(5.20)

Pri praktičnoj primeni jednačine (5.20) za procenu standardnog odstupanja posrednog merenja, nepoznati parametri raspodele neposrednog merenja µx, σx, δx se zamenjuju njihovim ocenama (Pog. 5.1.), za koje ćemo u daljem tekstu u ovom poglavlju umesto

*** ,, xxx δσµ koristiti iste oznake µx, σx, δx . Kako za ocenu srednje vrednosti µx uzimamo

jedno merenje ili aritmetičku sredinu, u narednom tekstu pri primeni formule (5.20), µx se zamenjuje sa reprezentativnim rezultatom merenja, koga ćemo označavati sa x.

Page 146: Osnovi inzenjerske statistike

146

Primer 5.8 Proceniti slučajnu, relativnu grešku određivanja površine A u prethodnom primeru.

Rešenje

Iz (5.20):

%222

2

2 =δ=σ=πσ=δ

σπ=σ

rrA

A

rrr

A

rr

rdr

dA

Udeo slučajne greške (2%) je, u ukupnoj relativnoj greški određivanja površine, znatno veći od udela sistematske greške (0.01%), pa smo ovu drugu opravdano zanemarili.

Konačno, što se tiče raspodele posrednog merenja, Z ona će u okolini µz biti

približno normalna ako X ima normalnu raspodelu,. Naime, važi približno linearna relacija Z = aX + b (jednačina 5.19) i iz normalne raspodele promenljive X sledi normalna raspodela njene linearne funkcije (Pogl. 2.10).

Nelinearna funkcija više neposrednih merenja

Pomoću neke formule:

z = f(x1, x2, ..., xm) (5.21)

se dobija vrednost posrednog merenja Z iz izmerenih vrednosti neposredno merenih veličina Xi, i = 1,...,m čije su srednje vrednosti i standardna odstupanja:

miii ,...,1,, =σµ . Uz pretpostavku da nema sistematskih i grubih grešaka merenja,

izvršićemo linearizaciju formule (5.21) u okolini tačke T(µ1, µ2, . . ., µn):

)()()(),,,( 222

111

21 nn

TnTT

n xx

fx

x

fx

x

ffz µ−

∂∂++µ−

∂∂+µ−

∂∂+µµµ≈ ……

Tako uz izvesnu grešku, koja je utoliko manja ukoliko su neposredna merenja preciznija, usvajamo:

),,,( 21 nz f µµµ=µ … (5.22)

( )mm

TmTT

z Tx

z

x

z

x

z µµµσ

∂∂++σ

∂∂+σ

∂∂=σ ,,,, 21

2

2

22

2

2

21

2

1

2…… (5.23)

Primer 5.9 Žižno rastojanje, f sfernog ogledala se dobija iz neposredno izmerenih rastojanja objekta od površine ogledala, v i rastojanja njegovog lika od površine ogledala, u uz pomoć jednačine:

Page 147: Osnovi inzenjerske statistike

147

uvf

111+=

Izmerena vrednost je za u je 4107.0=u sa standardnom greškom mu 0003.0=σ , a

izmerena vrednost za v i njena greška: mv v 0002.0,3513.0 =σ= . Treba izračunati

žižno rastojanje ogledala i njegovu standardnu grešku.

Rešenje

Iz date jednačine dobijamo formulu za određivanje žižne daljine iz direktnih merenja:

vu

f11

1

+=

i iz izmerenih vrednosti računamo:

1893.0

3513.0

1

4107.0

11

=+

=f m

Ocenu disperzije posrednog merenja f, dobijamo primenom formule (5.23):

22

22

2vuf v

f

u

f σ

∂∂+σ

∂∂=σ

Potrebni su nam parcijalni izvodi:

2

22

211

1,

11

1

vvu

v

f

uvu

u

f

+=∂

+=∂

Njihove vrednosti za date, izmerene vrednosti u i v su:

29050.0,21254.0 =∂∂=

∂∂

v

f

u

f

Relativno male vrednosti izvoda pokazuju da je žižna daljina sfernog ogledala relativno malo osetljiva na promene rastojanja u i v, i u skladu sa formulom (5.23) treba očekivati manju vrednost njene standardne greške od standardnih grešaka merenih rastojanja. Zaista,

mf

f

000086.010441.7

10441.70002.02905.00003.021254.0

9

922222

=⋅=σ

⋅=⋅+⋅=σ

Možemo da usvojimo kao krajnju procenu greške:

mf 0001.0=σ

Page 148: Osnovi inzenjerske statistike

148

i koristeći pravilo "tri sigme", da je maksimalna greška jednaka trostrukom standardnom odstupanju, da rezultat posrednog merenja prikažemo kao:

mf 0003.01893.0 ±=

Proizvod stepena

Posmatrajmo formulu oblika:

mam

aa xxxcz 21

21= (5.24)

gde su c i ai, i = 1,...,m konstante. Sprovešćemo postupak linearizacije formule. Imamo,

mix

zaxxxxxca

x

z

i

iam

ai

ai

ai

ai

i

miii ,...,1,1111

111 ===

∂∂

+−

+−

i nakon smene u (5.23) i deljenja dobijene jednačine sa z2:

2

1

2

2

µσ=

σ ∑

= i

im

ii

z az

(5.25)

ili, kako je z ocena za µz, tako je ocena koeficijenta varijacije posrednog merenja:

∑=

δ=δm

ixiz i

a1

222 (5.26)

gde su:

ixδ - koeficijent varijacije ili relativna greška neposrednog merenja Xi,

δz - koeficijent varijacije ili relativna greška posrednog merenja Z. Primer 5.10 Gustina čvrstog materijala, nerastvorljivog u vodi može da se odredi pomoću piknometra na sledeći način. Merenjem na vagi, odredi se masa, m malog komada ispitivanog materijala. Izmeri se zatim ukupna masa piknometra ispunjenog destilovanom vodom i komada materijala pored njega, m1. Konačno, izmeri se masa punog piknometra sa komadom materijala u njemu, m2. Iz ta tri neposredna merenja dobija se tražena gustina po formuli:

wmm

m ρ−

=ρ21

gde je ρw gustina vode na temperaturi merenja. Na vagi, sa standardnom greškom merenja g25.0=σ izmereno je: gmgmgm 60.142,27.146,73.8 21 === . Gustina

destilovane vode na temperaturi merenja je 331000 mkgw ±=ρ . Odrediti gustinu

čvrstog materijala i njenu standardnu grešku.

Rešenje

Iz datih podataka i formule dobijamo traženu gustinu materijala:

Page 149: Osnovi inzenjerske statistike

149

33

33 1038.210

6.14227.146

73.8

m

kg

m

kg

gg

g ⋅=−

Da bi odredili standardnu grešku gustine, uvešćemo pomoćnu promenljivu:

21 mmm −=∆

tako da formula za gustinu dobija oblik, pogodan za primenu formule (5.26):

1−∆ρ=ρ∆=ρ mmm

mww

Formula (5.26) daje:

2222

∆σ+

ρσ+

σ=

ρσ ∆ρρ

mmm

w

m w

Pošto je m∆ linearna funkcija promenljivih m1 i m2, 2

m∆σ dobijamo primenom

principa aditivnosti disperzije (5.14):

222

21 mmm σ+σ=σ∆

Smenom tog izraza u prethodnu formulu, imajući u vidu da je:

σ=σ=σ=σ21 mmm

dobijamo:

2222

2

∆σ+

ρσ+

σ=

ρσ ρρ

mm w

w

kgm 67.3=∆ , 31 mkgw=σρ (pravilo 3 sigme)

01.0

0681.0001.00286.0

67.3

25.02

1000

1

73.8

25.0

222

2222

=++=

+

+

=

ρσρ

Očigledno je doprinos relativne greške gustine vode zanemarljiv u odnosu na doprinose relativnih grešaka merenja mase.

1.001.0 ==ρσρ

Relativna greška posrednog merenja veća je od relativnih grešaka neposrednih merenja. Standardna greška gustine je:

32381.0 mkg=ρ=σρ

pa izmerena gustina može da se prikaže u obliku:

3/714238023832380 mkg±=⋅±=ρ

Page 150: Osnovi inzenjerske statistike

150

Primer 5.11 Koeficijent prolaza toplote para - voda, k u kotlu određuje se iz merenja, pomoću formule:

)/( 2KmWTA

dt

dTCW

keff

p

=

gde su: W - količina vode koja se greje, kg Cp - specifični toplotni kapacitet, J/kgK A - površina toplotne razmene, m2

effT∆ - efektivna razlika temperature grejne pare i vode u proizvoljnom

momentu vremena, K

dt

dT - nagib krive promene temperature vode, T od vremena t, K/h

U eksperimentu je izmereno:

• Ukupno W = 80 kg vode i to 8 jednakih porcija od po 10 kg. Maksimalna greška merenja mase vode je ± 0.12 kg

• A = 0.81 m2, uz maksimalnu grešku određivanja, ± 0.045 m2

• wseff TTT −=∆ = 30 K. Temperatura pare, Ts koja je zasićena, određivana je iz

pritiska zasićene pare, sa maksimalnom greškom ± 0.9 K. Temperatura vode, Tw je određivana kao aritmetička sredina pokazivanja dva termopara, od kojih svaki pokazuje maksimalnu grešku ± 0.3 K

• s

K.

min

K

dt

dT02505.1 == , sa maksimalnom greškom određivanja sa grafika

vreme t - temperatura vode T od s

K

min

K0006.036.0 ±=±

Za specifični toplotni kapacitet vode, Cp je uzeta vrednost 4187 J/kgK. Ona odstupa od tačne vrednosti manje od %2=

pCR .

a) Proceniti tačnu vrednost i standardnu grešku koeficijenta prelaza toplote, uz pretpostavku o odsustvu sistematskih grešaka merenja. b) Diskutovati doprinos pojedinih grešaka merenja ukupnoj greški koeficijenta prelaza toplote.

Rešenje

a) Iz date formule, za izmerene vrednosti dobijamo:

KmWk 2/3453081.0

025.0418780=

⋅⋅=

Za standardnu grešku, jednačina (5.25) daje:

2

/

22222

/

σ+

σ+

∆σ+

σ+

σ=

σ ∆

dtdTCTAWkdtdT

p

C

eff

TAwk peff

Neophodno je da procenimo standardna odstupanja pojedinih promenljivih. Uz pretpostavku da slučajne greške merenja imaju normalnu raspodelu, primenićemo pravilo “tri sigme”. Tako procenjujemo:

Page 151: Osnovi inzenjerske statistike

151

• Za količinu vode:

Pošto je ukupna količina vode dobijena kao 8 merenih porcija:

∑=

=

8

1iiWW

i primenom (5.14) dobijamo,

22 8iww σ=σ

Kao iwσ uzećemo trećinu granice aposolutne greške:

kgiw 04.03/12.0 ==σ

• Za površinu:

2015.03/045.0 mA ==σ

• Za wseff TTT −=∆ :

Pošto se temperatura vode, Tw određuje kao aritmetička sredina dva merenja:

2

21 www

TTT

+=

za standardnu grešku temperature vode imamo:

( ) 22222 005.0)3/3.0(225.025.021

Kwww TTT =⋅⋅=σ+σ=σ

Tako za standardnu grešku efektivne temperaturne razlike dobijamo:

( ) 22222 095.03/9.0005.0 Ksweff TTT =+=σ+σ=σ∆

• Za izvod dT/dt:

sKdtdT 0002.03/0006.0/ ==σ

• Za specifičnu toplotu vode, maksimalnu apsolutnu grešku, pC∆ dobijamo iz

maksimalne relativne greške, pCR :

kgKJRCpp CpC 7.8302.04817 =⋅==∆

pa je:

kgK

Jp

p

C

C 9.273

=∆

Konačno, smenom brojnih vrednosti u jednačinu za 2kσ , dobijamo:

Page 152: Osnovi inzenjerske statistike

152

3

35446

22

2

22

2

/

2222

2

2

109.6

104.61044.41006.11043.3102

025.0

0002.0

4187

9.27

30

095.0

81.0

015.0

80

04.08

/345

−−−−−

⋅=⋅+⋅+⋅+⋅+⋅=

=

+

++

+

=

σ+

σ+

∆σ+

σ+

σ=σ

dtdTCTAWdtdT

p

C

eff

TAwk peff

KmWk229=σ

b) Kao mere uticaja ili doprinosa grešaka pojedinih merenih veličina možemo da uzmemo kvadrate njihovih procena koeficijenata varijacije, jer se oni ovde sabiraju, da bi dali procenu kvadrata varijacije posrednog merenja:

Kao što vidimo, dominantan doprinos greški koeficijenta prolaza toplote ima greška nagiba, dtdT , dok se doprinosi grešaka merenja količine vode, W i specifične toplote Cp praktično mogu zanemariti. Tako, ako želimo da povećamo tačnost određivanja koeficijenta k, treba (ako je moguće) povećati tačnost određivanja nagiba, dtdT . S druge strane, povećanje tačnosti merenih vrednosti količine vode i specifične toplote, nema nikakvog smisla jer će uticaj biti zanemarljiv.

Granice tolerancije

Granice tolerancije vrednosti neke približne veličine x, predstavljaju granice unutar kojih je dozvoljeno variranje njenih vrednosti oko neke nominalne ili propisane. Drugim rečima, one definišu maksimalna dozvoljena odstupanja vrednosti x od propisane ili nominalne vrednosti. Granice tolerancije imaju važnu ulogu pri kontroli kvaliteta proizvoda. Ako posmatrana veličina X (recimo neki pokazatelj kvaliteta proizvoda) ima normalnu raspodelu N (µx,σx), onda se kao granice tolerancije, u skladu sa pravilom "tri sigme " uzimaju vrednosti µx - 3σx i µx + 3σx ili pišemo kratko,

x = µx ± 3σx

Primer 5.12 Granice tolerancije merenih veličina x i y su 1.06 ± 0.12 i 2.3 ± 0.15. Proceniti granice tolerancije za z = xy.

Merena veličina, xi

Doprinos, ( )2ix xiσ

Red veličine doprinosa

W 6102 −

⋅ 610− A 41043.3 −

⋅ 410−

effT∆ 41006.1 −

⋅ 410−

Cp 51044.4 −

⋅ 510− dtdT 3104.6 −

⋅ 310−

Page 153: Osnovi inzenjerske statistike

153

Rešenje

Primenom formule (5.22), sa preciznošću od dve decimale:

45.231.206.1 =⋅=µ⋅µ=µ yxz

Kao standardne greške merenja uzimamo:

σx = 0.12/3 = 0.04, σy = 0.15/3 = 0.05

i primenom (5.25) računamo standardnu grešku σz:

107.0

22

=

µσ+

µσµ=σ

y

y

x

xzz

Maksimalna greška:

32.03 =σ=∆ zz

Granice tolerancije:

32.045.2 ±=z

ZADACI 5.1 Izvršeno je 15 ponovljenih merenja površinskog napona vode, metodom čija je standardna greška σ = 0.00064 N/m. Kao rezultat (reprezentativna vrednost) dobijena je vrednost 0.07252 N/m. a) Izračunati standardnu grešku rezultata. b) Ako je referentna vrednost (ona koja se smatra tačnom) napona pare vode na temperaturi na kojoj su izvršena merenja, 0.07305 N/m, pokazati da se sa velikom pouzdanošću može tvrditi da merenja sadrže sistematsku grešku. 5.2 Novom metodom za određivanje nikla, dva laboranta su za probu koja sadrži 6.25% Ni dobili sledeće rezultate(%):

Laborant A 6.16 6.41 6.23 6.28

Laborant B 6.50 6.54 6.52 6.56

a) Poredeći opsege u kojima se kreću rezultati, koji laborant ima preciznija merenja? b) Koje su konačne rezultate određivanja nikla dobili laborant A i njegov kolega ? c) Proceniti standardne greške tih rezultata. b) Ispitati postojanje sistematske greške u rezultatima jednog i drugog laboranta.

5.3 Rezultati merenja 5 pakovanja istog leka (g) su:

2.10, 2.12, 2.11, 2.16, 2.10

Proceniti broj ponovljenih merenja koji je neophodan da bi se srednja vrednost mase pakovanja procenila sa standardnom greškom manjom od 0.01g.

Page 154: Osnovi inzenjerske statistike

154

5.4 Dvadeset merenja ubrzanja zemljine teže imaju srednju vrednost 9.811 m/s2, a za procenu njene standardne greške dobijena je vrednost 0.014 m/s2. Trideset merenja ubrzanja drugom metodom, su kao rezultat dala 9.802 m/s2, sa procenom standardne greške 0.022 m/s2. Pretpostavka je da su obe metode tačne i iste preciznosti . a) Šta znači to da su merne metode tačne, a šta da su iste preciznosti ? b) Kako bi glasila "statistička formulacija" date pretpostavke. c) Proceniti standardnu grešku mernih metoda. d) Izračunati srednju vrednost svih 50 merenja i proceniti njenu standardnu grešku.

5.5 Odabranom metodom je meren stepen regeneracije fosfora iz fosfata postupkom sublimacije, na 4 različite temperature. Date su izračunate vrednosti uzoračkih disperzija za 4 dobijena uzorka.

a) Ako posmatramo slučajnu promenljivu: stepen regeneracije fosfata za koga znamo da zavisi od temperature, da li možemo da smatramo da posmatrani uzorci potiču iz istog osnovnog skupa, tj. iz iste raspodele.

b) Za koju slučajnu promenljivu možemo da pretpostavimo da su dati uzorci iz iste raspodele ? Koja je to raspodela ?

c) Proceniti iz datih podataka standardnu grešku metode određivanja stepena regeneracije.

5.6 Pri određivanju sadržaja neke supstance u nehomogenom čvrstom materijalu, prisutna je greška probe, a standardna greška analize je σA = 1. Tri plana merenja (A, B i C), koji se razlikuju po broju uzetih proba ispitivanog materijala, n i broju ponavljanja merenja za svaku od uzetih proba, m data su u tabeli:

a) Koristeći dijagram na Sl. 5.2, poređati po tačnosti planove A, B i C za sledeće veličine standardnih grešaka probe: 3.1,1,7.0 =σ=σ=σ PPP

Tempera-tura:

Obim uzorka

2is

T1 6 1.72

T2 5 1.60

T3 7 1.97

T4 9 2.37

n m ukupan br. analiza

A 3 3 9

B 4 2 8

C 5 1 5

Page 155: Osnovi inzenjerske statistike

155

b) Ako su greške analize i probe: 1.1,9.0 =σ=σ PA , odrediti minimalan broj ponovljenih merenja, m za svaku od uzetih proba, koji obezbeđuje da standardna greška rezultata bude najviše 0.5 i to za: n = 5 proba, n = 4 probe.

5.7 Sadržaj bakra (%) u nekoj hemikaliji je određivan u tri laboratorije. U laboratoriji I, sa standardnom greškom metode σ1 = 1.1, iz 6 ponovljenih merenja, dobijen je rezultat

1.141 =x . U laboratoriji II, sa standardnom greškom metode σ2 = 2.0, iz 10 ponovljenih

merenja, dobijen je rezultat 5.132 =x . U laboratoriji III, sa metodom čija greška σ3 =

1.5 iz 20 ponovljenih merenja je dobijeno 7.143 =x .

a) Proceniti traženi sadržaj bakra uzimajući u obzir rezultate sve tri laboratorije. b) Odrediti standardnu grešku dobijene procene.

5.8 Ako je izmerena vrednost m = 0.850 ± 0.036, proceniti vrednosti posrednih merenja definisanih formulama mmm 1i, 32 , kao i njhove standardne greške.

5.9 Ako su granice tolerancije veličina a i b: 36.054.2,24.016.1 ±=±= ba , odrediti granice tolerancije za:

aa

ab

b

aabba lni,,,

−+

5.10 Sadržaj neke supstance, p u probi se pri volumetrijskoj analizi dobija iz formule:

( )%100e

vtkp =

gde su:

k - maseni stehiometrijski koeficijent u reakciji titracije, tj. količina ispitivane supstance (g), koja reaguje sa 1 g titracionog sredstva

e - masa probe, mg v - utrošena zapremnina standardnog rastvora za titraciju, ml t - titar standardnog rastvora za titraciju, mg/ml

Titar t se prethodno određuje titrisanjem određene količine neke čiste supstance et, standardnim rastvorom, po formuli:

tt

t

vk

et =

gde su:

kt - količina čiste supstance (g), koja reaguje sa 1 g titracionog sredstva vt - utrošena količina standardnog rastvora pri određivanju titra

a) Napisati formule za određivanje standardne relativne greške titra standardnog rastvora, ( ttσ ) i standardne relativne greške rezultata volumetrijske analize, ( ppσ ).

Pri tom masene stehiometrijske koeficijente k i kt smatrati tačnim.

b) Sadržaj gvožđa u nekoj leguri određivan je titrisanjem rastvora dobijenog rastvaranjem e = 252.6 mg probe u sumpornoj kiselini, standardnim rastvorom kalijumpermanganata. Pri tom je utrošeno v = 31.25 ml standardnog rasvora. Za reakciju, koja se odigrava pri titraciji, maseni stehiometrijski koeficijent je: k = 1.767. Prethodno je izmeren titar standardnog rastvora titracijom et = 210.5 mg čistog natrijumoksalata, pri čemu je utrošeno vt = 29.51 ml standardnog rastvora. Maseni stehiometrijski koeficijent za ovu

Page 156: Osnovi inzenjerske statistike

156

titraciju iznosi: kt = 2.120. Standardna greška merenja mase analitičkom vagom je σm = 0.2mg, a standardna greška određivanja utrošene zapremnine titracionog sredstva (preciznost očitavanja birete) je σv = 0.05 ml . Potrebno je iz datih podataka izračunati titar, t i njegovu standardnu relativnu grešku, a potom traženi sadržaj gvožđa u probi i njegovu standardnu relativnu grešku. Imati u vidu da se pri određivanju mase probe, e i mase natrijumoksalata et, vrše dva merenja (masa laboratorijske posude sa probom i masa prazne posude).

c) Pokazati da ukoliko bi standardna relativna greška titra bila svedena na najviše 0.05%, mogao bi se zanemariti doprinos greške titra relativnoj greški rezultata analize, p. Pokazati da se greška titra može smanjiti: (1) povećanjem mase natrijumoksalata et ili (2) ponavljanim određivanjem titra sa datom količinom oksalata.

d) Koliko puta bi trebalo povećati masu natrijumoksalata u ovom primeru, da bi se greška titra smanjila ispod 0.02%? Koliko bi bilo potrebno ponovljenih titracija date mase oksalata standardnim rastvorom, da bi se postigao isti efekat?

Page 157: Osnovi inzenjerske statistike

157

6 Intervalne ocene parametara raspodele

Do sada smo izložili postupke određivanja tačkastih ocena nepoznatih parametara osnovnog skupa i to na primeru najznačajnijih parametara: srednje vrednosti i disperzije. Izračunata vrednost θ*, neke tačkaste ocene (npr. x ) iz uzorka (x1,x2, ..., xn),

predstavlja samo jednu moguću realizaciju slučajne promenljive, funkcije uzorka Θ*(X1, X2,. . ., Xn), čija je srednja vrednost (ako je ocena nepristrasna) jednaka traženom parametru θ. Kao vrednost slučajne promenljive, ocena dobijena iz uzorka θ* će dakle, manje ili više odstupati oko njene srednje vrednosti θ. Zato bi znatno potpunija informacija bila u vidu intervala za koga možemo sa određenom verovatnoćom da tvrdimo da sadrži nepoznati parametar θ. Interval poverenja

Ocene parametra θ, u vidu intervala, zovu se intervalne ocene. Intervalna ocena se

zove i interval poverenja ili pouzdanosti. Kažemo da je interval ( )*2

*1,θθ interval

pouzdanosti ili interval poverenja za parametar θ, sa nivoom pouzdanosti ili poverenja γ, ako sa unapred zadatom verovatnoćom, γ možemo da tvrdimo da sadrži tačnu vrednost parametra, odnosno ako važi:

α−=γ=θ<θ<θ 1)( *2

*1P (6.1)

Jasno je da je:

α=θ≥θ∨θ≤θ )( *2

*1P

Page 158: Osnovi inzenjerske statistike

158

pa se verovatnoća α = 1 - γ naziva i rizik , jer predstavlja verovatnoću da tačna vrednost parametra bude izvan procenjenog intervala. Granice intervala pouzdanosti *

2*1,θθ se nazivaju granice pouzdanosti ili poverenja, a širina intervala

*1

*2 θ−θ predstavlja meru preciznosti intervalne ocene parametra. Što je širina intervala

manja, preciznost intervalne ocene je veća. Za interval poverenja kažemo da je simetričan, ako važi:

2/)()( *2

*1 α=θ>θ=θ<θ PP (6.2)

Na osnovu dosadašnjeg znanja o tačkastim ocenama θ*, koje zadovoljavaju uslove centriranosti i saglasnosti, možemo da zaključimo:

• Ukoliko je nivo pouzdanosti γ viši, tj. rizik α = 1 - γ da tačna vrednost parametra bude izvan intervala poverenja manji, utoliko će interval poverenja dobijen iz nekog uzorka obima n biti širi, tj. preciznost ocene manja.

• Pri datom nivou poverenja γ, sa povećanjem obima uzorka n iz koga se računa ocena θ*, opada širina intervala poverenja, tj. raste preciznost ocene. Ovo neposredno sledi iz svojstva saglasnosti ocene θ* (4.7).

• Od više različitih ocena posmatranog parametra θ, pri datom obimu uzorka n i nivou pouzdanosti γ, najuži interval pouzdanosti (najveća preciznost ocene) će imati najefikasnija od njih jer, po definiciji efikasnosti (Pogl. 4.3) najmanje varira oko svoje srednje vrednosti, θ .

6.1 OCENA SREDNJE VREDNOSTI NORMALNE RASPODELE SA POZNATOM DISPERZIJOM

Pretpostavimo da je slučajni uzorak obima n uzet iz populacije sa normalnom raspodelom N (µ,σ), čija je disperzija σ2 poznata. Uzoračka srednja vrednost X tada ima raspodelu (Pogl. 4.4),

X : N ( )n

xx

σ=σσµ ,,

U poglavlju 2.8 smo rešavali problem određivanja intervala u kome, sa zadatom verovatnoćom, variraju vrednosti slučajne promenljive sa normalnom raspodelom, oko njene srednje vrednosti µ (Primer 2.17). Odredimo sada, za zadatu verovatnoću, γ granicu apsolutnog odstupanja aritmetičke sredine X od njene srednje vrednosti µ, sa

njenim standardnim odstupanjem nx σ=σ kao jedinicom mere, tj. koliko

standardnih odstupanja xσ , iznosi ta granica. Odredimo, dakle, faktor zα takav da važi:

( ) α−=γ=σ<µ− α 1xzXP (6.3)

gde je γ zadato. Uzećemo jednačinu 2.54:

σεΦ=ε<∆ 2)( XP

i primeniti je na posmatrani problem. Znači da treba u jednačini,

Page 159: Osnovi inzenjerske statistike

159

• apsolutno odstupanje X∆ zameniti sa µ−X ,

• za granicu odstupanja ε uzeti xz σα ,

• σ zameniti sa xσ

Rezultat je:

( ) ( ) γ=Φ=σ<µ− αα zzXP x 2

Dakle, traženi faktor αz se dobija kao rešenje jednačine:

( )2

1

2

α−=γ=Φ αz (6.4)

odnosno predstavlja onu vrednost standardizovane slučajne promenljive sa normalnom raspodelom za koju Laplasova funkcija dobija vrednost ( ) 21 α− . Relaciji

xzX σ<µ− α su ekvivalentne sledeće relacije

xx zXz σ+µ<<σ−µ αα (6.5a)

xx zXzX σ+<µ<σ− αα (6.5b)

pa se Jedn. (6.3) može tumačiti na dva različita načina:

• Relacija (6.5a) predstavlja slučajan događaj da uzoračka srednja vrednost, kao slučajna promenljiva, upadne u interval sa fiksnim granicama (zα, xσ i µ

su konstante), koga možemo zvati verovatan interval za uzoračku srednju vrednost, X . Jednačina (6.3), tako određuje granice verovatnog intervala za X , pod uslovom da je poznata srednja vrednost µ.

• Slučajan događaj (6.5b) uz zadatu verovatniću γ, po definiciji (6.1) predstavlja interval poverenja za nepoznatu srednju vrednost µ, izračunat iz datog uzorka.

Zaključujemo da, pri poznatoj disperziji osnovnog skupa, interval pouzdanosti sa nivoom pouzdanosti γ = 1 - α, za srednju vrednost osnovnog skupa µ, glasi:

nzx

nzx

nzx

σ±=µ

σ+σ− ααα ili,, (6.6)

gde je zα definisano jednačinom (6.4) i zvaćemo ga koeficijent pouzdanosti. Ekvivalentna definicija koeficijenta pouzdanosti je (vidi sliku 6.1): ona vrednost standardizovane slučajne promenljive sa normalnom raspodelom za koju važi,

( ) α=≥ αzZP (6.6a)

Zaista,

( ) ( ) ( )ααα ≥=

≥σ

µ−=σ≥µ−=α zZPzX

PzXPx

x

5.6

Page 160: Osnovi inzenjerske statistike

160

( ) 20

2

2

1 z

ezf−

π=

Slika 6.1. Ilustracija jednačine 6.6a

U Tab. 6.1 date su vrednosti koeficijenta pouzdanosti za tri nivoa pouzdanosti γ, koje se najčešće koriste u praksi. Ove vrednosti se mogu dobiti iz tabele Tab. A1 i jednačine (6.4). Na primer, za vrednost α = 0.05 pronalazimo u tabeli onu vrednost zα za koju je:

96.1475.02

05.01

2

1)( =⇒=−=α−=Φ αα zz

Tabela 6.1 - Koeficijenti pozdanosti, zα

γ α αz

0.90 0.10 1.64 0.95 0.05 1.96 0.99 0.01 2.58

Treba zapaziti da su granice intervala poverenja (6.6) slučajne vrednosti (X je slučajna veličina). Dakle interval poverenja predstavlja jedan slučajan interval, koji sa zadatom verovatnoćom γ obuhvata nepoznatu ali fiksnu vrednost µ. Tako, ako bi postupak uzimanja uzorka i određivanja intervala poverenja ponavljali, svaki put bi dobili drugačiji interval poverenja, ali bi mogli očekivati da će u (γ⋅100) % (recimo 95%) svih slučajeva izračunati interval pouzdanosti obuhvatiti parametar µ. Jasno je sada zašto se za verovatnoću γ kaže da predstavlja nivo pouzdanosti intervalne ocene.

Primer 6.1 Aritmetička sredina četiri izmerene temperature (n = 4) peći optičkim pirometrom, t je 2250 0C. Ako je greška merne metode, σt = 10 0C, a) Naći sa pouzdanošću od 95% interval u kome leži prava vrednost temperature. b) Koliko je ponovljenih merenja temperature neophodno, da bi preciznost procene odstupanja tačne temperature od izmerene (sa datim nivoom pouzdanosti) bila 5 0C?

Rešenje

a) Za γ = 0.95, iz Tabele 6.1 čitamo: 96.105.0 ==α zz , pa je prema (6.5),

interval poverenja srednje vrednosti merenih temperatura peći, µt:

( )8.2259,2.22404

1096.12250,

4

1096.12250

,

+−

=

σ+σ−n

ztn

zt ta

ta

Page 161: Osnovi inzenjerske statistike

161

odnosno, sa pouzdanošću od 95%, prava temperatura peći, µt leži u intervalu

Ct08.22592.2240 <µ<

b) Preciznost procene predstavlja poluširinu intervala pouzdanosti, pa imamo uslov:

35.1592.3

92.3510

96.1

2 =≥

≥⇒≤=σ

α

n

nnn

z

Usvajamo kao minimalan broj neophodnih merenja: n = 16.

Aproksimacija za velike uzorke iz raspodele sa nepoznatom disperzijom

U skladu sa centralnom graničnom teoremom, za veće uzorke iz bilo koje raspodele sa parametrima µ i σ, primenljiva je aproksimacija da aritmetička sredina X ima

normalnu raspodelu N ( n/,σµ ). S druge strane, za velike uzorke (n ≥ 30) je primenljiva i aproksimacija:

( ) 222 σ=σ=∗

s

pa se za veće uzorke (n ≥ 30) iz raspodele sa nepoznatom disperzijom, interval (6.6) aproksimira intervalom:

n

szx

n

szx

n

szx ααα ±=µ

+− ili,, (6.7)

bez obzira na tip raspodele.

Primer 6.2. Obavljeno je 100 merenja mase čokolada, čija je deklarisana masa 100 g (prva kolona tabele). a) Odrediti granice u kojima se nalazi srednja masa čokolada “od 100 grama”, sa pouzdanošću od 90%, b) Ponoviti proračun za nivo pouzdanosti 99%. c) Da li se sa pouzdanošću od 90% može tvrditi da je srednja masa čokolade “od 100 grama” manja od nominalne (100 g), tako da ukazuje na poremećaj u procesu? Da li se ista tvrdnja može dati i sa sa pouzdanošću od 99% ?

Rešenje

Najpre izračunavamo uzoračku srednju vrednost i uzoračku disperziju iz formula za grupisane podatke (4.11b, 4.14b).

Tabela uz Primer 6.2.

Masa čokolade [g]

sredina intervala

x*, [g]

apsolutna frekvenca

m 92-94 93 5 94-96 95 7 96-98 97 21

Page 162: Osnovi inzenjerske statistike

162

98-100 99 33 100-102 101 19 102-104 103 11 104-106 105 4

∑ 100

gxmxi

ii 06.99100

1 7

1

*== ∑

=

, 227

1

2*2 796.710099

1gxxms

iii =

−= ∑=

Standardno odstupanje:

gs 79.2796.7 ==

a) Za pouzdanost 90%, 64.1=αz , pa je poluširina intervala pouzdanosti:

gn

sz 46.0

10

79.264.1 =⋅=α

a sam interval:

g46.006.99 ±=µ

b) Za pouzdanost 99%, 58.2=αz ,

g72.006.9910

79.258.206.99 ±=±=µ

Prema očekivanju, sa povećanjem nivoa pozdanosti smanjena je preciznost intervalne ocene (širi interval).

c) Sa pouzdanošću γ = 0.9, srednja masa proizvedenih čokolada “od 100 grama” leži u intervalu:

( ) ( )52.99,60.9846.006.99,46.006.99 ⇒+−

Pošto taj interval ne obuhvata nominalnu vrednost 100 g i leži ispod te vrednosti, sa datom pouzdanošću možemo da tvrdimo da je srednja vrednost populacije, tj. srednja masa proizvedene čokolade manja od deklarisane.

Do istog zaključka možemo da dođemo ako umesto intervala poverenja (6.5b), posmatramo verovatan interval uzoračke srednje vrednosti (6.5a). Njegova poluširina je jednaka procenjenoj poluširini intervala poverenja i predstavlja granicu slučajnih varijacija uzoračke srednje vrednosti. Pošto uočeno odstupanje uzoračke srednje vrednosti od pretpostavljene srednje vrednosti populacije:

gx 94.010006.99 −=−=µ−

po apsolutnoj vrednosti prevazilazi procenjenu granicu slučajnih varijacija ,

gn

szx 46.0=>µ− α

smatramo da se ono ne može pripisati slučajnim varijacijama uzoračke srednje vrednosti i kažemo da je statistički značajno. Zato odbacujemo pretpostavku da je srednja vrednost populacije 100 g.

Page 163: Osnovi inzenjerske statistike

163

Rizik da smo pogrešili jednak je verovatnoći da procenjeni interval poverenja (6.5b) ne obuhvati pretpostavljenu srednju vrednost, 100 g, odnosno verovatnoći da uzoračka srednja vrednost padne izvan verovatnog intervala (6.5a):

( ) %101001100 =γ−=⋅α

Za povišeni nivo pouzdanosti, γ = 0.99 interval poverenja srednje vrednosti je:

( ) ( )78.99,34.9872.006.99,72.006.99 ⇒+−

i razmišljajući na isti način, možemo i uz rizik od samo 1%, da zaključimo da ispitani uzorak ukazuje da je masa proizvedene čokolade manja od deklarisane.

6.2 OCENA SREDNJE VREDNOSTI NORMALNE RASPODELE NEPOZNATE DISPERZIJE

U slučajevima kada je disperzija σ2 nepoznata i uzorak nije veliki (n < 30) određivanje intervala pouzdanosti srednje vrednosti populacije sa normalnom raspodelom N (µ, σ), zasniva se na Studentovoj ili t - raspodeli.

Studentova raspodela

Slučajna promenljiva:

xS

X

n

SX

Tµ−=µ−= (6.8)

gde je S uzoračko standardno odstupanje (4.13), ima Studentovu ili t - raspodelu verovatnoće:

∞<<∞−

+

Γ

+Γπ=

+

td

td

d

dtf

d

2

12

1

2

21

1)( (6.9)

gde Γ označava gama funkciju (4.18a), a d je broj stepeni slobode t - raspodele i u slučaju statistike (6.8), on je jednak broju stepeni slobode sa kojim je izračunata ocena disperzije. Najčešće, disperziju osnovnog skupa ocenjujemo iz jednostavnog uzorka (koji nije nastao objedinjavanjem više uzoraka, kao u Pogl. 5.2), i tada je:

1−= nd (6.9a) Raspodela f(t) je, kao i standardizovana normalna raspodela, simetrična oko tačke t = 0 i ima zvonast oblik (slika 6.2). Parametri raspodele su:

Page 164: Osnovi inzenjerske statistike

164

M(T) = 0, ( )2−

=d

dTD

Očigledno je da t - raspodela ima veću disperziju od standardizovane normalne raspodele, ( ) 1>TD . Kada broj stepeni slobode d neograničeno raste, t - raspodela teži normalnoj raspodeli N(0, 1).

Slika 6.2. Standardizovana normalna i Studentova raspodela

Interval pouzdanosti srednje vrednosti normalne raspodele

Sprovešćemo na promenljivoj T (6.8) sličan postupak onom koga smo u prethodnom poglavlju, radi izvođenja intervala pouzdanosti srednje vrednosti, sproveli na standardizovanoj promenljivoj:

n

X

x

x

σµ−

Odredićemo za nivo pozdanosti γ = 1 - α, vrednost α,dt iz sledećeg uslova:

( ) α=≥ α,dtTP (6.10)

analognog uslovu (6.6a). Vrednost α,dt , koja predstavlja onu vrednost slučajne

promenljive sa t - raspodelom (6.9), za koju važi (6.10), smo obeležili sa dva indeksa, jer ona zavisi od broja stepeni slobode u raspodeli, d i verovatnoće α. Iz (6.8, 6.10) sledi:

γ=α−=

<µ−

α 1,dt

n

S

XP

Page 165: Osnovi inzenjerske statistike

165

pa smo dobili interval poverenja za srednju vrednost normalne raspodele, µ:

n

stx

n

stx

n

stx ddd ααα ±=µ

+− ,,, ili, (6.11)

gde je koeficijent pouzdanosti α,dt definisan jednačinom (6.10). Vrednosti koeficijenta

α,dt za razne vrednosti d i α date su u Tab. A2.

Poredeći intervale poverenja srednje vrednosti pri poznatoj i nepoznatoj disperziji osnovnog skupa, možemo da konstatujemo:

• Za razliku od intervala pouzdanosti srednje vrednosti pri datoj disperziji osnovnog skupa (6.6), poluširina intervala (6.11) je slučajna veličina jer je s vrednost slučajne promenljive - funkcije uzorka.

• Za dato γ i obim uzorka n, očekuje se da interval pouzdanosti pri nepoznatoj disperziji (6.11) uvek bude širi od odgovarajućeg intervala pri poznatoj disperziji (6.6), što je posledica odnosa:

)lim( ,

,

αα∞→

αα

=

>

zt

zt

dd

d

To je u skladu sa osnovnim principom teorije informacija, da je preciznost zaključka ili procene utoliko manja ukoliko se zasniva na manjoj koli čini informacija .

Primer 6.3 Procenat bakra u nekoj supstanci meren je 6 puta (n = 6) i aritmetička sredina 6 merenja je 1.14=x %. Odrediti interval u kome sa pouzdanošću γ = 95% leži pravi sadržaj bakra,

a) Ako je poznata greška metode, σ = 2.5% b) Iz datog uzorka procenjena je greška metode, s = 2.1%

Rešenje

05.01 =γ−=α

a) Koristimo jednačinu (6.6) sa 96.1=αz :

%0.21.14,0.26

5.296.1 ±=µ=⋅=σ

αn

z

b) U Tab. A2, za 05.0i1 =α−= nd nalazimo: 571.205.0,5 =t i iz (6.11):

%2.21.14,2.26

1.2571.2, ±=µ=⋅=α

n

std

Primer 6.4 Radi provere tačnosti metode, fotometrijskom titracijom je određivan berilijum u probi sa poznatom količinom berilijuma od 3.179 mg. Rezultati ponovljenih analiza (mg) su:

3.167, 3.172, 3.181, 3.170, 3.171, 3.162, 3.182, 3.169, 3.170, 3.166

a) Proceniti interval pouzdanosti za sistematsku grešku (bias) metode, b:

179.3−µ=b

sa 95% nivoom pouzdanosti, gde je µ srednja vrednost zamišljenog osnovnog skupa, koji sadrži beskonačan broj svih mogućih rezultata određivanja berilijuma u datoj probi. b) Na osnovu dobijenog intervala pouzdanosti diskutovati tačnost ispitivane metode.

Page 166: Osnovi inzenjerske statistike

166

Rešenje

a) Ocena sistematske greške iz datog uzorka od 10 merenja je:

179.3*−= xb .

Uz pretpostavku da merenja imaju normalnu raspodelu, statistika B* ima normalnu raspodelu sa parametrima:

( ) ( ) 22 179.3,179.3179.3 ** xbbXDbXM σ=−=σ=−µ=−=µ

Tako, u skladu sa jednačinom (6.11), interval pouzdanosti za njenu srednju vrednost b, dobijamo kao

10

05.0,9* s

tbb ±=

Iz datog uzorka izračunavamo:

00624.0,0080.0,1710.3 *=−== sbx

pa je poluširina intervala poverenja sistematske greške

0045.010

00624.0262.2

1005.0,9 ==

st

odnosno sam interval

0035.00125.0 −<<− b

b) Dudući da procenjeni interval poverenja sistematske greške ne uključuje nulu i leži u oblasti negativnih vrednosti, sa pouzdanošću od 95% smatramo da metoda ima sistematsku grešku i daje manje količine berilijuma od tačnih. 6.3 INTERVAL POVERENJA DISPERZIJE

NORMALNE RASPODELE

Neka raspolažemo uzorkom obima n (x1,x2,...,xn) iz normalne raspodele, iz koga

smo izračunali uzoračku disperziju s2 (4.14a). Potrebno je odrediti preciznost ocene disperzije, tj. interval pouzdanosti za disperziju sa odabranim nivoom pouzdanosti γ = 1 - α.

U poglavlju 4.7 smo izložili da slučajna veličina:

1,2

22 −=

σ=χ nd

Sd (6.12)

ima χ2 raspodelu sa d stepeni slobode (broj stepeni slobode sa kojim je računata uzoračka disperzija). Definisaćemo veličinu 2

, pdχ kao onu vrednost slučajne promenljive

(6.12) za koju važi:

pP pd =χ≥χ )( 2,

2 (6.13)

Page 167: Osnovi inzenjerske statistike

167

Slika 6.3. Ilustracija jednačine (6.13)

Vrednosti 2, pdχ , za razne verovatnoće p i brojeve stepeni slobode d, mogu se naći u Tab.

A3. Sada možemo da odredimo simetričan interval (vidi jednačinu (6.2)), u koga sa verovatnoćom γ = 1 - α pada vrednost slučajne promenljive χ2 (vidi sliku 6.4):

22/,

222/1, αα− χ<χ<χ dd (6.14)

Nakon smene izraza za χ2 (6.12) i rešavanja po nepoznatoj disperziji σ2, dobijamo traženi interval pouzdanosti, sa nivoom pouzdanosti γ = 1 - α:

2

2/1,

22

22/,

2

add

sdsd

−α χ<σ<

χ (6.15)

gde su 22/1, α−χd , 2

2/,αχd koeficijenti poverenja definisani jednačinom (6.13) i mogu se

naći u tabeli Tab. A3.

Slika 6.4. Granice intervala (6.14)

Page 168: Osnovi inzenjerske statistike

168

Primer 6.5 Za uzorke u Primeru 5.2 izračunati intervalnu ocenu standardnog odstupanja sa pouzdanošću 90%.

Rešenje

U Primeru 5.2 smo, iz objedinjenog uzorka, sa brojem stepeni slobode d = 14 dobili: s2 = 0.4279, s = 0.654 %

Zadato je: γ = 0.9, pa je α = 0.1. U Tab. A3 nalazimo:

69.23,57.6 205.0,14

22/,

295.0,14

22/1, =χ=χ=χ=χ αα− dd

Interval poverenja za disperziju dobijamo iz (6.15)

9077.02528.0

57.6

4279.014

69.23

4279.014

2

2

<σ<

⋅<σ<⋅

pa je traženi interval poverenja za standardno odstupanje (u %):

953.0502.0 <σ<

Primetimo, da za razliku od intervala pouzdanosti za srednju vrednost, koji je simetričan, u tom smislu da je uzoračka srednja vrednost u centru tog intervala, to nije slučaj sa intervalnim ocenama disperzije i standardnog odstupanja. Tako, u ovom primeru je centar procenjenog intervala za standardno odstupanje:

654.07275.02

953.0502.0>=

+

i leva granica intervala je znatno bliža uzoračkoj vrednosti od desne:

654.0953.0502.0654.0 −<−

Ova asimetričnost intervala poverenja opada sa povećanjem broja stepeni slobode sa kojim je izračunata uzoračka disperzija.

Primer 6.6 Statističke tablice za neku raspodelu f(x) su u literaturi često date u obliku vrednosti tzv. kvantila raspodele za različite verovatnoće, p. Takođe, statistički softveri uglavnom imaju ugrađene funkcije koje daju kvantile date raspodele. Kvantil (quantile) ili persentil (percentile) neke raspodele (verovatnoća data u procentima), sa funkcijom raspodele F(x), definiše se kao ona vrednost slučajne promenljive za koju funkcija raspodele dobija zadatu vrednost p. Ako kvantil raspodele označimo sa px , njegova

definicija je dakle (vidi sliku uz primer):

pxXPxF pp =<= )ˆ()ˆ(

Dakle, kvantili raspodele nisu ništa drugo do vrednosti slučajne promenljive za zadatu vrednost funkcije raspodele. Na primer, neki kvantili standardizovane normalne raspodele, pz su dati u tabeli.

Tabela uz Primer 6.6 - Kvantili standardizovane normalne raspodele,

p 0.5 0.8 0.9 0.95 0.975 0.98 0.99 0.995

pz 0 0.84 1.28 1.64 1.96 2.05 2.33 2.58

Page 169: Osnovi inzenjerske statistike

169

px px

Slika uz Primer 6.6 - Definicija kvantila raspodele

a) Kojim kvantilima odgovarajućih raspodela su jednake veličine 2,, i, ααα χddtz ,

definisane jednačinama (6.6a, 6.10 i 6.13) ?

b) U datoj tabeli kvantila standardizovane normalne raspodele uz Primer, naći koeficijente pozdanosti αz za α = 0.1, 0.05, 0.01

c) U tabeli vrednosti α,dt naći kvantile 95.0,890.0,10ˆ,ˆ tt

Rešenje

a) Na osnovu slike 6.1 i definicije kvantila (slika uz Primer) zaključujemo da je:

21 α−α = zz

Analogno,

21,,ˆ

α−α = dd tt

Na osnovu slike 6.3 i definicije kvantila zaključujemo: 2

1,2

, ˆα−α χ=χ dd

b)

58.2ˆˆ

96.1ˆˆ

64.1ˆˆ

995.0201.0101.0

975.0205.0105.0

95.021.011.0

===

===

===

zzz

zzz

zzz

c) Imajući u vidu vezu 21 α−α = tt , treba da odredimo verovatnoću α:

( ) 2.09.01290.02

1 =−=α⇒=α

i u Tab A.2 nalazimo:

372.1ˆ90.0,102.0,10 == tt

Na isti način:

860.1ˆ95.0,81.0,8 == tt

Page 170: Osnovi inzenjerske statistike

170

ZADACI

6.1 Za podatke iz Primera 6.5 proceniti interval poverenja za srednju vrednost µ i na

osnovu njega diskutovati tačnost ispitivane metode.

6.2 Dati su rezultati ponovljenih merenja vremena trajanja reakcije(s):

1.4, 1.2, 1.2, 1.3, 1.5, 1.0, 2.1, 1.4, 1.1

a) Uz pretpostavku da je standardna greška metode σ = 0.4 s, izračunati intervalnu ocenu srednje vrednosti sa nivoom pozdanosti 0.9. b) Koliko je ponovljenih merenja reakcionog vremena neophodno, da bi se odstupanje tačnog od izmerenog reakcionog vremena, procenilo (sa datim nivoom pouzdanosti) sa preciznošću od 0.1 s ? c) Ponoviti proračun u a) uz pretpostavku da standardna greška metode nije poznata.

6.3 Neka je iz normalne raspodele N(µ,σ) uzet slučajan uzorak obima n = 20 iz koga je izračunata ocena disperzije s2 = 37.9. Sa rizikom α = 0.02 naći intervalnu ocenu disperzije.

6.4 Sa nivoom poverenja γ = 0.9 oceniti standardnu devijaciju iz uzorka obima n = 31 iz normalne raspodele. Standardna greška izračunata iz uzorka je s = 0.85.

6.5 Izmerena je masa (g) pet pakovanja jednog leka:

2.10, 2.12, 2.16, 2.10, 2.13

Proceniti sa pouzdanošću od 90% srednju masu i disperziju masa pakovanja tog leka.

6.6 U tabeli su dati rezultati paralelnog gravimetrijskog (I) i volumetrijskog (II) određivanja sadržaja neke supstance (%) u probama identičnog sastava.

Metod I Metod II

1. 55.3 54.6

2. 56.9 54.3

3. 55.8 58.0

4. 57.3 52.7

5. 57.7 57.8

a) Odrediti intervalne ocene srednjeg sadržaja susptance za metodu I i metodu II, sa nivoom pozdanosti od 95 %.

b) Oceniti preciznosti metoda (standardna odstupanja) sa istom pouzdanošću.

6.7 Slučajan uzorak obima n1 uzet je iz raspodele N(µ1,σ) a drugi slučajan uzorak obima n2 iz raspodele N(µ2,σ). Pokazati da je interval pouzdanosti za razliku srednjih vrednosti (µ1-µ2) sa rizikom α, ako je σ poznato:

21

21

11)(

nnzxx +σ±− α

Page 171: Osnovi inzenjerske statistike

171

a ako σ nije poznato:

21

,221

11)(

21 nnstxx nn +±− α−+

gde je s standardna greška objedinjenog uzorka. (Napomena - vidi Zadatak 4.8)

6.8 Pretpostavićemo da su preciznosti metoda I i II u Zadatku 6.5 jednake.

a) Iz podataka u tom zadatku izračunati interval poverenja za razliku srednjih vrednosti sadržaja ispitivane supstance Metode I i Metode II, sa nivoom pouzdanosti 95 %.

b) Da li se, na osnovu izračunatog intervala, može doneti zaključak da između dve metode nema sistematskog odstupanja (da su obe metode podjednako tačne), uprkos uočenog međusobnog odstupanja dobijenih rezultata? Ako može, koliki je rizik da je zaključak pogrešan?

Page 172: Osnovi inzenjerske statistike

171

7 Testiranje statističkih hipoteza

Primena statističkih metoda u laboratorijama i proizvodnim pogonima je često povezana sa donošenjem zaključka o tome,

• da li je neka analitička metoda tačna, tj. da li je slobodna od sistematske greške, • da li se dve metode merenja razlikuju po preciznosti, • koji od dva tehnološka procesa je bolji, postojeći ili novi

i slično. U terminima statistike, najčešće se radi se o donošenju zaključaka o parametrima osnovnog skupa (srednja vrednost i disperzija), na osnovu raspoloživog slučajnog uzorka. Tako je prvi korak u postupku donošenja zaključka, postavljanje odgovarajuće statističke hipoteze ili pretpostavke, iz izvorne pretpostavke (npr. metoda merenja je tačna), koja se onda proverava ili testira.

Statistička hipoteza je pretpostavka ili tvrdnja u vezi sa raspodelom jedne ili više populacija (tip raspodele i/ili parametri raspodele), koja može da bude tačna ili pogrešna, a statistički test je postupak kojim se hipoteza prihvata ili odbacuje, na osnovu podataka iz uzorka. Ovde ćemo razmatrati dve vrste hipoteza:

• Parametarske hipoteze koje predstavljaju pretpostavku o vrednosti nekog od parametara poznate (pretpostavljene) raspodele.

• Neparametarske hipoteze koje predstavljaju pretpostavku o tipu raspodele populacije (na primer da li je raspodela normalna).

Testiranje parametarske hipoteze naziva se parametarski test, a neparametarske hipoteze neparametarski test.

Page 173: Osnovi inzenjerske statistike

172

7.1 POSTAVLJANJE I PROVERA HIPOTEZE

Hipoteza koja se proverava naziva se nulta hipoteza i označava sa H0. Što se postavljanja nulte hipoteze tiče, ona mora biti precizna da bi se mogla testirati. Tako, u slučaju parametarskog testa, ona u opštem slučaju glasi:

H0: θ = θ0 (7.1)

gde θ označava neki parametar populacije (npr. srednja vrednost) a θ0 je pretpostavljena vrednost tog parametra.

Onu hipotezu koju smatramo tačnom, ako je nulta hipoteza odbačena, nazivamo alternativna hipoteza i beležimo sa H1. Za nultu hipotezu (7.1) moguće je formulisati različite alternativne hipoteze.

H1: θ > θ0 (7.2)

H1: θ = θ1, (θ1 > θ0) (7.2a)

H1: θ < θ0 (7.3)

H1: θ = θ1, (θ1 < θ0) (7.3a)

H1: θ ≠ θ0 (7.4)

Formulisanje alternativne hipoteze je obavezno jer ona omogućuje definisanje kriterijuma odbacivanja hipoteze H0.

Parametarski test se sastoji u izboru odgovarajuće funkcije uzorka (statistike) koju zovemo test-parametar ili test statistika, izračunavanju njene vrednosti iz raspoloživog uzorka (x1,x2,...,xn) i poređenju te vrednosti sa odabranom kriti čnom vrednošću. Pri testiranju hipoteze (7.1) kao test-parametar uzimamo ocenu parametra θ iz uzorka (uzorački parametar *θ ) ili odgovarajućom transformacijom dobijenu bezdimenzionu test statistiku. Jasno je da će kriterijum odbacivanja H0 (7.1) u slučaju da je kao alternativna hipoteza uzeta ona data jednačinama (7.2) ili (7.2a) glasiti:

**kθ>θ (7.5)

gde je *kθ usvojena kritična vrednost, a oblast (7.5) se naziva kritična oblast testa.

Skup vrednosti test - statistike θ*, za koje se nulta hipoteza odbacuje, naziva se kriti čna oblast ili oblast odbacivanja hipoteze H0. Oblast vrednosti test - parametra θ*

u kojoj se nulta hipoteza H0 prihvata (ne odbacuje), naziva se oblast prihvatanja hipoteze.

U slučaju alternativnih hipoteza (7.3) ili (7.3a), kao kritična oblast se uzima,

**kθ<θ (7.6)

dok je u slučaju (7.4) kritična oblast dvostrana:

( ) ( )*2,

**1,

*kk θ>θ∨θ<θ (7.7)

Page 174: Osnovi inzenjerske statistike

173

i definisana je donjom *1,kθ i gornjom kriti čnom vrednošću *

2,kθ .

Prema tipu kritične oblasti, statistički testovi se dele na:

• jednostrane testove (alternativne hipoteze date jednačinama 7.2-3a) i • dvostrane testove (alternativna hipoteza 7.4)

Pri tom, jednostrani test može biti: • desnostrani test (alternativne hipoteze 7.2, 7.2a), ili • levostrani test (alternativne hipoteze 7.3, 7.3a)

Mada prihvatanje hipoteze H0, na osnovu ograničenog uzorka iz osnovnog skupa, ne znači da je ona tačna, već samo znači da uzorak ne protivreči hipotezi, u statistici se hipoteza smatra tačnom, sve dok se u postupku testiranja ne odbaci i time prihvati protivurečna hipoteza H1. Primetimo analogiju sa principom dokazivanja krivice u sudskom procesu: optuženi se smatra nevinim, sve dok se na osnovu relevantnih dokaza ne dokaže njegova krivica. Tako, “teret” dokazivanja da je nulta hipoteza H0 netačna “leži” na alternativnoj hipotezi H1. Ova osobenost može da pomogne oko izbora, koju od dve protivurečne pretpostavke uzeti kao H0, a koju kao H1.

Neka se na primer, novi tehnološki proces poredi sa postojećim i postavlja se pitanje koju od dve alternativne formulacije hipoteza usvojiti:

a) H0: postojeći proces je isti, ili bolji od novog H1: novi proces je bolji

b) H0: novi proces je isti, ili bolji od postojećeg H1: postojeći proces je bolji

Ako je postojeći proces pouzdan, a troškovi prelaza na novi proces su visoki, teret dokaza treba da leži na novom procesu - on se mora pokazati kao bolji. Zato se preporučuje izbor (a). Ako je pak postojeći proces nepouzdan, a troškovi prelaza nisu visoki, onda je teret dokaza na postojećem procesu i odgovarajući izbor je (b).

Dobar izbor nulte hipoteze često nije jednostavan i prevazilazi okvire statistike i nekada je za njegovo rešavanje neophodno koristiti savremenu naučnu disciplinu, teoriju odlučivanja. Primer testiranja statističke hipoteze

Pri testiranju znanja, kandidati odgovaraju na 20 pitanja zaokruživanjem jednog od 4 ponuđena odgovora (a) - (d), za svako pitanje, od kojih je tačan samo jedan [Walpole,R. 1970]. Pošto je teret na kandidatima da dokažu da nisu neznalice, pogodan izbor hipoteza je:

H0: Dati tačni odgovori su rezultat čistog pogađanja

H1: Dati tačni odgovori ukazuju na znanje kandidata

Kao kriterijum za odbacivanje hipoteze H0 možemo, recimo, odabrati sledeći: broj datih tačnih (od ukupno 20) odgovora je veći od 8. Kako glase odgovarajuće statističke hipoteze?

Page 175: Osnovi inzenjerske statistike

174

Podsetimo se definicije statističke hipoteze: pretpostavka o raspodeli neke slučajne veličine na osnovu uzorka. Slučajna veličina X, koja je ovde u pitanju je: broj tačnih odgovora na n = 20 pitanja. Zakon raspodele verovatnoće ove diskretne slučajne promenljive je binomni:

( )20,,1,0,)1(),,( ==−

= − nnxpp

x

npnxb xnx

gde je p verovatnoća izbora tačnog od 4 ponuđena odgovora, na bilo koje pitanje iz date oblasti. Dakle, ovde parametar raspodele p predstavlja statističku meru znanja kandidata. Ako kandidat nište ne zna nego samo pogađa, onda je očigledno verovatnoća da zaokruži tačan odgovor na neko pitanje, p = 1/4, a očekivan broj odgovora neznalice je np = 20/4 = 5. Tako je prethodno formulisanoj izvornoj nultoj hipotezi, ekvivalentna sledeća statistička nulta hipoteza:

H0: µx = np = 5 )4

1( =p

Kao odgovarajuća alternativa hipoteza H1, koju prihvatamo, ako se H0 odbaci, može se uzeti:

( )1)4

1(5:1 PpH x >>µ

ali i:

( )2)2

1(10:1 PpH x ==µ

ili recimo:

( )3)7.0(14:1 PpH x ==µ

U pitanju je svakako desnostrani test. Odabrana kriti čna vrednost je

8*, ==µ kkx x

pa je oblast odbacivanja hipoteze (7.5):

x > 8 Znači, ako neki kandidat da najviše 8 tačnih odgovora (x ≤ 8) na testu, prihvatamo hipotezu da je kandidat neznalica. U suprotnom (x > 8), kandidat je dokazao da nije neznalica. Preciznije, u zavisnosti od izbora alternativne hipoteze, prihvatamo jedan od tri alternativna zaključka:

P1: Kandidat ima neko znanje.

P2: Kandidat ima takvo znanje, da u proseku daje, zaokruživanjem jednog od 4 ponuđena odgovora, tačan odgovor na 50% pitanja iz date oblasti.

P3: Kandidat ima takvo znanje, da u proseku daje, zaokruživanjem jednog od 4 ponuđena odgovora, tačan odgovor na 70% pitanja iz date oblasti.

Statističkim terminima, testira se na osnovu uzorka obima n = 20 pretpostavka o srednjoj vrednosti, odnosno parametru p binomne raspodele. Hipoteza H0 se prihvata, ako test-statistika x, koja predstavlja ocenu srednje vrednosti binomne raspodele,

Page 176: Osnovi inzenjerske statistike

175

** npx x =µ=

gde je *p ocena parametra binomne raspodele p, upadne u interval 8* ≤µ= xx . Ako broj

tačnih odgovora upadne u kritičnu oblast (x > 8), prihvatamo jedan od zaključaka:

P1: Parametar raspodele p veći je od 1/4.

P2: Parametar raspodele p jednak je 1/2.

P3: Parametar raspodele p jednak je 0.7.

7. 2 GREŠKE PRI TESTIRANJU

Kao kod svakog zaključivanja o populaciji na osnovu ograničenog uzorka, i pri testiranju hipoteze postoji rizik da je zaključak testa pogrešan. Budući da su moguća dva zaključka: hipoteza H0 se odbacuje i hipoteza H0 se prihvata i svaki od njih može biti pogrešan, razlikuju se dva tipa greške:

• Greška prve vrste je učinjena, ako je tačna hipoteza H0 odbačena jer je vrednost test - parametra *θ upala u kritičnu oblast.

• Greška druge vrste je učinjena, ako je hipoteza H0 pogrešna ali je prihvaćena jer je vrednost test - parametra *θ upala u oblast prihvatanja hipoteze.

Od interesa je proceniti verovatnoće grešaka prve i druge vrste, koje se zovu rizici prve i druge vrste.

Rizik prve vrste, α jednak je:

( )0* HWP ∈θ=α (7.8)

gde je, W - kritična oblast

i predstavlja uslovnu verovatnoću da test statistika *θ upadne u kriti čnu oblast, pod uslovom da je nulta hipoteza tačna.

Rizik druge vrste, β je uslovna verovatnoća

( )1* HWP ∉θ=β (7.9)

događaja da test statistika *θ upadne u oblast prihvatanja hipoteze nulte hipoteze H0, koja nije tačna, odnosno tačna je alternativna hipoteza H1.

Primer 7.1 Za test znanja koji je prethodno opisan,

a) Odrediti na koji deo mogućih pitanja iz odgovarajuće oblasti kandidat zna tačan odgovor (koji deo oblasti je naučio), ako je verovatnoća da pruži tačan odgovor na posmatranom testu (zaokruživanjem jednog od četiri ponuđena odgovora) jednaka:

p = 0.5, 0.7 (pretpostavljene verovatnoće u alternativnim hipotezama P2 i P3)

b) Izračunati rizike prve i druge vrste.

Page 177: Osnovi inzenjerske statistike

176

Rešenje

a) Označimo traženi udeo od ukupnog broja pitanja na koje kandidat zna tačan odgovor (tj. deo oblasti koju je naučio) sa ω. Suočen sa nekim pitanjem sa ponuđena 4 odgovora, od kojih je samo jedan tačan, kandidat,

• zna odgovor na pitanje (događaj H1) i zaokružuje odgovarajući, tačan odgovor, ili

• ne zna odgovor na pitanje (događaj H2) i zaokružuje odgovor pogađanjem

Pošto opisani suprotni događaji H1 i H2 predstavljaju potpun sistem nespojivih događaja, verovatnoću zaokruživanja tačnog od četiri ponuđena odgovora (događaj A) na neko pitanje iz testa, dobijamo iz formule totalne verovatnoće (1.21):

P(A) = P(H1)P(A/ H1) + P(H2)P(A/ H2) = p

Verovatnoća događaja H1, da kandidat zna tačan odgovor, jednaka je upravo traženom udelu ω, P(H1) = ω, a verovatnoća njemu suprotnog događaja H2

jednaka je P(H2) = 1- ω. Uslovne verovatnoće zaokruživanja tačnog odgovora su jednake:

P(A/ H1) = 1, P(A/ H2) = 1/4

Tako imamo:

p=ω−+ω4

1)1(

odakle za ω dobijamo:

3

4)

4

1( −=ω p

Za dve vrednosti p računamo:

6.0:7.03

1:5.0

=ω=

=ω=

p

p

Dakle, alternativne hipoteze (P2) i (P3) možemo da formulišemo i rečima:

P2: Kandidat ima takvo znanje, da (u proseku) zna tačan odgovor na 1/3 postavljenih pitanja iz posmatrane oblasti.

P3: Kandidat ima takvo znanje, da (u proseku) zna tačan odgovor na 60% postavljenih pitanja iz posmatrane oblasti.

i ove formulacije ćemo koristiti u daljem tekstu. b) Prema (7.8), rizik prve vrste je verovatnoća da broj tačnih odgovora bude veći od 8, ako je parametar raspodele verovatnoće broja tačih odgovora, p = 1/4:

( ) ( )4/180 =>=∈=α pXPHWXP

i računamo ga iz binomne raspodele sa paramerom p = 1/4:

Page 178: Osnovi inzenjerske statistike

177

0409.09591.014

3

4

1201

4

3

4

120 208

0

2020

9

=−=

−=

=α−

=

=

∑∑x

xx

x

xx xx

Znači da će pri testiranju velikog broja kandidata približno 4.1% od njih (npr. 41 od 1000) proći na testu, iako su potpune neznalice jer su imali sreću pri pogađanju tačnih odgovora. Očigledno je da rizik prve vrste zavisi od odabrane kriti čne vrednosti i dobijeni mali rizik α rezultat je relativno visoke kriti čne vrednosti (xk = 8), odnosno relativno velike oblasti prihvatanja hipoteze (ovde, visok kriterijum polaganja testa).

Za određivanje verovatnoće greške druge vrste (7.9) neophodna je precizna formulacija alternativne hipoteze, kao npr. (P2) ili (P3). Odaberimo recimo alternativnu hipotezu (P2)

)2

1(10:1 ==µ pH x

Tako, verovatnoća β je verovatnoća da kandidat da najviše osam tačnih odgovora, x ≤ 8, ako je parametar p raspodele 21=p , odnosno ako on nije potpuna neznalica, već ima takvo znanje da, bez pogađanja, daje tačan odgovor na 1/3 pitanja iz date oblasti:

)2/18()( 1 =≤=∉=β pXPHWXP

2517.02

1

2

12020

8

0

=⋅

=β−

=

∑ xxx x

Dobijen je veliki rizik druge vrste, β ≈ 25%. U približno 25% slučajeva na testu će pasti i kandidati koji imaju izvesno znanje. Visok rizik druge vrste je rezultat široke oblasti prihvatanja nulte hipoteze H0 odnosno visoke kriti čne vrednosti xk.

Očigledno je da su rizici α i β međusobno zavisni, tj. da povećanje kriti čne vrednosti znači istovremeno smanjivanje rizika prve vrste α i povećanja rizika druge vrste, β.

Primer 7.2 Uzmimo da je zbog velikog rizika da na testu padnu i kandidati koji znaju tačne odgovora na 1/3 mogućih pitanja iz date oblasti, snižen kriterijum odnosno kritična granica sa 8 na 7 tačnih odgovora. Kako će se to odraziti na rizike α i β ?

Rešenje

Sa novom kritičnom granicom, za rizik prve vrste dobijamo

1018.0

4

3

4

1201

4

3

4

120)4/17(

207

0

2020

8

−=

==>=α

=

=

∑∑x

xx

x

xx xx

pXP

a sa istom alternativnom hipotezom kao u prethodnom primeru, za rizik druge vrste

1316.02

1

2

120)2/17( 20

7

0

=⋅

==≤=β−

=

∑ xxx x

pXP

Page 179: Osnovi inzenjerske statistike

178

Dakle, rizik druge vrste je približno prepolovljen, ali je zato rizik prve vrste više nego udvostručen. Ipak, može se konstatovati da je novi izbor kritične vrednosti, xk = 7 bolji od prvobitnog, xk = 8 u tom smislu što su dva rizika približno uravnotežena.

Iz definicije rizika druge vrste, β jasno je da on zavisi od izbora alternativne hipoteze H1 (Jedn. 7.2a, 7.3a), odnosno od izbora alternativne pretpostavke θ1 za vrednost parametra osnovnog skupa. Može se predvideti da će za dati uzorak i odabranu kriti čnu oblast, odnosno za konstantnu vrednost α, rizik β prihvatanja netačne nulte hipoteze biti utoliko veći ukoliko je manja razlika između pretpostavljene, θ0 i "prave" θ1 (odnosno one pretpostavljene hipotezom H1), vrednosti parametra.

Primer 7.3 Za test u prethodnim primerima, koliki je rizik da na proveri znanja sa pragom xk = 8, padnu i kandidati koji imaju značajnije znanje, tj. takvo da znaju tačne odgovore na 60% pitanja iz date oblasti? Statističkim jezikom rečeno, koliki je rizik prihvatanja pogrešne nulte hipoteze, ako je parametar raspodele, p = 0.7?

Rešenje

Traži se verovatnoća β sa reformulisanom alternativnom hipotezom:

H1: µx = 14 (p = 0.7)

Iz raspodele računamo:

0051.03.07.020

)7.08( 208

0

=⋅

==≤=β −

=

∑ xx

x xpXP

Tako, ako se kao kandidati koji bi mogli nepravedno pasti na ispitu posmatraju oni koji su naučili 60% posmatrane oblasti, onda je kritična vrednost od 8 tačnih odgovora dobro odabrana, jer se rizici prve i druge vrste, α i β ne razlikuju značajno.

Nije teško zaključiti da je jedini način da se, pri datim hipotezama H0 i H1 i

odabranoj kriti čnoj vrednosti test statistike, smanji verovatnoća greške oba tipa je povećanje obima raspoložive informacije, tj. povećanje obima uzorka na kome se hipoteza proverava.

Primer 7.4 Neka je test provere znanja iz prethodnih primera proširen na n = 100 pitanja sa po 4 odgovora (od kojih je jedan tačan). Kritičnoj vrednosti od 8 tačnih od ukupno 20 odgovora, odgovara kritična vrednost relativne frekvence, tj. test statistike *p :

4.020

8* ===ω kk p

pa bi za obim uzorka n = 100 pitanja, odgovarajući kritičan broj tačnih odgovora bio:

404.0100*=⋅== kk npx

Na isti način, kritičnom broju xk = 7 tačnih od 20 odgovora, odgovara

3520

7100 ==kx

tačnih odgovora od ukupno 100. Neka smo kao kritičnu vrednost broja tačnih od ukupno 100 odgovora odabrali vrednost između te dve:

Page 180: Osnovi inzenjerske statistike

179

xk = 37

Izračunati rizike prve i druge vrste pri testiranju hipoteze,

)4

1(25:0 ==µ pH x

sa alternativnom hipotezom:

)2

1(50:1 ==µ pH x

uz datu kritičnu vrednost:

37*, ==µ kkx x

Rešenje

Za n = 100, binomna raspodela b(x,p,n) se može aproksimirati normalnom

raspodelom N (np, npq ). Tako su parametri normalne raspodele kojom

aproksimiramo binomnu:

za p = 1/4,

33.4,75.184

3

4

1100,25

4

1100 2 =σ=⋅=σ=⋅=µ

a za za p = 1/2,

5,25,50 2 =σ=σ=µ

Na odgovarajući način reformulisane hipoteze su:

H0: µ = 25

H1: µ = 50

Sada možemo da izračunamo tražene verovatnoće α i β:

0028.0

0028.09972.01)77.2(

9972.05.0)77.2()77.2(

)77.2(1)77.2(

)77.2()33.4

2537()25/37(

=α=−=>

=+Φ=≤≤−=>

>=−>==µ>=α

ZP

ZP

ZPZP

ZPZPXP

0047.0

0047.05.0)6.2(5.0)6.2()6.2(

)6.2()5

5037()50/37(

=β=+Φ−=+−Φ=−≤

−≤=−≤==µ≤=βZP

ZPZPXP

Očigledno je da povećanja uzorka, odnosno broja postavljenih pitanja na proveri znanja smanjuje rizike prve i druge vrste, odnosno rizik α da test položi potpuna neznalica i rizik β da neznalicom bude proglašen kandidat, koji ima izvesno

Page 181: Osnovi inzenjerske statistike

180

znanje jer je u stanju da, bez pogađanja, da tačan odgovor na 1/3 pitanja iz date oblasti.

7.3 KRITI ČNE OBLASTI KOD NEPREKIDNIH RASPODELA

Pri testiranju neprekidnih raspodela, uobičajeno je da se ne biraju kritične vrednosti, već verovatnoća greške prve vrste α i onda se na osnovu nje formira kriti čna oblast. Razmotrimo testiranje parametarske hipoteze (7.1):

H0: θ = θ0

gde je θ0 pretpostavljena vrednost parametra raspodele θ. Pretpostavimo da je poznat model raspodele verovatnoće test statistike *Θ (ocene parametra θ iz uzorka). Tada, sa pretpostavljenom vrednošću θ0 kao srednjom vrednošću te raspodele, možemo da odredimo veličinu *

pθ kao onu vrednost test-statistike, za koju, sa zadatom

verovatnoćom p, važi:

( ) pP p =θ>Θ ** (7.10)

Sledi da su, za zadati rizik prve vrste α, kriti čne oblasti:

• za desnostrani test (H1 definisana sa 7.2 ili 7.2a),

**αθ>θ (7.11a)

• za levostrani test (H1 definisana sa 7.3 ili 7.3a),

*1

*α−θ<θ (7.11b)

• za dvostrani test (7.3a ili 7.4),

)()( *2

**21

*αα− θ>θ∨θ<θ (7.11c)

(vidi ilustracije na slikama 7.1a,b, 7.2)

Page 182: Osnovi inzenjerske statistike

181

Slika 7.1a- Kritična oblast za desnostrani test

Slika 7.1b - Kritična oblast za levostrani test

Slika 7.2 - Kritična oblast za dvostrani test

Opisani kriterijumi odbacivanja nulte hipoteze (7.1) karakterišu se fiksiranom, unapred odabranom verovatnoćom α greške prve vrste.

Alternativni na čin za testiranje hipoteze (7.1) je da se umesto poređenja iz uzorka dobijene vrednosti ∗θ , test statistike ∗Θ (na primer aritmetičke sredine uzorka, pri proveri hipoteze o srednjoj vrednosti), sa kritičnim vrednostima, dobijenim iz usvojene

Page 183: Osnovi inzenjerske statistike

182

verovatnoća greške prve vrste α ( vidi jedn , 7.11a-c), poredi verovatnoća p određena iz raspodele test statistike ∗Θ kao:

)( ** θ>Θ= Pp , za desnostrani test

)( ** θ<Θ= Pp , za levostrani test

( )00 θ−θ>θ−Θ= ∗∗Pp , za dvostrani test,

sa usvojenom vrednošću α i hipoteza odbacuje, ako je:

α<p

Ilustracija prihvatanja i odbacivanja nulte hipoteze za desnostrani test je data na slikama 7.3a,b.

7.3a) Nulta hipoteza se prihvata (p > α)

7.3b) Nulta hipoteza se odbacuje (p < α)

Navedena verovatnoća p u literaturi se naziva p-vrednost (p-value) a opisani postupak je uglavnom zastupljen u softverskim paketima.

Page 184: Osnovi inzenjerske statistike

183

Rizik druge vrste β (7.9), kao što smo već konstatovali, raste sa smanjivanjem razlike između pretpostavljene vrednosti parametra θ0 i alternativne vrednosti (hipoteza H1), θ1. To je ilustrovano slikom (7.4), gde su 1θ′ i 1θ′′ vrednosti pretpostavljene alternativnim hipotezama:

11 : θ′=θ′H

11 : θ ′′=θ′′H a β′′β′ i su rizici druge vrste za hipoteze 1H ′ i 1H ′′ .

Slika 7.4 - Uticaj alternativne vrednosti θ1 na rizik druge vrste

Pri prelazu sa dvostranog na jednostrani test smanjuje se rizik druge vrste β, što je ilustrovano slikom (7.5).

Slika 7.5 - Smanjenje rizika druge vrste, pri prelazu sa dvostranog na desnostrani test

7.4 TESTIRANJE HIPOTEZE O SREDNJOJ VREDNOSTI

Page 185: Osnovi inzenjerske statistike

184

Pretpostavimo da je slučajan uzorak obima n uzet iz normalne raspodele, N (µ,σ). Proveravamo hipotezu,

H0: µ = µ0 (7.12)

gde je µ0 pretpostavljena srednja vrednost populacije. Slučaj poznate disperzije (z-test)

Ako je disperzija raspodele poznata, kao test statistiku koristimo bezdimenzionu slučajnu veličinu, Z:

( )

n

X

XD

XMXZ σ

µ−=−= 0

)(: N (0,1) (7.13)

tj. normalizovanu uzoračku srednju vrednost i zvaćemo je kratko: Z - statistika. Prema opštem postupku, opisanom u prethodnom poglavlju, za zadatu verovatnoću p se definiše (7.10) ona vrednost *

pz test statistike Z, za koju važi:

( ) pzZP p => * (7.14)

( ) 20

2

2

1 z

ezf−

π=

Slika 7.6 Definicija veličine z*

p Tada, primenom jednačina (7.11a-c) uz

*** , pp zz =θ=θ

određujemo kriti čnu oblast, tj. kriterijum odbacivanja hipoteze (7.12), na sledeći način:

• za desnostrani test,

*0

*0 ili, αα σ>µ−>σµ−

zxzx

xx

(7.14a)

• za levostrani test,

*10

*1

0 ili, α−α− σ−>−µ<σµ−

zxzx

xx

(7.14b)

Page 186: Osnovi inzenjerske statistike

185

(pošto su verovatnoće α male, a srednja vrednost normalizovane raspodele je jednaka nuli, veličina *

1 α−z je negativna)

• za dvostrani test,

>σµ−∨

µ−αα−*

20*

210 z

xz

x

xx

,

odnosno

( ) ( )*20

*210 αα− σ+µ>∨σ+µ< zxzx xx (7.14c)

Pošto je raspodela Z - statistike simetrična oko nule, važi

*1

*α−α −= zz

(vidi Sl. 7.6), pa se kritične oblasti mogu prikazati na sledeći način:

• za jednostrani test,

xx

zxzx

σ>µ−>σµ−

αα*

0*0 ili, (7.15a)

• za dvostrani test,

xx

zxzx

σ>µ−>σµ−

αα*

20*

20 ili, (7.15b)

Kod standardizovane normalne raspodele, kao simetrične raspodele, uobičajeno je da se umesto veličine *

pz (7.14), za definisanje kriti čne vrednosti koristi veličina pz

data jednačinom (6.6a) i slikom 6.1:

( ) pzZP p => (7.16)

Veza između te dve veličine (Sl. 7.7) je:

pp zz 2*= (7.16a)

( ) 20

2

2

1 z

ezf−

π=

Slika 7.7 Ilustracija jednačine 7.16a

Page 187: Osnovi inzenjerske statistike

186

Tako, kritične oblasti, definisane pomoću vrednosti pz (7.16) dobijamo jednostavno,

zamenjujući α sa 2α u jednačinama (7.15a) i (7.15b):

• za jednostrani test,

xx

zxzx

σ>µ−>σµ−

αα 2020 ili, (7.17)

• za dvostrani test,

xx

zxzx

σ>µ−>σµ−

αα 00 ili, (7.17a)

i date su u Tabeli 7.1. Slučaj nepoznate disperzije (t - test)

Ako je disperzija raspodele nepoznata i pri tome je relativno mali obim uzorka, umesto Z - statistike, za proveru hipoteze (7.12) se koristi bezdimenziona statistika,

( )

n

SX

S

XMXT

x

0µ−=−= (7.18)

koja ima t - raspodelu sa (n -1) stepeni slobode (Pogl. 6.2) i koju ćemo kratko zvati T - statistika. Analognim postupkom, koristeći umesto zα, vrednost α,dt , definisanu kao

( ) ptTP pd =≥ ,

i može se naći u Tab.A2, definišu se kriterijumi odbacivanja hipoteze. Oni su dati u Tabeli 7.1 i poznati su pod imenom: t - test.

Tabela 7.1 - Kriterijumi odbacivanja hipoteze (7.12)

Alternativna hipoteza, H1 Statistika Kriterijum odbacivanja

σ poznato (z -test):

µ ≠ µ0 α> zz

µ > µ0 n

XZ

/0

σµ−= α> 2zz

µ < µ0 α> 2zz

σ nepoznato (t -test):

µ ≠ µ0 α−> ,1ntt

Page 188: Osnovi inzenjerske statistike

187

µ > µ0 nS

XT

/0µ−= α−> 2,1ntt

µ < µ0 α−> 2,1ntt

Primer 7.5 Mašina za pakovanje šećera u kese podešena je na 1.000 kg. Poznato je da je veličina slučajne greške pri pakovanju tj. standardno odstupanje osnovnog skupa σ = 0.01 kg. Potrebno je ispitati da li dobijena srednja masa od 1003 g za slučajan uzorak od 36 kesa ukazuje da je mašina “raštimovana” i da sistematski “prepunjava” kese. Za mase pakovanja, pretpostaviti normalnu raspodelu. Za α uzeti α = 0.05.

Rešenje

Na ovom primeru ćemo prikazati testiranje hipoteze preko kritičnih vrednosti i, alternativno, preko p-vrednosti.

Kao nultu hipotezu uzimamo:

H0: µ = 1000 g

a kao alternativnu možemo da uzmemo:

H1: µ ≠ 1000 g

U pitanju je dvostrani test, pa je kriterijum odbacivanja nulte hipoteze dat jednačinom (7.17a):

( )gn

zx 100000 =µσ>µ− α

Pošto za α = 0.05, u Tabeli 6.1 (Pogl.6.1) nalazimo

zα = 1.96

kriti čno odstupanje uzoračke od pretpostavljene srednje vrednosti je:

gn

z 27.36/1096.1 =⋅=σ

α

Budući da uočeno odstupanje:

gx 310001003 =−=µ−

ne prevazilazi kritično (3 < 3.27), uzorak ne protivreči hipotezi H0 i ona se prihvata .

Za testiranje pomoću p-vrednosti, iz dobijene srednje mase napunjenih kesa računamo:

8.1

36

10100010030 =

−=σ

µ−=

n

xz

U Tab. A1 dobijamo odgovarajuću vrednost Laplasove funkcije (0.4641), pa je p-vrednost za dvostrani test (imajući u vidu da je raspodela simetrična)

Page 189: Osnovi inzenjerske statistike

188

072.0)4641.05.0(2 =−⋅=p

Budući da je ova vrednost (0.072) veća od praga značajnosti (α = 0.05), uzorak ne protivreči hipotezi H0 i ona se prihvata.

Pošto se ipak može sumanjati da mašina sistematski prepunjava kese (čime je firma oštećena), tj. da je učinjena greška druge vrste (prihvaćena netačna hipoteza) kao alternativnu hipotezu je logično uzeti:

H1: µ > 1000g

odnosno sa dvostranog preći na jednostrani test, čime se smanjuje rizik β od nastupanja greške druge vrste. Odgovarajući kriterijum odbacivanja H0 dat je jednačinom (7.17), koja u konkretnom problemu glasi:

( )1000020 =µσ>µ− αn

zx

Kritično odstupanje uzoračke od pretpostavljene srednje vrednosti računamo sa:

64.11.02 ==α zz

i ono iznosi:

gn

z 73.26/1064.12 =⋅=σ

α

Pošto je 3 > 2.73, uslov za odbacivanje nulte hipoteze je ispunjen i zaključujemo: mašina sistematski prepunjava kese šećerom pa je treba ponovo podesiti.

Takođe, možemo testiranje izvršiti određivanjem p - vrednosti za jednostrani test iz test statistike:

8.1

36

10100010030 =−=σ

µ−=

n

xz

036.04641.05.0 =−=p

Budući da je ova vrednost manja od praga značajnosti (α = 0.05), dolazimo do istog zaključka, tj. uzorak protivreči hipotezi H0 i ona se odbacuje i prihvata alternativna.

Ovim primerom ilustrovano je smanjivanje rizika β prihvatanja netačne nulte hipoteze prelaskom sa dvostranog na odgovarajući jednostrani test.

Primer 7.6 Na usnovu uzorka u Primeru 6.5, proveriti da li je ispitivana analitička metoda tačna (nema sistematsku grešku) sa rizikom prve vrste α = 0.05, 0.01.

Rešenje

Kao nultu hipotezu uzećemo:

H0: Sistematska greška (bias) b, jednaka je nuli

a kao alternativnu,

Page 190: Osnovi inzenjerske statistike

189

H1: Postoji sistematska greška ( 0≠b ) gde je, 179.3−µ=b

µ - srednja vrednost rezultata analitičke metode

Ovim hipotezama je očigledno ekvivalentna statistička hipoteza:

179.3:

179.3:

1

0

≠µ=µ

H

H

koju ćemo testirati. U Primeru 6.5 smo za uzorak izračunali:

00422.0,1733.3 == sx

Prema tabeli 7.1, vrednost test-statistike je:

271.4

10

179.3−=

−=

sx

t

Kritičnu vrednost za α = 0.05 nalazimo u Tab A.2:

262.205.0,9 =t

Pošto je:

05.0,9262.2271.4 tt =>=

odbacujemo nultu hipotezu i zaključujemo sa rizikom od 5% da analitička metoda nije tačna.

Za smanjeni rizik da ćemo odbaciti tačnu hipotezu: α = 0.01, kriti čna vrednost je veća: 250.301.0,9 =t

ali i dalje manja od vrednosti 4.271 i zaključujemo sa rizikom od samo 1% da analitička metoda nije tačna. 7.5 PROVERA HIPOTEZE I INTERVAL POVERENJA

Iz jednačina (7.10) i (7.11c) i slike 7.3 je očigledno da oblast prihvatanja nulte

hipoteze o parametru raspodele θ:

H0: θ = θ0

predstavlja verovatan interval za test statistiku *Θ sa verovatnoćom γ. Zaista, iz (7.10) i (7.11c) sledi:

γ=α−=θ<θ<θ αα− 1)( *2

**21P

pa su *2

*21 i αα− θθ granice verovatnog intervala za uzorački parametar tj. test statistiku. S

obzirom na ekvivalenciju između verovatnog intervala ocene nekog parametra i intervala

Page 191: Osnovi inzenjerske statistike

190

poverenja tog parametra (Pogl. 6.1), oblast prihvatanja hipoteze (7.1) predstavlja takođe interval poverenja parametra raspodele θ sa nivom pouzdanosti γ = 1 - α . Tako, veličina na desnoj strani druge od jednačina (7.17a) nije ništa drugo nego poluširina intervala poverenja za parametar µ koji se testira, odnosno verovatnog intervala za test statistikuX . Treba da dodamo i to da kriti čne vrednosti kod jednostranih testova definišu jednostrane intervale poverenja, koje nismo obradili u prethodnoj glavi.

Da zaključimo, hipotezu (7.1) odbacujemo, ako pretpostavljena vrednost θ0

parametra raspodele padne izvan intervala poverenja za taj parametar, izračunat iz vrednosti test statistike i njene (njenih) kritične (kritičnih) vrednosti.

Primer 7.7 Rešiti Primer (6.3c) testiranjem odgovarajuće hipoteze.

Rešenje

Postavljeni problem ovde rešavamo testirajući hipotezu:

100:0 =µH

nasuprot hipotezi:

100:1 <µH

sa datim rizicima prve vrste: α = 0.1, 0.01

Ipak ćemo, radi lakšeg uočavanja veze između intervala poverenja srednje vrednosti i oblasti prihvatanja nulte hipoteze, u prvom koraku kao alternativnu hipotezu uzeti:

100:1 ≠µH

Tako je u pitanju dvostrani t - test koji se, s obzirom na veličinu uzorka može zameniti dvostranim z - testom normalne, sa kriterijumom odbacivanja hipoteze (7.17a) uz s=σ :

n

szx α>µ− 0

Za test statistiku, tj. odstupanje uzoračke od pretpostavljene srednje vrednosti smo u Primeru 6.3 izračunali:

94.00 =µ−x

a za kritičnu vrednost, koja predstavlja poluširinu intervala poverenja srednje vrednosti:

72.0100

79.258.2:01.0

46.0100

79.264.1:1.0

==σ

==σ

α

α

nz

nz

Vrednost test-statistike u oba slučaja prevazilazi kritičnu vrednost, što znači da pretpostavljena srednja vrednost pada izvan intervala poverenja i odbacujemo nultu hipotezu.

Sada ćemo test ponoviti sa ispravnije odabranom alternativnom hipotezom:

Page 192: Osnovi inzenjerske statistike

191

100:1 <µH

odnosno primeniti levostrani test, sa kriterijumom odbacivanja hipoteze (7.17) uz s=σ :

n

szx α>µ− 20

Pošto je: αα < zz2 (vidi Sl. 6.1),

kritične vrednosti za jednostrani test su manje od onih za dvostrani i tim pre odbacujemo nultu hipotezu, uz zaključak (alternativna hipoteza) da je srednja vrednost mase proizvedene čokolade "od 100g" manja od deklarisane.

7.6 PROVERA HIPOTEZE I STATISTI ČKA ZNA ČAJNOST

Iz dosadašnje diskusije i primera testiranja hipoteze:

H0: θ = θ0

može se zaključiti da provera hipoteze u stvari predstavlja proveru statističke značajnosti uočenog odstupanja uzoračkog od pretpostavljenog parametra populacije:

0* θ−θ=∆ (7.19)

Ako uočeno odstupanje prevazilazi kritičnu granicu, smatramo ga statistički značajnim i odbacujemo hipotezu (7.1) sa rizikom α da smo učinili grešku. Zato se u literaturi umesto termina: testiranje statističkih hipoteza sreće termin: testovi značajnosti (significance tests), a verovatnoća greške prve vrste α naziva prag ili nivo značajnosti testa. Uobičajene vrednosti za nivo značajnosti α su

α = 0.05 = 5% i α = 0.01 = 1%

Pri tom,

• ako je H0 odbačena pri α = 5% kaže se da je uočeno odstupanje (7.19) statistički značajno;

• ako je hipoteza H0 odbačena i pri α = 0.01 = 1% kaže se da je uočeno odstupanje statistički vrlo značajno.

Tako bi zaključak testiranja u Primeru 7.5 mogao da glasi:

• srednja masa kesa datog uzorka značajno odstupa od deklarisane (pretpostavljene srednje mase populacije), a u Primeru 7.7,

• odstupanje srednje mase čokolada određene iz uzorka od deklarisane mase je ne samo značajno nego i vrlo značajno.

Page 193: Osnovi inzenjerske statistike

192

7.7 POREĐENJE DVE SREDNJE VREDNOSTI

Na osnovu dva nezavisna uzorka,

21

,,,i,,, 2121 nn yyyxxx ……

iz dve populacije, sa raspodelama N ),( xx σµ i N ),( yy σµ redom, proveravamo

hipotezu da populacije tj. raspodele imaju jednake srednje vrednosti:

yxH µ=µ:0 (7.19)

proveravajući statističku značajnost razlike uzoračkih srednjih vrednosti yx − . Ako je pretpostavka je da su disperzije raspodela jednake:

σx = σy = σ

Prema svojstvu linearnosti normalne raspodele (2.57, 2.58), i u slučaju nezavisnih uzoraka, slučajna veličina:

YXU −= ima raspodelu N ),( uu σµ sa parametrima,

+σ=σ+σ=σµ−µ=µ21

2222 11,

nnyxuyxu

Očigledno je hipoteza (7.19) ekvivalentna hipotezi

0:0 =µuH (7.19a)

pa se problem svodi na proveru hipoteze da je srednja vrednost raspodele N ),( uu σµ

jednaka nuli, na osnovu uzorka obima n = n1 + n2. Tako kriterijumi odbacivanja hipoteze neposredno slede iz onih datih u tabeli 7.1 i prikazani su u tabeli 7.2. Pri tome su date statistike kada su standardna odstupanja poznata (Z statistika) ili nepoznata (T statistika).

Ako disperzije populacije nisu jednake, ali su poznate, primenljiv je test u Tabeli 7.2, s tim što je test - statistika:

2

2

1

2

nn

YXYXZ

yxu σ+

σ

−=

σ

−= (7.20)

Ako su disperzije populacija nepoznate i pritom se može tvrditi da nisu jednake (Pogl. 7.8) koristi se test - statistika:

2

2

1

2

n

S

n

S

YXT

yx +

−= (7.20a)

Page 194: Osnovi inzenjerske statistike

193

Ova test statistika nema t raspodelu ali se ova raspodela ipak koristi za određivanje kritičnih vrednosti, uz određene aproksimacije. Jedan od načina korišćenja t raspodele u ovom slučaju je korekcija broja stepeni slobode. Welch-Sattertwaite-ov izraz za određivanje broja stepeni slobode [NIST/SEMATECH e-Handbook] je:

( )

( ) ( )1

/

1/

//

2

2

22

1

2

12

2

22

12

−+

+=

n

ns

n

ns

nsnsd

yx

yx (7.21)

što, u opštem slučaju, nije ceo broj pa je u tabeli t raspodele potrebno izvršiti interpolaciju ili uzeti najbliži ceo broj. Za velike obime uzoraka se, kao što je već spomenuto, umesto t raspodele koristi standardizovana normalna raspodela.

Često se sreće slučaj da uzorci, jednakih obima n, iz dve populacije (x1,x2...xn, y1,y2...yn) nisu nezavisni. Tipičan primer je upoređivanje srednjih vrednosti dve slučajne veličine na osnovu njihovih vrednosti, izmerenih na istim statističkim entitetima. Recimo, merenje krvnog pritiska iste osobe pre i posle uzimanja leka, ili određivanje sadržaja neke supstance u istim probama, sa dve analitičke metode uporedo. Tada se, radi poređenja srednjih vrednosti, polazi od uzorka čiji su elementi parovi odgovarajućih vrednosti dve slučajne veličine, tzv. vezani uzorak: ),(,),,(),,( 2211 nn yxyxyx …

Iz vezanog uzorka se, dalje, obrazuje uzorak koji sadrži razlike vrednosti slučajnih veličina u pojedinim parovima:

niyxv iii ,...,1, =−=

Lako se može pokazati da je: yxv −= Ako su posmatrani uzorci (x1,x2...xn, y1,y2...yn) iz normalnih raspodela tada slučajna veličina:

YXV −=

ima raspodelu N )/,( nvv σµ . Tako, imajući u vidu da je µv = µx - µv , hipotezi (7.19) je

ekvivalentna hipoteza:

0:0 =µvH

a kriterijumi odbacivanja se računaju iz uzoračkih parametara v i sv , prema Tabeli 7.1

Page 195: Osnovi inzenjerske statistike

194

Tabela 7.2 - Testiranje hipoteze µx = µy pri jednakim disperzijama

Primer 7.8 Dve grupe analitičara su u jednoj istoj probi određivali sadržaj azota. Rezultati (%) ponovljenih merenja za obe grupe su date u sledećoj tabeli:

Pod pretpostavkom da obe grupe rade sa približno istom preciznošću i da rezultati grupe I ne sadrže sistematsku grešku (referentna grupa), da li grupa II čini pri određivanju sistematsku grešku? Pri testiranju hipoteze usvojiti nivo značajnosti, α = 0.01 (visok nivo značajnost testa).

Rešenje

Testiramo hipotezu:

H0: µ1 = µ2

nasuprot

H1: µ1 ≠ µ2

Alternativna hipoteza, H1

Statistika Kriterijum odbacivanja

hipoteze (7.19)

Standardno odstupanje σ = σx = σy, poznato:

µx ≠ µy

µx > µy ili µx < µy 21 /1/1 nn

YXZ

−=

α> zz

α> 2zz

Standardno odstupanje σ = σx = σy, nepoznato:

µx ≠ µy

µx > µy ili µx < µy 21 /1/1 nnS

YXT

+

−=

α> ,dtt

α> 2,dtt

gde su:

2

)1()1(

21

22

212

−+

−+−=

nn

snsns yx , d = n1 + n2 – 2

Grupa I Grupa II

9.29 9.53 9.38 9.48 9.35 9.61 9.43 9.68

Aritmetička sredina

9.363 9.575

Page 196: Osnovi inzenjerske statistike

195

Pošto nemamo standardno odstupanje, koristimo t - test, za šta je potrebna njegova procena, s. Računamo je kao standardnu grešku objedinjenog uzorka (5.6), po formuli datoj u Tabeli 7.2:

075.02

1077.71043.3

2244

)14()14( 3322

21

22

21 =

⋅+⋅=

+

−+

−+−=

−−sssss

Za broj stepeni slobode: 6242 =−⋅=d i nivo značajnosti α = 0.01:

707.3, =αdt

pa je kritična vrednost razlike aritmetičkih sredina:

197.04

2075.071.3

11

21, =⋅=+α nn

std

Kako je uočena razlika aritmeti čkih sredina,

212.0363.9575.921 =−=− xx

statistički vrlo značajna, jer prevazilazi kritičnu granicu, 0.197, sa nivoom značajnosti α = 0.01, odbacujemo nultu hipotezu i zaključujemo da je u merenjima grupe II prisutna sistematska greška.

Primer 7.9 Postoji brza ali neprecizna metoda za ocenu koncentracije hemikalije u posudi. Analizirano je osam proba iz iste posude tom metodom, a zatim još četiri probe, ali standardnom metodom koja je precizna ali za samo merenje je potrebno duže vreme. Odrediti da li brza metoda daje sistematsko potcenjivanje ili precenjivanje koncentracije hemikalije.

Rešenje

Testiramo hipotezu:

H0: µ1 = µ2

nasuprot

Standardna(1) Brza(2)

25 23 24 18 25 22 26 28 17 25 19 16

Aritmetička sredina

25 21

Page 197: Osnovi inzenjerske statistike

196

H1: µ1 ≠ µ2

Prvo ćemo odrediti procene standardnih odstupanja za obe metode:

21.4,82.0 21 == ss

Pošto se standardna odstupanja prilično razlikuju, sumnja u jednakost disperzija (preciznost metoda) postoji, pa koristimo t - test pri čemu za broj stepeni slobode koristimo izraz (7.21):

( )

( ) ( )( )

( ) ( ) 899.7

188/21.4

144/82.0

8/21.44/82.0

1/

1/

//2222

222

2

2

222

1

2

121

2

2221

21 ≈=

−+

−=

−+

+=

n

ns

n

ns

nsnsd

Za broj stepeni slobode: 8=d i nivo značajnosti α = 0.05

306.2, =αdt

pa je kritična vrednost (7.20a)

56.38

21.4

4

82.0306.2

22

2

22

1

21

, =+⋅=+α n

s

n

std

Pošto je uočena razlika aritmeti čkih sredina

4212521 =−=− xx

statistički značajna, jer prevazilazi kritičnu granicu, 3.56, sa nivoom značajnosti α = 0.05, odbacujemo nultu hipotezu i zaključujemo da brza metoda sistematski potcenjuje vrednost koncentracije tj. prisutna je sistematska greška.

Da smo, kojim slučajem, prevideli razliku disperzija i kritičnu vrednost odredili kao u prethodnom primeru, dobili bi smo kao kritičnu vrednost 4.84 (d =10, α = 0.05) što bi nas navelo da prihvatimo nultu hipotezu. U slučaju sumnje u pretpostavku o jednakosti disperzija, preporučuje se testiranje te hipoteze (Pogl.7.8) Primer 7.10 U jednoj laboratoriji za kontrolu kvaliteta proizvoda od mesa su merene količine nitrita (mg) u n = 10 različitih proizvoda pomoću dve metode. Merenje je vršeno tako što je svaka proba (uzorak materijala) podeljena na dva dela iste mase i jedan deo je ispitivan jednom metodom (1) a drugi deo drugom metodom (2). Rezultati su prikazani u tabeli.

Br. Metoda (1) x

Metoda(2) y

Razlika (1)-(2) v = x-y

1 15 16 -1 2 42 45 -3 3 32 35 -3 4 10 8 2 5 5 3 2 6 45 44 1 7 16 20 -4 8 2 5 -3 9 31 28 3

Page 198: Osnovi inzenjerske statistike

197

10 18 23 -5 1.1−=v

Odrediti da li postoji značajna razlika u rezultatima ove dve metode. Pri testiranju hipoteze usvojiti nivo značajnosti, α = 0.05

Rešenje

Ovde su merenja tako izvedena da se nameće testiranje hipoteze na vezanom uzorku.Testiramo hipotezu:

H0: µv = 0

nasuprot

H1: µv ≠ 0

Odredićemo procenu standardnog odstupanja slučajne veličine V:

89.21

1 2

1

2 =

−−= ∑=

vnvn

sn

iiv

Vrednost T statistike je (Tabela 7.1):

20.11089.2

1.1−=

−==

n

sv

tv

Kritična t vrednost za d = n -1 = 9 stepeni slobode na nivou značajnosti α = 0.05 je 262.2, =adt . Kako je adtt ,< prihvatamo nultu hipotezu i zaključujemo da

razlika između rezultata merenja ove dve merne metode nije statistički značajna.

7.8 POREĐENJE DVE DISPERZIJE (F – TEST)

Neka su iz dva uzorka, iz normalnih raspodela, dobijene ocene 22

21 i ss , disperzija

σ σ12

22i i neka su uzorci numerisani tako da je 2

221 ss > . Potrebno je proveriti hipotezu

da uzoračke disperzije 22

21 i ss predstavljaju ocene jedne iste disperzije σ2. Ako

odaberemo jednostrani test, znači da testiramo hipotezu:

222

210 : σ=σ=σH (7.22)

nasuprot hipoteze:

22

211 : σ>σH (7.22a)

U teoriji je pokazano da, pod uslovom da su statistike 22

21 i SS dve nezavisne

procene iste disperzije σ2 normalne raspodele, slučajna promenljiva, F:

22

21

S

SF = (7.23)

Page 199: Osnovi inzenjerske statistike

198

ima raspodelu, poznatu pod nazivom F- raspodela [Vukadinović, S 1990]. Prirodno je da F- raspodela zavisi od dva stepena slobode d1 i d2 i pišemo: F(d1,d2). To su stepeni slobode sa kojima su izračunate uzoračke disperzije 2

221 i ss , redom. Na Sl. 7.8,

skicirane su krive gustine ove raspodele za dva para vrednosti za d1 i d2.

Jasno je da velika vrednost količnika 22

21 ss navodi na sumnju da je hipoteza (7.22)

tačna. Treba utvrditi da li je njegova vrednost statistički značajno veća od 1, tj. dovoljno velika da bi, sa rizikom α, odbacili hipotezu. Pošto poznajemo raspodelu test-statistike (7.23), kriterijum odbacivanja hipoteze (7.22) definišemo postupkom opisanom u Pogl. 7.3 za jednostrani test (vidi Jedn. 7.10, 11a):

),( 21 ddFF α> (7.24)

gde je,

( ) α=> α ),( 21 ddFFP (7.24a)

Slika 7.8 - Krive gustine F- raspodele i kritična vrednost test-statistike

Vrednosti definisane jednačinom (7.24a) date su u Tab. A4a-b.

Primer 7.11 Proveriti pretpostavke o jednakosti (nejednakosti) disperzija dve populacije u primerima 7.8 i 7.9, sa nivoom značajnosti α = 0.05.

Rešenje

U primeru 7.8 vrednost količnika uzoračkih disperzija (definiše se tako da bude veći od 1) je:

27.2003425.0

007766.021

22 ==

s

s

Kritičnu vrednost nalazimo u Tab.A4a:

28.9)3,3(05.0 =F

i pošto je 28.927.2 < , uzoračke disperzije se ne razlikuju značajno i prihvatamo pretpostavku da su disperzije jednake.

Page 200: Osnovi inzenjerske statistike

199

U primeru 7.9 vrednost količnika uzoračkih disperzija je:

6.2667.0

7.1721

22 ==

s

s

Kritičnu vrednost nalazimo u Tab.A4a:

9.8)3,7(05.0 ≈F

i pošto je 9.86.26 > , uzoračke disperzije se statistički značajno razlikuju i odbacujemo pretpostavku da su disperzije jednake.

7.9 PIRSONOV χ2 TEST SAGLASNOSTI

Ovaj test spada u neparametarske testove, kojima proveravamo postavljenu hipotezu o modelu raspodele populacije, ili drugim rečima, proveravamo saglasnost uzorka, tj. empirijske raspodele sa pretpostavljenom teorijskom raspodelom.

Kao meru odstupanja između empirijskih frekvenci za uzorak sa intervalno sređenim podacima (Pogl. 4.2) i očekivanih ili teorijskih frekvenci (izračunatih iz pretpostavljenog modela raspodele) Pirson (K. Pearson) je predložio sumu:

∑ ∑=

−=−=χ

k

i i

ii

np

npm

1

222 )(

ekivanoco

ekivano)co(izmereno

(7.25)

gde je, mi - apsolutna frekvenca vrednosti koje pripadaju i- toj klasi u uzorku

npi - očekivana ili teorijska frekvenca vrednosti u i- toj klasi, gde je

pi - verovatnoća da vrednost upadne u i- tu klasu, izračunata iz pretpostavljenog teorijskog modela raspodele

n - obim uzorka

k - broj klasa, odnosno ukupan broj apsolutnih frekvenci Pirson je pokazao da slučajna promenljiva χ2, definisana jednačinom (7.25), ako uzorak pripada populaciji sa pretpostavljenom raspodelom, ima približno χ2- raspodelu (Pogl. 4.7) sa brojem stepeni d. Broj stepeni se, u skladu sa definicijom datom u Pogl. 4.6 i Jedn. (4.15) određuje kao:

1−−= rkd (7.26)

gde je r broj parametara u pretpostavljenoj raspodeli. Ti parametri su neophodni za izračunavanja sume (7.25) i procenjuju se iz raspoloživog uzorka (Pogl. 4.5, 4.6), te njihov broj r predstavlja broj veza između k podataka. Još jedna veza između podataka iz kojih se računa suma (7.25), od koje u (7.26) potiče umanjenje za 1 je:

Page 201: Osnovi inzenjerske statistike

200

nmk

ii =∑

=1

Ako su razlike između empirijskih frekvenci mi za neki uzorak i teorijskih npi

slučajne, one nisu statistički značajne, pa ni suma (7.25) neće biti značajno različita od nule, tj. neće prekoračiti neku kriti čnu vrednost. U suprotnom, vrednost sume, tj. test-statistike χ2 će biti značajno različita od nule i tada je razumno odbaciti hipotezu da dati uzorak pripada pretpostavljenoj raspodeli. Pošto je u pitanju neprekidna raspodela, kritičnu vrednost ćemo odrediti iz zadatog rizika prve vrste, α (rizik odbacivanja tačne hipoteze). Tako, kriterijum odbacivanja hipoteze o teorijskoj raspodeli, sa nivoom značajnosti α glasi:

2,

2αχ>χ d (7.27)

gde je 2,αχd definisano jednačinom (6.13) i slikom (6.3):

( ) α=χ≥χ α2

,2

dP

Primer 7.12 Guma dobijena regeneracijom u nekom pogonu razvrstava se u klase A, B, C i D. U dužem periodu vremena, raspodela pojedinih jedinica po klasama je približno bila:

A: 53.4% B: 26.6% C: 13.3% D: 6.7%

Proveriti sa nivoom značajnosti α = 0.05, da li u poslednjoj sedmici dobijena raspodela:

A: 340 jed. B: 130 jed. C: 100 jed. D: 30 jed.

značajno odstupa od pređašnje, što ukazuje da je došlo do značajnih poremećaja u procesu.

Rešenje

Računamo vrednost test-statistike χ2 (7.25):

Pošto model raspodele ne zahteva nijedan parametar, broj stepeni slobode za χ2 raspodelu računamo iz (7.26) sa r = 0:

d = k - 1 = 3

Za kritičnu vrednost, u Tab. A3 nalazimo: 82.7205.0,3 =χ

Klasa

Uočena apsolutna učestalost,

mi

Teorijska relativna

frekvenca, pi

Očekivana apsolutna frekvenca,

npi

i

ii

np

npm 2)( −

A 340 0.534 320 400/320 B 130 0.266 160 900/160 C 100 0.133 80 400/80 D 30 0.067 40 100/40

∑ n = 600 1.000 600 χ2 = 14.4

Page 202: Osnovi inzenjerske statistike

201

Pošto je 14.4 > 7.8, u skladu sa kriterijumom (7.27) zaključujemo: Došlo je do izmene raspodele proizvoda, tj. do značajnog poremećaja u procesu.

Napomenuli smo da statistika (7.25) ima samo približno χ2 - raspodelu. Da bi

aproksimacija bila što bolja neophodno je da empirijske apsolutne frekvence po klasama budu veće od 5 (mi > 5), ako je broj klasa bar 5, a ako je broj klasa manji od 5 donja granica empirijskih apsolutnih frekvenci treba da bude i veća. Ako uslov mi > 5 nije zadovoljen, treba objediniti dve ili više susednih klasa.

Primer 7.13 Merena je radioaktivnost nekog materijala prebrojavanjem radioaktivnih čestica u brojaču u toku 40 uzastopnih jednakih perioda vremena od 1 minuta. Broj registrovanih čestica u toku jednominutnih peroda se kretao od 1 do 4, a ukupan broj registrovanih čestica u toku 40 min bio je 48. U prvoj koloni tabele dat je broj registrovanih čestica x, a u drugoj koloni ukupan broj jednominutnih intervala, mi sa tim brojem registrovanih čestica.

Broj registrovanih čestica u 1 minuti, x:

0 1 2 3 4 5≥

Broj 1-minutnih perioda sa x čestica, m:

13 13 8 5 1 0

Kao što smo u poglavlju 2.6 naveli, teorijski model posmatrane slučajne pojave je Poasonova raspodela verovatnoće. Slučajna promenljiva je broj registrovanih radioaktivnih čestica, X u vremenskom periodu date dužine (ovde 1 min) i prema Poasonovom modelu, verovatnoća da se u periodu vremena date dužine registruje x čestica data je jednačinom (2.42):

,...2,1,0,!

)()( =µ=== µ− xex

xpxXPx

Potrebno je, sa nivoom značajnosti α = 0.05, proveriti saglasnost datog uzorka, tj. empirijske raspodele date tabelom, sa Poasonovim teoretskim modelom.

Rešenje

Da bi smo izračunali test statistiku (7.25) neophodan je parametar µ teoretske raspodele. Kako je µ srednja vrednost Poasonove raspodele (vidi Jedn. 2.43), njena ocena iz uzorka je aritmeti čka sredina, koju računamo pomoću formule (4.11b) za grupisani uzorak:

40015813131

=+++++==∑=

k

iimn

2.140

1435281130131

1

* =⋅+⋅+⋅+⋅+⋅===µ ∑=

k

iii xm

nx

Pošto apsolutne frekvence u poslednje tri klase u tabeli (m = 5,1,0), nisu veće od 5, u skladu sa datom preporukom, spojićemo te klase u jednu u kojoj će apsolutna frekvenca biti )5(6 > :

Page 203: Osnovi inzenjerske statistike

202

Klasa,

i

Broj čestica u 1min,

xi

Uočena apsolutna frekvenca,

mi

Teoretska relativna

frekvenca, pi

Očekivana apsolutna frekvenca,

npi

i

ii

np

npm 2)( −

1 0 13 0.301 12.0 0.083 2 1 13 0.361 14.5 0.155 3 2 8 0.217 8.67 0.052 4 ≥ 3 6 0.121 4.82 0.289

∑ n = 40 1.000 40 χ2 = 0.579

Teorijske ili očekivane relativne frekvence za prve 3. klase računamo iz raspodele po formuli,

3,2,1,!

=µ= µ− iex

pi

x

i

i

a za poslednju klasu:

∑=

−=

3

14 1

iipp

Kritičnu vrednost računamo sa brojem stepeni slobode d, koga određujemo prema (7.26) sa r = 1, jer teorijska raspodela ima jedan parametar (µ):

21141 =−−=−−= rkd

Za kritičnu vrednost, u Tab. A3 nalazimo: 99.5205.0,2 =χ

Pošto je 0.579 < 5.99 empirijska raspodela je u saglasnosti sa Poasonovom.

Primer 7.14 Testirati hipotezu da uzorak u Primeru 4.7 pripada populaciji sa normalnom raspodelom, sa nivoom značajnosti α = 0.05.

Rešenje

Teorijske relativne frekvence pi, računamo za pretpostavljenu, normalnu raspodelu, pri čemu za vrednosti parametara raspodele uzimamo uzoračke parametre, izračunate u Primeru 4.7:

697.0,413.3 ==σ==µ sx

Page 204: Osnovi inzenjerske statistike

203

Uočavamo da prve tri i poslednje dve klase nemaju više od po 5 vrednosti, pa ih spajamo: prve tri u jednu i poslednje dve u jednu, tako da novodobijeni širi intervali sadrže više od po pet vrednosti.Tako su granice prvog (proširenog) intervala x1 = 1.45 i x2 = 2.95. Teorijska relativna frekvenca p1, predstavlja verovatnoću da vrednost slučajne promenljive sa raspodelom N ),( sx upadne u posmatrani interval, i računamo je pomoću (2.52):

( )

−Φ−

−Φ=<<=s

xx

s

xxxXxPp 12

211

( ) ( ) 2522.04976.02454.0816.2664.01 =+−=−Φ−−Φ=p

Očekivani broj vrednosti (apsolutna freekvenca) u tom intervalu biće:

1.102522.0401 =⋅=np

Na sličan način izračunate su očekivane apsolutne učestanosti za preostale tri klase. Za vrednost test statistike, χ2 dobijamo:

64.23.8

)3.88(

3.10

)3.110(

7.10

)7.1015(

1.10

)1.107( 22222 =−+−+−+−=χ

Pošto je broj parametara raspodele, r = 2, kritičnu vrednost tražimo sa brojem stepeni slobode,

11241 =−−=−−= rkd

64.284.32,1 >=χ α

Prihvatamo pretpostavku da uzorak pripada normalnoj raspodeli.

7.10 KRITERIJUM ODBACIVANJA SUMNJIVIH MERENJA

Ovaj test treba da omogući objektivnu procenu da li je neki rezultat merenja, koji po veličini uočljivo odudara od ostalih, bezvredan jer sadrži grubu grešku ili je to

Klasa Granica intervala

Sredina intervala,

*ix

Apsolutna frekvenca,

mi

Očekivana aps. fekv,

npi

1 1.45-1.95 1.7 2

2 1.95-2.45 2.2 1 10.1

3 2.45-2.95 2.7 4 7

4 2.95-3.45 3.2 15 10.7

5 3.45-3.95 3.7 10 10.3

6 3.95-4.45 4.2 5

7 4.45-4.95 4.7 3 8 8.3

Page 205: Osnovi inzenjerske statistike

204

odstupanje slučajno. U pitanju je test homogenosti uzorka, tj. provera neparametarske hipoteze da sva merenja u datom uzorku pripadaju istoj populaciji (što znači da sadrže samo slučajna odstupanja). Jedan od takvih testova je Grubbs-test za odbacivanje sumnjivih merenja [NIST/SEMATECH e-Handbook]. Po ovom testu proveravamo hipotezu

H0: nema sumnjivih merenja u podacima

nasuprot

H1: postoji bar jedno sumnjivo merenja

Neka raspolažemo uzorkom: x1, x2, …,xn, obima n. Ako je uzorak uzet iz populacije sa normalnom raspodelom, može se definisati raspodela bezdimenzione slučajne veličine:

niS

XXG

x

i,...,1,

max=

−= (7.28)

koju ćemo zvati g - raspodela. Nulta hipoteza se odbacuje sa nivoom značajnosti α ako je:

α> ,ngG (7.29)

gde je kritična vrednost Grubbs-testa, gn,α

2

/,2

2/,2

, 2

1

nn

nnn tn

t

n

ng

α−

α−

α +−

−= (7.29a)

i predstavlja onu vrednost slučajne promenljive G (7.28), za koju važi:

α=≥ α )( ,ngGP (7.30)

pri tome je nnt /,2 α− odgovarajuća kritična vrednost iz t raspodele. Kao što se može videti,

ovo je dvostrani test jer daje kriterijum odbacivanja ili krajnje visokih ili krajnje niskih rezultata merenja.

Primer 7.15 Data su merenja x:

Br 1 2 3 4 5 6 7 8 9 10 x 1.98 1.97 1.98 1.95 1.92 2 1.99 2.03 2.11 1.75

Da li neko od merenja sadrži grubu grešku sa nivoom značajnosti α = 0.05?

Rešenje

Iz podataka računamo:

217.0max,092.0,968.1 10 =−=−== xxxxsx i

pa je vrednost test-statistike (7.28):

Page 206: Osnovi inzenjerske statistike

205

36.2092.0

217.0==g

Iz tabele Tab A.5 određujemo kritičnu vrednost Gn,α

29.205.0,10, ==α ggn

Kako je kritična vrednost (2.29) manja od test-statistike (2.36) nulta hipoteza se odbacuje sa sa nivoom značajnosti α = 0.05 što znači da izmerena vrednost 1.75 sadrži sistematsku grešku.

U slučaju više sumnjivih merenja se postupak ponavlja uz izbacivanje jednog po jednog dok se sva sumnjiva merenja ne eliminišu.

Primer 7.16 Ponoviti prethodni proračun uz izbacivanje sumnjivog merenja određenog u prethodnom primeru uz isti nivo značajnosti.

Rešenje

Ponavljanjem proračuna uz eliminaciju sumnjivog merenja dobijamo vrednosti test-statistike i kritične vrednosti Grubbs testa:

118.0max,054.0,992.1 9 =−=−== xxxxsx i

22.2,19.2 05.0,9, === α ggg n

iz čega se može videti da se nulta hipoteza može prihvatiti tj. da u preostalim podacima nema sumnjivih merenja.

Page 207: Osnovi inzenjerske statistike

206

ZADACI 7.1 Koji od sledećih ishoda testiranja hipoteze H0: a) Tačna hipoteza je prihvaćena, b) Tačna hipoteza je odbačena, c) Netačna hipoteza je prihvaćena, d) Netačna hipoteza je odbačena, 1) sadrže grešku prve vrste, 2) sadrže grešku druge vrste, 3) ne sadrže ni jednu ni drugu, 4) sadrže i jednu i drugu.

7.2 Profesor proverava znanje studenata testom koji sadrži 10 pitanja, sa odgovorima DA ili NE , od koji treba jedan zaokružiti, sa kriterijumom: ako student odgovori na 7 ili više pitanja, to ukazuje da on ima neko znanje. a) Formulisati nultu hipotezu u izvornoj i statističkoj formi i izračunati rizik prve vrste, b) Ako se kao alternativna hipoteza uzme: student je naučio 50% od obima predmeta, dati statističku formulaciju te hipoteze i izračunati rizik druge vrste, c) Koliki je rizik da na opisanom testu znanja padne student koji je savladao 60% gradiva?

7.3 Deklarisani škart peći za pečenje keramičkih pločica je 3%. Radi kontrole na izlazu iz peći, uzet je slučajan uzorak od 100 pločica. Ako je kriterijum za zaključak da je povećan škart: (a) 4 ili više loših pločica, (b) 5 ili više loših pločica, (c) 6 ili više loših pločica u uzorku, izračunati za svaki od njih rizik prve vrste.

7.4 Ako je stvarni škart peći iz prethodnog primera (a) 5%, (b) 6%, (c) 7%, izračunati rizike druge vrste u datom testu sa kriterijumom za odbacivanja nulte hipoteze: 4 ili više defektnih pločica u uzorku od 100 pločica.

7.5 Proizvođač veštačkog đubriva tvrdi da procenat fosfora u njegovom đubrivu nije manji od 3%. U cilju provere, kupac je izvršio merenja sadržaja fosfora u 10 proba, uzetih iz veće količine prispelog đubriva. Dobijena je srednja vrednost od 2.5% a standardna greška 0.5%. a) Formulisati statistički nultu i alternativnu hipotezu. Obrazložiti formulacije. b) Proveriti nultu hipotezu sa rizikom prve vrste α = 0.05, 0.01

7.6 Proizvođač veštačkog đubriva proizvodi đubrivo sa deklarisanim sadržajem fosfora od 3%. U njegovoj laborotoriji za kontrolu kvaliteta proizvoda izvršeno je merenja sadržaja fosfora u 10 proba tog đubriva. Dobijena je srednja vrednost od 3.3% sa analitičkom metodom čije je standardno odstupanje σ = 0.5%. a) Formulisati statistički nultu i alternativnu hipotezu. Obrazložiti formulacije. b) Proveriti nultu hipotezu sa rizikom prve vrste α = 0.05, 0.01

7.7 Ako je pitanje na koje treba dati odgovor u prethodnom zadatku formulisano kao: Da li se uzoračka srednja vrednost značajno razlikuje od pretpostavljene srednje vrednosti populacije, formulisati nultu i alternativnu hipotezu i izvršiti testiranje sa nivoom značajnosti α = 0.05, 0.01.

7.8 Rezultati merenja masa (g) slučajno odabranih 20 čokolada, čija je deklarisana masa 100 g su:

97 99 98 96 98 101 98 95 97 99

Page 208: Osnovi inzenjerske statistike

207

98 96 97 98 98 100 99 97 101 98

Proveriti da li je srednja masa čokolada dobijena u uzorku značajno manja od deklarisane mase, sa nivoom značajnosti 0.01.

7.9 Meren je sadržaj (ppm) neke supstance u 10 proba neke prirodne sirovine:

74.1 77.7 74.4 74.0 73.8 79.3 75.8 82.8 72.2 75.2

Za novu isporuku sirovine, izvršena je ista vrsta merenja sa rezultatima:

70.8 74.0 74.2 70.4 69.2 72.2 76.8 72.4 77.4 78.1

a) Sa pretpostavkom da merenja imaju normalnu raspodelu testirati hipotezu, sa rizikom prve vrste α = 0.05 (dvostrani test) da je srednja vrednost populacije iz koje je uzet drugi uzorak jednaka 72.0 ppm b) Radi smanjenja rizika druge vrste, ponoviti test sa pretpostavkom da su disperzije prvih i drugih merenja međusobno jednake.

7.10 U Pogl. 6.2 smo, polazeći od simetričnog verovatnog intervala, sa verovatnoćom γ = 1 - α, za slučajnu veličinu (6.14):

1,22,2

22

21, −=χ<σ

<χ αα− nddS

dd

gde je S2 disperzija uzorka obima n, uzetog iz normalne raspodele sa disperzijom σ2, dobili interval poverenja za disperziju:

2

1,

22

2,

2

22αα −χ

<σ<χ dd

sdsd

sa nivoom poverenja γ. a) Potrebno je definisati dvostrani test za proveru hipoteze o disperziji normalne raspodele,

20

20 : σ=σH

sa rizikom prve vrste, α.

b) U starom proizvodnom procesu, disperzija za neki pokazatelj kvaliteta je bila 920 =σ .

Nakon nekih modifikacija procesa, radi provere disperzije, uzet je slučajan uzorak od 20 proizvoda i iz njega je dobijena ocena disperzije: s2 = 6. Proveriti da li je došlo do promene disperzije, sa nivoom značajnosti α = 0.1 7.11 a) Polazeći od jednostranog verovatnog intervala za statistiku (6.14):

1,2,2

2

−=χ<σ α nddS

d

za koga važi

α−=γ=

χ<σ α 12,2

2

d

dSP

Page 209: Osnovi inzenjerske statistike

208

predložiti postupak za proveru da li je uzoračka disperzija značajno veća od pretpostavljene disperzije populacije sa normalnom raspodelom. b) Za neku analitičku metodu je poznato da je njena preciznost takva da je disperzija rezultata 5.12

0 =σ Ona je zamenjena jeftinijom metodom približno iste preciznosti i radi

provere preciznosti jeftinije metode, izvršeno je 25 ponovljenih analiza. Iz tih rezultata je dobijena uzoračka disperzija s2 = 2.5. Sa nivoom značajnosti α = 0.05, proveriti da li je jeftinija metoda manje precizna.

7.12 Izvršena su merenja postignutog prinosa x, nekog prozvoda u katalitičkom reaktoru, pri istim ostalim uslovima, sa dva različita katalizatora. Dobijeni su sledeći rezultati:

Katalizator A Katalizator B Broj merenja 16 15

x 1.219 1.179

xs 0.456 0.439

Ispitati, sa nivoom značajnosti α = 0.05, da li se prinosi postignuti katalizatorima A i B značajno razlikuju. Pretpostaviti pri tom da su disperzije prinosa za katalizatore A i B jednake.

7.13 U istom hemijskom reaktoru, pod istim uslovima, ponavljano je 6 puta izvođenje neke reakcije, sa starim tipom katalizatora (K1) i novim (K2). Dobijeni su sledeći stepeni konverzije (%) reaktanta:

Eksperiment K1 K2 1. 72 71 2. 70 78 3. 70 81 4. 73 75 5. 78 74 6. 67 75

Pretpostaviti da rezultati imaju normalnu raspodelu i da se disperzije stepena konverzije sa različitim katalizatorima ne razlikuju. Sa nivoom značajnosti α = 0.05, proveriti da li novi katalizator daje značajno veće stepene konverzije od starog?

7.14 Sa nivoom značajnosti α = 0.05, proveriti pretpostavke o jednakosti disperzija u zadacima 7.9 i 7.13.

7.15 Dve mašine (A i B) paralelno proizvode keramičke pločice. U tabeli su date izmerene debljine (mm) slučajnih uzoraka pločica. Proveriti, sa nivoom značajnosti α = 0.05 da li mašine proizvode pločice istih debljina.

A: 8.42 8.41 8.45 8.43 8.44 8.43 8.44 8.42 B: 8.43 8.39 8.41 8.42 8.40

7.16 Dati su rezultati određivanja sadržaja (ppm) neke supstance u probi, dobijeni primenom tri analitičke metode A, B i C:

A B C 55.3 53.6 50.5 56.9 55.3 53.0 55.8 57.0 53.8

Page 210: Osnovi inzenjerske statistike

209

57.3 53.7 53.0 57.7 58.0 55.3 56.6 55.5 52.9

Sa nivoom značajnosti α = 0.05, utvrditi da li su metode A, B i C a) jednako precizne b) jednako tačne 7.17 Potrebno je formulisati postupak testiranja hipoteze: 00 : ppH =

gde je p verovatnoća nastupanja nekog događaja, na osnovu uočene relativne frekvence *p tog događaja u seriji od n eksperimenata. Na primer, potrebno je proveriti da li je

procenat škarta pri proizvodnji keramičkih pločica, jednak propisanom procentu p0, na osnovu uočene relativne frekvence škarta *p , proverom n, na slučajan način odabranih, proizvedenih pločica. Pri tom se pretpostavlja da je obim uzorka dovoljno veliki da se binomna raspodela slučajne promenljive *nPX = (apsolutna frekvenca nastupanja posmatranog događaja u seriji od n eksperimenata) može aproksimirati normalnom (Pogl. 2.9), pa ako je hipoteza tačna, onda:

:*nPX = N 00000 1),,( pqqnpnp −=

a) Pokazati da za velike uzorke, ako je hipoteza H0 tačna, važi da statistika *P ima (približno) normalnu raspodelu:

:*P N ),( 000 n

qpp

b) Na osnovu stava u a), predložiti z-test (Pogl. 7.4) za testiranje hipoteze 00 : ppH = ,

sa test-statistikom:

nqp

ppZ

00

0*−

=

7.18 Proizvođač tvrdi da njegove pošiljke sadrže najviše 7% neispravnih proizvoda. Korisnik je uzeo slučajan uzorak od 200 proizvoda i našao u njemu 22 neispravna proizvoda. Proveriti tvrdnju proizvođača, sa nivoom značajnosti 0.05.

7.19 U toku jednog časa, za svaki od 60 minuta, registrovan je broj pogrešnih telefonskih priključaka u toku minuta:

3 2 2 3 1 1 0 4 2 1

1 4 0 1 2 3 1 2 5 2

3 0 2 4 1 2 3 0 1 2

1 3 1 2 0 7 3 2 1 1

4 0 4 2 3 2 1 3 0 1

2 2 3 1 4 0 2 1 1 5

Page 211: Osnovi inzenjerske statistike

210

Proveriti hipotezu, sa nivoom značajnosti 0.05, da broj pogrešnih priključaka u toku jedne minute ima Poasonovu raspodelu.

7.20 Na uzorku od 450 lampi, merene su dužine x, njihovog trajanja u nedeljama. Dobijeni su rezultati:

trajanje: 0-4 4-8 8-12 12-16 16-20 20-24 24-28 >28 broj lampi: 121 95 76 56 45 36 21 0

Sa nivoom značajnosti α = 0.01, proveriti hipotezu da dužina trajanja lampi ima eksponencijalnu raspodelu.

7.21 Sa nivoom značajnosti α = 0.05, proveriti saglasnost sledeće empirijske raspodele sa normalnom raspodelom:

Klasa Sredina klase

Frek-venca

4-6 5 1 6-8 7 4 8-10 9 5 10-12 11 16 12-14 13 22 14-16 15 21 16-18 17 12 18-20 19 6 20-22 21 3 22-24 23 1 24-26 25 1

7.22 Mereni su gubici vezanog azota sa sekundarnom parom (g/l), u pogonu proizvodnje amonijačne šalitre:

5.0 5.3 5.8 4.9 4.6 7.5 5.2

Proveriti sa nivoima značajnosti α = 0.05, da li postoji neko merenje koje odstupa od ostalih tj. sadrži grubu grešku, te ga treba odbaciti.

Page 212: Osnovi inzenjerske statistike

205

8 Analiza korelacije

Predmet ove glave je analiza međuzavisnosti (korelacije) dve neprekidne slučajne promenljive, na bazi paralelnog praćenja njihovih vrednosti. Najočigledniji primer međuzavisnosti dve slučajne veličine su visina i masa čoveka i kao što smo u Pogl. 3.6 konstatovali, u pitanju je ne funkcionalna, već stohastička veza između ta dva obeležja. Drugi primer je uticaj sadržaja neke komponente u složenom materijalu, recimo građevinskom, na neko svojstvo tog materijala, recimo čvrstinu. Želimo metodama statistike da, na osnovu merenja, dođemo do zaključka da li posmatrani sadržaj komponente utiče na čvrstinu građevinskog materijala i uz to,

• koliko je ta korelacija izražena (jaka), • da li je ona pozitivna ili negativna, tj. da li sa porastom sadržaja posmatrane

komponente čvrstina građevinskog materijala raste ili opada. Dijagram rasipanja Za statističku analizu korelisanosti dve slučajne promenljive (obeležja) X i Y,

neophodno je raspolagati parovima (odgovarajućih) vrednosti promenljivih:

( ) niyx ii ,...,2,1,, = (8.1)

ili tzv. vezanim uzorkom (8.1), umesto sa dva nevezana ili nezavisna uzorka: ( )nixi ,...2,1, = i ( )miyi ,...2,1, = gde su merenja xi i yi nepovezana.

Prvi korak u analizi korelacije je ucrtavanje uređenih parova (xi, yi), kao tačaka, u xy koordinatni sistem. Dobijeni dijagram se naziva dijagram rasipanja (scatter diagram). Na osnovu rasporeda tačaka u dijagramu, može se grubo proceniti:

• da li postoji stohastička zavisnost promenljivih (korelacija), • ako postoji korelacija, da li je ona linearna ili nelinearna, • ako postoji korelacija, da li je ona slaba ili jaka,

Page 213: Osnovi inzenjerske statistike

206

Slika 8.1. Prikaz linearne korelacije: a) jaka pozitivna, b) slaba pozitivna, c) negativna

Slika 8.2. (a) Nelinearna korelacija, (b) Nema korelacije

Na slikama 8.1a - c, eksperimentalne tačke leže oko neke prave, što daje osnovu za pretpostavku da su X i Y približno ili tačno, linearno povezane. Ako tačke leže blizu prave (Sl. 8.1a), u pitanju je jaka korelacija, a ako je rasipanje tačaka oko prave veliko, korelacija je slaba (Sl. 8.1b). Slike (8.1 a,b), ukazuju na pozitivnu korelaciju ili pozitivan trend, jer su velike vrednosti za Y , uglavnom, u paru sa velikim vrednostima X, dok Sl. 8.1c prikazuje negativnu korelaciju ili trend, gde su velike vrednosti za X praćene uglavnom malim vrednostima za Y.

Slika 8.2a prikazuje slučaj nelinearne korelacije ili nelinearne stohastičke veze, jer se tačke rasipaju oko neke krive . Konačno, na Sl. 8.2b, ne uočava se povezanost između X i Y, tj. nema ni pozitivnog ni negativnog trenda, pa zaključujemo da su one nezavisne ili nekorelisane.

Iz teorije verovatnoće znamo (Pogl. 3.7), da dijagrami (8.1a-c, 8.2a), na kojima su eksperimentalne tačke raspoređene duž neke prave ili krive ukazuju na (funkcionalnu) zavisnost uslovne srednje vrednosti slučajne promenljive Y od druge promenljive X. Dalje, linija na dijagramu rasipanja, u blizini koje leže eksperimentalne tačke, predstavlja u stvari grubu ocenu iz datog uzorka (8.1), funkcije (linije) regresije:

)(1 xxy ϕ=µ (3.31a)

Pri tom, ako je zavisnost (3.31a) pravolinijska , znači da dvodimenzionalna promenljiva (X,Y) ima normalnu raspodelu (3.12).

U ovom materijalu, ograničićemo se na linearnu korelaciju , što znači, • da će se statistička analiza zasnivati na pretpostavci o normalnoj raspodeli

dvodimenzionalne promenljive (X,Y),

Page 214: Osnovi inzenjerske statistike

207

• da će predmet analize biti uzorački koeficijent korelacije , kao mera jačine i pokazatelj pozitivne ili negativne korelacije (u skladu sa teorijskim izvodima, datim u Pogl. 3.7)

8.1 UZORAČKI KOEFICIJENT KORELACIJE

Ocenu koeficijenta korelacije slučajnih promenljivih X i Y:

yx

xyxy σσ

σ=ρ (3.32)

iz uzorka (8.1) dobićemo iz ocena kovarijanse xyσ (3.16b), i standardnih odstupanja σx,

σy, iz istog uzorka:

yx

xyxy ss

sr = (8.2)

Nepristrasne ocene sx i sy standardnih odstupanja, dobijaju se iz vrednosti statistike S2 definisane u Pogl. 4 (4.13),

∑∑==

−−

=−−

=

n

iiy

n

iix yy

nsxx

ns

1

2

1

2 )(1

1,)(

1

1 (8.3)

a sxy kao:

∑=

−−−

=

n

iiixy yyxx

ns

1

))((1

1 (8.4)

tj. kao vrednost statistike:

∑=

−−−

=

n

iiixy YYXX

nS

1

))((1

1 (8.5)

za koju se može pokazati da predstavlja nepristrasnu ocenu kovarijanse xyσ (3.16b).

Smena izraza (8.3) i (8.4) u (8.2) i transformacije analogne onoj, koja je primenjena za izvođenje praktične formule za računanje uzoračke disperzije (4.14a), daju sledeću praktičnu formulu za izračunavanje uzoračkog koeficijenta korelacije:

1,))((

2

11

2

2

11

2

111 ≤

−=

∑∑∑∑

∑∑∑

====

===

xyn

ii

n

ii

n

ii

n

ii

n

ii

n

ii

n

iii

xy r

yynxxn

yxyxnr (8.6)

U matematičkoj statistici se dokazuje da je ocena koeficijenta korelacije ρxy dobijena formulom (8.6) konzistentna i asimptotski nepristrasna.

Page 215: Osnovi inzenjerske statistike

208

Iz izračunate vrednosti uzoračkog koeficijenta korelacije, može se dati ocena jačine linearne korelacije na osnovu empirijskog pravila [Vukadinović, 1990] datog u Tabeli 8.1.

Tabela 8.1 - Jačina linearne korelacije

Primer 8.1 Primećeno je da je visok sadržaj supstance A u sirovini, obično praćen i visokim sadržajem supstance B. Radi utvrđivanja moguće linearne korelacije između sadržaja dve komponente izvršeno je merenje sadržaja A i B u 10 slučajnih uzoraka sirovine. Rezultati su dati u prve dve kolone Tabele 8.1. Tabela uz Primer 8.1

Rešenje

Tačke (xi, yi) su ucrtane u dijagram rasipanja. Očigledan je pozitivan linearan trend: porast sadržaja jedne suspstance, praćen je porastom sadržaja druge. Kao meru jačine linearne veze između sadržaja supstanci A i B, izračunaćemo po Jedn. (8.6) uzorački koeficijent korelacije. Pomoćni proračuni su dati u tabeli.

920.01743182104992711510

17449992281022=

−⋅−⋅

⋅−⋅=xyr

rxy jačina linearne veze:

r ≤ 0.3 neznačajna korelacija

0.5 < r < 0.7 značajna korelacija

0.7 ≤ r ≤ 0.9 jaka korelacija

r > 0.9 vrlo jaka korelacija

x (% A) y (% B) x2 y2 xy

67 24 4489 576 1608 54 15 2916 225 810 72 23 5184 529 1656 64 19 4096 361 1216 39 16 1521 256 624 22 11 484 121 242 58 20 3364 400 1160 43 16 1849 256 688 46 17 2116 289 782 34 13 1156 169 442

∑ 499 174 27175 3182 9228

Page 216: Osnovi inzenjerske statistike

209

20 30 40 50 60 70 80

10

12

14

16

18

20

22

24

26

y =

%B

x = %A

Dijagram rasipanja za Primer 8.1.

Prema empirijskom kriterijumu (Tab. 8.1), u pitanju je vrlo jaka linearna veza.

8.2 REGRESIONE PRAVE

Ako smo na osnovu veličine uzoračkog koeficijenta korelacije rxy, zaključili da posmatrane slučajne promenljive nisu nezavisne, korisno je izračunati koeficijente u pravolinijskim zavisnostima jedne od druge promenljive, koje predstavljaju ocene iz datog uzoraka (8.1), linearnih regresionih funkcija :

)(/ xx

yxyyxy x µ−σσ

ρ+µ=µ (3.35b)

)(/ yy

xxyxyx y µ−σσρ+µ=µ (3.36b)

Dobijene pravolinijske zavisnosti zvaćemo regresione prave (regression lines) i iz njih možemo da procenimo ili predvidimo (predict) vrednost jedne slučajne promenljive na osnovu vrednosti druge.

Regresionu pravu y(x), kao ocenu regresione funkcije (3.35b) ćemo, logično, tražiti u obliku:

xbbxxs

sryy

x

yxy 10)( +=−+=

odakle slede formule za izračunavanje nagiba b1 i odsečka b0:

Page 217: Osnovi inzenjerske statistike

210

2

11

2

11121

))((

−===

∑∑∑∑∑

==

===

n

ii

n

ii

n

ii

n

ii

n

iii

x

xy

x

yxy

xxn

yxyxn

s

s

s

srb (8.7a)

xbyb 10 −= (8.7b)

Slično, regresionu pravu x(y), dobijamo kao ocenu regresione funkcije (3.36b):

yccyys

srxx

y

xxy 10)( +=−+=

i formule za nagib c1 i odsečak c0 su:

2

11

2

11121

))((

−===

∑∑∑∑∑

==

===

n

ii

n

ii

n

ii

n

ii

n

iii

y

xy

y

xxy

yyn

yxyxn

s

s

s

src (8.8a)

ycxc 10 −= (8.8b)

Primer 8.2 Iz podataka datih u prethodnom primeru, potrebno je a) proceniti sadržaj komponente B u sirovini, ako ona sadrži 55% supstance A b) proceniti sadržaj komponente A u sirovini, ako ona sadrži 20% supstance B

Rešenje

a) Traženu procenu dobijamo iz regresione prave y(x). Koristeći pomoćne rezultate, izračunate u tabeli u prethodnom primeru, računamo parametre prave:

240.04992711510

174499922810))((

22

11

2

111)7.8(

1 =−⋅⋅−⋅=

−=

∑∑∑∑∑

==

===

n

ii

n

ii

n

ii

n

ii

n

iiia

xxn

yxyxnb

42.510

499240.01741

)7.8(

0 =⋅−

=−= xbybb

Za x = 55, računamo y iz regresione prave, odnosno procenu sadržaja supstance B:

%6.185524.042.510 =⋅+=+= xbby

b) Procenu sadržaja x supstance A za dati sadržaj y supstance B, ne računamo iz prethodno dobijene prave (rešavajući njenu jednačinu po x), već iz prave, koja predstavlja ocenu regresije x po y i čiji su parametri:

Page 218: Osnovi inzenjerske statistike

211

53.3174318210

174499922810))((

22

11

2

111)8.8(

1 =−⋅⋅−⋅=

−=

∑∑∑∑∑

==

===

n

ii

n

ii

n

ii

n

ii

n

iiia

yyn

yxyxnc

5.1110

17453.34991

)8.8(

0 −=⋅−

=−= ycxcb

Za sadržaj komponente B, y = 20, procenjeni sadržaj x druge komponente biće:

%1.592053.35.1110 =⋅+−=+= yccx

što se veoma dobro slaže sa eksperimentalnom vrednošću (58%). To se moglo očekivati, s obzirom na jaku korelaciju (rxy > 0.9), tj. približavanje linearne stohastičke zavisnosti, funkcionalnoj.

8.3 PROVERA ZNAČAJNOSTI KORELACIJE

Ako je dobijena vrednost uzoračkog koeficijenta korelacije (8.6) mala po apsolutnoj vrednosti, postavlja se pitanje da li ona ukazuje na postojanje linearne korelacije između slučajnih promenljivih X i Y , ili je samo rezultat slučajnih varijacija vrednosti statistike Rxy, definisane formulom (8.6), oko nule kao njene srednje vrednosti. Zato proveravamo statističku značajnost izračunatog uzoračkog koeficijenta korelacije ili, drugim rečima, hipotezu:

0:0 =ρxyH (8.9)

Teorijska osnova za formulisanje testa je sledeći stav (teorema): Ako slučajna promenljiva (X,Y) ima dvodimenzionalnu normalnu raspodelu, sa nultom vrednošću koeficijenta korelacije ρxy (X i Y su nezavisne), tada slučajna promenljiva:

21

2

xy

xy

R

nRT

−= (9.9)

gde su: n - obim uzorka (8.1) Rxy - uzorački koeficijent korelacije (8.6)

ima t - raspodelu sa d = n - 2 stepena slobode. Odatle slede kriterijumi značajnosti uzoračkog koeficijenta korelacije, odnosno odbacivanja hipoteze (8.9) i dati su u Tab. 8.2

Page 219: Osnovi inzenjerske statistike

212

Tabela 8.2 - Testiranje hipoteze H0: ρ = 0

Primer 8.3 Izmerene vrednosti sadržaja kalaja u leguri (x, %) i odgovarajuće izmerene tačke topljenja (y, 0C) date su u prve dve kolone tabele: x, % 44.1 44.9 44.4 44.7 45.1 45.0 44.7 44.6 46.3 y, 0C 513 512 511 510 513 514 521 514 526

x, % 44.9 45.1 44.5 45.1 43.0 44.8 44.2 45.2 45.5 y, 0C 525 522 521 513 537 513 519 512 514

Proceniti koeficijent korelacije između sadržaja kalaja i tačke topljenja i testirati njegovu značajnost sa α = 0.05.

Rešenje

Iz (8.6) dobijamo za uzorački koeficijent korelacije: r = -0.302

Testiramo hipotezu:

H0: ρ = 0

Pošto je poznato da povećanje sadržaja kalaja u leguri po pravili snižava temperaturu topljenja legure (negativna korelacija) to se, u cilju smanjenja rizika prihvatanja pogrešne nulte hipoteze, bira jednostrani test, tj. alternativna hipoteza:

H1: ρ < 0

Vrednost T - statistike i kritična vrednost, prema Tab. 8.2 su:

75.1,27.1302.01

16302.0

1

21.0,1622=−=

−=

−= t

r

nrt

Pošto je 1.27 < 1.75, izvodimo zaključak da rezultati merenja ne ukazuju na značajnu korelaciju između sadržaja kalaja i tačke topljenja legure.

8.4 TUMAČENJE KOEFICIJENATA KORELACIJE

S obzirom na smisao teoretskog koeficijenta korelacije ρxy, njegovu procenu rxy, ima smisla računati samo kada ima indikacija (teoretska znanja, dijagram rasipanja) da je

Alternativna hipoteza, H1

Statistika: Kriterijum odbacivanja hipoteze:

ρ ≠ 0 α−> ,2ntt

ρ > 0 α−> 2,2ntt

ρ < 0

21

2

xy

xy

R

nRT

−=

Rxy se računa iz (8.6) α−> 2,2ntt

Page 220: Osnovi inzenjerske statistike

213

veza između posmatranih promenljivih linearna ili približno linearna. Ako je veza nelinearna, uzorački koeficijent korelacije rxy nije merilo jačine korelacije i može biti i blizak nuli, uprkos jakoj vezi.

Takođe je važno imati u vidu da statistički značajna vrednost koeficijenta korelacije nije dokaz da između posmatranih promenljivih postoji kauzalna (suštinska) veza. Tako, visoka vrednost rxy može biti rezultat delovanja treće promenljive, koja se menja u toku eksperimenata, a koja je prouzrokovala istovremene promene posmatranih promenljivih i privid njihove međuzavisnosti. Instruktivan i duhovit primer daju Boks i sar. [Box G., Hunter W i Hunter S, 1978]. U periodu od 7 godina, na kraju svake godine, je određivan broj stanovnika Oldenburga i broj roda i zapažena je jaka linearna korelacija između te dve veličine. Da li iz toga treba zaključiti da je porast nataliteta prouzrokovan porastom broja roda (rode donose decu?)? U ovom primeru, treća promenljiva, sa kojom su rasle posmatrane dve jeste vreme. U laboratorijskim i pogonskim merenjima, primer "treće" ili "nekontrolisane" promenljive je temperatura, koja deluje na veliki broj fizičko-hemijskih parametara i ako se ne kontroliše (drži konstantnom) u toku praćenja neke dve veličine, može stvoriti privid kauzalne veze izmedju njih.

Tako, da bi se utvrdila suštinska povezanost između dve promenljive, neophodno je dobro poznavati njihovu fizičko-hemijsku prirodu s jedne strane, i vrlo pažljivo kontrolisati eksperimente, s druge strane.

ZADACI

8.1 Radi provere Njutnovog zakona hlađenja, prema kome temperatura hlađenog medijuma, y približno linearno opada sa vremenom, x izvršena su merenja i dobijeni rezultati:

Izračunati na tri decimale koeficijent korelacije i na osnovu njegove vrednosti oceniti jačinu korelacije i njen znak.

8.2 Radi provere Hukovog zakona (linearna veza između jačine sile i deformacije) dobijeni su sledeći rezultati merenja: Izračunati na tri decimale koeficijent korelacije i na osnovu njegove vrednosti oceniti jačinu korelacije i njen znak.

8.3 Dati su eksperimentalni podaci:

x: 6 5 8 8 7 6 10 4 9 7 y: 8 7 7 10 5 8 10 6 8 6

a) Nacrtati dijagram rasipanja i na osnovu njega proceniti jačinu i znak korelacije b) Izračunati koeficijent korelacije na tri decimale c) Izračunati koeficijente regresionih pravih y(x) i x(y), sa tačnošću od 3 decimale

Vreme, min 4 8 10 12 16 22 Temperatura 0C 46 34 30 26 24 20

Sila, N 2 5 8 11 15 Istezanje, mm 2 23 62 119 223

Page 221: Osnovi inzenjerske statistike

214

d) Izračunati, sa jednom decimalom, y za x = 6 i x za y = 9 e) Testirati značajnost koeficijenta korelacije sa nivoom značajnosti α = 0.05 8.4 Praćen je prinos (y, %) neke supstance u procesu, na različitim temperaturama (x, 0C):

x, 0C y, % x, 0C y, % 1100 8.5 11.6 1175 37.5 40 42.3 1125 19.0 28.2 21.8 1200 50.5 50.0 1150 29.5 30.6 1225 57.2 60.3 62.7

a) Nacrtati dijagram rasipanja i na osnovu njega proceniti jačinu i znak korelacije b) Izračunati koeficijent korelacije (sa tri decimale) i proveriti njegovu značajnost sa

nivoom α = 0.01 c) Izračunati odsečak regresione prave y(x) sa jednom decimalom i nagib sa 4 decimale. d) Izračunati prinos na temperaturi 1160 0C

Page 222: Osnovi inzenjerske statistike

215

9 Regresiona analiza

Često, od dve slučajne promenljive, jednu promenljivu (X) smatramo nezavisno-, a drugu (Y) zavisno-promenljivom. Tako je u Primeru 8.3, logično sadržaj kalaja u leguri smatrati nezavisno-, a temperaturu topljenja legure zavisno-promenljivom. Budući da daje srednju vrednost promenljive Y za zadatu vrednost X, najbolja funkcija za predskazivanje vrednosti Y za dato X je regresiona funkcija:

)(1 xxy ϕ=µ (3.31a)

Tako je u mnogim praktičnim problemima u nauci i tehnici od interesa naći približnu regresionu funkciju. Predmet regresione analize je formulisanje približnih regresionih funkcija , koje se nazivaju regresione jednačine ili empirijske formule (jednačine), na osnovu uzorka (8.1).

Zadatak regresione analize obuhvata:

• Izbor oblika regresione funkcije,

),...,,,( 10 kxy x βββϕ=µ (9.1)

gde su βj, j = 0,1,...,k parametri ili koeficijenti u funkciji (9.1) i zovu se pravi ili teorijski regresioni koeficijenti .

• Ocenjivanje regresionih koeficijenata βj, j = 0,1,...,k, tj. određivanje njihovih približnih vrednosti: b j, j = 0,1,...,k, tako da regresiona jednačina,

),...,,,()( 10 kbbbxxy ϕ= (9.2)

predstavlja što bolju aproksimaciju regresione funkcije (9.1). Koeficijenti bj se zovu empirijski regresioni koeficijenti ili parametri u empirijskoj formuli .

• Statističku analizu dobijene jednačine: preciznost predskazivanja, intervali poverenja teorijskih regresionih koeficijenata itd.

Page 223: Osnovi inzenjerske statistike

216

Izbor oblika regresione jednačine (empirijske formule)

Iz definicije regresione funkcije sledi da izbor oblika regresione jednačine (9.1) zahteva poznavanje raspodele verovatnoće dvodimenzionalne slučajne promenljive (X,Y). Tako, ako je ona normalna, izveli smo (Pogl. 3.6) pravolinijsku zavisnost:

xx xyxx

yyxy 11/

0

)( β+µβ−µ=µ−σσρ+µ=µ

β

sa teorijskim koeficijentima regresije:

xyx

y µβ−µ=βσσρ=β 101 ,

Regresiona jednačina ili empirijska formula tada glasi:

xbbxy 10)( +=

čiji parametri b0 i b1 predstavljaju ocene teorijskih koeficijenata 10,ββ i intuitivno

smo ih izveli u Pogl. 8.2 (Jedn. 8.7a,b). Može se pokazati da te formule daju najverodostojnije ocene teorijskih regresionih koeficijenata, dakle one koje bi dobili primenom metode maksimalne verodostojnosti (Pogl. 4.4).

Budući da u opštem slučaju, dvodimenzionalna raspodela nije poznata, problem izbora oblika regresione jednačine ili empirijske formule se rešava približno na osnovu:

• teorijskih znanja i iskustva u vezi sa uticajem neke veličine X na drugu veličinu Y • dijagrama rasipanja eksperimentalnih tačaka ( ) niyx ii ,...,2,1,, =

Na primer, poznato je da temperatura ima jak uticaj na brzinu hemijske reakcije. U hemijskoj kinetici se izraz za brzinu r nepovratne hemijske reakcije, najčešće traži u obliku:

⋅= 32121 ,...),()(),...,,(ms

molccfTkTccr

gde su c1,c2,..., molske koncentracije reaktanata, a k(T) se zove konstanta brzine hemijske reakcije, mada zavisi od temperature. Tako se pri ispitivanju uticaja temperature na brzinu neke reakcije, meri temperatura T(K) i eksperimentalno određuju odgovarajuće vrednosti konstante brzine hemijske reakcije k. Na osnovu poznavanja osnovnih zakonitosti u hemijskoj kinetici, empirijsku jednačinu k(T) tražimo u obliku poznate Arenijusove (Arrenius) formule:

TbRTE ebekTk /0

/0

1)( −−

==

Zbog svoje jednostavnosti i osobine da mogu dobro da aproksimiraju različite funkcije, kao empirijske formule se često koriste polinomi drugog i višeg stepena:

)2()( 2210 ≥+++= kxbxbxbbxy k

k (9.3)

Može se primetiti da odabrana empirijska formula može biti linearna ili nelinearna kako po nezavisno promenljivoj tako i po parametrima. Na primer, Arenijusov izraz je

Page 224: Osnovi inzenjerske statistike

217

nelinearan po nezavisno promenljivoj (T) i neliearan po parametrima (b0,b1). Polinom je, na primer, nelinearan po nezavisno promenljivoj (x) ali linearan po parametrima (b0,...bk). Linearna regresiona jednačina je empirijska formula koja je linearna po parametrima. Pored toga, ako odabrana empirijska formula,

),...,,,()( 10 kbbbxfxy = (9.4)

nema kao osnovu regresionu funkciju (3.31a), već ima čisto empirijski karakter , tada se naravno ne može govoriti o parametrima bj, j = 0,1,...,k kao ocenama teorijskih regresionih koeficijenata.

Statistička analiza regresione jednačine

Ovo je veoma složen problem, jer zahteva poznavanje raspodela empirijskih regresionih koeficijenata, bj, j = 0,1,...,k , kao funkcija uzorka. Tako je on u opštem slučaju rešiv samo uz pretpostavku da nezavisna promenljiva nije slučajna, već determinisana (kontrolisana) promenljiva. Drugim rečima, eksperimentalne vrednosti xi, i = 1,2,..,n u uzorku (8.1) su unapred odabrane ili fiksirane. Praktično, ovaj uslov će biti zadovoljen ako su slučajne varijacije (greške merenja) u vrednostima slučajne promenljive Y mnogo veće od onih u vrednostima X ( 22

xy σ>>σ ). Na primer, pri

određivanju koeficijenata u Arenijusovoj zavisnosti konstante brzine hemijske reakcije od temperature, slučajne greške merenja temperature su daleko manje od slučajnih grešaka pri određivanju konstanti brzine reakcije (posredna merenja).

9.1 METOD NAJMANJIH KVADRATA

Princip najmanjih kvadrata je formulisao Ležandr (Legendre): najverovatnija vrednost bilo koje veličine, koju određujemo na osnovu ponovljenih merenja, je ona za koju je suma kvadrata odstupanja merenja od te vrednosti najmanja. Uzmimo na primer da je radi procenjivanja tačne vrednosti r neke fizičke veličine, izvedeno n ponovljenih merenja, sa rezultatima: xi, i = 1,2,...,n i pretpostavimo da merenja imaju normalnu raspodelu i da ne sadrže sistematske i grube greške. Prema principu najmanjih kvadrata, kao najverovatniju vrednost za r uzimamo onu za koju suma kvadrata odstupanja:

( )∑=

−=

n

ii rxrS

1

2)(

ima minimum. Dobijamo je iz uslova minimuma funkcije S(r):

( )∑=

=−−=n

ii rx

dr

dS

1

02

kao:

Page 225: Osnovi inzenjerske statistike

218

∑=

==

n

ii xx

nr

1

1

Prepoznajemo aritmetičku sredinu, za koju smo u Pogl. 4.5 pokazali, da predstavlja najverodostojniju ocenu srednje vrednosti rezultata merenja kao slučajne veličine, koja je, pod uslovom da merenje ne sadrže sistematske i grube greške, upravo jednaka tačnoj vrednosti merene veličine (Pogl. 2.3).

Određivanje parametara u empirijskoj formuli

Neka raspolažemo eksperimentalnim tačkama (xi,yi), i = 1,2,...,n. Pretpostavimo, za početak, da su svih n vrednosti nezavisno promenljive u uzorku različite tj. da nema ponovljenih merenja zavisno promenljive za jednu vrednost nezavisne. Neka smo odabrali oblik empirijske formule (9.4), pri čemu je neophodno da broj parametara (k + 1) u formuli, bude manji od broja eksperimentalnih tačaka:

k + 1 < n

Traže se takve vrednosti parametara bj, j = 0,1,...,k u odabranoj empirijskoj formuli, da se računske vrednosti zavisno promenljive dobijene iz nje:

nibbbxfy kiraci ,...,2,1),,...,,,( 10 == (9.5)

najmanje razlikuju od eksperimentalnih (iz uzorka), yi, i = 1,2,...,n u smislu principa najmanjih kvadrata, a to znači da suma kvadrata odstupanja ei, i = 1,2,...,n eksperimentalnih od računskih vrednosti zavisno promenljive:

)1()(),...,,(1

2

1

210 +>−=== ∑∑

==

knyyebbbSSn

i

racii

n

iik (9.6)

bude najmanja. Geometrijski interpretirano, biraju se tako vrednosti parametara, da se kriva (9.4) "provlači" što bliže eksperimentalnim tačkama (Sl.9.1), pri čemu je mera odstupanja krive od eksperimentalnih tačaka, suma kvadrata odstupanja (9.6).

Slika 9.1 - Provlačenje krive između eksperimentalnih tačkaka

Page 226: Osnovi inzenjerske statistike

219

Primetimo da je suma kvadrata odstupanja S, funkcija samo nepoznatih parametara, jer su vrednosti ( ) niyx ii ,...,2,1,, = poznate, a računske vrednosti niy rac

i ,...,2,1, = su,

prema (9.5), funkcije parametara. Problem izračunavanja parametara bj, j = 0,1,...,k se tako svodi na problem određivanja minimuma funkcije više promenljivih (9.6). Oni se dobijaju rešavanjem sistema jednačina, koji predstavljaju potreban uslov minimuma funkcije (9.6) i kojih ima tačno onoliko koliki je broj traženih parametara:

kjb

bbbS

j

k ,...,1,0,0),...,,( 10 ==

∂∂

(9.7)

Jednačine (9.7) su u literaturi poznate pod nazivom normalne jednačine.

Neka u uzorku,( ) niyx ii ,...,2,1,, = ima ponovljenih merenja zavisno promenljive

Y pri jednoj vrednosti za x, što znači da među vrednostima xi, i = 1,2,...,n ima jednakih. Tada, uz uslov da je broj razli čitih vrednosti nezavisno promenljive m (tj. broj njenih vrednosti u grupisanom uzorku) veći od broja parametara (k + 1) u empirijskoj formuli:

m > k+1 (9.8)

važe sva prethodna razmatranja.

9.2 SREDNJI KVADRAT ODSTUPANJA EMPIRIJSKE FORMULE

Neka smo metodom najmanjih kvadrata odredili parametre bj, j = 0,1,...,k u

odabranoj empirijskoj formuli (9.4):

),...,,,()( 10 kbbbxfxy =

Međutim, nekada smo suočeni sa problemom da od više empirijskih jednačina, koje mogu da sadrže različit broj paramatara, odaberemo najbolju, tj. onu koja najbolje opisuje ili "fituje" (od glagola to fit) date eksperimentalne podatke, odnosno najmanje u određenom smislu odstupa od njih. Za rešavanje tog problema, potrebna nam je neka mera odstupanja empirijske formule, čiji su parametri izračunati metodom najmanjih kvadrata, od eksperimentalnih podataka. U skladu sa principom najmanjih kvadrata, kao tražena mera, koristi se srednji kvadrat odstupanja empirijske formule ili regresione jednačine (9.4), definisan kao:

)1(

)),...,,,((

)1(

)(1

210

1

2

2

+−

=+−

=∑∑==

kn

bbbxfy

kn

yys

n

ikii

n

i

racii

(9.9)

Kao što vidimo, suma kvadrata odstupanja eksperimentalnih od računskih vrednosti iz dobijene empirijske formule, deli se razlikom ukupnog broja eksperimentalnih tačaka i ukupnog broja parametara u formuli (broj stepeni slobode). Tako se mogu porediti regresione jednačine sa različitim brojem parametara, pri čemu je pri jednakim sumama

Page 227: Osnovi inzenjerske statistike

220

kvadrata odstupanja za dve formule, bolja ona koja sadrži manji broj parametara. Srednje kvadratno odstupanje (9.8) se u regresionoj analizi koristi za:

• poređenje kvaliteta više regresionih jednačina, • analizu adekvatnosti neke regresione jednačine

Ako se neka regresiona jednačina oceni kao odgovarajuća (adekvatno opisuje zavisnost srednje vrednosti slučajne promenljive Y od kontrolisane promenljive x), onda njen srednji kvadrat odstupanja s2:

• daje nepristrasnu ocenu disperzije slučajne promenljive Y, • predstavlja meru jačine stohastičke zavisnosti Y od x (ukoliko je s2 veće, veza

je slabija). 9.3 ODREĐIVANJE PRAVOLINIJSKE ZAVISNOSTI

Pretpostavimo da srednja vrednost slučajne promenljive Y linearno zavisi od kontrolisane promenljive x:

xxy 10 β+β=µ (9.10)

Drugim rečima, zavisno promenljivu Y možemo da prikažemo u obliku zbira njene srednje vrednosti (9.10) i slučajnog odstupanja (greške) E :

0)(10/ =+β+β=+µ= EEE M,xY xy (9.11)

Iz uzorka ( ) niyx ii ,...,2,1,, = procenjujemo vrednosti teorijskih regresionih

koeficijenata 10,ββ , ili drugim rečima, izračunavamo parametre b0, b1 (odsečak prave i

njen nagib) u empirijskoj formuli:

xbby 10 += (9.12)

Metodom najmanjih kvadrata, uzoračke regresione koeficijente b0, b1 dobijamo iz uslova minimuma sume kvadrata odstupanja eksperimentalnih od računskih vrednosti (9.6), koja u slučaju formule (9.12) izgleda:

∑∑==

+−=−=n

iii

n

i

racii xbbyyybbS

1

210

1

210 )]([)(),(

Primenjujući pravilo da je prvi izvod sume jednak sumi prvih izvoda, za uslove minimuma dobijamo:

∑=

=−+−=∂∂ n

iii xbby

b

S

110

0

0)1)](([2

∑=

=−+−=∂∂ n

iiii xxbby

b

S

110

1

0))](([2

odnosno, nakon delenja jednačina sa (-2) i sređivanja:

∑ ∑= =

=−−

n

i

n

iii xbnby

1 110 0

Page 228: Osnovi inzenjerske statistike

221

∑ ∑∑= ==

=−−

n

i

n

ii

n

iiii xbxbyx

1 1

21

10 0

Konačno, nakon prebacivanja poznatih vrednosti na drugu stranu jednačina, dobijamo sistem od dve linearne jednačine po traženim parametrima:

∑∑==

=

+ n

ii

n

ii ybxnb

11

10 (9.13a)

∑∑∑===

=

+

n

iii

n

ii

n

ii yxbxbx

11

1

20

1

(9.13b)

koje predstavljaju normalne jednačine (9.7) za slučaj pravolinijske regresije. Rešenja dobijenog sistema jednačina se mogu prikazati u obliku identičnom formulama (8.7a,b):

2

11

2

1111

))((

−=

∑∑∑∑∑

==

===

n

ii

n

ii

n

ii

n

ii

n

iii

xxn

yxyxnb (9.14a)

xbyb 10 −= (9.14b)

Tako, pri sledećim pretpostavkama:

• važi linearan model (9.11) za merenja Yi, i = 1,2,...,n • disperzija slučajnih varijacija zavisno promenljive Y je konstantna:

( ) .2 constD y =σ=E

• merenja Yi, i = 1,2,...,n su nezavisna i imaju normalnu raspodelu

metod najmanjih kvadrata daje saglasne i nepristrasne ocene regresionih koeficijenata:

( ) 1,0, =β= jBM jj (9.15)

istovetne onima koje daje metod maksimalne verodostojnosti. U Jedn. (9.15), Bj su statistike čije se vrednosti računaju formulama (9.14a,b). Uz to, pokazuje se da srednji kvadrat odstupanja računskih vrednosti (9.8),

( )∑=

−−−

=

n

iii xbby

ns

1

210

2

2

1 (9.16)

kao vrednost statistike:

( )∑=

−−−

=

n

iii xbbY

nS

1

210

2

2

1 (9.17)

predstavlja nepristrasnu ocenu disperzije zavisno promenljive:

( ) 22ySM σ=

Formuli (9.16) ekvivalentna je sledeća:

Page 229: Osnovi inzenjerske statistike

222

)(2

1 221

22xy sbs

n

ns −

−= (9.18)

gde su 22 i yx ss srednji kvadrati odstupanja:

1

/)(,

1

/)( 222

222

−=

−=

∑∑∑∑n

nyys

n

nxxs ii

yii

x (9.18a)

Primer 9.1 Zbog zajedničkog jona

Cl rastvorljivost BaCl2, y(%) u vodi, pri konstantnoj temperaturi približno linearno opada sa porastom koncentracije CaCl2, x(%) u vodi. a) Formulisati empirijsku jednačinu za procenjivanje rastvorljivosti BaCl2 pri različitim sadržajima CaCl2 u vodi, na osnovu podataka datih u prve tri kolone tabele

b) Proceniti rastvorljivost BaCl2 pri koncentraciji CaCl2 od 13%.

Tabela uz Primer 9.1

Rešenje

a) Nagib i odsečak u traženoj empirijskoj pravolinijskoj zavisnosti dobijamo formulama (9.14a,b)

355.1588146

110587206))((

22

11

2

1111 −=−⋅

⋅−⋅=

−=

∑∑∑∑∑

==

===

n

ii

n

ii

n

ii

n

ii

n

iii

xxn

yxyxnb

43.316

58355.111010 =

⋅+=−= xbyb

pa je empirijska prava:

xy 355.143.31 −=

U dijagram su ucrtane eksperimentalne tačke i dobijena prava.

N0 x y x2 xy

1 0 32 0 1024 2 5 25 25 625 3 8 20 64 400 4 10 17 100 289 5 15 11 225 121 6 20 5 400 25

∑ = 58 110 814 720

Page 230: Osnovi inzenjerske statistike

223

Slika uz Primer 9.1

b) Smenom zadate rastvorljivosti CaCl2, x = 13 u dobijenu empirijsku jednačinu, dobijamo procenu odgovarajuće rastvorljivosti BaCl2:

%8.1313355.143.31 =⋅−=y

Primer 9.2 Merene su električne otpornosti R metalnog provodnika na različitim temperaturama t:

t, 0C 30 35 40 45 50 55 60 R,Ω 86.67 92.01 93.92 96.60 97.77 99.77 101.82

Potrebno je iz podataka,

a) izračunati temperaturni koeficijent otpornosti metala α, koji je definisan jednačinom temperaturne zavisnosti otpora:

( )tRtR α+= 1)( 0

b) proceniti standardnu grešku primenjene metode merenja otpornosti.

Rešenje

a) Pošto su u datoj pravolinijskoj zavisnosti otpora od temperature:

( ) tbbtRRtRtR 10000 1)( +=α+=α+=

odsečak i nagib jednaki:

b0 = R0 b1 = R0α

traženi temperaturni koeficijent α se dobija iz njih kao:

0

1

0

1

b

b

R

b==α

Uz x = t, y = R, računamo nagib i odsečak pomoću formula (9.14a,b):

Page 231: Osnovi inzenjerske statistike

224

4630.0315148807

56.668315304107))((

22

11

2

1111 =−⋅

⋅−⋅=

−=

∑∑∑∑∑

==

===

n

ii

n

ii

n

ii

n

ii

n

iii

xxn

yxyxnb

67.747

315463.056.66810 =

⋅−=−= xbyb

i iz njih koeficijent α:

0062.00

1 ==αb

b

Dijagram rasipanja eksperimentalnih tačaka i regresiona prava su dati na slici uz primer.

30 35 40 45 50 55 60

86

88

90

92

94

96

98

100

102

104

R

t

Slika uz Primer 9.2

b) Kao ocenu standardne greške merne metode σR, možemo uz pretpostavke navedene u prethodnom tekstu, da uzmemo srednje kvadratno odstupanje (9.16):

( )∑=

Ω==−−−

=n

iiiR xbby

ns

1

210 43.1

5

125.7

2

1

Koeficijent determinacije i koeficijent korelacije

Opšta linearna regresiona formula sa jednom nezavisno promenljivom se može napisati kao:

)(),...,()( 110 xfbxfbbxy kk+=

Page 232: Osnovi inzenjerske statistike

225

gde su bj, j = 0,1,...,k nepoznati parametri a fj(x), j = 0,1,...,k poznate funkcije jedne nezavisno promenljive koje ne sadrže nepoznate parametre (mogu biti linearne ili nelinarne po nezavisno promenljivoj). Pored srednjeg kvadrata odstupanja empirijske formule ili regresione jednačine (9.9) se kao mera kvaliteta linearne empirijske formule može definisati koeficijent determinacije. On se definiše kao odnos dve sume:

10,)(

)(2

1

2

1

2

2 ≤≤−

−==

∑∑

=

= Ryy

yy

SST

SSFR n

ii

n

i

raci

(9.19)

gde suma:

∑=

−=

n

ii yySST

1

2)(

predstavlja meru ukupne varijacije u eksperimentalnim vrednostima, yi. Suma:

∑∑==

−+=−=n

ikk

n

i

raci yxfbxfbbyySSF

1

2110

1

2 ))(),...,(()(

meri varijacije ra čunskih vrednosti koje daje regresiona jednačina, oko aritmetičke sredine y kao odabrane referentne vrednosti. Može se reći da SSF predstavlja objašnjenu (empirijskom formulom) varijaciju oko y .

U slučaju da Y ne zavisi od x, odnosno da je:

yxy µ=µ /

empirijska jednačina, koja daje ocene srednje vrednosti za Y, će kao procene dati

niyy raci ,...,2,1, =≈

što kao rezultat ima vrednost SSF blisku nuli, odnosno količnik dve sume blizak nuli :

0≈SST

SSF

Ovde treba primetiti da definicija koeficijenta determinacije ima smisla jedino kada u empirijskoj formuli postoji tzv. slobodan član tj. parametar b0.

Drugi granični slučaj je kada empirijska formula tačno reprodukuje eksperimentalne podatke, odnosno:

niyy iraci ,...,2,1, =≈

pa će količnik dve sume biti blizak jedinici :

1≈SST

SSF

što znači da postoji izrazito jaka veza između Y i x.

Koeficijent determinacije, R2 se, dakle, može interpretirati kao deo ukupne varijacije koji je objašnjen linearnom empirijskom formulom. S obzirom na ovu osobinu, koeficijent determinacije je pogodnija mera jačine veze između Y i x nego

Page 233: Osnovi inzenjerske statistike

226

srednji kvadrat odstupanja s2 (9.9). Pri tome treba naglasiti da za formule nelinearne po parametrima ova razmatranja gube svoj smisao.

Koeficijent determinacije, kao opšta mera jačine veze između Y i x, u slučaju pravolinijske zavisnosti dobija oblik:

2

221

1

2

1

221)14.9(

1

2

1

210

1

2

1

2

2

)(

)(

)(

)(

)(

)(

y

xn

ii

n

iib

n

ii

n

ii

n

ii

n

i

raci

s

sb

yy

xxb

yy

yxbb

yy

yyR =

=

−+

=

=

∑∑

∑∑

∑∑

=

=

=

=

=

= (9.20)

gde su 22, yx ss srednji kvadrati odstupanja (9.19). Ako parametar b1 izrazimo preko

koeficijenta korelacije rxy, pomoću Jedn. (8.7a):

x

yxy s

srb =1

dobijamo da je koeficijent determinacije jednak kvadratu koeficijenta korelacije:

xyxy rRRrR ===222 ili

što smo, s obzirom na značenje tih koeficijenata mogli da očekujemo. U slučaju linearne

zavisnosti Y od x, 2R , dakle, daje jačinu linearne veze, ali pošto je uvek pozitivan, ne daje (za razliku od rxy) informaciju o tome da li Y opada ili raste sa x.

9.4 INTERVALI POVERENJA ODSE ČKA I NAGIBA

Određivanje intervala poverenja odsečka β0 i nagiba β1 u pravolinijskoj regresionoj funkciji (9.10), zahteva poznavanje raspodela njihovih ocena, tj. statistika Bj, j = 0,1. Sa pretpostavkama navedenim u prethodnom poglavlju, može se pokazati da uzorački regresioni koeficijenti imaju normalne raspodele:

Bj: N 1,0),,( =σβ jjbj (9.21)

sa disperzijama:

212

22

)1(1 yx

yb c

snσ=

σ=σ (9.21a)

20

22

1

2

2

)1(0 yyx

n

ii

b csnn

xσ=σ

−=σ∑= (9.21b)

gde je 2xs srednji kvadrat odstupanja (9.19), a c0 i c1 koeficijenti, definisani samim

jednačinama (9.21a-b). Formule (9.14a,b) pokazuju da su statistike Bj, j = 0,1 linearne kombinacije slučajnih promenljivih Yi, i =1,2,..,n, koje prema pretpostavkama imaju raspodele:

Page 234: Osnovi inzenjerske statistike

227

Yi: N nix yi ,...,2,1),,( 10 =σβ+β

i tako relacije (9.21, 9.21a-b) slede iz osobine linearnosti normalne raspodele, tj. iz jednačina (2.57) i (2.58).

Ocene disperzija uzoračkih regresionih koeficijenata 1,0,2=js

jb dobijamo kada

u Jedn. (9.21a-b) umesto disperzije 2yσ zavisno promenljive, zamenimo njenu ocenu s2:

1,0,22== jscs jb j

(9.22)

koja se računa formulom (9.16) ili (9.18):

Iz izloženog sledi, da standardizovana slučajna veličina:

1,0,)( =σ

β−=σ−= j

c

BBMBZ

yj

jj

b

jj

j

(9.23)

gde su koeficijenti cj, j = 0,1 definisani jednačinama (9.21a,b) ima raspodelu N (0,1). Kao što smo se u Pogl. 6.2 upoznali, to dalje znači da bezdimenziona statistika:

1,0,)( =β−=−= j

Sc

B

S

BMBT

j

jj

b

jj

j

(9.24)

gde je statistika S definisana jednačinom (9.17), ima t - raspodelu sa

d = n - 2

stepeni slobode. Sada imamo sve što je neophodno, da bi mogli da definišemo intervale poverenja teorijskih regresionih koeficijenata, sa nivoom poverenja γ = 1-α:

1,0,,2,2 =+<β<+− α−α− jcstbbcst jnjjjjn (9.25)

Primer 9.3 Za uzorak od 12 studenata dati su u tabeli brojevi poena osvojeni u testu inteligencije (x) i brojevi poena osvojeni na ispitu iz hemije (y):

x: 50 50 55 55 55 55 65 65 65 70 70 70 y: 74 76 76 85 81 74 85 90 94 87 98 91

a) Izračunati nagib i odsečak u empirijskoj pravolinijskoj zavisnosti

xbby 10 +=

b) Proceniti jačinu linearne veze c) Dati intervalne ocene za prave regresione koeficijente β0 i β1 sa nivoom pouzdanosti 95%.

Rešenje

a)

897.07254447012

10117256168012))((

22

11

2

1111 =−⋅

⋅−⋅=

−=

∑∑∑∑∑

==

===

n

ii

n

ii

n

ii

n

ii

n

iii

xxn

yxyxnb

Page 235: Osnovi inzenjerske statistike

228

043.3012

725897.0101110 =

⋅−=−= xbyb

50 55 60 65 70

75

80

85

90

95

100

y

x

Slika uz Primer 9.3

b) Izračunaćemo srednje kvadrate odstupanja (9.19):

174.6111

1272544470

1

/)( 2222

=−

=−

−=∑∑

n

nxxs ii

x

205.6611

12101185910

1

/)( 2222

=−

=−

−=∑∑

n

nyys ii

y

a onda iz (9.20) koeficijent determinacije:

744.0205.66

174.61897.0 2

2

221

2===

y

x

s

sbR

Koeficijent korelacije, kao mera jačine linearne veze je koren:

862.02== Rrxy (jaka linearna veza, prema Tab.8.1)

Na osnovu vrednosti koeficijenta determinacije, možemo da zaključimo da je 74.4% ukupne varijacije u bodovima ostvarenim na ispitu iz hemije objašnjeno varijacijama u broju bodova osvojenih u testu inteligencije (varijacija objašnjena regresionom jednačinom). Ostatak od 25.6% ukupne varijacije u bodovima ostvarenim na ispitu je neobjašnjen.

c) Za izračunavanje itervala poverenja (9.25), treba nam ocena standardnog odstupanja vrednosti Y, koju dobijamo kao koren srednjeg kvadrata odstupanja dobijene empirijske jednačine od eksperimentalnih tačaka (9.18)

Page 236: Osnovi inzenjerske statistike

229

319.4

656.18)174.61897.0205.66(10

11)(

2

1 2221

22

=

=⋅−=−−

−=

s

sbsn

ns xy

Dalje, trebaju nam koeficijenti c0 i c1 (9.21a-b):

3212

1

2

0 10486.1)1(

1,508.5

174.611112

44470

)1(−= ⋅=

−==

⋅⋅=

−=

∑xx

n

ii

snc

snn

xc

U Tab.A.2 nalazimo koeficijent poverenja:

228.205.0,10 =t

i poluširine intervala poverenja regresionih koeficijenata su:

605.22508.5319.4228.2005.0,10 =⋅⋅=cst

371.010486.1319.4228.2 3105.0,10 =⋅⋅⋅=

−cst

Konačno, traženi intervali poverenja su:

268.1526.0,65.5244.7 10 <β<<β<

9.5 TESTIRANJE HIPOTEZA U VEZI SA ODSEČKOM I NAGIBOM

Proveravamo hipoteze: 1,0,: 0

0 =β=β jH jj (9.26)

nasuprot hipoteza: 1,0,: 0

1 =β≠β jH jj (9.27)

Imajući u vidu (Pogl. 7.5) da interval poverenja regresionog koeficijenta (9.25) sa nivoom poverenja γ = 1 - α, uključujući i njegove granice,

1,0,,2 =≤β− α− jcstb jnjj

predstavlja oblast prihvatanja nulte hipoteze (9.26), oblast odbacivanja te hipoteze uz rizik prve vrste α, biće,

1,0,,2 =>β− α− jcstb jnjj

ili, što je ekvivalentno:

1,0,,2 =>β−= α− jtcs

bt n

j

jj

j (9.28)

Relacija (9.28) daje kriterijume odbacivanja hipoteza (9.26)

Page 237: Osnovi inzenjerske statistike

230

Primer 9.4 Ovaj primer [Mandel J., 1964.] ilustruje primenu testiranja regresionih koeficijenata za proveru hipoteze da je neka analitička metoda tačna (nema sistematsku grešku). Proveravana je jedna metoda za određivanje sadržaja masnih kiselina u gumi. Date su vrednosti dodatih količina (mg) masne kiseline u gumu (x) i odgovarajuće izmerene vrednosti (y, mg), posmatranom metodom.

x: 20.0 20.0 50.0 50.0 150.0 153.7 250.0 250.0 500.0 500.0 y: 20.6 17.1 51.1 50.4 150.4 155.8 250.4 251.9 505.0 501.8

Potrebno je testiranjem koeficijenata linearne regresije, sa rizikom prve vrste α = 0.05, proveriti da li metoda sadrži sistematsku grešku ili ne.

Rešenje

Iz podataka se dobijaju sledeće ocene koeficijenata u modelu xY 10 β+β= :

0076.1,4064.0 10 =−= bb

Ako bi metoda bila tačna, važio bi model xY = , sa koeficijentima:

1,0 10 =β=β

Znači, da je hipotezi da je analizirana metoda tačna, ekvivalentna hipoteza:

1,0: 100 =β=βH

Dakle, odbacujemo hipotezu da je metoda tačna, ako bar jednu od hipoteza:

1:,0: 1000 =β′′=β′ HH

odbacimo, na osnovu dobijenih vrednosti uzoračkih koeficijenata b0, b1. Drugim rečima ako se vrednost odsečka b0 značajno razlikuje od nule i/ili vrednost nagiba b1 značajno razlikuje od jedinice, sa nivoom značajnosti α = 0.05, odbacujemo hipotezu da je metoda tačna, sa rizikom α.

Za proveru formulisanih hipoteza, potrebne su nam ocene disperzija uzoračkih koeficijenata (9.22), odnosno srednji kvadrat odstupanja s2 (9.18) i koeficijenti c0 i c1 (9.21a-b):

482.1

195.2)10324.30076.110375.3(8

9)(

2

1 424221

22

=

=⋅⋅−⋅=−−

−=

s

sbsn

ns xy

6214

5

21

2

0 10343.3)1(

1,226.0

10324.3910

10769.6

)1(−= ⋅=

−==

⋅⋅⋅

⋅=

−=

∑xx

n

ii

snc

snn

xc

U Tab. A.2 nalazimo kritičnu vrednost T- statistike:

306.205.0,8 =t

Provera hipoteze o nultom odsečku:

0:

0:

01

00

≠β′=β′

H

H

Page 238: Osnovi inzenjerske statistike

231

Vrednost odgovarajuće T -statistike (9.28) je:

306.2577.0226.0482.1

4064.00

0

00 <==

−=

cs

bt

pa zaključujemo da se vrednost uzoračkog odsečka ne razlikuje značajno od nule i prihvatamo hipotezu o nultom odsečku.

Provera hipoteze o jediničnom nagibu:

1:

1:

11

10

≠β′′=β′′

H

H

Vrednost odgovarajuće T-statistike (9.28) je:

306.2823.210343.3482.1

10648.716

3

1

11 >=

⋅=

−=

cs

bt

pa zaključujemo da se vrednost uzoračkog nagiba značajno razlikuje od jedinice i odbacujemo hipotezu o jediničnom nagibu.

Pošto je jedna od testiranih hipoteza odbačena, odbacujemo i hipotezu da je metoda tačna, odnosno zaključujemo da sadrži sistematsku grešku.

9.6 LINEARIZOVANE DVOPARAMETARSKE EMPIRIJSKE FORMULE

Može se pokazati da su normalne jednačine (9.7) za izračunavanje parametara u nekoj dvoparametarskoj empirijskoj formuli, linearne, samo ako je formula linearna po parametrima, a to znači da ima oblik:

)()()( 1100 xfbxfbxy += (9.29)

gde su f0(x) i f1(x) bilo kakve funkcije, u kojima ne figurišu nepoznati parametri. Na primer kod pravolinijske regresije, funkcije f0(x) i f1(x) su:

xxfxf == )(,1)( 10

Ako dvoparametarska empirijska formula:

),,( 10 bbxfy = (9.30)

nema oblik (9.29), normalne jednačine su nelinearne i njihovo rešavanje nije jednostavno. Da bi se računski problemi olakšali pristupa se, kad god je to moguće, “ ispravljanju ” ili linearizaciji jednačine, pogodnom smenom promenjivih. Na primer, formula:

baxy = (9.31)

gde su a i b parametri, se može linearizovati logaritmovanjem:

Page 239: Osnovi inzenjerske statistike

232

xbay logloglog +=

i smenom promenljivih:

z = log y, v = log x,

što kao rezultat daje linearnu formulu po novim promenljivima v i z:

bBaABvAz ==+= ,log, (9.33)

Pošto izračunamo odsečak A i nagib B iz vrednosti novih promenljivih,

zi = log yi, vi = log xi, i = 1,2,...,n

originalne parametre a i b, prema (9.33), dobijamo kao:

b = B, a = 10A

U Tab. 9.1 date su smene promenljivih za linearizaciju nekih dvoparametarskih neliearnih formula, a na Sl. 9.2 grafici datih nelinearnih funkcija. Na žalost, rigorozna statistička analiza linearizovane formule je nemoguća ili vrlo otežana, jer neophodne pretpostavke, koje važe za originalnu zavisno promenljivu (Pogl. 9.4) zbog izvedene transformacije, ne važe za novu zavisnu promenljivu.

Tabela 9.1 - Linearizacija dvoparametarskih formula

formula smena promenljivih linearizovana formula

1. bxa

y+

=1

y

z1= z = a + bx

2. x

bay +=

xv

1= y = a + bv

3. bxa

xy

+=

y

xz = z = a + bx

4. bxay ⋅= yzxv ln,ln == z = A + bv gde je A = lna

5. xbay ⋅= yz ln= z = A + Bx gde je A = lna, B = lnb

Page 240: Osnovi inzenjerske statistike

233

0 2 4 6 8 10 12-10

-5

0

5

10

3.01

=+

= b,bxa

y

1: a = -0.12: a = 0.13: a = -0.54: a = 0.5

4

3

1 32

y

x

0 2 4 6 8 10 12

0

2

4

6

8

10

12

y = a + b/x, b = 0.3

1: a = -0.12: a = 23: a = 44: a = 64

3

1

2

y

x

0 2 4 6 8 10 120

2

4

6

8

10

12

3.0, =+

= bbxa

xy

1: a = -0.12: a = 23: a = -0.44: a = 4

4

31

2

y

x 0 2 4 6 8 10 120

2

4

6

8

10

12

14

y = axb, a = 4

1: b = 0.52: b = 0.33: b = -0.34: b = -0.5

4

3

1

2

y

x

0 2 4 6 8 10 120.0

0.5

1.0

1.5

2.0

2.5

3.0

y = abx, a = 2

b = 1.3 b = 1.04

b = 1.2

b = 0.95

b = 0.8b = 0.3

b = 0.2

y

x

Slika 9.2 - Grafici nelinearnih funkcija iz Tab. 9.1

Page 241: Osnovi inzenjerske statistike

234

Primer 9.5 Odabrati oblik dvoparametarske empirijske jednačine koja opisuje zavisnost y od x, prema eksperimentalnim vrednostima datim u tabeli (prve od dve kolone). Izračunati parametre u odabranoj zavisnosti. Rešenje

Na slici 1. uz primer, ucrtane su eksperimentalne tačke (xi, yi), i = 1,2,...,7. Zamišljena linija, koja bi približno povezivala tačke, liči na sledeće krive na Sl.9.2:

• linije 2 i 4 familije krivih sa jednačinom: bxa

xy

+=

• liniju 2 familije krivih sa jednačinom: baxy =

Zato u uži izbor formula ulaze navedene dve.

a) jednačina bxa

xy

+=

Smena koja linearizuje jednačinu je:

v = x, z = x/y

U 3. koloni tabele uz primer, upisane su izračunate vrednosti za z = x/y, a na slici 2 uz primer ucrtane su tačke (xi, zi), i = 1,2,...,7.

0 2 4 6 8

60

80

100

120

140

y

x

Slika 1 uz Primer 9.5 - Eksperimentalne tačke

x y x/y 1 62.1 0.01610 2 87.2 0.02294 3 109.5 0.02740 4 127.3 0.03142 5 134.7 0.03712 6 136.2 0.04405 7 134.9 0.05189

Page 242: Osnovi inzenjerske statistike

235

0 2 4 6 80.00

0.02

0.04

0.06

z

x

Slika 2 uz Primer 9.5 - Tačke u koordinatama x - z

U dijagramu sa transformisanim koordinatama tačke približno leže na pravoj liniji. b) jednačina baxy =

Nove promenljive su: v = lnx; z = lny. Tačke, ucrtane u koordinatama v - z, ne leže duž neke prave i ova jednačina se odbacuje.

0 1 2 34.0

4.2

4.4

4.6

4.8

5.0

z =

lny

v = lnx

Slika 3 uz Primer 9.5 - Eksperimentalne tačke u koordinatama lnx-lny

Parametri u prihvaćenoj formuli se dobijaju iz parametara linearizovane jednačine:

xvyxzvbbz ==+= ,/,10

kao: a = b0, b = b1

Potrebne su sledeće sume:

083.1,140,23092.0,28 2==== ∑∑∑∑ iiiii zvvzv

i iz formula (9.14a,b) dobijamo:

Page 243: Osnovi inzenjerske statistike

236

b1 = 0.0056899, b0 = 0.010229

Konačno,

a = 0.010229, b = 0.0056899

i eksperimentalni podaci su približno opisani jednačinom:

x

xy

0056899.0010229.0 +=

U tabeli su data odstupanja eksperimentalnih od računskih vrednosti, ei:

0 2 4 6 8

60

80

100

120

140

y

x

Slika 4 uz Primer 9.5 - Eksperimentalne tačke i dobijena kriva

Primer 9.6 Date su eksperimentalne vrednosti specifične električne provodljivosti stakla (y) u funkciji od temperature, (x, 0C). Odabrati empirijsku formulu i odrediti parametre u njoj.

Rešenje

x y racy racyye −=

1 62.1 62.82 -0.72 2 87.2 92.55 -5.95 3 109.5 109.9 -0.40 4 127.3 121.25 6.05 5 134.7 129.27 5.43 6 136.2 135.23 0.97 7 134.9 139.84 -4.94

x 14.5 30.0 64.5 74.5 86.7 94.5 98.9 y 0 0.004 0.018 0.029 0.051 0.073 0.090

lny - -5.52 -4.02 -3.54 -2.98 -2.62 -2.41

Page 244: Osnovi inzenjerske statistike

237

Poređenjem izgleda zamišljene linije koja bi spajala eksperimentalne tačke na Sl. 1 uz primer, sa graficima dvoparametarskih emirijskih formula zapaža se da bi moguć adekvatan oblik formule bio:

xaby =

Smenom z = lny dobija se linearna jednačina:

z = lna + lnbx

Smena nije primenljiva na prvu eksperimentalnu tačku jer je: ln(0) = ∞. Pošto eksperimentalne tačke u transformisanim koordinatama (Sl.2 uz primer) približno leže duž neke prave, formula se prihvata.

0 20 40 60 80 100

0.00

0.02

0.04

0.06

0.08

0.10

y

x

Slika 1. uz Primer 9.6 - Eksperimentalne tačke

20 40 60 80 100-6

-5

-4

-3

-2

z

x

Slika 2. uz Primer 9.6 - Eksperimentalne tačke u transformisanim koordinatama

Računamo potrebne sume:

Page 245: Osnovi inzenjerske statistike

238

925.1432,85.36838,09.21,1.449 2−==−== ∑∑∑∑ iiiii zxxzx

Iz (9.14 a,b) računamo: A = b0 = -6.897, B = b1 = 0.4518

i parametre u polaznoj, nelinearnoj formuli:

a = eA = 0.001011, b = eB = 1.046

Dobili smo empirijsku jednačinu:

xy 046.110011.1 3⋅⋅=

− Primer 9.7 U prve dve kolone tablice date su eksperimentalne vrednosti suvozasićene pare v neke supstance i odgovarajuće vrednosti napona pare, p. Naći empirijsku zavisnost p = f(v).

i za dobijenu formulu izračunati pokazatelj njene adekvatnosti.

Rešenje

Na slici 1. uz primer su ucrtane eksperimentalne tačke. Hiperboličan oblik zamišljene krive oko koje leže tačke sreće se kod svake od sledećih 5 tipova dvoparametarskih jednačina:

bxa

xy

baxy

x

bayabyaxy xb

+=

+=+=== ,

1,,,

0 1 2 3 40

5

10

15

20

p

v

Slika 1. uz Primer 9.7 - Eksperimentalni podaci

v(m3/kg) p(bar) x = lnv y = lnp 3.334 0.482 1.2042 -0.7298 1.63 1.034 0.4886 0.0334 0.8657 2.027 -0.1442 0.7066 0.4323 4.247 -0.8386 1.4462 0.2646 7.164 -1.3295 1.9691 0.1699 11.48 -1.7725 2.4406 0.1146 17.60 -2.1663 2.8679

Page 246: Osnovi inzenjerske statistike

239

Ipak, može se na osnovu poznavanja gasnih zakona prednost dati stepenoj zavisnosti: p = avb

pa će njena adekvatnost biti prvo ispitana. Odgovarajućom smenom,

y = ln p, x = ln v

kriva p = avb se "ispravlja":

y = lna + bx = b0 + b1x

-2 -1 0 1

-2

-1

0

1

2

3

4

5

lnp

lnv

Slika 2. uz Primer 9.7 - Eksperimentalni podaci u koordinatama lnp-lnv

Kao što Sl. 2. uz primer pokazuje, odabrana zavisnost je adekvatna. Sume za proračun koeficijenata b0 i b1su,

3338.15,0151.12,734.8,5583.4 2−===−= ∑∑∑∑ iiiii yxxyx

i iz formula (9.14a,b) dobijamo:

b0 = 0.55337, b1 = -1.0663

i dalje,

0663.1,7391.1 10 −==== bbea b

Dobili smo empirijsku jednačinu:

7391.1ili,7391.1 0663.10663.1==

− pvvp

U tabeli su upoređene eksperimentalne i računska vrednost napona pare:

Page 247: Osnovi inzenjerske statistike

240

Pokazatelji adkvatnosti dobijene empirijske zavisnosti je srednji kvadrat odstupanja (9.9):

33

1

2

1

2

2 10563.15

10813.7

2)1(

)(−

== ⋅=⋅

=−

=+−

=∑∑n

e

kn

pps

n

ii

n

i

racii

Mala vrednost srednjeg kvadrata odstupanja formule pokazuje da dobijena formula adekvatno opisuje (fituje) eksperimentalne podatke o naponu pare.

ZADACI 9.1 Meren je stepen konverzije reaktanta u reaktoru (y, %) na raznim temperaturama (x, 0C):

x, 0C 207.1 210.3 200.4 201.1 203.4 y, % 92.30 92.58 91.56 91.63 91.83

a) Uveriti se na osnovu dijagrama rasipanja da se može pretpostaviti linearna zavisnost stepena konverzije od temperature b) Izračunati sa 4 decimale odsečak i sa 3 decimale nagib regresione prave y(x) c) Izračunati srednji kvadrat odstupanja regresione prave od eksperimentalnih podataka d) Izračunati koeficijente determinacije i korelacije i dati tumačenje e) Izračunati intervalne ocene odsečka i nagiba, sa nivoom poverenja 0.95.

9.2 Proveriti statističku značajnost nagiba regresione prave y(x) (da li je izračunati nagib značajno različit od nule), sa α = 0.05: a) u problemu 8.3, b) u problemu 9.1 Povezati rezultate sa značajnošću izračunatih koeficijenata korelacije.

9.3 Merene su gustine ρ (g/ l) neke supstance na različitim temperaturama t:

v p racp e = p - racp

3.334 0.482 0.4816 0.0004 1.63 1.034 1.0329 0.0011 0.8657 2.027 2.0282 -0.0012 0.4323 4.247 4.2528 -0.0058 0.2646 7.164 7.178 -0.0140 0.1699 11.48 11.512 -0.0320 0.1146 17.6 17.5184 0.0816

t, 0C 20 30 40 50 60 70 ρ, (g/ l) 640 652 668 680 684 692

Page 248: Osnovi inzenjerske statistike

241

a) Odrediti odsečak sa jednom i nagib sa tri decimale u pravolinijskoj zavisnosti gustine od temperature. b) Proceniti gustinu na temperaturi 74 0C c) Dati intervalnu ocenu, sa nivoom poverenja 0.95, temperaturnog koeficijenta gustine (promena gustine, pri povećanju temperature za 1 0C).

9.4 Koje smene promenljivih "ispravljaju" sledeće krivolinijske dvoparametarske zavisnosti:

a) baxy += 2 , b) bx

ay +=2 , c) bxa

y++= )3(

1 d) bxaey +

= e) 1−

+=x

baxy

9.5 a) Ucrtavajući eksperimentalne tačke u odgovarajući koordinatni sistem, uveriti se da podaci o temperaturama (t, 0C) i odgovarajućim masenim protocima (m, g/s) navode na zaključak da se maseni protok menja linearno sa korenom temperature:

btam +=

t, 0C 10 20 40 80 100 m, g/s 14.76 20.14 27.73 38.47 42.82

b) Dati intervalne ocene odsečka i nagiba sa nivoom pouzdanosti 0.95.

9.6 Date su eksperimentalne vrednosti:

. Izračunati, sa tri decimale, parametre a i b u empirijskoj jednačini:

bxa

y+

=1

9.7 Pretpostavlja se da za neki gas približno važi sledeća jednačina stanja:

cpvm=

gde su: p - pritisak, v -molska zapremina, m i c -parametri. Za date podatke:

a) Proveriti pretpostavku, pomoću dijagrama rasipanja b) Izračunati parametre m i c i srednje kvadratno odstupanje empirijske formule. 9.8 Radi kalibracije higrometra, menjan je sadržaj vode u gasu (x, %) i očitavana vrednost na skali higrometra (y). Rezultati su dati u tabeli:

a) Na osnovu dijagrama rasipanja odabrati dvoparametarsku empirijsku zavisnosti y(x) b) Izračunati parametre u odabranoj formuli.

x 1.0 2.0 3.0 5.0 10.0 y 0.279 0.194 0.168 0.120 0.083

v, cm3/mol 50.5 61.0 71.5 81.2 105 p, bar 64.7 51.3 40.5 25.9 7.8

x 5 20 40 60 80 y 0.011 0.044 0.083 0.126 0.170

Page 249: Osnovi inzenjerske statistike

242

9.9 Date su viskoznosti vode, η na različitim temperaturama T (K):

a) Izračunati parametre u formuli:

T

b

ae=η b) Proceniti viskoznost vode na 300 K

T 283 293 303 313 323 333 343 η 1.308 1.005 0.801 0.656 0.549 0.469 0.406

Page 250: Osnovi inzenjerske statistike

1

10 Statistička kontrola kvaliteta

Predmet ove glave su neki problemi kontrole kvaliteta industrijskih proizvoda uz

primenu statističkih kriterijuma i metoda. U statistističkoj kontroli kvaliteta (SQC -statistical quality control) se razlikuju dva tipa problema :

1. Statistička kontrola prijema robe (AS - acceptance sampling);

2. Statistička kontrola proizvodnog procesa (SPC - statistical process control)

Statistička kontrola prijema robe - acceptance sampling se bavi proverom kvaliteta proizvedene robe odnosno prihvatanjem ili neprihvatanjem proizvodne pošiljke na osnovu slučajnog uzorka iz pošiljke.

Statistička kontrola proizvodnog procesa (statistical process control), ima cilj uočavanje poremećaja u procesu i preduzimanje odgovarajuće korigujuće akcije.

Većinu šema za kontrolu prijema robe i kontrolu procesa planiraju statističari, ali je za osobu koja treba da ih primenjuje korisno da razume osnovne principe i ideje na kojima se te šeme zasnivaju, kao i značenje pojedinih termina. Tako, ovde će biti izloženi osnovni principi i metode, a zainteresovanog čitaoca, radi šireg upoznavanja, upućujemo na odgovarajuću literaturu [Duncan,1974; Wetherill,1977; Guenther,1977 i Hald,1981].

10.1 KONTROLA PRIJEMA ROBE

Prilikom primanja (ili odašiljanja) pošiljke nekog proizvoda, u opštem slučaju se ne praktikuje provera ispravnosti svakog pojedinog komada. Stopostotna kontrola prozvoda bila bi neekonomična, a nemoguća u slučaju kada se postupkom provere proizvod oštećuje. Tako se kontrola najčešće sastoji u uzimanju uzorka iz pošiljke, na osnovu koga se procenjuje kvalitet čitave pošiljke i donosi odluka o prihvatanju ili odbacivanju (vraćanje prozvođaču) pošiljke, polazeći od unapred zadatog standarda kvaliteta. S obzirom na tip pokazatelja kvaliteta, kao statističkog obeležja, razlikujemo dva tipa kontrole :

1. Kontrola na osnovu atributivnog (kvalitativnog) obeležja (sampling by attributes).

2. Kontrola na osnovu kvantitativnog (merenog) obeležja (sampling by variables).

Kod atributivne kontrole , prozvodi se najčešće razvrstavaju na ispravne i neispravne. Tipičan primer je kontrola sijalica. Kod kontrole na osnovu kvantitativnog obeležja, pokazatelj kvaliteta je numerička promenljiva čija je vrednost rezultat merenja, recimo sadržaj neke supstance u proizvodu, ili njegova viskoznost itd.

Page 251: Osnovi inzenjerske statistike

2

Postoje različiti planovi kontrole (sampling plan), tj. različite šeme uzimanja uzoraka i donošenja odluke o prihvatanju ili odbacivanju pošiljke. Najjednostavniji plan kontrole je onaj na osnovu atributivnog obeležja uz uzimanje samo jednog uzorka. Različiti planovi će biti razmotreni u Pogl. 10.2 pri čemu ćemo se ograničiti na atributivnu kontrolu.

Statistička analiza planova atributivne kontrole (ispravan-neispravan) se najčešće zasniva na binomnom modelu (Pogl. 2.6) za broj neispravnih delova u uzetom slučajnom uzorku, čiji parametar p predstavlja udeo (proporciju) defektnih proizvoda u pošiljci. Pri tom, ako su uzeti uzorci dovoljno mali u odnosu na pošiljku, pretpostavlja se da se parametar p ne menja uzimanjem uzoraka.

Dobrim planom kontrole smatramo onaj koji obezbeđuje da će “dobre” isporuke biti najverovatnije prihvaćene, a “loše” isporuke najverovatnije vraćene proizvođaču. Odluka se donosi na osnovu prethodno utvrđene dozvoljene granice za broj loših proizvoda u uzorku. Ne postoji idealan plan, tj. svaki sadrži rizik da će biti odbačena dobra pošiljka - rizik proizvođača, α , kao i rizik da će biti prihvaćena loša pošiljka - rizik kupca, β. Dakle rizik proizvođača α predstavlja verovatnoću odbacivanja dobre pošiljke, a rizik kupca β predstavlja verovatnoću prihvatanja loše pošiljke. Zato, proizvođač i kupac po pravilu zajedno biraju šemu kontrole, koja će biti prihvatljiva za obe strane. Pre svega, kupac je dužan da navede kakav nivo kvaliteta mu je potreban, odnosno prihvatljivi nivo kvaliteta (acceptable quality level - A.Q.L), pod kojim se kod atributivne kontrole podrazumeva dozvoljena proporcija neispravnih komada u pošiljci, i označićemo je sa p1. Tako se dobrom pošiljkom smatra ona za koju je p p≤ 1 . Idealna šema kontrole bi obezbedila da dobra pošiljka bude sigurno

prihvaćena, tj. rizik proizvođača bude jednak nuli (α = 0). Anuliranje rizika proizvođača moguće je međutim samo pri potpunoj (stopostotnoj) kontroli pošiljke. Pošiljka koja sadrži više od p1 % neispravnih delova (p > p1) ne smatra se u opštem slučaju lošom, odnosno kupac određuje i najveću dozvoljenu proporciju loših komada u pošiljci, p2, koju ćemo zvati granica tolerancije pošiljke (lot tolerance percentage defective - L.T.P.D). Ako je p p≥ 2 , pošiljka se smatra lošom. Idealno, kao rezultat kontrole svaka loša pošiljka se odbacuje, tj. rizik kupca je jednak nuli, ali je to moguće samo pri stopostotnoj proveri pošiljke.

Operaciona kriva

Budući da je stopostotna provera svih pošiljki robe nepraktična ili nemoguća, u cilju kontrole rizika proizvođača i kupca se konstruišu operacione krive. Operaciona ili O-C kriva predstavlja grafik verovatnoće prihvatanja pošiljke, kao funkcije proporcije neispravnih delova p u njoj, za dati plan kontrole. Plan kontrole određuje uslove prihvatanja ili odbacivanja pošiljke. Jasno je da posmatrana funkcija, L(p) treba da ima sledeće karakteristike:

1. Monotono opada;

2. ( ) ( )L L0 1 1 0= =;

Page 252: Osnovi inzenjerske statistike

3

Na slici 10.1, skicirana je O-C kriva. Rizik proizvođača, α za dati prihvatljivi nivo kvaliteta, p1 jednak je verovatnoći da će (dobra) pošiljka sa p1% neispravnih proizvoda biti odbačena:

( )11 pL−=α (1)

dok je rizik kupca β, za datu granicu tolerancije, p2 jednak verovatnoći da će (loša) pošiljka, sa p2 % neispravnih proizvoda biti prihva ćena:

( )2pL=β (2)

L ( p )

1

0 p p 1 p 2 1

α

β

Slika 10.1 O-C kriva

Treba reći da, iako su neprihvatljive samo one isporuke koje imaju p > p2,

proizvođač je zainteresovan da održava kvalitet, odnosno da p održava manjim od p1, jer pri povećavanju proporcije neispravnih delova od p1 do p2, brzo opada verovatnoća prihvatanja, tj. raste verovatnoća odbacivanja pošiljke (vidi sl.10.1).

Na slici 10.2 je skicirana O-C kriva idealnog plana kontrole, pri p1 = p2, koji obezbeđuje da se prihvataju sve pošiljke sa proporcijom neispravnih delova manjom od p1, a one sa p > p1 vraćaju proizvođaču.

p

L(p)

1

10 p1= p2

Slika 10.2 O-C kriva idealnog plana kontrole

Page 253: Osnovi inzenjerske statistike

4

Kao što smo već primetili, idealan Z-oblik O-C krive može se postići samo pri potpunoj (stopostotnoj) kontroli. Dakle, on se približava idealnom pri povećavanju obima uzorka.

Primer 1 Pretpostavimo sledeću šemu kontrole. Iz pošiljke se uzima jedan uzorak od n = 20 proizvoda i pošiljka se prima ako je broj neispravnih delova, c u njoj manji od 2. Nacrtati O-C krivu i odrediti rizike proizvođača i kupca pri p1 = 5 % i p2 = 15%.

Rešenje U skladu sa datom definicijom, funkcija L(p) predstavlja verovatnoću :

( ) ( ) ( ) ( )pbpbxPpL ,20,1,20,02 +=<=

gde je b(x,n,p) binomni zakon raspodele :

( ) )1(,, pqqpx

npnxb xnx −=

= −

Tako imamo :

( ) ( )19201920 120)1(1

20

0

20ppppqqpL −+−=

+

=

U Tabeli su date vrednosti funkcije L(p), a na slici njen grafik ( O - C kriva ).

p L(p)

0 1 0.01 0.9831 0.02 0.9401 0.05 0.7358 0.08 0.5169 0.1 0.3917 0.13 0.2461 0.15 0.1756 0.2 0.0692 0.25 0.0243 0.3 0.0076 0.4 0.0005

0 0.1 0.2 0.3 0.4

0

0.2

0.4

0.6

0.8

1

p

L(p)

Tabela uz Primer 1

Slika uz Primer 1

Rizik proizvođača za p1 = 5% , tj. verovatnoća da će pošiljka sa 5% neispravnih proizvoda biti vraćena proizvođaču je :

( ) %42.267358.0105.01 =−=−=α L

Verovatnoća da će biti prihvaćena pošiljka sa 15% neispravnih proizvoda, tj rizik kupca uz p2=15% je :

( ) %56.171756.015.0 ===β L

Page 254: Osnovi inzenjerske statistike

5

Zanimljivo je povezati plan kontrole sa testiranjem hipoteza. Treba primetiti da je odbacivanje (dobre) pošiljke ekvivalentno odbacivanju nulte hipoteze :

H0 : p = p1

sa alternativnom hipotezom:

H1 : p > p1

Greška tipa I, da je odbačena nulta hipoteza koja je ispravna, očigledno je jednaka riziku proizvođača, α. Prihvatanje (loše) pošiljke je ekvivalentno prihvatanju nulte hipoteze koja je pogrešna (pri tome H0 : p = p2 , H1 : p > p2) i predstavlja grešku tipa II koja je jednaka riziku kupca, β.

10.2 TIPOVI PLANOVA KONTROLE

Zadatak izračunavanja O-C krive za odabrani plan kontrole (vidi Primer 1) je obično direktan, odnosno jednostavan. U praksi je međutim često potrebno projektovati plan kontrole sa zadatim vrednostima p1, p2, α i β . Drugim rečima, treba pronaći onu šemu kontrole čija O-C kriva prolazi kroz dve tačke : (p1, 1 - α) i (p2, β). Opisaćemo nekoliko osnovnih tipova planova kontrole.

Jednostavan plan

To je najjednostavnija šema kontrole i sastoji se od uzimanja jednog jedinog uzorka obima n i prihvatanju pošiljke ako broj nađenih neispravnih komada ne prelazi zadatu granicu c. Broj c se naziva i prihvatljiv broj neispravnih delova u uzorku. Teba reći da nije uvek moguće naći jednostavan plan koji tačno zadovoljava postavljene uslove p1, p2, α i β, s obzirom da traženi obim uzorka n i prihvatljiv broj c moraju da budu celi brojevi. Približna rešenja u takvim slučajevima mogu se naći u odgovarajućim tabelama [Duncan, 1974, Wetherill, 1977].

Dvoetapna kontrola

U pitanju je kontrola u dva stupnja. Najpre se uzima uzorak obima n1 i pošiljka prihvata, ako broj nađenih neispravnih komada, x1 ne prelazi c1 (x1 ≤ c1). Pošiljka se odbacuje ako je broj neispravnih komada veći od c2 (x1 > c2). Inače, tj. ako je c1 < x1 ≤ c2

, uzima se još jedan uzorak obima n2 i ako ukupan broj neispravnih delova u oba uzorka (x1 + x2) ne prelazi granicu c3, pošiljka se prihvata, a inače odbacuje (vidi Sl. 10.3).

Page 255: Osnovi inzenjerske statistike

6

Uzorak obima n1 sa x1

neispravnih proizvoda

Uzorak obima n2 sa x2

neispravnih proizvoda

Prihvatanje Odbacivanje

x1> c2

c1< x1≤ c2

x1≤ c1

x1+x2≤ c3 x1+x2> c3

Slika 10.3 Šema dvoetapne kontrole

Obično se šema dvoetapne kontrole pojednostavljuje uzimanjem: 32 cc = pri čemu

je rezultujuća uprošćena šema skicirana je na slici 10.4.

Uzorak obima n1 sa x1

neispravnih proizvoda

Uzorak obima n2 sa x2

neispravnih proizvoda

Prihvatanje Odbacivanje

x1> c2

c1< x1≤ c2

x1≤ c1

x2≤ c2x2 > c2

Slika 10.4 Pojednostavljena šema dvoetapne kontrole

Primer 2 Iz pošiljke se uzima uzorak od 20 proizvoda i ako se nađe manje od 2 neispravna ona se prima, a ako se nađe više od 4 neispravna, vraća proizvođaču. Ako je pak nađeno 2, 3, ili 4 neispravna komada uzima se nov uzorak od 40 proizvoda i ako se u tom uzorku nađe najviše 4 neispravna proizvoda, pošiljka se konačno prima, a u suprotnom vraća proizvođaču. formirati O-C krivu i uporediti je sa O-C krivom jednostavnog plana kontrole (Primer 1).

Rešenje Nemeće se uprošćena dvoetapna kontrola (slika 10.4) uz:

4,1,40,20 2121 ==== ccnn

Tražena verovatnoća prihvatanja pošiljke, L(p) jednaka je očigledno :

( ) ( ) ( ) ( )

( ) ∑ ∑ ∑= += =

−−−

+

=

≤⋅≤<+≤=

1 2

1

2

211

0 1 0

211

2221111

c

x

c

cx

c

x

xnxxnxxnx qpx

nqp

x

nqp

x

npL

cxPcxcPcxPpL

Page 256: Osnovi inzenjerske statistike

7

Tabela uz Primer 2

Slika uz Primer 2

p L1(p) L2(p) 0 1.0000 1.0000 0.01 0.9831 1.0000 0.02 0.9401 0.9999 0.05 0.7358 0.9849 0.08 0.5169 0.8826 0.1 0.3917 0.7472 0.13 0.2461 0.4992 0.15 0.1756 0.3478 0.2 0.0692 0.1117 0.25 0.0243 0.0306 0.3 0.0076 0.0082 0.4 0.0005 0.0005

0 0.1 0.2 0.3 0.40

0.2

0.4

0.6

0.8

1

p

L(p)

L1(p)L2(p)

U tabeli su date uporedo vrednosti funkcije L(p) za jednostavnu kontrolu (Primer 1) - L1(p) i za dvoetapnu kontrolu - L2(p), a na slici O-C krive. Iz izvedenih izraza za L(p), jasno je da je O-C kriva za dvoetapnu kontrolu u celom opsegu p vrednosti iznad krive za jednostavan plan kontrole, što je svakako povoljnije za proizvođača (manji rizik α).

Možemo da primetimo da je bitna odlika dvoetapne kontrole da se kao rezultat ispitivanja prvog uzorka prihvataju vrlo dobre, a odbacuju vrlo loše pošiljke. Problem projektovanja dvoetapne šeme kontrole se sastoji u nalaženju obima uzoraka n1 i n2 i graničnih vrednosti c1 i c2, pri datim vrednostima p1, p2, α i β. Da bi se dobilo jednoznačno rešenje, neophodno je dodatno ograničenje [Duncan, 1974] i to je, recimo, odnos n1 i n2 - najčešće se usvaja : n2 = 2n1. U poređenju sa jednoetapnom kontrolom, dvoetapna kontrola ima prednost da je prvi uzorak manji od uzorka pri ekvivalentnoj (iste vrednosti p1, p2, α i β) jednostavnoj kontroli. Druga prednost je psihološka - pre konačnog odbacivanja pošiljke, pruža joj se još jedna prilika (2. uzorak), što je svakako povoljno za proizvođača. Istovremeno, pri većim vrednostima p2, rizik potrošača se ne povećava značajno (vidi sliku uz Primer 2).

Sekvencijalna kontrola

Princip dvoetapne kontrole se može uopštiti i rezultat je višestupnjevita ili sekvencijalna kontrola. Ona se sastoji u postupnom povećavanju uzorka uklju čivanjem jednog po jednog proizvoda iz pošiljke. Nakon provere proizvoda donosi se odluka da se pošiljka prihvata, vraća proizvođaču ili se postupak nastavlja dodavanjem uzorku još jednog komada iz pošiljke. Nakon svakog od sekvencijalnih koraka tj. nakon uzimanja još jednog komada iz pošiljke, poznat je ukupan ili kumulativan broj komada u uzorku, n kao i kumulativan broj neispravnih delova, d. Tada, ako je:

Page 257: Osnovi inzenjerske statistike

8

2hnsd +⋅>

pošiljka se vraća proizvođaču, a ako je :

1hnsd −⋅<

pošiljka se prihvata. Ako nije ispunjen nijedan od tih uslova, postupak se nastavlja (Slika 10.5). Pored zadatih p1, p2, α i β, parametri h1, h2 i s računaju se po formulama :

( )( )

( )( )

( )( )

−−

−−

=

−−

αβ−

=

−−

βα−

=21

12

2

1

21

12

2

21

12

1

1

1log

11

log

;

1

1log

1log

;

1

1log

1log

pp

pp

p

p

s

pp

pph

pp

pph

Jasno je da je postupak okončan odlukom da se pošiljka prihvata ili odlukom da se odbacuje .

Odbacivanje

Nastavak kontrole

Prihvatanje

d = s n + h2

h2

h1

d

n

d = s n - h1

Slika 10.5 Dijagram sekvencijalne kontrole

Planovi kontrole sa zamenjivanjem neispravnih delova ispravnim

Pri kontroli proizvoda uz zamenjivanje neispravnih ispravnim, koju nazivamo i rektifikaciona šema kontrole (rectifying scheme), pošiljka koja je odbačena podvrgava se stopostotnoj kontroli i zamenjivanju neispravnih komada ispravnim (rektifikacija), što je ilustrovano slikom 10.6.

Page 258: Osnovi inzenjerske statistike

9

Proizvođač Kontrola Kupac

100% kontrolai rektifikacija

prihvatanje

odbacivanje

Slika 10.6 Dijagram sekvencijalne kontrole

Jasno je da je nakon sekvencijalne kontrole (uz rektifikaciju) kupac primio dve vrstee pošiljki: one koje su pri kontroli prihvaćene, što znači da sadrže izvestan broj neispravnih komada i one kojima su svi neispravni komadi zamenjeni ispravnim, pošto nisu prethodno prihvaćene (vidi sliku 10.6). Tako se može izračunati srednji udeo neispravnih proizvoda u konačno primljenoj količini proizvoda, koja se zove srednji izlazni kvalitet - average outgoing quality, A.O.Q. Ako bi u svim pošiljkama sadržaj neispravnih komada bio jednak nuli, p = 0, srednji izlazni kvalitet, bio bi jednak nuli, A.O.Q.= 0. S druge strane, A.O.Q. se približava nuli sa porastom broja loših pošiljaka, koje nisu prošle test, zbog zamene neispravnih komada ispravnim. Zaključujemo da A.O.Q. kao funkcija proporcije defektnih prizvoda, p ima maksimum, koji se zove granični srednji izlazni kvalitet , A.O.Q.L (average outgoing quality limit), što je ilustrovano slikom 10.6.

A.O.Q

A.O.Q.L

p

Slika 10.6. Srednji izlazni kvalitet u zavisnosti od proporcije neispravnih delova

10.3 KONTROLA NA OSNOVU KVANTITATIVNOG OBELEŽJA

Neka je zadat standard kvaliteta, U. U okviru plana kvantitativne kontrole, neophodno je merenje vrednosti odabranog pokazatelja kvaliteta, (na primer sadržaj neke supstance u proizvodu) za svaki proizvod i izračunavanje aritmetičke sredine, x . Ako merene vrednosti, X imaju, recimo, normalnu raspodelu i ako je poznato (ili procenjeno)

Page 259: Osnovi inzenjerske statistike

10

standardno odstupanje, σ, onda se može proceniti proporcija proizvoda čija vrednost X prevazilazi zadatu granicu, U. Kriterijum za odbacivanje pošiljke je da bezdimenziona

veličina : σ−= /UXZ prevazilazi odabranu granicu. Pri tome treba obratiti pažnju da

li su zadate minimalne i/ili maksimalne vrednosti kao standard kvaliteta. Kako se procene vrše na osnovu uzoraka većih obima, za ovu analizu se koristi standardizovana normalna raspodela.

PRIMER 3 Iz pošiljke margarina je uzet uzorak od 100 komada margarina i određene su aritmetička sredina mase margarina, x = 255 g i procenjeno standardno odstupanje σ = 4.7 g.

a) Ako je standardom kvaliteta postavljena minimalna Umin=240 g i maksimalna masa margarina Umax = 260 g, proceniti koji procenat pojedinih komada margarina je izvan zadatog standarda kvaliteta. Da li ograničenje od 10% izvan standarda kvalifikuje ovu pošiljku za odbacivanje?

b) Koji procenat pojedinih komada margarina je izvan zadatog standarda kvaliteta ako je izmerena aritmetička sredina x = 250 g pri istoj vrednosti standardnog odstupanja.

Rešenje a) Treba primetiti da je aritmetička sredina u granicama kvaliteta. Kako imamo donju i gornju granicu, traženi procenat se dobija kao zbir verovatnoća tj.

σ−<−

σ−<−=

σ−>+

σ−>=

maxmin

maxmin

2Ux

ZPUx

ZP

UxZP

UxZPp

Pomoću tablica za normalnu standardizivanu slučajnu promenljivu se dobija

%5.14999.0856.02 =−−=p

znači da je u uzorku od 100 margarina14.5% (~15 komada) margarina izvan zadatih granica kvaliteta, što ovu pošiljku kvalifikuje za odbacivanje (>10%).

b) Opisanim postupkom se dobija vrednost od 3.4%, što je i minimalna vredost jer je aritmetička sredina tačno jednaka sredini između minimalne i maksimalne granice kvaliteta.

10.4 KONTROLA PROIZVODNOG PROCESA

Kontrola proizvodnog procesa (process control) obuhvata:

1. Uočavanje poremećaja u procesu

2. Prepoznavanje uzroka poremećaja

3. Odgovarajuće ispravljanje procesa.

Najčešći metod uočavanja promena u procesu je pomoću kontrolnih karata (control chart). Kontrolna karta predstavlja, u stvari, grafik merenih vrednosti odabranog pokazatelja kvaliteta procesa - kontrolne promenljive, u funkciji od

Page 260: Osnovi inzenjerske statistike

11

vremena, tj. u kartu se hronološki unose izmerene vrenosti odabrane procesne promenljive - recimo temperature u nekom reaktoru.

Kontrolna karta

Kontrolna karta ima centralnu liniju koja predstavlja propisanu ili nominalnu vrednost kontrolne promenljive (target value) - recimo propisan sadržaj neke supstance u proizvodu, i još dve paralelne linije : gornju i donju kontrolnu granicu (upper control line, U.C.L. i lower control line, L.C.L.). Ako tačke u karti leže između kontrolnih granica , smatramo da se proces odvija normalno ili da je pod kontrolom, a da su uočene promene kontrolne promenljive (sadržaj supstance, na primer) rezultat neznatnih nekontrolisanih poremećaja (uključujući i grešku merenja) i smatramo ih slučajnim varijacijama , koje takođe nazivamo i neobjašnjene ili preostale - rezidualne (residual) varijacije. Ako se pak vrednost parametra nađe izvan kontrolnih granica, koje se još nazivaju i linije akcije (action lines), znači da je nastupio poremećaj u procesu, tj. da je on izvan kontrole i da je neophodna koriguju ća akcija. Kao rezultat odgovarajuće koriguju će akcije, uzrok poremećaja (assignable cause) se uklanja i proces ponovo vraća pod kontrolu.

Kontrolne granice ili linije akcije obično se dobijaju primenom pravila tri sigme, odnosno kao granice tolerancije vrednosti kontrolne promenljive (Pogl. 5.5):

σ+= 3U.C.L T (3a)

σ−= 3L.C.L. T (3b)

gde je T ordinata centralne linije, odnosno nominalna ili željena vrednost (target value) , a σ je standardno odstupanje rezidualnih varijacija, odnosno standardno odstupanje merenih vrednosti kontrolne promenljive kada je proces pod kontrolom. Za normalnu raspodelu merenih vrednosti, znamo da je verovatnoća da će se merena vrednost kontrolne promenljive naći izvan kontrolnih granica, kada je proces pod kontrolom, samo 0.27%. Isto pravilo tri sigme se koristi i kada merenja nemaju normalnu raspodelu, što znači da je tada verovatnoća padanja tačke u kontrolnoj karti izvan linija akcije nešto drugačija. Treba reći da se ordinata srednje linije, T , odnosno nominalna vrednost najčešće određuje kao aritrmetička sredina većeg broja ponovljenih merenja (po pravilu, najmanje 25 merenja) uzetih u prethodnom periodu u kome je proces bio pod kontrolom .

Pored kontrolnih granica ili linija akcije, u kartu se mogu ucrtati i granice upozorenja (warning lines) sa ordinatama: T ± 2σ. Ako nekoliko uzastopnih merenja padnu izvan linija upozorenja, treba preduzeti korigujuću akciju.

Kontrolne karte za uzorke

Page 261: Osnovi inzenjerske statistike

12

Pri objašnjavanju kontrolnih karata, pretpostavili smo da se u uzastopnim vremenskim momentima uzima po jedno merenje kontrolne promenljive. Međutim, u kontrolnu kartu se mogu takođe unositi vrednosti dobijene iz malih uzoraka, uzetih u određenim momentima. Tipičan primer je kontrola procesa na osnovu atributivnog obeležja, kao pokazatelja kvaliteta procesa. Uzorci uzeti u pojedinim intervalima su mali, za razliku od uzoraka u toku kontrole prijema robe (Pogl. 10.1), ali ipak mogu da pruže vrednu informaciju o procesu, naročito ako njihovo uzimanje organizuje iskusan kontrolor.

U slučaju kontinualne kontrolne promenljive (recimo sadržaj supstance u proizvodu) najčešće nije moguće istovremeno izvršiti više merenja. Tako se, tokom kratkog vremenskog intervala uzima nekoliko ponovljenih merenja, koja se nazivaju podgrupa merenja (subgroup of observations) i smatraju uzorkom.

Atributivna kontrolna promenljiva

Iako se atriburivna kontrola procesa može odvijati formiranjem kontrolnih karata na opisan način (srednja linija, gornje i donje linije akcije i upozorenja), ovde ćemo opisati nešto jednostavniji slučaj. Ako se, na primer, u kontrolnu kartu za atributivnu kontrolu unose brojevi neispravnih proizvoda nađeni u uzorcima od po n proizvoda, uzetim u pravilnim vremenskim intervalima tada je tipičan izgled ovakve kontrolne karte za atributivnu kontrolu dat na slici 10.7.

0 1 2 3 4 5 6 7 8 9 100

1

2

3

4

5

6

7

uzorak

broj

def

ektn

ih p

roiz

voda

linija akcije (A)

linija upozorenja (W)

Slika 10.7 Kontrolna karta za atributivnu kontrolu

Linija akcije i linija upozorenja određuju se obično pomoću binomne raspodele. Naime, ako pretpostavimo da je proces pod kontrolom, sa srednjom proporcijom neispravnih komada u uzorcima (određenom na bazi dužeg posmatranja) jednakom p, broj neispravnih komada u uzorcima imaće binomnu raspodelu verovatnoće sa parametrima n i p. Tako je verovatnoća da u uzorku bude x neispravnih proizvoda jednaka :

( ) )1(,,,)( pqqpx

npnxbxXP xnx −=

=== −

Page 262: Osnovi inzenjerske statistike

13

i ordinata linije akcije , A određuje se iz uslova da je verovatnoća da broj defektnih komada u uzorku prevaziđe granicu A manja od ili jednaka 0.001. Slično, ordinata linije upozorenja, W određuje se iz nešto veće verovatnoće , 0.025 :

( ) ( ) ( )∑<

− ≤−

−=<−=≥

Ax

xnx ppx

nAXPAXP 001.0111 (4a)

( ) ( ) ( )∑<

− ≤−

−=<−=≥

Wx

xnx ppx

nWXPWXP 025.0111 (4b)

odnosno :

( ) ( ) ( )∑−

=

− ≥−

=−≤=< 1

0

999.011A

x

xnx ppx

nAXPAXP (5a)

( ) ( ) ( )∑−

=

− ≥−

=−≤=< 1

0

975.011W

x

xnx ppx

nWXPWXP (5b)

U slučaju da se binomna raspodela može aproksimirati Poasonovom, A i W se lakše određuju primenom ove druge.

Sve dok je broj neispravnih komada u uzorku manji od W, smatra se da je proces pod kontrolom. Na poremećaj procesa ukazuju: broj neispravnih delova u jednom uzorku najmanje jednak granici A, ili broj neispravnih delova u dva uzastopna uzorka najmanje jednak granici upozorenja, W.

PRIMER 4 U toku dužeg vremenskog perioda u toku koga je proces bio pod kontrolom, srednja proporcija neispravnih komada u nekom procesu bila je 3%. Treba odrediti linije upozorenja (W) i akcije (A) pri obimu kontrolnih uzoraka , n = 30.

Rešenje Zadovoljen je kriterijum (2.44) za zamenu binomne Poasonovom raspodelom:

59.0;2030 <=>= npn

U tabeli su date kumulativne verovatnoće P(X < d), tj. vrednosti suma :

( ) ( )∑−=

=

−=<1

0 !

dx

x

npx

ex

npdXP

za različite vrednosti d i np = 30⋅0.3 = 0.9.

Tabela uz Primer 4.

d P(X < d)

1 0.4066

2 0.7725

3 0.9371

4 0.9865

Page 263: Osnovi inzenjerske statistike

14

5 0.9977

6 0.9997

Tražene granice A i W, dobijamo kao najmanje celobrojne vrednosti d koje zadovoljavaju relacije (5a) i (5b), redom, pri čemu je binomna raspodela aproksimirana Poasonovom. Iz Tabele nalazimo: W = 4, A = 6

Kontinualna kontrolna promenljiva

Pretpostavimo da su uzorci od po n merenja uzeti u pravilnim vremenskim intervalima, sa ciljem :

1. Kontrole srednjeg kvaliteta procesa, čiji pokazatelj je aritmetička sredina n merenja, tj. uzoračka srednja vrednost .

2. Praćenja variranja merenih vrednosti u okviru uzoraka.

Kontrola srednjeg kvaliteta procesa vrši se pomoću tzv. x -karte, u koju se unose uzastopne srednje vrednosti uzoraka. Pošto je standardno odstupanje aritmetičke sredine

jednako n/σ , ordinate linija akcije su nT /3σ± , gde je T nominalna vrednost.

Praćenje varijacija merenih vrednosti se izvodi pomoću R-karti u koje se unose vrednosti intervala (razmaka) varijacije uzoraka. Interval varijacije uzorka se dobija kao razlika najveće i najmanje vrednosti u uzorku:

minmax xxR −= (6)

i predstavlja meru rasipanja vrednosti oko centra, kao i standardno odstupanje. R je pogodna statistika za poređenje varijacija u uzorcima istih obima. Logično je očekivati da raspodela R-vrednosti ima očekivanu vrednost, koja je u vezi sa standardnim odstupanjem. Zaista, ako su merenja normalno raspodeljena, srednja vrednost za R, kao i kvantili Rα proporcionalni su standardnom odstupanju. Tako imamo:

( ) σ= 1kRM (7)

σ= 2975.0 kR (7a)

σ= 3999.0 kR (7b)

U Tabeli 10.1 date su vrednosti parametara k1, k2 i k3 za razne obime ozoraka.

Tabela 10.1 - Vrednosti parametara k1, k2 i k3

n 2 3 4 5 6 7 8 9 10 11 12

k1 1.13 1.69 2.06 2.33 2.53 2.70 2.85 2.97 3.08 3.17 3.26

k2 3.17 3.68 3.98 4.20 4.36 4.49 4.61 4.70 4.79 4.86 4.92

k3 4.65 5.06 5.31 5.48 5.62 5.73 5.82 5.90 5.97 6.04 6.09

Page 264: Osnovi inzenjerske statistike

15

Treba napomenuti da se u slučaju kada obim uzoraka, n nije konstantan za korišćenje ove tabele se usvaja aritmetička sredina pojedinih obima, tj. najbliži ceo broj. R-karta , s obzirom da je uvek R > 0 nema dve već samo jednu liniju akcije i to sa ordinatom R0.999 = k3σ , odnosno verovatnoća da će, ako je proces pod kontrolom, interval varijacije uzetog uzorka biti iznad linije akcije je samo 0.001. Granica upozorenja na karti ima ordinatu R0.975 = k2σ.

Do sada smo smatrali standardno odstupanje, σ poznatim. Međutim, ono se po pravilu procenjuje na osnovu prethodnih merenja. Imajući u vidu vezu između očekivane vrednosti intervala varijacije, R i standardnog odstupanja, ocena σ se može jednostavnije dobiti iz aritmetičke sredine R kao :

1/ kR≈σ (8)

nego iz srednjeg kvadrata odstupanja, s2.

PRIMER 5 Propisana vrednost kontrolne promenljive za neki proces je, T = 50. U pravilnim vremenskim intervalima uzimano je po 5 ponovljenih merenja kontrolne promenljive i za period u kome je proces bio pod kontrolom, dobijena je uzoračka srednja vrednost intervala varijacije, 0.5=R . Treba formirati kontrolne karte za proces.

Rešenje

Potrebno je odrediti ordinate kontrolne granice i granice upozorenja za −x i −R kartu. Najpre procenjujemo standardno odstupanje iz aritmetičke sredine

intervala varijacije (6) :

15.233.2

5

1

===σk

R

Za −x kartu, granice upozorenja su : 92.1505/250 ±=σ± , a

linije akcije : 88.2505/350 ±=σ±

Za −R kartu, granica upozorenja je : 0.90.533.2

20.4

1

2 ==Rk

k , a

linija akcije : 8.110.533.2

48.5

1

3 ==Rk

k

PRIMER 6 Nominalna vrednost kontrolne promenljive za neki proces određena je kao ukupna srednja vrednost za sve uzorke uzete u periodu dok je proces bio pod kontrolom T = x = 10.80 . Treba formirati kontrolne karte za uzorke obima 4, ako je 46.0=R .

Rešenje

223.006.2

46.0

1

===σk

R

Za −x kartu, granice upozorenja na su : 22.080.104/280.10 ±=σ± , a

linije akcije : 33.080.104/380.10 ±=σ±

Page 265: Osnovi inzenjerske statistike

16

Za −R kartu, granica upozorenja je : 89.046.006.2

98.3

1

2 ==Rk

k , a linija akcije:

19.146.006.2

31.5

1

3 ==Rk

k

Granice kvaliteta i granice toleranicije

Često, umesto jedne, nominalne vrednosti (target) postoji oblast prihvatljivih vrednosti kontrolne promenljive ograničena granicama kvaliteta. Na primer, zadaju se donja i gornja granica sadržaja neke supstance u proizvodu ili granice dozvoljenih dimenzija proizvedenog elementa. Trebalo bi očekivati da nominalna vrednost (ordinata centralne linije kontrolne karte) bude jednaka aritmetičkoj sredini zadatih granica kvaliteta, ali to nije obavezno, tj. “srednji” zadati kvalitet se može razlikovati od ukupne srednje vrednosti kontrolne promenljive, x određene iz uzoraka u periodu dok je proces pod kontrolom.

Pretpostavimo da je u periodu dok je proces pod kontrolom uzet niz uzoraka obima n i iz izmerenih vrednosti kontrolne promenljive određena ukupna srednja vrednost x i aritmetička sredina intervala varijacije, R . Kao granice tolerancije, u skladu sa jedn. (3a,b i 8) uzimamo:

1

3

k

Rx ±

Ako one nisu upale u oblast između granica kvaliteta neophodno je :

(a) prilagoditi srednju vrednost kontrolne promenljive u procesu, ili

(b) smanjiti nepreciznost, tj.standardno odstupanje σ, odnosno interval varijacije, R.

Posebno, ako je odstojanje između granica kvaliteta manje od 6σ, jasno je da je tada neophodno ili smanjiti σ ako je moguće, ili promeniti granice kvaliteta.

Sa druge strane, ako su granice tolerancije znatno niže od granica kvaliteta znači da se proizvodi “suviše dobar” proizvod , pa se u cilju sniženja troškova proizvodnje proces menja tako da se one prošire do granica kvaliteta.

PRIMER 7 Granice kvaliteta za neki proizvod su: x = 15.0 ± 6.0. Radi formiranja −x i −R kontrolnih karti uzeto je 15 uzoraka iz procesa obima n = 4 (tabela). Inspekcijom

uzoračkih srednjih vrednosti kontrolne promenljive i uzoračkih intervala varijacije, najpre odstraniti sumnjive vrednosti koje ukazuju da proces nije bio pod kontrolom kada su odgovarajući uzorci uzeti. Zatim, iz preostalih vrednosti definisati centralne i kontrolne linije na −x i −R karti. Konačno, proveriti da li su granice tolerancije za kontrolnu promenljvu x unutar datih granica kvaliteta.

Tabela uz primer 7.

Uzorak x R Uzorak x R Uzorak x R

Page 266: Osnovi inzenjerske statistike

17

1 16.1 3.0 6 15.7 2.7 11 15.3 13.8

2 15.2 2.1 7 15.2 2.3 12 17.8 14.2

3 14.2 5.6 8 15.0 3.8 13 15.9 4.8

4 13.9 2.4 9 16.5 5.0 14 14.6 5.0

5 15.4 4.1 10 14.9 2.9 15 15.2 2.2

Rešenje

Provera x vrednosti ne ukazuje na sumnjive rezultate koji uočljivo odstupaju od drugih. Međutim, dve od R vrednosti i to 11. i 12. su sumnjive (outliers) i radi eventualnog odbacivanja primenićemo test homogenosti rezultata merenja objašnjen u poglavlju 7.10 (Grubbs test). Pošto su u pitanju dve sumnjive krajnje velike vrednosti, testiramo prvo manju od njih - sa rednim brojem 11., tako što odbacujemo veću sumnjivu vrednost (sa rednim brojem 12.) i računamo aritmetičku, R sredinu i standardnu grešku, sR preostalih 14 vrednosti R

536.9max,99.2,26.4 11 =−=−== RRRRsR iR

gde je vrednost test-statistike Grubbs testa:

19.399.2

536.9==g

Iz tabele TabA.5 uz usvojeni nivo značajnosti 01.0=α određujemo kritičnu vrednost Gn,α

76.201.0,14, ==α ggn

Pošto je 3.19 > 2.76, prihvatamo hipotezu da je u pitanju grubo odstupanje. Ovde to znači da je proces u toku uzimanja 11. uzorka bio van kontrole. Naravno to vredi i za 12. uzorak, koji se još više razlikuje od aritmetičke sredine, 4.26.

Alternativno, test smo mogli da izvedemo tako što za svih 15 vrednosti R izračunamo aritmetičku sredinu :

93.4=R

i gornju kontrolnu liniju R- karte :

7.1206.2

93.431.5

1

3999.0 =

⋅== R

k

kR

Pošto obe sumnjive vrednosti prekoračuju R0.999, zaključujemo da su one rezultat ispada procesa iz kontrole i odstranjujemo ih .

Sada možemo da definišemo kontrolne karte, iz preostalih 13 uzoraka: 1.-10. i 13.-15. računamo :

x = 15.22; 5.3=R

Page 267: Osnovi inzenjerske statistike

18

Tako su pozicije linija akcije na x - karti : 57.222.154

3

1

±=±k

Rx

Ordinata gornje akcione linije R -karte je : 1.906.2

53.331.5

1

3999.0 =

⋅== R

k

kR

Na slici su date kontrolne karte sa unetim vrednostima za 13 uzoraka.

0 2 4 6 8 10 12 14 1612

14

16

18

20

uzorak

x-

gornja linija akcije

donja linija akcije

0 2 4 6 8 10 12 14 160

2

4

6

8

10

uzorak

R

gornja linija akcije

Slika uz Primer 6.

Konačno, možemo da zaključimo da su granice tolerancije :

]36.20,08.10[14.522.153

1

⇒±=±k

Rx

unutar zadatih granica kvaliteta : 15.0 ± 6.0 ]21,9[⇒

Kusum karte

Na kontrolnim kartama opisanim u prethodnim poglavljima teško je detektovati promene u srednjoj vrednosti kontrolne promenljive, tj. one zbog relativno velikih

Page 268: Osnovi inzenjerske statistike

19

rezidualnih varijacija često ostaju nezapažene (“pokrivene” rezidualnim varijacijama). Naime, svaka pojedinačna tačka se poredi nezavisno od ostalih sa kontrolnim granicama, a promene srednje vrednosti bi bile uočljivije kad bi se na neki način kombinovala uzastopn merenja. Zato su osmišljene kusum (cusum) karte koje omogućuju lakše detektovanje poremećaja srednje vrednosti.

U kusum kartu, čiji naziv predstavlja skraćenicu za “kumulativna suma”(cumulative sum), ucrtavaju se kumulativne sume odstupanja vrednosti kontrolne promenljive od nominalne. Kumulativna suma, St u trenutku t data je izrazom:

( )∑≤

−=tp

pt TxS (9)

xp - kontrolna promenljive u momentu p

T - nominalna vrednost (target)

Na slici 10.8. uporedo su prikazani procesni podaci u kontrolnoj i kusum karti.

0 5 10 15 20 250

5

10

15

20

25

30

uzorak

kont

roln

a pr

om.

U.C.L

L.C.L

T

τ

0 5 10 15 20 25-10

0102030405060

uzorak

St

τ

Sl. 10.8 Poređenje kontrolne i kusum karte

Uočavamo da se srednja vrednost kontrolne promenljive promenila oko momenta τ i od tog momenta tačke u kusum karti pokazuju jasan postojan trend, dok u kontrolnoj karti, pošto tačke i dalje leže između kontrolnih granica, nema jasne evidencije tog poremećaja. Ako se, na primer, na osnovu x - kontrolna karte formira kusum karta, tada će se detektovati promena aritmetičke sredine (x ), odnosno srednje vrednosti merene veličine, a na osnovu R - karte će se odrediti promena u aritmetičkoj sredini intervala varijacije ( R ) odnosno standardnog odstupanja merene veličine.

Lako je izvesti sledeći rekurentan postupak za računanje tačaka u kusum karti:

Page 269: Osnovi inzenjerske statistike

20

( ) ,...3,2,1

11

=−+=

−=

−tTxSS

TxS

ttt

Ostaje da pokažemo da je odstupanje “lokalne” srednje vrednosti kontrolne promenljive od nominalne vrednosti u vezi sa nagibom krive u kusum karti. Lokalna srednja vrednost, Lx za tačke xm do xn ( m < n) jednaka je :

( )

mn

SST

mn

TxT

mn

xx mn

n

mi

n

mii

iL

−+=

+=−

= ∑∑

+=

+=

1

1

odnosno:

nagibkTxL ×+=

gde je nagib jednak nagibu linije koja povezuje tačke Sm i Sn u karti, a k je koeficijent koji zavisi od odabrane razmere na x - i y- osama kusum karte. Jasno je da pozitivan nagib ukazuje na porast lokalne srednje vrednosti u odnosu na nominalnu vrednost, dok negativan nagib govori o padu srednje vrednosti. Uočljivost poremećaja srednje vrednosti, naravno, zavisi od odabrane razmere za ose kusum karte. Praktična preporuka je da razmeru treba odabrati tako da promena srednje vrednosti od 2σ u odnosu na nominalnu ima za rezultat grafik sa nagibom od 450 [Wetherill, 1977].

U slučaju da nominalna vrednost nije unapred precizno definisana kusum karta se mora računati u odnosu na neku referentnu vrednost, koju treba pažljivo odabrati. Kao referentnu vrednost treba odabrati onu koja je bliska ukupnoj aritmetičkoj sredini svih merenja jer je mnogo lakše uočavati promene srednje vrednosti ako nagib menja znak.

Detektovanje poremećaja procesa

Za objektivno detektovanje poremećaja procesa, koriste se dva postupka :

10 Metod V-maske (V- mask)

20 Metod intervala odluke (decision interval)

Metod V-maske se bazira na unetoj maski oblika slova V u kusum kartu čije je teme na rastojanju d od poslednje tačke (slika 10.9.). Ugao između krakova maske i horizontale označen je sa θ. Ako su sve prethodne tačke unutar V-maske, kao što je to slučaj na slici, smatra se da je proces pod kontrolom. Položaj jedne ili više tačaka izvan V-maske ukazuje na poremećaj procesa. Da bi V-maska dala pouzdane rezultate neophodan je odgovarajući izbor vrednosti parametara d i θ. Diskusija izbora parametara data je npr. u [Wetherill, 1977]. Ako su d i θ vrednost prevelike, V-maska neće pokazati poremećaj. Premale vrednosti pak, usloviće puno “iskakanja” i otežati detekciju pravog poremećaja.

Page 270: Osnovi inzenjerske statistike

21

-1

0

1

2

3

4

5

0 2 4 6 8 10 12

vreme

St

d

θα

Sl. 10.9 Prikaz V-maske

Metod intervala odluke, zasniva se na dve veličine: referentna vrednost i interval odluke. Referentna vrednost se bira na sredini između nominalne i neke nezadovoljavajuće vrednosti. Svaki put kada se uoči vrednost koja od nominalne odstupa više nego referentna vrednost Ref, počinje nov proračun kusum karte sa Ref kao referentnom tačkom. Ako tačke u kusum karti ponovo padnu u blizini nule znači da je proces pod kontrolom (varijacije su bile slučajne). Ako, pak, postoji trend koji konačno dovodi do odstupanja od nule većeg od odabranog intervala odluke, smatra se da je u tom momentu došlo do poremećaja procesa.

ZADACI

10.1 Ako su u Primeru 2. postavljeni p1=10% i p2=15% odrediti a) rizike proizvođača i rizike kupca. b) kako će se promeniti rizici proizvođača i kupca ako se primeni dvoetapna kontrola prikazana na slici 10.3 ako je c3=5

10.2 Komponente za pogonske mašine se izrađuju na strugu. Merenja dimenzije se vrše u uzorcima od n = 5 komada na svakih 30 min i određene su aritmetičke sredine x . U slučaju potrebe ili sumnje, se merenja vrše u kraćim intervalima. U periodu kada je proces bio pod kontrolom određene su nominalne vrednosti: 500.3=x , 3107.0 −×=R . Data je tabela odstupanja od nominalne vrednosti i opsega varijacije u toku radnog dana.

Br. Vreme Odstupanje ( ) 310×− xx

Opseg varijacije 310×R

1 7.30 0.32 0.3 2 7.35 0.20 0.2 3 8.00 -0.06 0.5 4 8.30 0.02 0.6 5 9.00 -0.26 0.7 6 9.05 -0.36 0.4 7 10.30 -0.16 1.0 8 11.00 0.14 0.8 9 11.30 0.22 0.7 10 12.00 0.02 0.6 11 12.45 0.10 1.1

Page 271: Osnovi inzenjerske statistike

22

12 13.15 0.08 0.6 13 13.20 -0.14 0.8 14 13.50 -0.10 0.9 15 14.20 0.10 0.7 16 16.15 1.62 0.8

a) Ako je granica kvaliteta [3.498,3.502] da li je ovaj interval u granicama tolerancije?

b) Izraditii x i R kontrolnu kartu. U karte uneti nominalne vrednosti, linije upozorenja i linije akcije. U procesu je posle merenja sa brojem 6 preduzeta korigujuća akcija. Da li se to na x kontrolnoj karti može primetiti?

10.3 Kontroliše se sadržaj rastvorenog gvožđa u boji, x za odevne predmete (ppm) pomoću x i R kontrolnih karata. Svaki uzorak je obima n = 5 i pri tome je na osnovu većeg broja uzoraka dobijeno 6.15=x , 36.3=R a) odrediti linije akcije i linije upozorenja za x i R kontrolnu kartu b) pod pretpostavkom de je proces pod kontrolom tj. da nema promene u srednjim vrednostima i opsegu varijacije, proceniti koji procenat pojedinih merenja prevazilazi maksimalan dozvoljen sadržaj od 18 ppm

Page 272: Osnovi inzenjerske statistike

243

Prilog A - Statističke tabele Tabela A1 - Laplasova funkcija Tabela A2 - t raspodela Tabela A3 - χ2 raspodela Tabela A4a - Fišerova raspodela (α = 0.05) Tabela A4b - Fišerova raspodela (α = 0.01) Tabela A5 - g raspodela. Vrednosti gn,α za koje važi P(G ≥ gn,α) = α

Page 273: Osnovi inzenjerske statistike

244

Tabela A1 - Vrednosti Laplasove funkcije: ∫ −

=Φx t

dtex0

2

2

2

1)(

π

x Φ( x ) x Φ( x ) x Φ( x ) x Φ( x ) x Φ( x )

0.00 0.0000 0.52 0.1985 1.04 0.3508 1.56 0.4406 2.16 0.4846 0.01 0.0040 0.53 0.2019 1.05 0.3531 1.57 0.4418 2.18 0.4854 0.02 0.0080 0.54 0.2054 1.06 0.3554 1.58 0.4429 2.20 0.4861 0.03 0.0120 0.55 0.2088 1.07 0.3577 1.59 0.4441 2.22 0.4868 0.04 0.0160 0.56 0.2123 1.08 0.3599 1.60 0.4452 2.24 0.4875 0.05 0.0199 0.57 0.2157 1.09 0.3621 1.61 0.4463 2.26 0.4881 0.06 0.0239 0.58 0.2190 1.10 0.3643 1.62 0.4474 2.28 0.4887 0.07 0.0279 0.59 0.2224 1.11 0.3665 1.63 0.4484 2.30 0.4893 0.08 0.0319 0.60 0.2257 1.12 0.3686 1.64 0.4495 2.32 0.4898 0.09 0.0359 0.61 0.2291 1.13 0.3708 1.65 0.4505 2.34 0.4904 0.10 0.0398 0.62 0.2324 1.14 0.3729 1.66 0.4515 2.36 0.4909 0.11 0.0438 0.63 0.2357 1.15 0.3749 1.67 0.4525 2.38 0.4913 0.12 0.0478 0.64 0.2389 1.16 0.3770 1.68 0.4535 2.40 0.4918 0.13 0.0517 0.65 0.2422 1.17 0.3790 1.69 0.4545 2.42 0.4922 0.14 0.0557 0.66 0.2454 1.18 0.3810 1.70 0.4554 2.44 0.4927 0.15 0.0596 0.67 0.2486 1.19 0.3830 1.71 0.4564 2.46 0.4931 0.16 0.0636 0.68 0.2517 1.20 0.3849 1.72 0.4573 2.48 0.4934 0.17 0.0675 0.69 0.2549 1.21 0.3869 1.73 0.4582 2.50 0.4938 0.18 0.0714 0.70 0.2580 1.22 0.3888 1.74 0.4591 2.52 0.4941 0.19 0.0753 0.71 0.2611 1.23 0.3907 1.75 0.4599 2.54 0.4945 0.20 0.0793 0.72 0.2642 1.24 0.3925 1.76 0.4608 2.56 0.4948 0.21 0.0832 0.73 0.2673 1.25 0.3944 1.77 0.4616 2.58 0.4951 0.22 0.0871 0.74 0.2704 1.26 0.3962 1.78 0.4625 2.60 0.4953 0.23 0.0910 0.75 0.2734 1.27 0.3980 1.79 0.4633 2.62 0.4956 0.24 0.0948 0.76 0.2764 1.28 0.3997 1.80 0.4641 2.64 0.4959 0.25 0.0987 0.77 0.2794 1.29 0.4015 1.81 0.4649 2.66 0.4961 0.26 0.1026 0.78 0.2823 1.30 0.4032 1.82 0.4656 2.68 0.4963 0.27 0.1064 0.79 0.2852 1.31 0.4049 1.83 0.4664 2.70 0.4965 0.28 0.1103 0.80 0.2881 1.32 0.4066 1.84 0.4671 2.72 0.4967 0.29 0.1141 0.81 0.2910 1.33 0.4082 1.85 0.4678 2.74 0.4969 0.30 0.1179 0.82 0.2939 1.34 0.4099 1.86 0.4686 2.76 0.4971 0.31 0.1217 0.83 0.2967 1.35 0.4115 1.87 0.4693 2.78 0.4973 0.32 0.1255 0.84 0.2995 1.36 0.4131 1.88 0.4699 2.80 0.4974 0.33 0.1293 0.85 0.3023 1.37 0.4147 1.89 0.4706 2.82 0.4976 0.34 0.1331 0.86 0.3051 1.38 0.4162 1.90 0.4713 2.84 0.4977 0.35 0.1368 0.87 0.3078 1.39 0.4177 1.91 0.4719 2.86 0.4979 0.36 0.1406 0.88 0.3106 1.40 0.4192 1.92 0.4726 2.88 0.4980 0.37 0.1443 0.89 0.3133 1.41 0.4207 1.93 0.4732 2.90 0.4981 0.38 0.1480 0.90 0.3159 1.42 0.4222 1.94 0.4738 2.92 0.4982 0.39 0.1517 0.91 0.3186 1.43 0.4236 1.95 0.4744 2.94 0.4984 0.40 0.1554 0.92 0.3212 1.44 0.4251 1.96 0.4750 2.96 0.4985 0.41 0.1591 0.93 0.3238 1.45 0.4265 1.97 0.4756 2.98 0.4986 0.42 0.1628 0.94 0.3264 1.46 0.4279 1.98 0.4761 3.00 0.4987 0.43 0.1664 0.95 0.3289 1.47 0.4292 1.99 0.4767 3.20 0.4993 0.44 0.1700 0.96 0.3315 1.48 0.4306 2.00 0.4772 3.40 0.4997 0.45 0.1736 0.97 0.3340 1.49 0.4319 2.02 0.4783 3.60 0.4998 0.46 0.1772 0.98 0.3365 1.50 0.4332 2.04 0.4793 3.80 0.499928 0.47 0.1808 0.99 0.3389 1.51 0.4345 2.06 0.4803 4.00 0.499968 0.48 0.1844 1.00 0.3413 1.52 0.4357 2.08 0.4812 4.20 0.499987 0.49 0.1879 1.01 0.3438 1.53 0.4370 2.10 0.4821 4.50 0.499997 0.50 0.1915 1.02 0.3461 1.54 0.4382 2.12 0.4830 5.00 0.4999997 0.51 0.1950 1.03 0.3485 1.55 0.4394 2.14 0.4838

Page 274: Osnovi inzenjerske statistike

245

Tabela A2 - t raspodela: Vrednosti td,α za koje važi: P(|T|≥ td,α) = α

d\α 0.8 0.6 0.4 0.2 0.1 0.05 0.02 0.01 1 0.325 0.727 1.376 3.078 6.314 12.706 31.821 63.656 2 0.289 0.617 1.061 1.886 2.920 4.303 6.965 9.925 3 0.277 0.584 0.978 1.638 2.353 3.182 4.541 5.841 4 0.271 0.569 0.941 1.533 2.132 2.776 3.747 4.604 5 0.267 0.559 0.920 1.476 2.015 2.571 3.365 4.032 6 0.265 0.553 0.906 1.440 1.943 2.447 3.143 3.707 7 0.263 0.549 0.896 1.415 1.895 2.365 2.998 3.499 8 0.262 0.546 0.889 1.397 1.860 2.306 2.896 3.355 9 0.261 0.543 0.883 1.383 1.833 2.262 2.821 3.250 10 0.260 0.542 0.879 1.372 1.812 2.228 2.764 3.169 11 0.260 0.540 0.876 1.363 1.796 2.201 2.718 3.106 12 0.259 0.539 0.873 1.356 1.782 2.179 2.681 3.055 13 0.259 0.538 0.870 1.350 1.771 2.160 2.650 3.012 14 0.258 0.537 0.868 1.345 1.761 2.145 2.624 2.977 15 0.258 0.536 0.866 1.341 1.753 2.131 2.602 2.947 16 0.258 0.535 0.865 1.337 1.746 2.120 2.583 2.921 17 0.257 0.534 0.863 1.333 1.740 2.110 2.567 2.898 18 0.257 0.534 0.862 1.330 1.734 2.101 2.552 2.878 19 0.257 0.533 0.861 1.328 1.729 2.093 2.539 2.861 20 0.257 0.533 0.860 1.325 1.725 2.086 2.528 2.845 21 0.257 0.532 0.859 1.323 1.721 2.080 2.518 2.831 22 0.256 0.532 0.858 1.321 1.717 2.074 2.508 2.819 23 0.256 0.532 0.858 1.319 1.714 2.069 2.500 2.807 24 0.256 0.531 0.857 1.318 1.711 2.064 2.492 2.797 25 0.256 0.531 0.856 1.316 1.708 2.060 2.485 2.787 26 0.256 0.531 0.856 1.315 1.706 2.056 2.479 2.779 27 0.256 0.531 0.855 1.314 1.703 2.052 2.473 2.771 28 0.256 0.530 0.855 1.313 1.701 2.048 2.467 2.763 29 0.256 0.530 0.854 1.311 1.699 2.045 2.462 2.756 30 0.256 0.530 0.854 1.310 1.697 2.042 2.457 2.750

∞ 0.253 0.524 0.842 1.282 1.645 1.960 2.327 2.576

Page 275: Osnovi inzenjerske statistike

246

Tabela A3 - χ2 raspodela. Vrednosti χ2d,p za koje važi: P(χ2 ≥χ2

d,p ) = p

d\p 0.99 0.95 0.8 0.5 0.2 0.1 0.05 0.01 1 0.000 0.004 0.064 0.455 1.642 2.706 3.841 6.635 2 0.020 0.103 0.446 1.386 3.219 4.605 5.991 9.210 3 0.115 0.352 1.005 2.366 4.642 6.251 7.815 11.345 4 0.297 0.711 1.649 3.357 5.989 7.779 9.488 13.277 5 0.554 1.145 2.343 4.351 7.289 9.236 11.070 15.086 6 0.872 1.635 3.070 5.348 8.558 10.645 12.592 16.812 7 1.239 2.167 3.822 6.346 9.803 12.017 14.067 18.475 8 1.647 2.733 4.594 7.344 11.030 13.362 15.507 20.090 9 2.088 3.325 5.380 8.343 12.242 14.684 16.919 21.666 10 2.558 3.940 6.179 9.342 13.442 15.987 18.307 23.209 11 3.053 4.575 6.989 10.341 14.631 17.275 19.675 24.725 12 3.571 5.226 7.807 11.340 15.812 18.549 21.026 26.217 13 4.107 5.892 8.634 12.340 16.985 19.812 22.362 27.688 14 4.660 6.571 9.467 13.339 18.151 21.064 23.685 29.141 15 5.229 7.261 10.307 14.339 19.311 22.307 24.996 30.578 16 5.812 7.962 11.152 15.338 20.465 23.542 26.296 32.000 17 6.408 8.672 12.002 16.338 21.615 24.769 27.587 33.409 18 7.015 9.390 12.857 17.338 22.760 25.989 28.869 34.805 19 7.633 10.117 13.716 18.338 23.900 27.204 30.144 36.191 20 8.260 10.851 14.578 19.337 25.038 28.412 31.410 37.566 21 8.897 11.591 15.445 20.337 26.171 29.615 32.671 38.932 22 9.542 12.338 16.314 21.337 27.301 30.813 33.924 40.289 23 10.196 13.091 17.187 22.337 28.429 32.007 35.172 41.638 24 10.856 13.848 18.062 23.337 29.553 33.196 36.415 42.980 25 11.524 14.611 18.940 24.337 30.675 34.382 37.652 44.314 26 12.198 15.379 19.820 25.336 31.795 35.563 38.885 45.642 27 12.878 16.151 20.703 26.336 32.912 36.741 40.113 46.963 28 13.565 16.928 21.588 27.336 34.027 37.916 41.337 48.278 29 14.256 17.708 22.475 28.336 35.139 39.087 42.557 49.588 30 14.953 18.493 23.364 29.336 36.250 40.256 43.773 50.892

Page 276: Osnovi inzenjerske statistike

Tabela A4a - Fišerova raspodela. Vrednosti Fα (d1,d2) za koje važi P(F(d1,d2)≥Fα(d1,d2)) = α α = 0.05

d2\d1 1 2 3 4 5 6 8 10 12 15 20 24 30

1 161.45 199.50 215.71 224.58 230.16 233.99 238.88 241.88 243.90 245.95 248.02 249.05 250.10 2 18.51 19.00 19.16 19.25 19.30 19.33 19.37 19.40 19.41 19.43 19.45 19.45 19.46 3 10.13 9.55 9.28 9.12 9.01 8.94 8.85 8.79 8.74 8.70 8.66 8.64 8.62 4 7.71 6.94 6.59 6.39 6.26 6.16 6.04 5.96 5.91 5.86 5.80 5.77 5.75 5 6.61 5.79 5.41 5.19 5.05 4.95 4.82 4.74 4.68 4.62 4.56 4.53 4.50 6 5.99 5.14 4.76 4.53 4.39 4.28 4.15 4.06 4.00 3.94 3.87 3.84 3.81 7 5.59 4.74 4.35 4.12 3.97 3.87 3.73 3.64 3.57 3.51 3.44 3.41 3.38 8 5.32 4.46 4.07 3.84 3.69 3.58 3.44 3.35 3.28 3.22 3.15 3.12 3.08 9 5.12 4.26 3.86 3.63 3.48 3.37 3.23 3.14 3.07 3.01 2.94 2.90 2.86 10 4.96 4.10 3.71 3.48 3.33 3.22 3.07 2.98 2.91 2.85 2.77 2.74 2.70 11 4.84 3.98 3.59 3.36 3.20 3.09 2.95 2.85 2.79 2.72 2.65 2.61 2.57 12 4.75 3.89 3.49 3.26 3.11 3.00 2.85 2.75 2.69 2.62 2.54 2.51 2.47 13 4.67 3.81 3.41 3.18 3.03 2.92 2.77 2.67 2.60 2.53 2.46 2.42 2.38 14 4.60 3.74 3.34 3.11 2.96 2.85 2.70 2.60 2.53 2.46 2.39 2.35 2.31 15 4.54 3.68 3.29 3.06 2.90 2.79 2.64 2.54 2.48 2.40 2.33 2.29 2.25 16 4.49 3.63 3.24 3.01 2.85 2.74 2.59 2.49 2.42 2.35 2.28 2.24 2.19 17 4.45 3.59 3.20 2.96 2.81 2.70 2.55 2.45 2.38 2.31 2.23 2.19 2.15 18 4.41 3.55 3.16 2.93 2.77 2.66 2.51 2.41 2.34 2.27 2.19 2.15 2.11 19 4.38 3.52 3.13 2.90 2.74 2.63 2.48 2.38 2.31 2.23 2.16 2.11 2.07 20 4.35 3.49 3.10 2.87 2.71 2.60 2.45 2.35 2.28 2.20 2.12 2.08 2.04 21 4.32 3.47 3.07 2.84 2.68 2.57 2.42 2.32 2.25 2.18 2.10 2.05 2.01 22 4.30 3.44 3.05 2.82 2.66 2.55 2.40 2.30 2.23 2.15 2.07 2.03 1.98 23 4.28 3.42 3.03 2.80 2.64 2.53 2.37 2.27 2.20 2.13 2.05 2.01 1.96 24 4.26 3.40 3.01 2.78 2.62 2.51 2.36 2.25 2.18 2.11 2.03 1.98 1.94 25 4.24 3.39 2.99 2.76 2.60 2.49 2.34 2.24 2.16 2.09 2.01 1.96 1.92 30 4.17 3.32 2.92 2.69 2.53 2.42 2.27 2.16 2.09 2.01 1.93 1.89 1.84 40 4.08 3.23 2.84 2.61 2.45 2.34 2.18 2.08 2.00 1.92 1.84 1.79 1.74 60 4.00 3.15 2.76 2.53 2.37 2.25 2.10 1.99 1.92 1.84 1.75 1.70 1.65

Page 277: Osnovi inzenjerske statistike

Tabela A4b - Fišerova raspodela. Vrednosti Fα (d1,d2) za koje važi P(F(d1,d2)≥Fα(d1,d2)) = α α = 0.01

d2\d1 1 2 3 4 5 6 8 10 12 15 20 24 30

1 4052.18 4999.34 5403.53 5624.26 5763.96 5858.95 5980.95 6055.93 6106.68 6156.97 6208.66 6234.27 6260.35 2 98.50 99.00 99.16 99.25 99.30 99.33 99.38 99.40 99.42 99.43 99.45 99.46 99.47 3 34.12 30.82 29.46 28.71 28.24 27.91 27.49 27.23 27.05 26.87 26.69 26.60 26.50 4 21.20 18.00 16.69 15.98 15.52 15.21 14.80 14.55 14.37 14.20 14.02 13.93 13.84 5 16.26 13.27 12.06 11.39 10.97 10.67 10.29 10.05 9.89 9.72 9.55 9.47 9.38 6 13.75 10.92 9.78 9.15 8.75 8.47 8.10 7.87 7.72 7.56 7.40 7.31 7.23 7 12.25 9.55 8.45 7.85 7.46 7.19 6.84 6.62 6.47 6.31 6.16 6.07 5.99 8 11.26 8.65 7.59 7.01 6.63 6.37 6.03 5.81 5.67 5.52 5.36 5.28 5.20 9 10.56 8.02 6.99 6.42 6.06 5.80 5.47 5.26 5.11 4.96 4.81 4.73 4.65 10 10.04 7.56 6.55 5.99 5.64 5.39 5.06 4.85 4.71 4.56 4.41 4.33 4.25 11 9.65 7.21 6.22 5.67 5.32 5.07 4.74 4.54 4.40 4.25 4.10 4.02 3.94 12 9.33 6.93 5.95 5.41 5.06 4.82 4.50 4.30 4.16 4.01 3.86 3.78 3.70 13 9.07 6.70 5.74 5.21 4.86 4.62 4.30 4.10 3.96 3.82 3.66 3.59 3.51 14 8.86 6.51 5.56 5.04 4.69 4.46 4.14 3.94 3.80 3.66 3.51 3.43 3.35 15 8.68 6.36 5.42 4.89 4.56 4.32 4.00 3.80 3.67 3.52 3.37 3.29 3.21 16 8.53 6.23 5.29 4.77 4.44 4.20 3.89 3.69 3.55 3.41 3.26 3.18 3.10 17 8.40 6.11 5.19 4.67 4.34 4.10 3.79 3.59 3.46 3.31 3.16 3.08 3.00 18 8.29 6.01 5.09 4.58 4.25 4.01 3.71 3.51 3.37 3.23 3.08 3.00 2.92 19 8.18 5.93 5.01 4.50 4.17 3.94 3.63 3.43 3.30 3.15 3.00 2.92 2.84 20 8.10 5.85 4.94 4.43 4.10 3.87 3.56 3.37 3.23 3.09 2.94 2.86 2.78 21 8.02 5.78 4.87 4.37 4.04 3.81 3.51 3.31 3.17 3.03 2.88 2.80 2.72 22 7.95 5.72 4.82 4.31 3.99 3.76 3.45 3.26 3.12 2.98 2.83 2.75 2.67 23 7.88 5.66 4.76 4.26 3.94 3.71 3.41 3.21 3.07 2.93 2.78 2.70 2.62 24 7.82 5.61 4.72 4.22 3.90 3.67 3.36 3.17 3.03 2.89 2.74 2.66 2.58 25 7.77 5.57 4.68 4.18 3.85 3.63 3.32 3.13 2.99 2.85 2.70 2.62 2.54 30 7.56 5.39 4.51 4.02 3.70 3.47 3.17 2.98 2.84 2.70 2.55 2.47 2.39 40 7.31 5.18 4.31 3.83 3.51 3.29 2.99 2.80 2.66 2.52 2.37 2.29 2.20 60 7.08 4.98 4.13 3.65 3.34 3.12 2.82 2.63 2.50 2.35 2.20 2.12 2.03

Page 278: Osnovi inzenjerske statistike

249

Tabela A5 - g raspodela. Vrednosti gn,α za koje važi P(G ≥ gn,α) = α

n\α 0.1 0.05 0.01

3 1.15 1.15 1.15

4 1.46 1.48 1.50

5 1.67 1.72 1.76

6 1.82 1.89 1.97

7 1.94 2.02 2.14

8 2.03 2.13 2.27

9 2.11 2.22 2.39

10 2.18 2.29 2.48

11 2.23 2.35 2.56

12 2.28 2.41 2.64

13 2.33 2.46 2.70

14 2.37 2.51 2.76

15 2.41 2.55 2.81

16 2.44 2.59 2.85

17 2.47 2.62 2.89

18 2.50 2.65 2.93

19 2.53 2.68 2.97

20 2.56 2.71 3.00

30 2.75 2.91 3.24

40 2.87 3.04 3.38

50 2.96 3.13 3.48

60 3.03 3.20 3.56

70 3.08 3.26 3.62

80 3.13 3.31 3.67

90 3.17 3.35 3.72

100 3.21 3.38 3.75

Page 279: Osnovi inzenjerske statistike

251

Prilog B - Rešenja zadataka Glava 1

1.1 a) 5

1

25

5==p , b)

1771380

5

25

2

5

3

20 =

=p

1.2 a) )1)((

2,2),1)((2 −++

==−++== +

baba

abpabmbabaVn ba

b) 22

2 )(2

,)(ba

abpbaVn ba

+=+== +

1.3

=

=

2

4,

4

6mn (kombinacije 2. klase od elemenata B,C,E i F)

52

6543

!2!6!4!4

!2!4!6!2!2

!4

=⋅

⋅=

⋅=

⋅==n

mp

1.4 9

5,, 6

36

3 === pVmVn ,

1.5 94

,1

4

1

4,

2

9 =

=

= pmn

1.6 a) 1560

1,1,394040

2 ==⋅== pmVn

b) 383

405 20, VmVn ⋅== ,

78

1=p

1.7 a) 28

10=p b)

21

10=p

1.8 a) 8

1=p b)

8

7=p

1.9 14

5=p

1.10 33

4=p

1.11 857.0498

473

499

474

500

475≈⋅⋅=p

1.12 12=n

1.13 8702.0=p

1.14 a) [ ]∏=

−+n

iiiii mPMPmPMP

1

)()()()(

Page 280: Osnovi inzenjerske statistike

252

b)

−− ∏∏==

n

ii

n

ii mPMP

11

)(1)(11

1.15 a) 12

1=p b)

3

1=p c)

9

1=p

1.16 a) 8

5=p b) ( ) ( )

2

1,

8

5== ABPAP c)

8

3=p d)

4

3=p

e) ( )2

1=BAP , ( )

3

2=ABP f) ( )

4

3=BAP , ( )

5

3=ABP g) 1=p

1.17 27.0=p

1.18 a) 9428.0=p b) 998.0=p

Glava 2 2.1 a)

b) 1225

600)(,

35

60)( == XDXM

2.2 nxxpxqn

N

xn

Nq

x

Npxp ,...,1,0),(1)(,)( =−=

=

2.3 p(x) = pqx-1, q = 1 - p, x = 1, 2, …

1)(1

)(...))()(1)(()( 2

1

=−

=+++=∑∞

= xq

xpxqxqxpxp

i

2.4 a) 5,4,3,2,1,1,3.0,5

),5,()( 5 =−==

== − xpqpqp

xpxbxp xx

b) 9692.0=p

c) µx = np = 1.5, D(X) = npq = 1.05 2.5 a) 1042.0=p b) 30=m

2.6 11≥n

2.7 299≥n

2.8 ( ) 00856.05

5

4

5

3

53 5423 =

+

+

=≥ pqpqpXP

2.9 4232.0)3( =<XP , 9502.01)0( =−=> −µeXP 2.10 a) 40.02% b) Zadovoljeni su uslovi (2.44), p=40.59%, %5.1%35.1 <=δ

x 0 1 2 3 p(x) 1/35 12/35 18/35 4/35

Page 281: Osnovi inzenjerske statistike

253

2.11 ( ) 6321.011 ≈−=≥ −λeXP

2.12 a) ( ) %13.400 =>XP b) Potrebne su 3 rezervne mašine. 2.13 a) 2 b) %62.27

2.14 a) 1804.0!3

)3(3

=µ== µ−eXP b) 3233.0]2/1[1)3( 2 =++−=≥ −µµµ eXP

2.15 3315 ≤≤ X

2.16 m1 = 4, m2 = 31

2.17 a) %5.90=ω b) 06.00588.0 ≈=ε

2.18 a) p = 0.9706 b) p = 0.7651

2.19 a) 0668.0)9(1)9( =≤−=> XPXP

b) [ ]

2165.0)5(

)9(

)5(

)5)(9()5/9( =

>

>=

>

>>=>>

XP

XP

XP

XXPXXP

2.20 a) 69.15% b) 1.1,56.499 =σ=µ c) %27.1

2.21 a) 026.0,036.1 =σ=µ

b) ( ) ldint 12026.0036.100151.0036.1673.03.11 22 ≈+−⋅+=

2.22 7888.0=p

2.23 a) ( )

≥<

= −

0 za1

0 za0

teu

ttf u

t , ( ) uTM =λ=1

b) ( ) ( ) 135.0180180 1500

3000

≈==>−

eRTP , 865.0135.01rizik =−=

c) ( ) hu 4998999.0ln

5=−≥

2.24 a) b)

( ) ≥λ

=λ−λ

ecina0

23

3

2

3

2

yeeygy

( ) 0,ecina0

11 >λ ≥λ

= +λ

yyyg

Glava 3

3.1 a) 4=k b) ( ) ( ) <<<<=

ecina0

10,10,

2

yxxyyxF

c) 10,2)( <<= yyyf y d) ( ) 10,2 <<= xxyxf

e) X i Y su nezavisne f)16

3=p

3.2 a) b)

Page 282: Osnovi inzenjerske statistike

254

( ) <<<<=

ecina0

0,1014,

4

xyxyxyxf ( ) ( )

<<−=

ecina0

1015

14 5

yyyyf y

c) zavisne d) 4

1=p

3.3 a) 2λ=c

b)

( ) ( )

≥≥+−−=

+λ−λ−λ−

ecina0

0,01,

yxeeeyxF

yxyx

c) ( ) 0, ≥= − xexf xx

λλ ( ) 0, ≥λ= λ− yeyf yy d) nezavisne

e) ( ) λ−−=≤≤ eXP 110 , ( ) ( ) λ−−=≤≤==≤≤ eXPYXP 110110

( ) ( ) ( ) ( ) ( )22 110101010,10 λ−−=≤≤=≤≤≤≤=≤≤≤≤ eXPYPXPYXP

3.4 a) π= 21k , 0=σ xy

b) 234.2=a

3.5 ( ) ( ) 9332.05.05.14 =+Φ=≤XP , ( ) 0668.09332.014 =−=>XP

( ) ( ) 8700.05.03700.05.0125.15.04

34 =+=+Φ=+

−Φ==≤

yx

yxYXPσµ

( ) ( ) 13.034134 ==≤−==> YXPYXP

3.6 a) 1.78m i 69.9kg b)8.3% c) 0.26% d) kgYkg 6.849.69 << e) mXm 99.172.1 << Glava 4 4.1 a)

4.9 4.95 50

0.2

0.4Poligon

ω

x

4.9 4.95 50

0.2

0.4Histogram

ω

ω

x b) 98.4=x , 025.0=s 4.2 X=*µ

4.3 X=

*1

λ

Page 283: Osnovi inzenjerske statistike

255

4.6 Nepristrasna ocena obima: 3.13210.42142.3 =⋅== dO π . Pristrasna ocena

površine: 228.13924

21 == dSπ

a nepristrasna ocena površine:

218.13925

065.010.42

4

142.3

42

22

2 =

−=

−=

n

sdS dπ

. Nepristrasnost je zanemarljiva.

4.7 502.0

2

=

≥ σn

4.9 96.1=x

b

σ, 620.096.1 ==−= xab σ

Glava 5

5.1 a) 0001625.0==n

x

σσ b) σµ 307305.007252.0 >−=−x

5.2 a) Laborant B b) 530.6,340.6 == BA xx c) 026.0,181.0 ==BA xx ss

d) Rezultati laboranta B sadrže sistematsku grešku. 5.3 7 merenja 5.4 b) Merenja dobijena sa obe metode pripadaju istoj populaciji sa raspodelom N(µ,σ) c)

( ) ( )( ) ( ) ( )( )22222

211

21

2 0022.0301300014.02012023020

111

21

⋅−+⋅−−+

=−+−−+

= snsnnn

s

102.0=s d) 0144.0,8056.9 == xsx

5.5 a) Ne b) Slučajna greška merenja: N(0,σ) c) 41.1=s 5.6 a) Za 7.0=Pσ : B,A,C, za 1=Pσ : B,C,A i za 3.1=Pσ : C,B,A

5.7 a) 3.14=x b) 21.0=xσ

5.8 017.0,176.11

;0260.0,6141.0;0204.0,7225.0 32====== σσσ

mmm

5.9

207.0148.0)ln(,55.019.1

,115.0457.0,74.095.2,43.07.3

±=±=−

±=±=±=+

aa

abb

aabba

5.10 a) ( ) ( ) ( )222tvtet vet

ttσσσ += , ( ) ( ) ( ) ( )2222 tvep tvep σσσσ ++=

b) %29.0%,55.73%,22.0,365.3 ==== pptt pt σσ d) bar 2.2 puta. 5

titracija Glava 6

Page 284: Osnovi inzenjerske statistike

256

6.2 a) (1.136, 1.575) b) 44 c) (1.157, 1.554) 6.3 (19.9, 94.3) 6.4 (0.704, 1.083) 6.5 (2.098, 2.146); ( 34 1049.3,1061.2 −−

⋅⋅ )

6.6 a) 86.5734.55 1 << µ , 37.5859.52 2 << µ b) 92.261.0 1 <<σ , 68.639.1 1 <<σ

6.8 a) 73.449.2 21 <−<− µµ b) Da. 5% Glava 7 7.1 1) b 2) c 3) a i d 4) nema 7.2 a) Dati tačni odgovori su rezultat čistog pogađanja, )21(5:0 === pnpH xµ ,

%2.17=α b) )75.0(5.7:1 === pnpH xµ , %4.22=β c) %1.12=β

7.3 (a) 35.3% (b) 18.2% (c) 8.1%

7.4 (a) 25.8% (b) 14.3% (c) 7.4%

7.5 a) 3:,3: 10 <µ=µ HH b) t = 3.162 > t9, 0.1 = 1.83, t > t9, 0.02 = 2.82

7.6 a) 3:,3: 10 >µ=µ HH b) t = 1.987 > t9, 0.1 = 1.83, t < t9, 0.02 = 2.82

7.7 a) 3:,3: 10 ≠µ=µ HH b) t = 1.987 < t9, 0.05 = 2.26, t < t9, 0.01 = 3.25

7.8 Jeste, jer je t = 5.748 > t19, 0.02 = 2.54

7.9 a) Prihvata se, t = 1.583 < t9, 0.05 = 2.26 b) Odbacuje, t = 2.214 > t18, 0.05 = 2.101

7.10 a) Test statistika:20

22

σ=χ ds

. Kriterijum odbacivanja: 22,

2221,

2 ili, αα− χ>χχ<χ dd

b) Nije došlo do promene disperzije: 14.30,12.10,67.12 05.0,1995.0,192 =χ=χ=χ

7.11 a) Test statistika :20

22

σ=χ ds

. Kriterijum odbacivanja: 2,

2αχ>χ d

b) Jeste, jer je 42.3640 05.0,242 =χ>=χ

7.12 Ne, jer : t = 0.249 < t29, 0.05 = 2.05

7.13 Da, jer : t = 1.931 > t10, 0.1 = 1.812

7.14 Prihvata se jer 18.3)9,9(044.1 05.0 =<= FF , Prihvata se jer

87.11)5,5(169.1 05.0 =<= FF

7.15 Ne, jer t = 2.248 > t11, 0.05 = 2.201

7.16 Jednako su precizne. A i B su jednako tačne, C sistematski odstupa od A i B

7.18 Odbacuje se, jer je z = 2.217 > 1.645

7.19 Prihvata se, jer 82.7125.0 205.0,3

2 =χ<=χ

7.20 Odbacuje se, jer 81.1619.61 201.0,6

2 =χ>=χ

Page 285: Osnovi inzenjerske statistike

257

7.21 Prihvata se, jer 82.76.1 205.0,3

2 =χ<=χ

7.22 Rezultat 7.5 odstupa značajno od ostalih i pri tome je po Grubbs testu g = 2.09 > g7, 0.05 = 2.02 te ga treba odbaciti. Glava 8 8.1 r = - 0.92, vrlo jaka, negativna korelacija 8.2 r = 0.974, vrlo jaka, pozitivna korelacija 8.3 b) r = 0.553 c) yxxy 612.0408.2,5.04 +=+= d) 9.7)9(,7)6( == xy

e) Nije značajan, jer 86.1782.1 1.0,8 =<= tt

8.4 b) r = 0.989, vrlo značajan jer 65.29.23 02.0,13 =>= tt c) xy 3875.08.414 +−=

d) 34.7% Glava 9 9.1 b) xy 1056.0389.70 += c) 32 10175.1 −

⋅=s d) 998.0,996.02== rR Vrlo jaka

linearna veza, dobijena regresiona jednačina objašnjava 99.6% ukupne promene zavisno promenljive e) 1186.00926.0,056.73722.67 10 <β<<β<

9.2 a) Nagib nije statistički značajan jer 306.2879.1 05.0,8 =<= tt . To je u skladu sa

neznačajnošću koeficijenta korelacije, uočenom u Problemu 8.3 b) Nagib se značajno razlikuje od nule, jer 306.2765.25 05.0,8 =>= tt , što je u skladu sa vrlo velikim

koeficijentom korelacije. Uočite da mala vrednost nagiba, ne znači da je on neznačajan!

9.3 a) t051.10.622 +=ρ b) lg /8.699=ρ c) 330.1772.0 1 <β<

9.4 a) yzxv == ,2 b) 2,1

yzx

v == c) y

zxv1

,3 =+= d) yzxv ln, ==

e) y

xzxv == ,2

9.5 107.4097.4,823.1755.1 <<<< ab

9.6 996.0,515.0,945.3 2=−== Rba

9.7 3.159,10389.6,868.2 26=⋅== scm

9.8 a) Pravolinijska b) yR 2131.08.474 −=

9.9 a) Te1885310623.1 −⋅=η b) 0.870

Glava 10 10.1 a) α = 25.28%, β = 34.78% b) α = 36.12%, β = 23.89%

Page 286: Osnovi inzenjerske statistike

258

10.2 a) Granice tolerancije: L.C.L = 1

3k

Rx − =3.499, U.C.L =

1

3k

Rx + =3.501 što je

unutar granica kvaliteta [3.498,3.502] 10.3 a) linije akcije (13.7,17.5), linije upozorenja (14.6,16.9) b) data gornja granica (18) - 4.8% pojedinačnih merenja izvan ove granice

Page 287: Osnovi inzenjerske statistike

258

Literatura 1. Ahnazarova S., Kafarov V., Metody optimizacii eksperimenta v himičeskoj tehnologii, Vysšaja škola, Moskva, 1985.

2. Box G., Hunter W. i Hunter S, Statistics for Experimenters, John Willey & Sons, New York, 1978.

3. Bronštajn I., K., Semendjajev, Spravočnik po matematike, Nauka, Moskva, 1980.

4. Chatfield C., Statistics for Technology, Chapman & Hall, New York, 3rd. edn. 1983.

5. Duncan A.,J., Quality Control and Industrial Statistics, 4th.edn. Irwin

6. Guenther W., C., Sampling Inspection in Statistical Quality Control, Griffin 1977.

7. Hadžić O., Ð. Takači, Matematičke metode, Univerzitet u Novom Sadu, Novi Sad, 2000.

8. Hald A., Statistical Theory of Sampling Inspection by Attributes, Academic Press, 1981.

9. IUPAC Compendium of Chemical Terminology (Gold Book) 2008 http://goldbook.iupac.org/about.html

10. Mandel J., The statistical analysis of experimental data, John Willey & Sons, New York 1964.

11. NIST/SEMATECH e-Handbook of Statistical Methods, Last updated: 7/18/2006 http://www.itl.nist.gov/div898/handbook/

12. Pavlic I., Statistička teorija i primjena, Tehnička knjiga, Zagreb, 1971.

13. Topping J., Errors of Observation and Their Treatment, Chapman & Hall, London, 1972.

14. Vukadinović S., Elementi teorije verovatnoće i matematičke statistike, Privredni pregled, Beograd, 1990.

15. Walpole R., Introduction to statistics, The Macmilan Co., 1970.

16. Wetherill G.,B., Sampling Inspection and Quality Control, 2nd edn. Chapman& Hall, 1977