61
UNIVERZITET U NIŠU PRIRODNO – MATEMATIČKI FAKULTET DEPARTMAN ZA MATEMATIKU KONTROLNE KARTE ZA VIŠEDIMENZIONALNA OBELEŽJA MASTER RAD Student: Mentor: Marija Mladenović Prof. dr Miodrag Đorđević Br. indeksa 190 Niš, 2018.

VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

UNIVERZITET U NIŠU

PRIRODNO – MATEMATIČKI FAKULTET

DEPARTMAN ZA MATEMATIKU

KONTROLNE KARTE ZA VIŠEDIMENZIONALNA

OBELEŽJA

MASTER RAD

Student: Mentor: Marija Mladenović Prof. dr Miodrag Đorđević Br. indeksa 190

Niš, 2018.

Page 2: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

1

Sadržaj Glava 1 Uvodni pojmovi ........................................................................................................................ 3

1.1. Kvalitet i poboljšanje kvaliteta ................................................................................................... 3

1.2. Statistički metodi u kontroli i poboljšanju kvaliteta ................................................................... 4

1.3. Određivanje granica kontrolnih karata ...................................................................................... 6

Glava 2 Hotelingova 𝑇2 statistika ......................................................................................................... 8

2.1. Bitne raspodele u statističkoj kontroli kvaliteta......................................................................... 8

2.2. Definicija i svojstva 𝑇2 raspodele .............................................................................................. 9

Glava 3 Multivarijacioni kontrolni grafikoni ........................................................................................ 13

3.1. Grafikoni za praćenje stabilnosti individualnih višedimenzionalnih opservacija ..................... 13

3.2. Grafikoni za praćenje individualnih budućih opservacija......................................................... 16

3.3. Praćenje budućih opservacija dobijenih na osnovu poduzoraka ............................................. 17

Glava 4 Konstrukcija referentne baze podataka ................................................................................ 19

4.1. Preliminarni podaci .................................................................................................................. 19

4.2. Procesi prikupljanja podataka. Nedostajući podaci. ................................................................ 21

4.3. Problem autlejera ..................................................................................................................... 23

4.4. Čišćenje autlejera ..................................................................................................................... 24

4.4.1. Slučaj nepoznatih parametara .......................................................................................... 25

4.4.2. Slučaj poznatih parametara .............................................................................................. 25

4.4.3. Slučaj nepoznate 𝑇2 raspodele ......................................................................................... 28

Glava 5 Faza II ..................................................................................................................................... 31

5.1. Izbor verovatnoće greške I vrste .............................................................................................. 31

5.2. 𝑇2 kontrolna karta ................................................................................................................... 32

5.2.1. Slučaj nepoznatih parametara .......................................................................................... 32

5.2.2. Slučaj poznatih parametara .............................................................................................. 35

5.2.3. Slučaj sredina podgrupa .................................................................................................... 37

5.3. Princip glavnih komponenata .................................................................................................. 37

5.4. Kontrolni dijagrami u prostoru glavnih komponenti................................................................ 38

Glava 6 Interpretacija 𝑇2 signala za dve i više promenljivih ............................................................... 43

6.1. Ortogonalna dekompozicija ..................................................................................................... 43

6.2. MYT dekompozicija .................................................................................................................. 45

6.3. Interpretacija signala na 𝑇2 komponenti ................................................................................. 49

6.3.1. Slučaj dve promenljive ...................................................................................................... 49

6.3.2. Slučaj više promenljivih ..................................................................................................... 50

Page 3: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

2

6.4. Primer ....................................................................................................................................... 53

Literatura: ............................................................................................................................................ 59

Biografija ……………………………………………………………………………………………………………………………............60

Page 4: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

3

Glava 1 Uvodni pojmovi

1.1. Kvalitet i poboljšanje kvaliteta

Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na jednu ili više karakteristika koje bi proizvod ili usluga koji se koriste morali da imaju. Danas, kvalitet je postao odlučujući faktor u izboru između više konkurentskih proizvoda ili usluga. Stoga, poboljšanje kvaliteta je ključni faktor u uspešnom poslovanju i rastu kompanije.

Kada je reč o kvalitetu možemo posmatrati više aspekata u vezi sa njim. Garvin je

razmatrao osam dimenzija kvaliteta u industrijskim i poslovnim situacijama: performanse, upotreba- da li proizvod služi čemu je namenjen i koliko dobro; pouzdanost- koliko često proizvod podbaci u svojoj svrsi; izdržljivost- koliko će proizvod trajati; mogućnost servisiranja- koliko je jednostavno popraviti proizvod u slučaju kvara; estetika- kakav je vizuelni izgled proizvoda; dodatne funkcionalnosti- da li pored osnovne namene postoje još neke upotrebe

proizvoda; reputacija- kakav ugled uživa sama kompanija ili sam proizvod; usklađenost sa standardima.

Međutim, kada se radi o uslugama prema korisniku kao što su finansije,

zdravstvo, itd, možemo posmatrati još neke apsekte: vreme odziva- koliko dugo se čeka na sam proizvod ili uslugu; profesionalizam prilikom pružanja usluga- koliko je pružalac usluga stručan; pažnja koju pružalac usluga poklanja klijentu.

U tradicionalnom smislu, kvalitet se može definisati kao sveukupna podesnost za

upotrebu i kao takav, se može pratiti kroz dve komponente: dizajna i usaglašenosti. Komponenta dizajna obuhvata materijale koji su korišćeni prilikom izrade sastavnih delova, pouzdanosti izrade i slično. Komponenta usaglašenosti obuhvata uvežbanost zaposlenih i njihovu motivisanost, način kontrole i testiranja proizvoda.

Međutim, danas se sve više kvalitet posmatra kao veličina obrnuto proporcionalna

varijabilnosti. Ovde je reč o neželjenoj varijabilnosti i što je varijabilnost veća, kvalitet je manji i obratno. Povećana varijabilnost dovodi do povećanja troškova proizvodnje, bilo kroz proces dorade ili kroz škart koji se odbacuje, a zatim do smanjenja pouzdanosti proizvoda i celokupnog kvaliteta. Većina kompanija smatra teškim da obezbedi kupcu

Page 5: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

4

proizvode koji imaju karakteristike kvaliteta koji su uvek identični od jedinice do jedinice ili su na nivou koji odgovaraju očekivanjima kupaca. Postoji određena količina varijabilnosti u svakom proizvodu, pa ne postoje dva identična proizvoda. Ukoliko je varijacija velika, kupac može uočiti jedinicu da bude nepoželjna i neprihvatljiva. U skladu sa ovim, poboljšanje kvaliteta se može posmatrati kao smanjenje varijabilnosti.

Karakteristike kvaliteta često se procenjuju u odnosu na specifikacije. Specifikacije su

željene vrednosti u finalnom proizvodu i njegovim komponentama. U uslužnim delatnostima, specifikacije se izražavaju u smislu maksimalnog vremena za obradu naloga ili pružanje određene usluge.

Specifikacija predstavlja ciljnu ili nominalnu vrednost koju bi posmatrano obeležje, tj.

karakteristika, trebalo da postigne na svakom proizvodu. Pored ciljne vrednosti, zadaju se i gornja i donja specifikaciona granica (USL-upper specification limit, LSL-lower specification limit). One predstavljaju najveću i najmanju dozvoljenu vrednost koju posmatrana dimenzija kvaliteta može da ima, a da se proizvod ne smatra škartom.

Neke karakteristike imaju samo jednu specifikacionu granicu. Na primer, otpornost branika automobila, ova karakteristika ima svoju ciljnu vrednost koja je određena u fazi dizajniranja automobila, kao i donju specifikacionu granicu dok nema gornju. Specifikacije nastaju kao rezultat inženjerskih principa još u fazi dizajniranja proizvoda, ali i kao rezultat niza testova i eksperimenata na različitim prototipovima i modelima.

1.2. Statistički metodi u kontroli i poboljšanju kvaliteta

Proces (proizvodni) se posmatra kao interakcija nekih ulaznih faktora i rezultata, kao što je prikazano na slici 1.1. Prva grupa faktora koja utiče na krajnji proizvod su kontrolisani ulazni faktori (𝑥1, 𝑥2, … , 𝑥𝑝). Njihove vrednosti se tokom proizvodnje mogu

podešavati na željene vrednosti kao što su temperatura, pritisak, itd. Druga grupa faktora su nekontrolisani ulazni faktori (𝑧1, 𝑧2, … , 𝑧𝑞). Oni predstavljaju sastavni deo procesa i ove

osobine se ne mogu menjati, kao što su sredinski faktori ili osobine sirovina. Proizvodni proces transformiše ulazne promenljive u gotov proizvod koji ima nekoliko karakteristika kvaliteta koje će biti mera kvaliteta procesa i proizvoda.

Page 6: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

5

Slika 1.1. Proces kao interakcija ulaznih faktora i rezultata

Ovakav koncept se može primeniti i u uslužnim delatnostima, na primer, u banci, pri

odobrenju kredita za kupovinu stana. Ulazne promenljive će biti podaci iz formulara za kredit koji sadrži informacije o klijentu, stanu, ceni, koliku sumu potražuje. Kontrolisani faktori će biti vrste obuka i znanje koje su službenici usvojili, pravila i politika banke, broj službenika. Dok će nekontrolisani faktori biti kamatna stopa, količina novca koja je namenjena za kredite u zavisnosti od visine primanja, broj formulara za kredit pristiglih u određenom periodu. I na kraju, rezultat procesa će biti odluka da li je kredit odobren ili ne, broj odobrenih kredita, vreme koje protekne od trenutka apliciranja do konačne odluke o kreditu.

U svakom procesu, bez obzira na to koliko je on dobro isplaniran, dizajniran i koliko se

dobro održava, određena količina prirodne varijabilnosti mora da postoji. To će biti posledica mnogih nevidljivih, neizbežnih uzroka. Takve uzroke varijacije zovemo slučajni uzroci. Za proces u kome su prisutni samo slučajni uzroci varijacije kažemo da je pod statističkom kontrolom. Dakle, oni su prirodno, sastavni deo procesa.

Međutim, u procesu mogu biti prisutni i neki drugi uzroci varijacije. Oni nisu stalno prisutni već se javljaju sporadično, s vremena na vreme. U procesima proizvodnje ovakvu varijaciju mogu, na primer, da prouzrokuju: neodgovarajuće podešene ili loše kontrolisane mašine, greške operatera, loše sirovine. Varijacije koje nastaju kao posledica ovih i sličnih uzroka nazivamo specijalnim uzrocima varijacije. I za proces u kome su prisutni specijalni uzroci varijacije kažemo da je van kontrole.

Jedan od osnovnih ciljeva statističke kontrole procesa je da se vrlo brzo, nakon pojave,

utvrdi prisustvo specijalnih uzroka varijacije, tako da odgovarajuća analiza i korektivne mere budu preduzete na vreme i da šteta nastala usled povećane varijacije bude minimalna.

Page 7: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

6

Statistički metodi imaju glavnu ulogu u kontroli i poboljšanju kvaliteta procesa i proizvoda. To dovodi do potreba merenja određenih karakteristika i dimenzija proizvoda i usluga, tj. do definisanja obeležja. Jedna od osnovnih tehnika koja se koristi u statističkoj kontroli procesa je kontrolna karta. Na kontrolnoj karti se nalaze sledeći elementi: srednja vrednost posmatrane karakteristike kvaliteta dobijena iz uzorka, centralna linija, gornja i donja kontrolna linija. Centralna linija (CL) predstavlja poziciju na kojoj se nalazi srednja vrednost posmatrane karakteristike kvaliteta. Gornja (UCL-upper control limit) i donja kontrolna linija (LCL-lower control limit) predstavljaju granice u okviru kojih bi, ako je proces pod kontrolom, trebalo da se nađu sve vrednosti obeležja kvaliteta, o čemu će kasnije biti više reči.

Tačka izvan kontrolnih granica se interpretira kao stanje procesa van kontrole i kao

jedan od znakova prisustva nekih specijalnih uzroka varijacije. Tada je potrebno preduzeti neke korektivne mere kako bi se odstranili specijalni uzroci varijacije i doveo proces u stanje kontrole. Međutim, čak i ako su sve tačke unutar kontrolnih granica, to ne povlači nužno da je proces u stanju kontrole. Ukoliko su tačke raspoređene na neki sistematičan, neslučajan način oko centralne linije, to može biti znak da je proces van kontrole. Ukoliko je proces u stanju kontrole, tačke bi trebalo da budu raspoređene na neki slučajan način oko centralne linije.

Kontrolna karta je alat koji može tačno da opiše šta se podrazumeva pod statističkom

kontrolom procesa. One se koriste u onlajn nadgledaju procesa. Dakle, još u toku proizvodnje se vrši uzorkovanje, podaci se beleže i upisuju u kontrolne karte. Ukoliko na karti ne postoji sistematičan šablon ponašanja, kažemo da je proces u stanju kontrole. Ali najvažnija uloga kontrolnih karata je u poboljšanju procesa. Mnogi procesi funkcionišu, a da nisu u stanju statističke kontrole. Tada se kontrolne karte koriste u otkrivanju specijalnih uzroka varijacije. Ukoliko se ti izvori varijacije mogu otkloniti iz sistema, varijabilnost će se smanjiti i doći će do poboljšanja kvaliteta procesa. Međutim, nikad neće biti moguće potpuno eliminisati sve uzroke varijacije, ali uz pomoć kontrolnih karata broj uzroka varijacije se efikasno može smanjiti.

Navešćemo još neke razloge korišćenja kontrolnih karata: kontrolne karte su sigurna tehnika za poboljšanje produktivnosti; kontrolne karte su efektne u otkrivanju defekata; kontrolne karte sprečavaju nepotrebna podešavanja procesa; kontrolne karte pružaju dijagnostičke informacije o procesu; kontrolne karte pružaju informacije o sposobnosti procesa.

1.3. Određivanje granica kontrolnih karata

Daćemo opšti model kontrolnih karata u jednodimenzionalnom slučaju. Neka je w statistika koja predstavlja neku funkciju karakteristike kvaliteta. Neka je 𝜇𝜔 njena

Page 8: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

7

očekivana vrednost, a standardna devijacija 𝜎𝜔. Tada se elementi kontrolne karte određuju na sledeći način:

UCL=𝜇𝜔 + 𝐿 ∗ 𝜎𝜔,

CL=𝜇𝜔 , LCL=𝜇𝜔 − 𝐿 ∗ 𝜎𝜔,

gde je L rastojanje kontrolnih granica od centralne linije izraženo u standardnim devijacijama. Ovakav koncept je predložio Walter A. Shewhart, pa se nazivaju Šuartove kontrolne karte.

Određivanje kontrolnih granica je jedna od najkritičnijih odluka prilikom generisanja kontrolnih karata. Pomeranjem kontrolnih granica od centralne linije smanjuje se rizik od greške prve vrste, verovatnoća da se tačka na kontrolnoj karti nađe van kontrolnih granica, a da u sistemu ne postoji specijalan izvor varijacije. S druge strane, time se povećava rizik od greške druge vrste, tj. povećava se verovatnoća da se tačka nađe unutar kontrolnih granica, a da u sistemu postoji neki specijalan izvor varijacije. Ukoliko se kontrolne granice približavaju centralnoj liniji problemi sa greškama su suprotni.

Pri izboru 3𝜎 kontrolnih granica za kartu srednjih vrednosti, sa normalno

raspodeljenim podacima, verovatnoća greške prve vrste je 0,0027, tj. 27 u 10000 slučajeva. Ova vrednost se određuje na osnovu zakona normalne raspodele iz tablice normalne raspodele. Ukoliko bismo želeli da se ta greška smanji na 0,001, tada bi trebalo izabrati 3,09 standardne devijacije sa jedne strane, pa bi ukupna greška bila 0,002. U Americi se koriste 3𝜎 granice, dok se u Engleskoj i nekim delovima Zapadne Evrope koriste 0,001 sigma granice. Stvarna raspodela karakteristika kvaliteta često nije poznata da bi se izračunale precizne granice, pa ako se ona može aproksimirati normalnom raspodelom postoje određene razlike između 3𝜎 i 0,001 granica.

Osim već pomenuta tri elementa kontrolne karte, uvode se još dve linije, linije

upozorenja. To su linije koje se najčešće nalaze na 2𝜎 rastojanju od centralne linije. Nekoliko tačaka koje se nalaze između linije upozorenja i kontrolne granice mogu predstavljati znak da sa procesom nešto nije u redu i da je potrebno preduzeti neke korektivne mere. Korišćenje linija upozorenja može povećati senzitivnost kontrolnih karata, tj. povećati osetljivost na otkrivanje neželjenog stanja procesa.

Da bismo identifikovali neslučajno ponašanje procesa, Western Electric je 1956. godine

predložio sledeći skup pravila: jedna tačka van kontrolnih granica; 2 od 3 uzastopne tačke izvan granica upozorenja(2𝜎 granice); 4 od 5 uzastopnih tačaka izvan 1𝜎 pojasa od centralne linije; osam uzastopnih tačaka sa jedne strane centralne linije.

Page 9: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

8

Glava 2 Hotelingova 𝑇2 statistika

2.1. Bitne raspodele u statističkoj kontroli kvaliteta

Najpre ćemo navesti neke od najbitnijih raspodela u statističkoj teoriji, pa i u kontroli

kvaliteta. Jedna od najvažnijih je normalna raspodela, kako u teoriji, tako i u primenama. Ukoliko

slučajna promenljiva ima normalnu raspodelu, onda je njena funkcija gustine definisana na sledeći način:

𝑓(𝑥) =1

𝜎√2𝜋𝑒

−(𝑥−𝜇)2

2𝜎2 , 𝑥𝜖𝑹,

gde je 𝜇 matematičko očekivanje, a 𝜎2 disperzija ove slučajne promenljive. Ako je 𝜇 = 0, a 𝜎2 = 1, tada kažemo da slučajna promenjiva ima normalnu normiranu raspodelu. U slučaju n-dimenzionalne normalne raspodele, gde je 𝝁 = ( 𝜇1, 𝜇2, … , 𝜇𝑛) i V simetrična, nenegativno – definitna, nesingularna matrica (det(V)> 0), gustina ove slučajne promenljive definisana na sledeći način:

𝑓(𝒙) =1

(2𝜋)𝑛/2√det (𝑉)𝑒−

(𝒙−𝝁)′𝑉−1(𝒙−𝝁)

2 , 𝒙 = (𝑥1, 𝑥2, … , 𝑥𝑛) ∈ 𝑹𝑛.

Neka je 𝑋1, 𝑋2, … , 𝑋𝑛 prost slučajni uzorak iz populacije sa normalnom normiranom

raspodelom. Tada statistika 𝑌 = 𝑋12 + 𝑋2

2 + ⋯ + 𝑋𝑛2 ima 𝝌𝟐 („hi kvadrat“) raspodelu sa n

stepeni slobode. Još jedna korisna raspodela je studentova t- raspodela koja se dobija na sledeći način:

𝑡 =𝑋

√𝑌

𝑘

, gde je X slučajna promenljiva sa normalnom normiranom raspodelom, a Y

slučajna promenljiva sa 𝜒2 raspodelom sa k stepeni slobode i nezavisna je od X.

Na kraju, posmatramo slučajnu promenljivu 𝐹𝑘,𝑙 =𝑊

𝑘𝑌

𝑙

, gde su W i Y dve nezavisne

slučajne promenljive sa 𝜒2 raspodelama sa k i l stepeni slobode, respektivno. U ovom slučaju, rezultujuća slučajna promenljiva ima Fišerovu raspodelu ili F – raspodelu sa k i l stepeni slobode.

Page 10: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

9

2.2. Definicija i svojstva 𝑇2 raspodele Neka je 𝑿1, 𝑿2, … , 𝑿𝑛 slučajni uzorak iz p - dimenzionalne normalne raspodele sa

sredinom 𝝁 i pozitivno – definitnom kovarijansnom matricom ∑.

Kada je p=1, tada statistika 𝑡 =�̅�−𝜇

𝑆

√𝑛

, gde su �̅� =1

𝑛∑ 𝑋𝑖

𝑛𝑖=1 uzoračka sredina, a

𝑆 = (1

𝑛−1∑ (𝑋𝑖 − �̅�)2)𝑛

𝑖=1

1 2⁄ uzoračka standardna devijacija, ima studentovu raspodelu

sa n-1 stepeni slobode. Kvadrat t – statistike se može zapisati kao statistika

𝑡2 =(�̅� − 𝜇)

2

𝑆2 𝑛⁄= 𝑛(�̅� − 𝜇)(𝑆

2)

−1(�̅� − 𝜇)

koja je još uvek jednodimenzionalna. Sada, prirodnom generalizacijom ove 𝑡2 statistike dobijamo (p-dimenzionalni slučaj):

Definicija 2.2.1. Statistika 𝑇2 = 𝑛(�̅� − 𝝁)′𝑺−1(�̅� − 𝝁), gde su 𝑺 =1

𝑛−1∑ (𝑿𝒊

𝑛𝑖=1 −

�̅�)(𝑿𝒊 − �̅�)′ uzoračka kovarijansna matrica, a �̅� =

1

𝑛∑ 𝑋𝑖

𝑛𝑖=1 vektor srednjih vrednosti,

zove se Hotelingova 𝑻𝟐 statistika. Dobila je naziv u čast američkog statističara i ekonomiste, Harolda Hotelinga. On je, u

svom radu o multivarijacionim procedurama za analizu podataka o bombama, bio među prvima koji su se bavili analizom koreliranih promenljivih sa statističke tačke gledišta. Njegov proces kontrole bio je zasnovan na statističkim grafikonima, što je izneo u svom ranijem radu o generalizaciji studentove t - statistike. Danas, Hotelingova statistika je jedna od najpopularnijih u multivarijacionoj kontroli procesa.

- Svojstva 𝑇2 raspodele Osnovna pretpostavka koja prethodi bilo kojoj diskusiji o svojstvima raspodele

Hotelingove 𝑇2 statistike, jeste da su multivarijacione opservacije izvedene kao rezultat slučajnog uzorkovanja iz p – dimenzionalne normalne raspodele sa sredinom 𝝁 i kovarijansnom matricom ∑. Tako se ponašanje nezavisnih opservacija može opisati raspodelom čiji su parametri poznati ili ne. Nepoznate parametre ocenjujemo na osnovu prikupljenih podataka iz procesa dok je on pod kontrolom.

Naš zadatak je da date p – dimenzionalne opservacije transformišemo u vrednost

Hotelingove 𝑇2 statistike, koja će takođe biti slučajna jer su opservacije slučajne veličine. S obzirom na to, dobijenu vrednost možemo opisati odgovarajućom raspodelom.

Page 11: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

10

U slučaju da parametri normalne raspodele nisu poznati i moraju se oceniti, razlikujemo dva slučaja. U prvom slučaju je vektor opservacija X nezavisan od ocena

parametara. Nezavisnost se javlja kada X nije uključen u računanje �̅� i S, ocena parametara 𝝁 i ∑, respektivno. Drugi slučaj nastupa kada je vektor opservacija X uključen u izračunavanje ocena parametara, pa stoga nije nezavisan od njih.

Najčešće raspodele u opisivanju 𝑇2 statistike su sledeće:

1. Ukoliko su parametri multivarijacione normalne raspodele poznati, 𝑇2 statistika za

vektor opservacija X ima 𝜒2 raspodelu sa p stepeni slobode. Dakle, 𝑇2 raspodela i broj stepeni slobode zavisi od broja promenljivih u opservacionom vektoru X.

Slika 2.1. Funkcije gustine hi kvadrat raspodele

Na slici 2.1. prikazane su funkcije gustina hi kvadrat raspodela u zavisnosti od broja

stepeni slobode (df). Uočavamo da što je broj stepena slobode veći, to raspodela više poprima simetrični oblik. 2. Ukoliko parametri multivarijacione normalne raspodele nisu poznati, a ocenjeni su

pomoću �̅� i S koji su nezavisni od pojedinačnih opservacija vektora X, tada se 𝑇2 statistika asimptotski ponaša kao

𝑇2 = (𝑋 − �̅�)′𝑆−1(𝑋 − �̅�)~𝑝(𝑛+1)(𝑛−1)

𝑛(𝑛−𝑝)𝐹(𝑝,𝑛−𝑝),

gde je 𝐹(𝑝,𝑛−𝑝) Fišerova raspodela sa p i n-p stepeni slobode.

Page 12: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

11

Grafik funkcija gustina F – raspodele dat je na slici 2.2. za različite vrednosti stepena slobode, pri čemu su p i n-p dati sa m i n respektivno, i možemo uočiti da je raspodela asimetrična sa izduženim repom na desno.

Slika 2.2. Funkcije gustine Fišerove raspodele

3. U poslednjem slučaju, kada vektor opservacija X nije nezavisan od ocena �̅� i S i

uključen je u njihovo izračunavanje, raspodela 𝑇2 statistike se asimptotski ponaša kao:

𝑇2 = (𝑋 − �̅�)′𝑆−1(𝑋 − �̅�)~(𝑛−1)2

𝑛𝛽(𝑝/2,(𝑛−𝑝−1) 2)⁄ ,

gde 𝛽(𝑝/2,(𝑛−𝑝−1) 2)⁄ predstavlja β – raspodelu sa parametrima 𝑝/2 i (𝑛 − 𝑝 − 1)/2.

Kao što se može primetiti na slici 2.3, raspodela 𝑇2 statistike zavisi od broja promenljivih 𝑝 i veličine uzorka 𝑛.

Page 13: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

12

Slika 2.3. Funkcije gustine Beta raspodele

Page 14: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

13

Glava 3 Multivarijacioni kontrolni grafikoni

3.1. Grafikoni za praćenje stabilnosti individualnih višedimenzionalnih opservacija

Kada u kontroli kvaliteta imamo više od jedne važne karakteristike, multivarijacioni

pristup se koristi za praćenje stabilnosti procesa. Ovakav pristup može uzeti u obzir korelacije između karakteristika. Kada postoji korelacija između promenljivih i ako je ona pozitivna, vrednosti promenljivih će se menjati u istom smeru, ali ako je korelacija negativna, menjaće se u suprotnim smerovima. U oba navedena slučaja, vrednosti promenljive se menjaju u skladu sa promenama vrednosti druge promenljive sa kojom je u visokoj korelaciji. Stoga, visoke korelacije između promenljivih otežavaju procenu ukupne greške ukoliko se svaka karakteristika prati zasebno na jednodimenzionalnim kontrolnim kartama i grafikonima, jer zanemarujemo odnose između promenljivih. Zato primenjujemo

multivarijacione kontrolne grafikone, a najčešće korišćeni su elipsoid i 𝑇2 – grafikon. Da bismo postavili kontrolne granice koristimo poznato tvrđenje iz multivarijacione

analize koje kaže da ako slučajna promenljiva X ima p-dimenzionalnu normalnu raspodelu sa sredinom µ i kovarijansnom matricom ∑, tada (𝑿 − µ)′∑−1(𝑿 − µ) ima asimptotski 𝜒2 raspodelu sa 𝑝 stepeni slobode. Neka su 𝑿𝟏, 𝑿𝟐, … , 𝑿𝒏 nezavisne slučajne promenljive iz p – dimenzionalne normalne raspodele 𝑁𝑝(𝝁, ∑). Tada je

𝑿𝒋 − �̅� = (1 −1

𝑛) 𝑿𝒋 −

1

𝑛𝑿𝟏 − ⋯ −

1

𝑛𝑿𝒋−𝟏 −

1

𝑛𝑿𝒋+𝟏 − ⋯ −

1

𝑛𝑿𝒏,

𝐸(𝑿𝒋 − �̅�) = (1 −1

𝑛) µ − (1 −

1

𝑛) µ = 0,

𝐶𝑜𝑣(𝑿𝒋 − �̅�) = (1 −1

𝑛)2∑ + (𝑛 − 1)𝑛−2∑ =

𝑛 − 1

𝑛∑.

Svaka 𝑿𝒋 − �̅� ima normalnu raspodelu, ali nije nezavisna od uzoračke kovarijansne matrice

S. Na osnovu prethodno navedenog zaključujemo da

(𝑿𝒋 − �̅�)′𝑺−1(𝑿𝒋 − �̅�)~𝜒2, tj. ima 𝜒2 raspodelu.

Elipsoid je jedan od intuitivnijih grafikona, ali njegov nedostatak je ograničenost

primene samo na dve promenljive, tj dve karakteristike kvaliteta. Dve karakteristike na j – toj jedinici su predstavljene kao par tačaka (𝑥𝑗1, 𝑥𝑗2). 95 % elipsoidna oblast poverenja se

sastoji od svih x koji zadovoljavaju (𝒙 − �̅�)′𝑺−1(𝒙 − �̅�) ≤ 𝝌𝟐𝟐(0,05), a 𝝌𝟐

𝟐(0,05) je gornji kvantil reda α=0,05 hi kvadrat raspodele sa 2 stepena slobode, tj. vrednost za koju je 𝑃(𝜒2

2 ≥ 𝜒22(𝛼)) = 𝛼.

Page 15: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

14

𝑻𝟐- grafikon se, za razliku od elipsoida, može primeniti za veliki broj karakteristika i tačke su prikazane u vremenskom redosledu. Stoga je lako uočiti da li je proces pod

kontrolom ili ne. Za j–tu tačku računa se 𝑇2 statistika: 𝑇𝑗

2 = (𝒙𝒋 − �̅�)′𝑺−1(𝒙𝒋 − �̅�).

Nakon toga, ove vrednosti ucrtavamo na vremensku osu. Donja kontrolna granica je nula, dok je gornja kontrolna granica 𝑈𝐶𝐿 = 𝜒𝑝

2(0,05) ili 𝑈𝐶𝐿 = 𝜒𝑝2(0,01) i nema centralne linije.

Case Voltage (𝑋1) Current (X2) Feed speed (X3) Gas flow (X4)

1 23,0 276 289,6 51,0 2 22,0 281 289,0 51,7 3 22,8 270 288,2 51,3 4 22,1 278 288,0 52,3 5 22,5 275 288,0 53,0 6 22,2 273 288,0 51,0 7 22,0 275 290,0 53,0 8 22,1 268 289,0 54,0 9 22,5 277 289,0 52,0

10 22,5 278 289,0 52,0 11 22,3 269 287,0 54,0 12 21,8 274 287,6 52,0 13 22,3 270 288,4 51,0 14 22,2 273 290,2 51,3 15 22,1 274 286,0 51,0 16 22,1 277 287,0 52,0 17 21,8 277 287,0 51,0 18 22,6 276 290,0 51,0 19 22,3 278 287,0 51,7 20 23,0 266 289,1 51,0 21 22,9 271 288,3 51,0 22 21,3 274 289,0 52,0 23 21,8 280 290,0 52,0 24 22,0 268 288,3 51,0 25 22,8 269 288,7 52,0 26 22,0 264 290,0 51,0 27 22,5 273 288,6 52,0 28 22,2 269 288,2 52,0 29 22,6 273 286,0 52,0 30 21,7 283 290,0 52,7 31 21,9 273 288,7 55,3 32 22,3 264 287,0 52,0 33 22,2 263 288,0 52,0 34 22,3 266 288,6 51,7 35 22,0 263 288,0 51,7 36 22,8 272 289,0 52,3 37 22,0 277 287,7 53,3 38 22,7 272 289,0 52,0 39 22,6 274 287,2 52,7 40 22,7 270 290,0 51,0

Tabela 3.1. Podaci o zavarivanju

Page 16: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

15

Slika 3.1. 𝑇2 – grafikon za podatke zavarivanja

Isprekidana linija na 𝑇2- grafikonu je 95% granica, a puna linija 99% granica. Primećujemo da je kod 99% granica proces pod kontrolom, dok kod 95% granica 31. tačka izvan nje.

Razmotrimo sada šta pokazuje elipsoid za dve promenljive, za protok gasa i napon. Za

razliku od 𝑇2- grafikona, uočavamo da je kod 99% elipsoida za protok gasa i napona, 31. tačka van kontrolnih granica, a uzrok tome je neobično veliki protok gasa, što se vidi sa slika 3.1. i 3.2.

Slika 3.2. Kontrolni elipsoid kvaliteta

Page 17: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

16

Na kraju razmatramo i svaku promenljivu ponaosob. Za svaku promenljivu konstruišemo kartu srednjih vrednosti. Jednodimenzionalna karta srednjih vrednosti za protok gasa takođe pokazuje da je već pomenuta tačka van 3𝜎 granica, što se može i videti na sledećoj slici, dok kod ostalih su sve tačke unutar kontrolnih granica.

Slika 3.3. Karte srednjih vrednosti individualnih komponenti

3.2. Grafikoni za praćenje individualnih budućih opservacija

Od važnog značaja, kako u statističkoj kontroli procesa, tako i šire, jeste praćenje

stabilnosti budućih opservacija dobijenih na osnovu podataka uzetih iz procesa dok je u stabilnom stanju. Na osnovu uzetih podataka, potrebno je odrediti kontrolni region u kome se očekuje da će se naći buduće opservacije i nazvan je region predviđanja. Ukoliko posmatrani proces nije pod kontrolom, najpre moramo preduzeti korektivne mere kako bismo isti doveli u stabilno stanje, a zatim iz novodobijenog procesa pristupamo određivanju regiona predviđanja. U ovom pristupu koristimo poznato tvrđenje iz multivarijacione analize koje kaže da ako su 𝑿𝟏, 𝑿𝟐, … , 𝑿𝒏 nezavisne slučajne promenljive iz p-dimenzionalne normalne raspodele 𝑁𝑝(𝝁, ∑) i X buduća opservacija iz iste raspodele,

tada 𝑇2 =𝑛

𝑛+1(𝑿 − �̅�)′𝑆−1(𝑿 − �̅�) ima asimptotski

(𝑛−1)𝑝

𝑛−𝑝𝐹(𝑝,𝑛−𝑝) raspodelu i 100(1 − 𝛼)%

p-dimenzionalni kontrolni elipsoid je dat sa

(𝒙 − �̅�)′𝑆−1(𝒙 − �̅�) ≤(𝑛2−1)𝑝

𝑛(𝑛−𝑝)𝐹(𝑝,𝑛−𝑝)(𝛼),

Page 18: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

17

pri čemu je 𝐹(𝑝,𝑛−𝑝)(𝛼) gornji kvantil reda α Fišerove raspodele sa p i n-p stepeni slobode.

Za 𝑝 = 2, budući 95% predikcioni elipsoid je dat sa:

(𝒙 − 𝒙)′𝑆−1(𝒙 − �̅�) ≤(𝑛2−1)2

𝑛(𝑛−2)𝐹(2,𝑛−2)(0,05).

Buduća opservacija biće proglašena van kontrole ako se nađe van granica ovog elipsoida.

Kao što smo već govorili u odeljku 3.1, za 𝑝 > 2 koristimo 𝑇2 grafikone. Po već opisanom postupku, za svaku novu opservaciju računamo

𝑇2 =𝑛

𝑛 + 1(𝑿 − �̅�)′𝑆−1(𝑿 − �̅�)

i ucrtavamo na vremensku osu. Donja kontrolna granica se postavlja na nulu, dok se gornja računa kao:

𝑈𝐶𝐿 = (𝑛−1)𝑝

𝑛−𝑝𝐹(𝑝,𝑛−𝑝)(0,05).

Tačke koje se nađu izvan gornje kontrolne granice su van kontrole i ukazuju na moguće prisustvo nekih specijalnih uzroka varijacije.

3.3. Praćenje budućih opservacija dobijenih na osnovu poduzoraka

Razmotrimo još jedan pristup praćenja podataka baziran na istovremenom uzimanju

𝑚 uzoraka, 𝑚 > 1, iz procesa. Pretpostavimo da je svaki slučajni vektor opservacija nezavisno raspodeljen sa p-dimenzionalnom normalnom raspodelom 𝑁𝑝(𝟎, ∑). Za svaki

uzorak računamo njegovu uzoračku sredinu i kovarijansnu matricu, koje su, prema jednoj od osobina normalne raspodele, nezavisne.

Slično kao u odeljku 3.1, za poduzoračku sredinu �̅�𝑗, �̅�𝑗 − �̿� ima normalnu raspodelu sa

sredinom 0 i

𝐶𝑜𝑣(�̅�𝑗 − �̿�) = (1 −1

𝑛)

2

𝐶𝑜𝑣(�̅�𝑗) +𝑛−1

𝑛2 𝐶𝑜𝑣(�̅�1) = 𝑛−1

𝑛𝑚∑,

gde je

�̿� = 1

𝑚∑ �̅�𝑗

𝑚

𝑗=1

ukupna uzoračka sredina.

Na osnovu rezultata iz multivarijacione analize, da je združena kovarijansna matrica S od n poduzoraka dobijena usređavanjem njihovih uzoračkih kovarijansnih matrica, tj.

𝑺 =1

𝑛(𝑆1 + ⋯ + 𝑆𝑛),

Page 19: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

18

naša združena matrica (𝑛𝑚 − 𝑛)𝑺 je nezavisna od svake �̅�𝑗 i njihove sredine �̿� i ima

Wishart-ovu raspodelu sa (𝑛𝑚 − 𝑛) stepeni slobode. Na osnovu ovoga važi sledeće:

𝑇2 = 𝑛𝑚

𝑛−1(�̅�𝑗 − �̿�)′𝑺−1(�̅�𝑗 − �̿�) ~

(𝑛𝑚−𝑛)𝑝

𝑛𝑚−𝑛−𝑝+1𝐹(𝑝,𝑛𝑚−𝑛−𝑝+1).

Kao i u dosadašnjim razmatranjima, za 𝑝 = 2, 95% kontrolni elipsoid za parove

poduzoračkih sredina dat je sa

(�̅� − 𝒙)′𝑺−1(�̅� − 𝒙) ≤ (𝑛−1)(𝑛𝑚−𝑛)2

𝑛𝑚(𝑛𝑚−𝑛−2+1)𝐹(2,𝑛𝑚−𝑛−2+1)(0,05).

Dok za 𝑝 > 2, ucrtavamo vrednosti

𝑇𝑗2 = 𝑚(�̅�𝑗 − �̿�)′𝑺−1(�̅�𝑗 − �̿�),

za 𝑗 = 1, 𝑛̅̅ ̅̅ ̅, gde se gornja kontrolna granica računa na sledeći način:

𝑈𝐶𝐿 = (𝑛 − 1)(𝑚 − 1)𝑝

(𝑛𝑚 − 𝑛 − 𝑝 + 1)𝐹(𝑝,𝑛𝑚−𝑛−𝑝+1)(0,05).

Kao što smo razmatrali praćenje budućih individualnih opservacija u odeljku 3.2, tako

ćemo ovde pristupiti praćenju budućih observiranih poduzoračkih sredina. Naime, ako je �̅�

buduća poduzoračka sredina iz multivarijacione normalne raspodele, tada �̅� − �̿� ima takođe multivarijacionu normalnu raspodelu sa sredinom 0 i

𝐶𝑜𝑣(�̅� − �̿�) = 𝐶𝑜𝑣(�̅�) +1

𝑛𝐶𝑜𝑣(�̅�1) =

𝑛+1

𝑛𝑚∑.

Tada, 𝑛𝑚

𝑛 + 1( �̅� − �̿�)′𝑺−1( �̅� − �̿�)

ima asimptotski (𝑛𝑚−𝑛)𝑝

𝑛𝑚−𝑛−𝑝+1𝐹(𝑝,𝑛𝑚−𝑛−𝑝+1) raspodelu.

Za 𝑝 = 2, 95% predikcioni elipsoid za svaku buduću poduzoračku sredinu �̅� je određen

na sledeći način:

(𝒙 − �̅�)′𝑆−1(𝒙 − �̅�) ≤(𝑛+1)(𝑚−1)2

𝑚(𝑛𝑚−𝑛−1)𝐹(2,𝑛𝑚−𝑛−1)(0,05).

Dok za 𝑝 > 2, ucrtavamo vrednosti

𝑇2 = 𝑚(�̅� − �̿�)′𝑺−1(�̅� − �̿�)

i računamo gornju kontrolnu granicu na sledeći način:

𝑈𝐶𝐿 = (𝑛+1)(𝑚−1)𝑝

𝑚(𝑛𝑚−𝑛−𝑝+1)𝐹(𝑝,𝑛𝑚−𝑛−𝑝+1)(0,05).

U oba navedena slučaja, tačke će biti van kontrole ako se nalaze van odgovarajućih

kontrolnih oblasti i da se one na neki način razlikuju od prethodnih opservacija, koje su bile pod kontrolom. Takođe nam je poznato da se desna strana poslednje nejednakosti

(jednakosti), može aproksimirati vrednošću 𝜒2

2(0,05)

𝑚 ( 𝜒𝑝

2(0,05), kada je n veliko ).

Page 20: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

19

Glava 4 Konstrukcija referentne baze podataka

4.1. Preliminarni podaci

Faza I statističke kontrole procesa predstavlja planiranje, administraciju, sakupljanje

podataka, upravljanje podataka i istraživački rad, uključujući grafičku i numeričku analizu, kako bismo ispitali da li je proces pod kontrolom. Ponekad se faza I naziva retrospektivnom analizom. Skup podataka prikupljenih dok je proces u stanju kontrole je neophodan u multivarijacionoj kontroli procesa. Takav skup podataka predstavlja bazu za uspostavljanje kontrolnih granica i ocenu nepoznatih parametara. Stoga, cilj faze I je da se dobije skup opservacija koji je pod kontrolom, rereferentna baza podataka, da bismo mogli da odredimo kontrolne granice koje ćemo koristiti u fazi II kontrole procesa. Faza II kontrole procesa predstavlja praćenje budućih opservacija.

Prvi korak u formiranju referentne baze podataka je određivanje preliminarnog skupa

podataka. To je uzorak opservacija uzetih iz procesa dok je on pod kontrolom. Međutim, u fazi I proces ne mora biti u stanju statističke kontrole i zato početni skup podataka može sadržati podatke iz procesa dok je pod kontrolom, tako i podatke kada je van kontrole. Podaci mogu opisati pravu istoriju procesa, ali možda neće imati željenu formu potrebnu za konstrukciju referentne baze podataka.

Da bismo razumeli ovakav koncept razmotrimo tabelu 4.1. koja se sastoji od uzorka od 30 opservacija na 8 promenljivih merenih na hemijskom procesu. Pretpostavimo da je poželjno konstruisati kontrolnu kartu koristeći samo opservacije 7 promenljivih u tabeli 4.1. Pretpostavimo da je 𝑋4 jedna od bitnijih karakteristika i zato je ona uzeta za određivanje tačaka koje su u stanju kontrole (𝑋4 ≥ 5). Na taj način je dobijen skup od 17 tačaka i on je uzet kao referentan. U slučaju da postoji još neka važna promenljiva, onda i ona može da se doda u filter i kriterijum izbora tačaka će biti pooštren.

Page 21: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

20

Obs. No. X1 X2 X3 X4 X5 X6 X7 X8

1 2020 165 661 5,90 1,60 0,28 0,56 86

2 2020 255 675 7,00 5,00 0,26 0,61 84

3 2014 266 675 7,00 3,90 0,27 0,60 85

4 1960 270 900 3,00 8,00 0,27 0,65 89

5 1870 185 850 4,00 4,80 0,30 0,62 90

6 1800 195 590 3,00 4,00 0,30 0,52 87

7 1711 201 663 4,00 3,60 0,29 0,61 88

8 1800 250 875 0,00 6,00 0,33 0,59 88

9 2011 182 710 2,40 7,70 0,29 0,59 86

10 1875 175 600 4,30 6,00 0,29 0,57 97

11 2099 252 566 5,70 7,20 0,35 0,68 86

12 2175 270 535 4,50 1,00 0,33 0,60 86

13 1226 216 495 0,00 9,60 0,29 0,56 86

14 1010 180 520 0,00 8,00 0,31 0,58 92

15 2041 192 692 6,80 9,40 0,28 0,60 92

16 2040 225 700 7,50 10,00 0,32 0,64 90

17 2330 131 483 7,40 7,90 0,29 0,62 88

18 2330 160 600 5,50 8,00 0,26 0,53 92

19 2250 241 523 7,90 6,20 0,31 0,58 90

20 2250 195 480 6,50 8,50 0,31 0,60 90

21 2351 177 679 1,80 7,90 0,32 0,61 94

22 2350 135 640 3,30 5,50 0,28 0,58 95

23 1977 181 705 6,70 3,30 0,29 0,60 87

24 2125 200 830 6,50 4,50 0,31 0,59 90

25 2033 189 830 6,50 5,90 0,32 0,60 90

26 1850 150 800 5,80 5,00 0,32 0,64 92

27 1904 103 970 0,00 4,10 0,24 0,51 93

28 1950 125 670 6,50 4,00 0,29 0,52 88

29 1795 290 629 5,10 5,70 0,35 0,63 90

30 2060 240 590 6,00 4,00 0,32 0,65 88

Tabela 4.1. Podaci hemijskog procesa

Page 22: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

21

4.2. Procesi prikupljanja podataka. Nedostajući podaci. Da bismo formirali preliminarni skup podataka najpre moramo prikupiti podatke.

Podaci se mogu prikupiti na više načina. S jedne strane, podaci se mogu ručno beležiti, dok se u opremljenijim kompanijama podaci mogu elektronski snimati. Međutim, postoje slučajevi kada je poželjno kombinovati ove dve tehnike i u tim slučajevima može doći do problema.

Razmotrimo najpre ručno beleženje podataka. Nedostajući podaci se često mogu desiti

ako je operater zauzet drugim stvarima u trenutku uzorkovanja i ne uspeva da tačno zabeleži podatke. Takođe se mogu javiti i greške prepisivanja. Ako je skupo dobiti uzorak, nedostajući podaci mogu postati veliki problem i izazvati velike troškove samoj kompaniji. S druge strane, elektronskim snimanjem se mogu izbeći navedeni problemi, ali se mogu javiti novi. Razmotrimo 20 opservacija na 7 promenljivih u tabeli 4.2.

Vreme X1 X2 X3 X4 X5 X6 X7

1 138,21 1,27 5762,99 158,81 2327,05 0,35 0,16 2 135,72 1,27 5762,99 154,20 2327,05 0,35 0,16 3 131,72 1,27 5763,87 151,13 2327,93 0,34 0,16 4 128,24 1,27 5763,87 149,81 2327,05 0,34 0,16 5 122,96 1,27 5762,11 152,67 2327,05 0,33 0,16 6 121,91 1,28 5762,99 175,08 2327,05 0,33 0,16 7 118,21 1,28 5763,87 192,57 2312,11 0,30 0,16 8 121,04 1,27 5763,87 204,29 2312,11 0,29 0,16 9 124,53 1,27 5763,87 203,34 2312,07 0,28 0,16

10 131,47 1,27 7009,57 179,13 2312,70 0,27 0,16 11 131,60 1,23 7009,57 160,42 2312,70 0,26 0,16 12 116,98 1,27 6232,03 162,14 2076,86 0,24 0,27 13 122,94 12,7 6233,50 148,67 2077,73 0,24 0,27 14 128,78 12,7 6234,38 141,55 2077,73 0,24 0,27 15 132,21 1,27 6233,50 141,13 2075,98 0,28 0,05 16 134,87 1,27 6234,38 141,55 2253,22 0,26 0,05 17 134,64 1,28 6233,50 166,27 2254,10 0,25 0,05 18 134,38 1,27 6234,28 182,23 2253,22 0,23 0,05 19 131,36 12,6 6234,38 194,50 2253,22 0,22 0,05 20 120,79 1,27 5822,46 200,91 2253,22 0,20 0,05

Tabela 4.2. Podaci dobijeni elektronskim putem

Podatke snimamo elektronskim putem. Svi podaci jednog vektora opservacija se retgistruju u toku jednog minuta. Neke komponente su dobijene hemijskim razlaganjem posebnog komada opreme. Pošto se vreme recikliranja različitih delova opreme razlikuje, neke promenljive mogu imati iste vrednosti u različitim trenucima uzorkovanja. Kao što

Page 23: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

22

možemo zapaziti iz tabele 4.2, svaka od izmerenih vrednosti promenljive 𝑋7 se ponavlja vise puta. Stoga je potrebna detaljna analiza da bismo mogli da dobijemo adekvatan preliminarni skup podataka. Još jedan problem, koji može nastati pri prikupljanju podataka jesu neispravne opservacije, koje mogu biti rezultat neispravne opreme.

Najjednostavniji metod za rešavanje problema nedostajućih podataka bio bi brisanje

opservacija ili promenljivih sa nedostajućim podacima. Ovaj metod je ispravan samo ako ostali podaci i dalje predstavljaju reprezentativni uzorak iz procesa i ako uzrok nedostajanja podataka nije povezan sa samim vrednostima. U suprotnom, koriste se neke druge tehnike o kojima će biti više reči na dalje u tekstu.

Jedna korisna procena nedostajućih podataka, kada se koristi 𝑇2 kao kontrolna

statistika, jeste srednja vrednost te promenljive uslovljena posmatranim vrednostima ostalih vektorskih komponenti. Ovaj postupak se zasniva na regresionoj analizi i u tom slučaju dobijena vrednost bi trebalo da ima mali ili nikakav efekat na ostale komponente vektora podataka i minimalni efekat na ocene parametara.

Time X1 (NaOH) X2 (NaCl) X3 (I1) X4 (I2) X5 (Cl2) X6 (O2) 1 134,89 203,00 0,05 4,00 98,37 1,17 2 129,30 203,10 0,06 1,90 98,37 1,17 3 145,50 208,60 0,17 6,10 98,23 1,42 4 143,80 188,10 0,11 0,40 98,44 1,12 5 146,30 189,10 0,22 0,50 98,44 1,11 6 141,50 196,19 0,16 3,50 98,26 1,35 7 157,30 185,30 0,09 2,90 98,23 1,40 8 141,10 209,10 0,16 0,50 98,69 0,86 9 131,30 200,80 0,17 3,80 97,95 1,64

10 156,60 189,00 0,19 0,50 97,97 1,62 11 135,60 192,80 0,26 0,50 97,65 1,94 12 128,39 213,10 0,07 3,60 98,43 1,23 13 138,10 198,30 0,15 2,70 98,12 1,36 14 140,50 186,10 0,30 0,30 98,15 1,37 15 139,30 204,00 0,25 3,80 98,02 1,54 16 152,39 176,30 0,19 0,90 98,22 1,30 17 139,69 186,10 0,15 1,60 98,30 1,25 18 130,30 190,50 0,23 2,60 98,08 1,37 19 132,19 198,60 0,09 5,70 98,30 1,16 20 134,80 196,10 0,17 4,90 97,98 1,50 21 142,30 198,80 0,09 0,30 98,41 1,00

Tabela 4.3. Podaci hemijskog procesa

Da bismo ilustrovali regresionu proceduru za procenu nedostajućih vrednosti,

razmotrimo 21 opservaciju u tabeli 4.3. Pretpostavimo da je ovo referentna baza podataka za hemijski proces u kome nedostaje 21. vrednost promenljive 𝑋5. Pristupamo određivanju

Page 24: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

23

regresione jednačine za 𝑋5 u zavisnosti od ostalih promenljivih, na osnovu modela linearne regresije, na sledeći način:

𝐶𝑙2 = 97,89 + 0,004𝑁𝑎𝑂𝐻 + 0,004𝑁𝑎𝐶𝑙 − 0,296𝐼1 − 0,009𝐼2 − 0,878𝑂2. Koristeći dobijenu jednačinu, računamo ocenu nedostajuće vrednosti promenljive 𝑋5 i ona iznosi 98,58, što je veoma blisko datoj vrednosti u tabeli. Kao što možemo zapaziti, mala je razlika između 𝑇2 vrednosti sa uključenom ocenom i bez nje, čije su vrednosti redom 5,94 i 5,92. Dobijena ocena nedostajuće vrednosti ima mali uticaj na 𝑇2 statistiku, kao i na sredinu promenljive 𝑋5, pri čemu je sredina ove promenljive 98,21, bez uključene ocene, a sa uključenom ocenom je 98,23. Međutim, postojaće mala razlika u korelacijama promenljive 𝑋5 sa ostalim promenljivama kao što vidimo u tabeli 4.4.

𝑁𝑎𝑂𝐻 𝑁𝑎𝐶𝑙 𝐼1 𝐼2 𝑂2 Bez ocene 0,042 0,246 -0,551 -0,123 -0,962 Sa ocenom 0,050 0,247 -0,563 -0,158 -0,970

Tabela 4.4. Poređenje korelacija

Ovaj postupak ocene nedostajućih vrednosti je veoma brz i efikasan. Međutim,

ocenjena vrednost je dobra koliko i sam model. Zbog toga se često postavlja pitanje koliko je regresioni model dobar. Da bismo to utvrdili pristupamo daljim analizama, što dodatno uključuje kako vreme, tako i troškove.

4.3. Problem autlejera

Ne postoji precizna definicija autlejera, ali se može shvatiti kao atipična vrednost koja

se nalazi na ekstremnom rastojanju od glavnog dela podataka iz uzorka. On može nastati zbog varijabilnosti u merenju ili neke eksperimentalne greške, ali nekad može se samo značajno razlikovati od ostalih podataka. Često ukazuju na greške u merenju, da raspodela ima teške repove, ili greške u teoriji koja je generisala pretpostavljenu familiju raspodela. Detekcija autlejera je slična detekciji opservacija koje su van kontrole ili ukazuju na prisustvo specijalnih uzroka varijacije u fazi I. Autlejeri mogu izazvati ozbiljne probleme u statističkoj analizi jer to najčešće dovodi do pogrešnih ocena srednje vrednosti i kovarijansne matrice, što kasnije može izazvati greške i pogrešne odluke prilikom kontrole.

Da ilustrujemo ovo razmotrimo grafik preliminarnog skupa podataka dve promenljive.

Tri odvojene grupe autlejera označene kao grupe A, B, C prikazane su grafikom na slici 4.1. Uključivanjem ovih opservacija u referentnu bazu podataka, koje su označene crnim kružićima na grafiku, će loše uticati na procenu varijanse ove dve promenljive, kao i na procenu korelacije između njih. Na primer, uključenje podataka iz grupe A će povećati varijansu u obe promenljive, ali će imati mali uticaj na korelaciju. Nasuprot prethodnom,

Page 25: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

24

uključenje podataka iz grupe C će poremetiti korelaciju ovih promenljivih, ali će i povećati varijansu slučajne promenljive 𝑥1.

Slika 4.1. Dijagram rasipanja za tri grupe podataka

Neki autlejeri su očigledni za identfikaciju sa grafikona, kao što su tačke B1 i C1, ali za

neke je potrebna detaljnija analiza. Detekcija autlejera je dosta teža u multivarijacionom slučaju. Kao i u jednodimenzionalnom, tako i u multivarijacionom procesu mora biti konstruisana preliminarna kontrolna procedura na taj način da očisti podatke od atipičnih opservacija. Sa 𝑇2 statistikom, odgovarajuća kontrolna karta ima samo gornju kontrolnu granicu. Ukoliko izračunata 𝑇2 vrednost za opservaciju prelazi datu granicu, opservacija se briše.

4.4. Čišćenje autlejera

Postupak čišćenja autlejera počinjemo odabirom vrednosti 𝛼, verovatnoće greške I

vrste. Njen odabir određuje veličinu kontrolne oblasti 1 − 𝛼. Greška prve vrste se javlja ako se opservacija proglasi autlejerom, a zapravo nije. Rezultat takve greške je isključivanje dobrih opservacija iz referentne baze podataka. Za mali skup podataka isključenje ovih opservacija može imati značajan efekat na ocenu kovarijansne matrice, dok bi za veće skupove taj efekat bio minimalan. Situacija je obrnuta kada uzmemo u obzir grešku uključenja autlejera u referentnu bazu podataka. Pre nego što opservaciju isključimo iz referentne baze podataka, treba je najpre dobro analizirati, a posebno moramo obratiti pažnju pri radu sa malim skupovima podataka.

Razlikujemo dva slučaja čišćenja autlejera u zavisnosti od toga da li su parametri

pretpostavljene raspodele poznati ili ne. Razmotrićemo svaki slučaj ponaosob.

Page 26: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

25

4.4.1. Slučaj nepoznatih parametara

Razmotrimo fazu I procesa čišćenja vektora individualnih opservacija 𝑋′ = (𝑥1 ,...,

𝑥𝑝) za čiju se kontrolu koristi 𝑇2 kontrolna karta. Pretpostavimo da podaci potiču iz

multivarijacione normalne (MVN) raspodele sa nepoznatim vektorom sredine 𝜇 i kovarijansnom matricom ∑. Koristeći preliminarne podatke, dobijamo ocene �̅� i S za µ i ∑, respektivno. Za dati nivo α, svi opservacioni vektori čije su 𝑇2 vrednosti ispod gornje kontrolne granice će ostati u toj grupi podataka, tj. ako

𝑇2 = (𝑋 − �̅�)′𝑆−1(𝑋 − �̅�) ≤ 𝑈𝐶𝐿, gde je kontrolna granica određena sa:

𝑈𝐶𝐿 =(𝑛−1)2

𝑛𝛽

(𝑝

2,𝑛−𝑝−1

2)(𝛼),

i gde je β(𝛼,𝑝

2,

𝑛−𝑝−1

2 ) gornji kvantil reda α beta raspodele sa

𝑝

2 i

𝑛−𝑝−1

2 stepeni slobode. Ako

je realizovana vrednost 𝑇2 statistike veća od gornje kontrolne granice, on se uklanja iz preliminarnih podataka i računamo nove ocene vektora sredine i kovarijansne matrice na osnovu preostalih podataka. Ponavljamo postupak računanja 𝑇2 statistike za svaki od preostalih podataka, kao i gornje kontrolne granice i uklanjanjamo detektovane autlejere. Postupak se nastavlja sve dok ne dobijemo homogeni skup opservacija koga nazivamo referentnom bazom podataka.

Čišćenje autlejera, u slučaju kontrole individualnih merenja navedenog iznad,

uopštićemo na uzorkovanje k opservacionih vektora veličine 𝑚𝑖, 𝑖 = 1, 𝑘̅̅ ̅̅̅, pri čemu je ukupna veličina uzorka 𝑛 = ∑ 𝑚𝑖

𝑘𝑖=1 . Dakle, prilikom uzorkovanja ne biramo samo jedan

proizvod, nego poduzorak veličine 𝑚𝑖 i na svakom od tih proizvoda očitavamo neke karakteristike. Postupak ponavljamo za svaki od k poduzoraka. Za svaki poduzorak računamo vektor sredina komponenti i dobijamo k vektora koje sada možemo posmatrati kao vektor individualnih merenja. Na osnovu njega, računamo 𝑇2 vrednosti i gornju kontrolnu granicu. Upoređujemo svaku od 𝑇2 vrednosti sa gornjom kontrolnom granicom i donosimo odgovarajuću odluku.

4.4.2. Slučaj poznatih parametara Razmotrimo sada slučaj poznatih parametara, tj. pretpostavimo da uzorak potiče iz

MVN raspodele sa poznatim vektorom sredine 𝜇 i kovarijansnom matricom ∑. U ovom slučaju 𝑇2 statistika za opservacioni vektor 𝑋′ = (𝑥1 ,..., 𝑥𝑝) postaje

𝑇2 = (𝑋 − µ)′∑−1(𝑋 − µ). Za dati nivo α, gornja kontrolna granica koja se koristi u postupku uklanjanja autlejera se računa na sledeći način

𝑈𝐶𝐿 = 𝜒𝑝2(𝛼),

Page 27: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

26

gde je 𝜒𝑝2(𝛼) gornji kvantil reda α 𝜒2 raspodele sa p stepeni slobode.

Za ilustrovanje i upoređivanje ovog metoda sa slučajem nepoznatih parametara,

posmatrajmo uzorak od 25 opservacija dobijenih merenjem temperature na osam gorionika u kotlu, predstavljenih u tabeli 4.5, dok je korelaciona matrica predstavljena u tabeli 4.6.

Obs. No. t1 t2 t3 t4 t5 t6 t7 t8

1 507 516 527 516 499 512 472 477

2 512 513 533 518 502 510 476 475

3 520 512 537 518 503 512 480 477

4 520 514 538 516 504 517 480 479

5 530 515 542 525 504 512 481 477

6 528 516 541 524 505 514 482 480

7 522 513 537 518 503 512 479 477

8 527 509 537 521 504 508 478 472

9 533 514 528 529 508 512 482 477

10 530 512 538 524 507 512 482 477

11 530 512 541 525 507 511 482 476

12 527 513 541 523 506 512 481 476

13 529 514 542 525 506 512 481 477

14 522 509 539 518 501 510 476 475

15 532 515 545 528 507 511 481 478

16 531 514 543 525 507 511 482 477

17 535 514 542 530 509 511 483 477

18 516 515 537 515 501 516 476 481

19 514 510 532 512 497 512 471 476

20 536 512 540 526 509 512 482 477

21 522 514 540 518 497 514 475 478

22 520 514 540 518 501 514 475 478

23 526 517 546 522 502 516 477 480

24 527 514 543 523 - 502

512 475 476

25 529 518 544 525 504 516 479 481

Tabela 4.5. Podaci temperature u kotlu

Ako pretpostavimo da su parametri MVN raspodele nepoznati, 𝑇2 vrednosti su date u

tabeli 4.7. za dati nivo α=0,001, računamo gornju kontrolnu granicu i dobijamo da je ona jednaka 17,416. Deveta opservacija se identifikuje kao autlejer jer njena 𝑇2 vrednost prelazi gornju kontrolnu granicu. Ovu vrednost uklanjamo iz prvobitnog skupa podataka i na osnovu preostalih podataka računamo nove ocene vektora sredine i kovarijansne matrice. Takođe računamo i korelacionu matricu čije su vrednosti prikazane u tabeli 4.8. Upoređivanjem dobijenih

Page 28: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

27

korelacionih matrica, pre i nakon uklanjanja autlejera, vidimo da se one značajno razlikuju, pa će sličnih razlika biti i u kovarijansnoj matrici. Ovim smo pokazali koliki efekat ima jedan autlejer pri malom obimu uzorka.

Pretpostavimo sada da su parametri MVN raspodele poznati. U ovom slučaju, pri gore zadatom nivou 𝛼, gornja kontrolna granica ima vrednost 𝜒2

2(0,001) = 26,125. Upoređujući, razmotrene 𝑇2 vrednosti u tabeli 4.7. sa ovom vrednošću uočavamo da se nijedna opservacija ne može proglasiti autlejerom. Dakle, u ovom slučaju opservacija 9 neće biti obrisana.

Kao što uočavamo, glavna razlika u ova dva slučaja je način računanja gornje kontrolne

granice.

t1 t2 t3 t4 t5 t6 t7 t8

t1 1 0,059 0,584 0,901 0,819 -0,147 0,813 0,014 t2 0,059 1 0,281 0,258 0,044 0,659 0,094 0,797 t3 0,584 0,281 1 0,444 0,308 0,200 0,396 0,294 t4 0,901 0,258 0,444 1 0,846 -0,226 0,788 0,018 t5 0,819 0,044 0,308 0,849 1 -0,231 0,924 -0,043 t6 -0,147 0,659 0,200 -0,226 -0,231 1 0,103 0,893 t7 0,813 0,094 0,396 0,788 0,924 -0,103 1 0,079 t8 0,014 0,797 0,294 0,018 -0,043 0,893 0,079 1

Tabela 4.6. Korelaciona matrica podataka temperature u kotlu

Obs. No, T2 Value Obs. No, T2 Value 1 13,96 14 9,55 2 9,78 15 7,07 3 5,47 16 6,52 4 14,74 17 4,77 5 6,58 18 8,74 6 5,31 19 9,84 7 7,89 20 8,64 8 9,78 21 12,58 9 17,58* 22 2,79

10 2,79 23 6,09 11 3,29 24 7,98 12 3,63 25 5,32 13 1,32

Tabela 4.7. 𝑇2 vrednosti za prvi korak

Page 29: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

28

t1 t2 t3 t4 t5 t6 t7 t8 t1 1 0,051 0,807 0,899 0,808 -0,141 0,805 0,021 t2 0,051 1 0,342 0,259 0,034 0,662 0,087 0,799 t3 0,807 0,342 1 0,717 0,506 0,204 0,569 0,320 t4 0,899 0,259 0,717 1 0,838 -0,225 0,780 0,027 t5 0,808 0,034 0,506 0,838 1 -0,228 0,922 -0,037 t6 -0,141 0,662 0,204 -0,225 -0,228 1 -0,096 0,893 t7 0,805 0,087 0,569 0,780 0,922 -0,096 1 0,086 t8 0,021 0,799 0,320 0,027 -0,037 0,893 0,086 1

Tabela 4.8. Korelaciona matrica preostalih podataka nakon uklanjanja autlejera

Broj opservacije 𝑇2 vrednosti Broj opservacije 𝑇2 vrednosti 1 16,07 14 7,55 2 9,62 15 7,49 3 5,41 16 6,62 4 14,09 17 8,75 5 6,56 18 9,66 6 5,43 19 10,62 7 7,89 20 12,62 8 9,34 21 3,26 9 5,26 22 6,79

10 3,21 23 7,76 11 3,53 24 5,44 12 1,22 13 9,84

Tabela 4.9. 𝑇2 vrednosti za drugi korak

4.4.3. Slučaj nepoznate 𝑇2 raspodele Pored do sada navedenih, dostupne su još neke alternativne procedure za detekciju

autlejera kada ne važi pretpostavka o MVN raspodeli. To su Čebiševljev pristup i metod kvantila.

Najpre ćemo demonstrirati proceduru zasnovanu na Čebiševljevoj teoremi razmatrajući n=491 opservacija na p=6 promenljivih, uzetih za preliminarni skup podataka. Odgovarajuće 𝑇2 vrednosti opservacija se izračunavaju i ucrtavaju na kartu datu na slici 4.2.

Page 30: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

29

Slika 4.2. 𝑇2 vrednosti industrijskih podataka

Najpre računamo ocene sredine i standardne devijacije, kao i aproksimiranu vrednost gornje kontrolne granice na sledeći način:

𝑈𝐶𝐿 = �̅� + 𝑘 ∗ 𝑠𝑇 , za k=4,472 i 𝛼 ≤ 0,1. Ocena gornje kontrolne granice za prvi korak je 19,617 i na osnovu nje se iz skupa podataka izbacuje 13 podataka. Nakon uklanjanja ovih podataka, pristupamo ponovnom izračunavanju gornje kontrolne granice na osnovu preostalih podataka i proces čišćenja se ponavlja sve dok se ne dobije homogeni skup podataka 𝑇2 vrednosti. Potrebna su 5 koraka i 27 opservacija su obrisane, a rezultat svakog koraka je prikazan u tabeli 4.10.

Korak 1 Korak 2 Korak 3 Korak 4 Korak 5 Korak 6 �̅� 5,988 5,987 5,987 5,987 5,987 5,987 𝑠𝑇 4,310 3,630 3,488 3,407 3,348 3,310

UCL 19,617 17,468 17,019 16,761 16,575 16,455 Broj uklonjenih opservacija

13 6 4 3 2 0

Tabela 4.10. Koraci uklanjanja autlejera

Da bismo ilustrovali proceduru zasnovanoj na tehnici kvantila, 𝑇2 vrednosti ređamo u opadajući poredak. Zatim računamo aproksimaciju gornje kontrolne granice na sledeći način:

𝑈𝐶𝐿 = (𝑇(𝑟)2 + 𝑇(𝑠)

2 )/2,

gde su 𝑇(𝑟)2 , 𝑇(𝑠)

2 donja i gornja granica 99% intervala poverenja za gornju kontrolnu granicu.

Kao i malopre, postupak nastavljamo dok se ne dobije homogeni skup podataka 𝑇2 vrednosti.

U ovoj proceduri uvek će biti najmanje jedna 𝑇2 vrednost iznad procenjene gornje kontrolne granice u svakom koraku. Stoga se postupak mora zaustaviti u koraku gde se

Page 31: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

30

sreće samo jedan autlejer. U našem slučaju jedan autlejer se javlja u 6. koraku, pa je potrebno samo 5 koraka i brisanje 27 opservacija, što je prikazano u tabeli 4.11.

Korak

1 Korak

2 Korak

3 Korak

4 Korak

5 Korak

6 UCL 22,952 21,142 17,590 17,223 16,588 16,402

Broj uklonjenih opservacija

5 8 6 3 5 (1)

Tabela 4.11. Rezultat procesa čišćenja koristeći neparametarski metod

Page 32: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

31

Glava 5 Faza II

5.1. Izbor verovatnoće greške I vrste

Pri konstruisanju 𝑇2 kontrolne karte za fazu II, najpre se izračunavaju statistike

potrebne za crtanje kontrolne karte i odrediti verovatnoću greške I vrste. Kao što je već dobro poznato, greška prve vrste se javlja kada zaključimo da opservacija predstavlja signal za prisutvo nekog specijalnog uzroka varijacije, a zapravo nijedan od specijalnih uzroka varijacije nije prisutan. S druge strane, verovatnoća greške druge vrste β se javlja kada zaključimo da nema signala, a kada je specijalan uzrok varijacije prisutan u procesu. Ove dve verovatnoće razmatramo uporedo i prirodno je da težimo da one budu što manje. Međutim, ovo je u opštem slučaju protivurečno, jer najčešće smanjivanje α dovodi do povećanja β, i obrnuto. Zbog toga se jedna od ovih dveju verovatnoća fiksira, a druga se minimizira u zadatim uslovima. U ovoj fazi razlikujemo dva slučaja. Prvi, kada su vektor sredine i kovarijansna matrica poznati, koristi se 𝜒2 statistika da opiše 𝑇2 raspodelu, dok u drugom primenjujemo F raspodelu.

Da bismo ilustrovali postupak izbora verovatnoća α i β, posmatrajmo hemijski proces u

kome, ukoliko neke komponente imaju vrednosti iznad dozvoljenih, mogu nastati proizvodi koji su opasni za upotrebu. Stoga je poželjno izabrati veoma malo β, dok veliko α neće značajno uticati na proces, jer tada samo može doći do ponovne obrade proizvoda. Verovatnoća α ne mora biti ista za obe faze kontrole procesa. Na primer, veliko α u fazi I kontrole procesa može značajno uticati na ocene vektora sredine i kovarijansne matrice, koje će dalje uticati na izračunavanje statistika kontrolne karte.

Za razliku od jednodimenzionalnog, u multivarijacionom slučaju izbor verovatnoće α je

nešto složeniji. Ukoliko svaku komponentu vektora opservacija pratimo pojedinačno, ne bismo dobili adekvatnu kontrolnu oblast, kao u slučaju praćenja svih komponenti istovremeno, jer na ovaj način zanemarujemo odnose koji postoje između tih komponenti. Ovo možemo videti na slici 5.1. na kojoj je prikazana kontrolna oblast praćenja pojedinačnih komponenti dvodimenzionalnog, normalno raspodeljenog vektora opservacija 𝑋′ = (𝑥1, 𝑥2), osenčen pravougaonik, dok će stvarna kontrolna oblast istovremenog praćenja komponenti pomenutog vektora imati oblik elipse. U slučaju da su komponente vektora opservacija X nezavisne, verovatnoća ukupne greške će biti 𝛼𝑠 = 1 −(1 − 𝛼)2, gde je α verovatnoća greške svake pojedinačne promenljive. Postupak se može uopštiti za p – dimenzionalni opservacioni vektor.

Page 33: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

32

Slika 5.1. Zajednička kontrolna oblast .

5.2. 𝑇2 kontrolna karta

5.2.1. Slučaj nepoznatih parametara Razmotrimo stacionaran proces čiji su vektori opservacija nezavisni, normalno

raspodeljeni, sa nepoznatim parametrima. Neka je dat vektor opservacija 𝑋′ = (𝑥1, … , 𝑥𝑝) p

promenljivih u svakom trenutku. Za dato α, gornju kontrolnu granicu računamo na sledeći način:

𝑈𝐶𝐿 =𝑝(𝑛+1)(𝑛−1)

𝑛(𝑛−𝑝)𝐹(𝑝,𝑛−𝑝)(𝛼),

gde je n veličina referentne baze podataka i 𝐹(𝑝,𝑛−𝑝)(𝛼) kvantil reda α Fišerove raspodele sa

p i 𝑛 − 𝑝 stepeni slobode. Za svaku novu opservaciju računamo 𝑇2 statistiku i ucrtvamo na kontrolnu kartu. 𝑇2 vrednosti koje prelaze gornju kontrolnu granicu smatraju se signalom specijalnog uzroka varijacije i smatra se da nisu u skladu sa referentnom bazom podataka.

Razmotrimo sistem parne turbine čija je ulazna promenljiva prirodni gas koji se koristi za proizvodnju pare u kotlu. Para visokog pritiska se koristi za pokretanje turbine, koja je povezana sa generatorom koji proizvodi struju, dok para niskog pritiska odlazi u kondenzator gde se pretvara u tečnost koja se vraća do kotla kako bi proces bio ponovo pokrenut. Na ovaj način, sistem se smatra stabilnim i radi u kontuiranom ciklusu.

Izvršena su merenja potrošnje goriva, protoka pare, temperatura pare, proizvodnje

snage turbine u MW, temperatura kondenzatora i apsolutnog pritiska koji se posmatra u kondenzatoru. Ovim je dobijeno 28 opservacija koje su predstavljene u tabeli 5.1.

Page 34: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

33

Broj opservacij

a

Gorivo Protok pare

Temperatura pare MW

Temperatura kondenzator

a

Pritisak

1 232666 178753 850 20,53 54,10 29,20 2 237813 177645 847 20,55 54,20 29,20 3 240825 177817 848 20,55 54,00 29,20 4 240244 178839 850 20,57 53,90 29,10 5 239042 177817 849 20,57 53,90 29,20 6 239436 177903 850 20,59 54,00 29,10 7 234428 177903 848 20,57 53,90 29,20 8 232319 177990 848 20,55 53,70 29,10

9 233370 177903 848 20,48 53,60 29,10 10 237221 178076 850 20,49 53,90 29,10 11 238416 177817 848 20,55 53,90 29,10 12 235607 177817 848 20,55 53,80 29,10 13 241423 177903 847 20,55 53,70 29,10 14 233353 177731 849 20,53 53,60 29,10 15 231324 178753 846 20,64 53,90 29,10 16 243930 187378 844 21,67 53,90 29,10 17 252550 187287 843 21,65 54,20 29,10 18 251166 187745 842 21,67 53,70 29,10 19 252597 188770 841 21,78 53,40 29,10 20 243360 179868 842 20,66 53,70 29,10

21 238771 181389 843 20,81 53,90 29,10 22 239777 181411 841 20,88 54,00 29,10 23 219664 167330 850 19,08 54,10 29,20 24 228634 176137 846 20,64 54,00 29,20 25 231514 176029 843 20,24 53,80 29,20 26 235024 176115 846 20,22 53,60 29,20

27 239413 176115 845 20,31 53,70 29,20 28 228795 176201 847 20,24 54,30 29,20

Tabela 5.1. Podaci faze I parne turbine

Ocene vektora sredine i kovarijansne matrice iz podataka u tabeli 5.1. date su sa:

�̅� = ( 237596 179016 846,393 20,647 53,871 29,139)′ i

Page 35: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

34

𝑆 =

002474.0003757.00134.0032143.0969.115391.169

003757.0043598.002312.0152381.0795.203673.408

0134.002312.0285332.093735.014.230242.3313

032143.0152381.093735.06918.806.81125.11749

969.115795.20314.230206.81120791.10776.2

391.169673.40842.33135.117490776.20725.5

EE

EE

.

Na osnovu datih podataka, vrednost gornje kontrolne granice iznosi 43,91.

Posmatrajući tabelu 5.1. kao referentnu bazu podataka, računamo 𝑇2 vrednost za 16 novih opservacija. Realizovane vrednosti 𝑇2 statistika se nalaze u tabeli 5.2. 𝑇2 vrednosti u ovoj tabeli označene zvezdicom prelaze gornju kontrolnu granicu što se može uočiti i sa slike 5.2. Svaka od ovih vrednosti predstavlja signal prisustva nekog specijalnog uzroka varijacije i, kako su oni u našem slučaju uzastopni, ukazivaće na neku promenu u procesu.

Često pitanje u statističkoj kontroli kvaliteta jeste kada je pravo vreme za

preduzimanje korektivnih mera. Da li se one moraju preduzeti odmah nakon uočavanja pojedinih tačaka van kontrolne oblasti ili je potrebno pratiti proces u nekom vremenskom intervalu kako bismo imali jasniju sliku o ponašanju procesa. Procena trenda je statistička tehnika koju inženjeri koriste kako bi dobili što bolju predstavu o pravom stanju procesa. Kada se serija merenja tretira kao vremenska serija, ova tehnika je korisna u opisu njihovog ponašanja. Poželjno je uočiti da li pokazuju trend rasta ili opadanja koji se statistički značajno razlikuje od slučajnog ponašanja, što je jedan od kriterijuma kada je proces van kontrole.

Broj opservacija

Gorivo Protok

pare Temperature

pare MW

Temperatura kondenzatora

Pritisak T2

1 234953 181678 843 20,84 54,5 29,0 35,00 2 247080 189354 844 20,86 54,4 28,9 167,98* 3 238323 184419 845 21,10 54,5 28,9 56,82* 4 248801 189169 843 22,18 54,5 28,9 69,48* 5 246525 185511 842 21,21 54,6 28,9 65,91* 6 233215 180409 845 20,75 54,5 29,0 32,56 7 233955 181323 842 20,82 54,6 29,0 43,91 8 238693 181346 844 20,92 54,8 29,0 49,33* 9 248048 185307 844 21,15 54,6 29,0 39,96

10 233074 181411 844 20,93 54,5 29,0 34,46 11 242833 186216 844 21,59 54,4 29,0 25,51 12 243950 182147 844 21,37 54,2 29,0 41,03 13 238739 183349 844 21,01 54,3 29,0 23,28 14 251963 188012 850 21,68 54,4 29,0 29,33 15 240058 183372 846 21,15 54,2 29,0 16,40 16 235376 182436 844 20,99 54,3 29,0 24,10

Tabela 5.2. Podaci parne turbine faze II

Page 36: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

35

Slika 5.2. 𝑇2 kontrolna karta merenja komponenti parne turbine Što se tiče performansi rada parne turbine u stabilnim uslovima, možemo primetiti da

su i ulazna (količina goriva) i izlazna (opterećenje) veličina, u idealnim uslovima konstantne vrednosti. Zbog toga se očekuje da, u stabilnim uslovima, njihove vrednosti imaju malu varijaciju. Međutim, ukoliko usled povecanja opterećenja, dođe do pogoršanja uslova, te promene, iako kratkotrajne, mogu dovesti do neželjenih posledica. Potrebno je identifikovati ovakve situacije, gde postoje poremećaji sa poznatim uzrocima. Kada je uzrok nepoznat, specifični uslovi se proglašavaju kada nekoliko tačaka ispadne van kontrolne oblasti.

5.2.2. Slučaj poznatih parametara Ponekad su parametri MVN raspodele za dati proces podataka poznati. Na primer,

poznati vektor sredine može se javiti u industrijskim procesima koji su tokom dužeg vremenskog perioda stabilni.

Dakle, ako su parametri MVN raspodele poznati, za dato α, gornja kontrolna granica se

računa na sledeći način: 𝑈𝐶𝐿 = 𝜒𝑝

2(𝛼),

gde je 𝜒𝑝2(𝛼) gornji kvantil reda α 𝜒𝑝

2 raspodele. U ovom slučaju, gornja kontrolna granica je

nezavisna od referentne baze podataka, jer njeno izračunavanje ne zavisi od iste.

Posmatrajmo dvodimenzionalni industrijski proces sa 11 opservacija, predstavljen u tabeli 5.3. Poslednje dve kolone tabele predstavljaju korigovane sredine svake od komponente vektora opservacija. Istovremeno pratimo obe komponente, korišćenjem 𝑇2

0.00

50.00

100.00

150.00

200.00

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

𝑇^2 kontrolna karta

T^2 UCL = 43.91

Page 37: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

36

kontrolne karte, kako bismo održali odnos između njih. Vektor sredine i kovarijansna matrica dati su sa:

𝜇′ = (145,86; 199,04); ∑ = [12,703 −12,018

−12,018 26,825] .

Broj opservacija

𝑥1 𝑥2 𝑥1 − µ1∗ ,

µ1∗=145,86

𝑥2 − µ2∗ ,

µ2∗ =199,04

1 150,5 204,0 4,64 4,96 2 147,6 201,3 1,74 2,26 3 143,9 199,3 -1,97 0,26 4 147,9 198,3 2,03 -0,74 5 144,3 198,5 -1,56 -0,54 6 147,6 196,3 1,74 -2,74 7 149,7 197,3 3,83 -1,74 8 148,2 195,8 2,33 -3,24 9 140,5 202,1 -5,47 3,06

10 137,3 202,5 -8,56 3,46 11 147,1 194,0 1,24 -5,04

Tabela 5.3. Nove opservacije industrijskog procesa

Slika 5.3. 𝑇2 kontrolna karta za industrijski proces podataka

Za podatke u tabeli 5.3. računamo 𝑇2 vrednosti i ucrtavamo u kontrolnu kartu

prikazanu na slici 5.3. Za 𝛼 = 0,05, vidimo da su 𝑇2 vrednosti prve i desete opservacije iznad gornje kontrolne granice, pa se one proglašavaju signalima.

Page 38: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

37

5.2.3. Slučaj sredina podgrupa U slučaju posmatranja m opservacionih vektora, računamo srednje vrednosti za svaki

od pomenutih vektora i koristimo za izračunavanje statistika potrebnih pri konstruisanju kontrolne karte. Ukoliko je svaki od ovih vektora opisan MVN raspodelom 𝑁𝑝(µ, ∑), tada

će, prema poznatoj osobini normalne raspodele, srednja vrednost podgrupe od m vektora

imati 𝑁𝑝 (µ,∑

𝑚). Ako su parametri µ i ∑ poznati, 𝑇2 statistika za i-tu podgrupu sredine 𝑋�̅� se

računa kao: 𝑇2 = 𝑚(𝑋�̅� − 𝜇)′∑−1(𝑋�̅� − 𝜇),

a gornja kontrolna granica je jednaka 𝑈𝐶𝐿 = 𝜒𝑝

2(𝛼).

U suprotnom, 𝑇2 = (𝑋�̅� − �̅�)′𝑆−1(𝑋�̅� − �̅�)

i

𝑈𝐶𝐿 =(𝑚+𝑛)(𝑛−1−𝑝)

𝑚𝑛(𝑛−𝑝)𝐹(𝑝,𝑛−𝑝)(𝛼),

pri čemu su �̅� i S zajedničke procene µ i ∑ dobijene iz referentne baze podataka.

5.3. Princip glavnih komponenata

Analiza glavnih komponenata se bavi objašnjavanjem varijansno – kovarijansne strukture skupa promenljivih preko linearnih kombinacija ovih promenljivih. Njen zadatak je da smanji dimenzionalnost podataka i da ih interpretira. Posmatrajmo skup od p promenljivih koji je izabran da opiše varijabilnost čitavog sistema. Analizom glavnih komponenata razmatramo odnose između promenljivih i dolazimo do određenih interpretacija. Algebarski, glavne komponente su linearne kombnacije p slučajnih promenljivih, dok u geometrijskom smislu analiza glavnih komponenata pokušava da odabere nov koordinatni sistem, dobijen rotacijom originalnog koordinatnog sistema čije su ose datih p promenljivih. Nove ose predstavljaju pravce maksimalne varijabilnosti i obezbeđuju jeftinije i jednostavnije predstavljanje kovarijansne strukture, jer se skup od p promenljivih redukuje na k promenljivih koje daju istu informaciju kao i polazni skup promenljivih.

Neka je 𝑿 = (𝑋𝑖(1)

, … , 𝑋𝑖(𝑝)

) i-ti p-dimenzionalni vektor opservacija u originalnim

podacima. Mi formiramo novu p-dimenzionalnu opservaciju (𝑍𝑖(1)

, … , 𝑍𝑖(𝑝)

), tako da je l-ta

promenljiva u Z, 𝑍𝑖(𝑙)

, linearna kombinacija odstupanja originalnih p- dimenzija od njihovih

ciljnih vrednosti, tj.

𝑍𝑖(𝑙)

= ∑ 𝑐𝑙𝑢(𝑋𝑖(𝑢)

− 𝑚(𝑢)𝑝𝑢=1 ) .

Page 39: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

38

Za proces sa višedimenzionalnim podacima, njegova ukupna varijansa je definisana

kao suma varijansi p promenljivih, tj. suma dijagonalnih elemenata kovarijansne matrice ∑=(𝜎)𝑙𝑢. Ako označimo 𝜆1, ... , 𝜆𝑝 sopstvene vrednosti kovarijansne matrice ∑, dobro je

poznato da je njihova suma jednaka ukupnoj varijansi gore definisanog procesa, tj. ∑ 𝜆𝑙 =∑ 𝜎𝑙𝑙.

Za kvadratnu matricu A kažemo da je λ njena sopstvena vrednost sa odgovarajućim

sopstvenim vektorom 𝑒 ≠ 0, ako važi 𝐴𝑒 = 𝜆𝑒. Simetrična kvadratna matrica 𝐴𝑝𝑥𝑝 ima p

parova sopstvenih vrednosti i vektora (𝜆1, 𝑒1), … , (𝜆𝑝, 𝑒𝑝). Sopstveni vektori su jedinstveni,

osim u slučaju kada su dve ili više sopstvenih vrednosti jednake. Najčešće uređujemo sopstvene vrednosti u nerastućem poretku, tj. 𝜆1 ≥ ⋯ ≥ 𝜆𝑝. Neka je A matrica sopstvenih

vektora kovarijansne matrice ∑ i Ω matrica sopstvenih vrednosti, tj. Ω = [

𝜆1 ⋯ 0⋮ ⋱ ⋮0 ⋯ 𝜆𝑝

].

Tada važi, 𝐴𝐴′ = ∑ i 𝐴′𝐴 = 𝛺. Dakle, i- ta glavna komponenta je:

𝒁(𝑖) = 𝑒𝑖′(𝑿 − 𝒎)

koja maksimizira 𝑉𝑎𝑟(𝑍(𝑖)) = 𝑒𝑖′∑𝑒𝑖, 𝐶𝑜𝑣(𝑍(𝑖), 𝑍(𝑗)) = 𝑒𝑖

′∑𝑒𝑗 = 0, 𝑖, 𝑗 = 1, 𝑝̅̅ ̅̅̅, 𝑖 ≠ 𝑗, pod

uslovom da je 𝑒𝑖′𝑒𝑖 = 1, zbog jedinstvenosti rešenja. Za i-tu opservaciju, linearna kombinacija 𝒁(1) = 𝐶1

′(𝑿 − 𝒎) ima maksimalnu varijansu među svim mogućim linearnim

kombinacijama od X. Razlomak 𝜆𝑖

∑ 𝜆𝑖 označava varijansu objašnjenu i-tom glavnom

komponentom. Ušteda se postiže time što se smanji inicijalni broj komponenata, time što se odbacuju one komponente koje najmanje objašnjavaju varijansu.

5.4. Kontrolni dijagrami u prostoru glavnih komponenti

Da bismo videli ulogu glavnih komponenata u statističkoj kontroli procesa, razmotrimo

proces koji je opisan dvodimenzionalnom normalnom raspodelom sa poznatim parametrima µ i ∑.

Najpre analizirajmo sliku 5.4. Kao što vidimo sa slike, razlikujemo tri koordinatna

sistema. Prvi koordinatni sistem je sistem polaznih promenljivih (𝑥1, 𝑥2). Ukoliko standardizujemo 𝑥1 i 𝑥2, koristeći vrednosti

𝑦1 =𝑥1−𝜇1

𝜎1 i 𝑦2 =

𝑥2−𝜇2

𝜎2

mi dobijamo translirani koordinatni sistem (𝑦1, 𝑦2) koji se nalaze u centru elipse na slici 5.4.

Page 40: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

39

Slika 5.4. Transformacije koordinatnih sistema

Tada je 𝑇2 statistika predstavljena preko 𝑦1 i 𝑦2 na sledeći način: 𝑇2 = (𝑋 − 𝜇)′∑−1(𝑋 − µ) = 𝑌′𝑃−1𝑌,

gde je 𝑌′ = (𝑦1, 𝑦2), a P je korelaciona matrica za X. Položaj elipse u (𝑦1, 𝑦2) prostoru ostaje nepromenjen ovim transliranjem, kao i korelacija između 𝑦1 i 𝑦2 koja je ista kao korelacija između 𝑥1 i 𝑥2.

Treći koordinatni sistem na slici 5.4. je dobijen sledećim transformacijama:

𝑧1 =𝑦1+𝑦2

√2, 𝑧2 =

𝑦1−𝑦2

√2.

Pri ovim transformacijama 𝑇2 ima oblik: 𝑇2 = (𝑋 − 𝜇)′∑−1(𝑋 − µ) = 𝑌′𝑃−1𝑌 = 𝑍′𝛬−1𝑍,

gde 𝑍′ = (𝑧1, 𝑧2) i matrica Λ je dijagonalna matrica sa sopstvenim vrednostima matrice P duž dijagonale.

Poslednjom transformacijom smo promenljive 𝑧1 i 𝑧2 učinili nekoreliranim, a kako je reč o normalnoj raspodeli, 𝑧1 i 𝑧2 su i nezavisne. Pošto su 𝑧1 i 𝑧2 linearne kombinacije promenljivih 𝑥1 i 𝑥2, to su one glavne komponente korelacione matrice za 𝑥1 i 𝑥2. Ukoliko preskočimo korak standardizacije polaznih promenljivih, promenljive 𝑧1 i 𝑧2 biće glavne komponente odgovarajuće kovarijansne matrice ∑ i imaće različite reprezentacije.

Kontrolna oblast 𝑇2 statistike se može opisati promenljivama 𝑧1 i 𝑧2 na sledeći način

𝑇2 =𝑧1

2

1+𝜌+

𝑧22

1−𝜌< 𝑈𝐶𝐿,

gde je 𝜌 korelacija između 𝑥1 i 𝑥2, a 1 + 𝜌 i 1 − 𝜌 sopstvene vrednosti korelacione matrice polaznih promenljivih 𝑥1 i 𝑥2.

Postupak se može uopštiti za p polaznih promenljivih čijom se transformacijom 𝑇2 statistike se može opisati glavnim komponentama korelacione matrice istih na sledeći način:

𝑇2 =𝑧1

2

𝜆1+ ⋯ +

𝑧𝑝2

𝜆𝑝< 𝑈𝐶𝐿,

gde su 𝜆1 ≥ ⋯ ≥ 𝜆𝑝 sopstvene vrednosti korelacione matrice. Svaka vrednost 𝑧𝑖 je

izračunata kao

Page 41: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

40

𝑧𝑖 = 𝑈𝑖′𝑌,

gde su 𝑈𝑖, 𝑖 = 1, 𝑝̅̅ ̅̅̅ odgovarajući normalizovani sopstveni vektori korelacione matrice i Y je standardizovani vektor opservacija.

Da bismo bolje razumeli princip glavnih komponenti, razmotrimo opservacije koje su dobijene merenjima na 6 komponenti strukture sastavljene od aluminijumskih blokova pomoću numerički kontrolisane mašine.

E-Values % Cumul % Vec 1 Vec 2 Vec 3 Vec 4 Vec 5 Vec 6 1 240E-03 67,02 67,02 -0,04 0,46 0,11 -0,26 -0,79 0,29 2 7,70E-04 21,47 88,49 -0,05 0,46 0,13 -0,26 0,07 -0,84 3 3,59E-04 10,00 98,49 -0,04 0,50 0,10 -0,40 0,60 0,46 4 2,86E-05 0,80 99,29 -0,03 0,51 0,16 0,84 0,06 0,05 5 1,45E-05 0,40 99,69 0,70 -0,12 0,70 -0,03 0,01 0,00 6 1,10E-05 0,31 100,00 0,71 0,23 -0,67 0,01 -0,01 -0,02

Tabela 5.4. Sopstvene vrednosti inverzne kovarijansne matrice

U prvoj koloni tabele 5.4. predstavljene su sopstvene vrednosti inverzne kovarijansne

matrice za prvih 30 podataka, dok druga kolona sadrži procenat objašnjenja varijanse odgovarajućom glavnom komponentom. Biramo one glavne komponente koje najviše objašnjavaju varijansu. U našem slučaju to su prve tri glavne komponente i njihovim izborom veličina varijanse koja ostaje neobjašnjena je svega 1,5%. Kolone sa oznakama Vec1, Vec2, ... , Vec6 predstavljaju sopstvene vektore odgovarajućih sopstvenih vrednosti u koloni 1 koji se koriste pri linearnom predstavljanju glavnih komponenti originalnim promenljivim. Tako je, u našem slučaju, prva glavna komponenta aritmetička sredina pete i šeste promenljive, druga aritmetička sredina preostale četiri promenljive i treća razlika između šeste i pete promenljive.

S obzirom na to da glavne komponente predstavljaju linearne kombinacije centriranih slučajnih promenljivih, u slučaju stabilnih uslova, kada je proces u stanju statističke kontrole, njihove vrednosti bi trebalo da se grupišu oko nule, sa varijansama koje su jednake odgovarajućim sopstvenim vrednostima. Biramo one glavne komponente koje objašnjavaju najveći procenat varijanse i ucrtavamo ih na kontrolnu kartu sa sredinom nula i konstantnom gornjom i donjom centralnom granicom, tj. koristimo kontrolne granice sa 3 standardne devijacije od centralne linije. Pojedinačne komponente se mogu ucrtati na zasebnoj kontrolnoj karti, parovi komponenti se mogu grafički predstaviti na dijagramu rasipanja sto je prikazano na slikama 5.5, 5.6, 5.7.

Opažamo da prva glavna komponenta ima značajnu negativnu vrednost na 48-oj

opservaciji i značajnu pozitivnu vrednost za opservacije 49 i 61. Druga glavna komponenta ima značajan autlejer na 66. opservaciji. S obzirom na koeficijente ovih komponenti, ovi autlejeri bi trebalo da odgovaraju autlejerima u merenju dužine i prečnika.

Page 42: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

41

Slika 5.5. Grafik prve komponente u prostoru glavnih komponenti

Slika 5.6. Grafik druge komponente u prostoru glavnih komponenti

Page 43: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

42

Slika 5.7. Dijagram rasipanja prve dve glavne komponente

Korišćenjem tehnike glavnih komponenti ne znamo koliko je ukupno odstupanje multivarijacionih podataka od normalnih. Stoga kontrolni dijagrami u prostoru glavnih komponenti ne mogu zameniti 𝑇2 grafikone. Ukoliko istovremeno posmatramo više dijagrama, ne možemo tako dobro proceniti stanje van kontrole originalnih promenljivih, a u isto vreme ostaju nam nepoznati uzroci koji izazivaju ovakvo stanje.

Page 44: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

43

Glava 6 Interpretacija 𝑇2 signala za dve i više promenljivih

6.1. Ortogonalna dekompozicija

Da bismo mogli da interpretiramo signal na 𝑇2 kontrolnoj karti, razložićemo 𝑇2

statistiku u ortogonalne komponente koje će zapravo biti linearne kombinacije p originalnih promenljivih.

Neka je 𝑋′ = (𝑥1, 𝑥2) opservacioni vektor iz dvodimenzionalne normalne raspodele sa

nepoznatim vektorom sredine i nepoznatom kovarijansnom matricom. Pretpostavimo da su ove dve promenljive nezavisne. Na osnovu osobine normalne raspodele, njihova korelacija jednaka nuli. Takođe, pretpostavimo da su dve uzoračke varijacije 𝑠1

2 i 𝑠22

nejednake i označimo sa 𝑥1̅̅̅ i 𝑥2̅̅ ̅ odgovarajuće uzoračke sredine. 𝑇2 eliptična kontrolna oblast se dobija upotrebom sledeće formule:

𝑇2 =(𝑥1−𝑥1̅̅̅̅ )2

𝑠12 +

(𝑥2−𝑥2̅̅̅̅ )2

𝑠22 = 𝑐2, (6.1)

gde je c veličina kontrolne oblasti. Tipična kontrolna oblast je ilustrovana unutrašnošću

elipse na slici 6.1.a. Dakle, 𝑇2 statistiku razlažemo na dve aditivne i nezavisne komponente, zbog nezavisnosti originalnih promenljivih.

Slika 6.1.a. (𝑥1, 𝑥2) prostor Slika 6.1.b. (𝑦1, 𝑦2) prostor

Koristeći standardizaciju promenljivih 𝑥1 i 𝑥2, redom

𝑦1 =𝑥1−𝑥1̅̅̅̅

𝑠1 i 𝑦2 =

𝑥2−𝑥2̅̅̅̅

𝑠2,

Page 45: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

44

𝑇2 vrednost se može zapisati na sledeći način: 𝑇2 = 𝑦1

2 + 𝑦22 = 𝑐2, (6.2)

gde su 𝑦1 i 𝑦2, takođe, nezavisne, ali imaju različite vrednosti. Pažljivim ispitivanjem ovih komponenata dolazimo do uzroka javljanja signala. Kontrolna oblast koja se koristi nakon poslednje transformacije prikazana je na slici 6.1.b. i predstavljena je unutrašnošću kruga. 𝑇2 vrednost u ovom ortogonalnom transformisanom prostoru je ista kao Euklidovo kvadratno rastojanje tačke (𝑦1, 𝑦2) od koordinatnog početka i može biti predstavljena kvadratom hipotenuze pravouglog trougla kao na slici 6.1.b. Ovo je ekvivalentno statističkom rastojanju tačke (𝑥1, 𝑥2) od vektora sredine (𝑥1̅̅̅, 𝑥2̅̅ ̅̅ ).

Slika 6.2.a. Slika 6.2.b.

Dvodimenzionalni dijagrami glavnih komponenti sa različitim (a) i jednakim (b) varijansama

Razmotrimo slučaj kada promenljive nisu nezavisne i neka je njihova korelacija r, 𝑟 ≠

0. Tada je 𝑇2 vrednost predstavljena na sledeći način:

𝑇2 =1

1−𝑟2 [(𝑥1−𝑥1̅̅̅̅ )2

𝑠12 − 2𝑟

𝑥1−𝑥1̅̅̅̅

𝑠1 𝑥2−𝑥2̅̅̅̅

𝑠2 +

(𝑥2−𝑥2̅̅̅̅ )2

𝑠22 ] (6.3)

i odgovarajuća eliptična kontrolna oblast bila bi nagnuta, za razliku kada su promenljive nezavisne. Korišćenjem standardizovanih vrednosti 𝑦1 i 𝑦2, za 𝑥1 i 𝑥2, redom, 𝑇2 vrednost je predtsavljena na sledeći način:

𝑇2 =1

1−𝑟2 (𝑦12 − 2𝑟𝑦1𝑦2 + 𝑦2

2). (6.4)

Kako transformacija u prostoru (𝑦1, 𝑦2) nije ortogonalna, to se 𝑇2 statistika ne može predstaviti dvema nezavisnim aditivnim komponentama. Da bismo rešili ovaj problem, najpre moramo transformisati ose prostora (𝑥1, 𝑥2) u ose elipse, međutim to u našem, zavisnom, slučaju nije moguće, pa koristimo dodatnu transformaciju

𝑧1 =𝑦1+𝑦2

√2 i 𝑧2 =

𝑦1−𝑦2

√2,

čime razlažemo 𝑇2 statistiku, na dve aditivne komponente 𝑧1 i 𝑧2, koje zapravo predstavljaju prvu i drugu glavnu komponentu, dobijene na osnovu korelacione matrice za 𝑥1 i 𝑥2. Tada 𝑇2 ima oblik

𝑇2 =𝑧1

2

1+𝑟+

𝑧22

1−𝑟. (6.5)

Page 46: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

45

Glavne komponente 𝑧1 i 𝑧2 nemaju jednake pondere, pa njihovom primenom još uvek ne možemo sa lakoćom odrediti statističko rastojanje, slika 6.2.a. Zaista, ponder prve komponente jednak je recipročnoj vrednosti 𝜆1 = 1 + 𝑟, a ponder druge 𝜆2 = 1 − 𝑟, a ove vrednosti će biti jednake samo u slučaju nezavisnih originalnih promenljivih.

Da bismo 𝑇2 statistiku predstavili preko aditivnih, ortogonalnih komponenti jednakih pondera, koristimo dodatnu transformaciju:

𝑤1 =𝑧1

√1+𝑟 i 𝑤2 =

𝑧2

√1−𝑟,

i 𝑇2 biće predstavljena na sledeći način: 𝑇2 = 𝑤1

2 + 𝑤22 = 𝑐2. (6.6)

Kontrolna oblast koja se koristi nakon poslednje transformacije je kružna i kvadratno rastojanje je predstavljeno hipotenuzom pravouglog trougla, što se i vidi sa slike 6.2.b. Kako su 𝑤1 i 𝑤2 linearne kombinacije obe promenljive 𝑥1 i 𝑥2, ne možemo imati jasnu interpretaciju izvora signala koji se javljaju na pojedinačnim promenljivim. Sa povećanjem promenljivih problem postaje kompleksniji, pa koristimo takozvanu MYT dekompoziciju o kojoj će biti više reči u narednom poglavlju.

6.2. MYT dekompozicija

Ovaj metod je jedan od najpoželjnijih metoda dekompozicije 𝑇2 statistike. Dobila je naziv u čast njenim tvorcima Mason, Young and Tracy.

Najpre razmatramo dvodimenzionalni vektor opservacija 𝑋′ = (𝑥1, 𝑥2) gde su 𝑥1 i 𝑥2

korelirane. MYT dekompozicija koristi ortogonalnu transformaciju u razlaganju 𝑇2 vrednosti na dve jednako ponderisane komponente. Jedna dekompozicija data je sa

𝑇2 = 𝑇12 + 𝑇2.1

2 ,

gde su 𝑇12 =

(𝑥1−𝑥1̅̅̅̅ )2

𝑠12 i 𝑇2.1

2 =(𝑥2−𝑥2.1̅̅ ̅̅ ̅̅ )2

𝑠2.12 . U ovoj formuli 𝑥2.1̅̅ ̅̅ ̅ je ocena uslovne sredine 𝑥2 za datu

vrednost 𝑥1, a 𝑠2.12 odgovarajuća ocena uslovne varijanse promenljive 𝑥2 za datu vrednost

𝑥1. Sada 𝑇2 možemo zapisati na sledeći način:

𝑇2 =(𝑥1 − 𝑥1̅̅̅)2

𝑠12 +

(𝑥2 − 𝑥2.1̅̅ ̅̅ ̅)2

𝑠2.12 .

Page 47: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

46

Slika 6.3. (𝑇1, 𝑇2.1) prostor

Kvadratni koren 𝑇2 vrednosti može se ucrtati u 𝑇1 i 𝑇2.1 prostoru kao što se može videti na slici 6.3. I ovo je samo jedna od mogućih dekompozicija za p=2. Slično, 𝑇2 statistiku možemo predstaviti na sledeći način:

𝑇2 = 𝑇22 + 𝑇1.2

2 ,

gde su 𝑇22 =

(𝑥2−𝑥2̅̅̅̅ )2

𝑠22 i 𝑇1.2

2 =(𝑥1−𝑥1.2̅̅ ̅̅ ̅̅ )2

𝑠1.22 .

Posmatrajmo sada p-dimenzionalni vektor opservacija 𝑋′ = (𝑥1, … , 𝑥𝑝). Vektor (𝑋 −

�̅�) možemo zapisati u sledećem obliku (𝑋 − �̅�)′ = [(𝑋(𝑝−1) − �̅�(𝑝−1)), (𝑥𝑝 − 𝑥𝑝̅̅ ̅)]′, gde je

𝑋(𝑝−1)′ = (𝑥1, … , 𝑥𝑝−1) (p-1)-dimenzionalni vektor koji isključuje p-tu promenljivu 𝑥𝑝 i

�̅�(𝑝−1) predstavlja odgovarajući vektor sredine. Slično, matricu S možemo predstaviti na sledeći način:

𝑆 = [𝑆𝑋𝑋 𝑠𝑥𝑋

𝑠𝑥𝑋′ 𝑠𝑝

2 ],

gde je 𝑆𝑋𝑋 (p-1)x(p-1) kovarijansna matrica za prve p-1 promenljive, 𝑠𝑝2 je varijansa od 𝑥𝑝, a

𝑠𝑥𝑋 vektor koji sadrži kovarijansu između 𝑥𝑝 i preostalih p-1 promenljivih. Korišćenjem

prethodnih rezultata, 𝑇2 statistiku razlažemo na dve nezavisne komponente na sledeći način:

𝑇2 = 𝑇𝑝−12 + 𝑇𝑝.1,2,… ,𝑝−1

2 ,

gde je 𝑇𝑝−12 = (𝑋(𝑝−1) − �̅�

(𝑝−1))

′𝑆𝑋𝑋

−1 (𝑋(𝑝−1) − �̅�(𝑝−1)

) po svojoj prirodi je i sama 𝑇2

statistika i drugi sabirak može da se predstavi kao kvadrat p-te komponente vektora X, korigovan ocenama sredine i standardne devijacije uslovne raspodele 𝑥𝑝 za dato

(𝑥1, … , 𝑥𝑝−1), tj.

𝑇𝑝.1,2,… ,𝑝−12 = (𝑥𝑝 − �̅�𝑝.1,2,…,𝑝−1)

2 𝑠𝑝.1,2,…,𝑝−12⁄ ,

gde su

�̅�𝑝.1,2,…,𝑝−1 = 𝑥𝑝̅̅ ̅ + 𝐵𝑝′ (𝑋(𝑝−1) − �̅�(𝑝−1)) i 𝐵𝑝

′ = 𝑆𝑋𝑋−1𝑠𝑥𝑋

p-1 dimenzionalni vektor ocene koeficijenata regresije za 𝑥𝑝 na osnovu p-1 preostalih

promenljivih. To može biti prikazano kao ocena uslovne varijanse date sa 𝑠𝑝.1,2,…,𝑝−1

2 = 𝑠𝑝2 − 𝑠𝑥𝑋

′ 𝑆𝑋𝑋−1𝑠𝑥𝑋.

Page 48: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

47

Pošto je 𝑇𝑝−12 , takođe, 𝑇2 statistika, razlažemo je na dve ortogonalne komponente na

sledeći način:

𝑇𝑝−12 = 𝑇𝑝−2

2 + 𝑇𝑝−1.1,2,…,𝑝−22 .

Nastavljajući ovaj postupak i dobijamo samo jednu od mogućih MYT dekompozicija 𝑇2 statistike:

𝑇2 = 𝑇12 + 𝑇2.1

2 + 𝑇3.1,22 + ⋯ + 𝑇𝑝.1,2,…,𝑝−1

2 , (6.7)

gde je 𝑇1

2 kvadrat jednodimenzionalne t statistike za prvu komponentu vektora X i data je

sa 𝑇12 =

(𝑥1−𝑥1̅̅̅̅ )2

𝑠12 . Iz navedenog možemo zapaziti da svi izrazi, u razlaganju 𝑇2 statistike, sem

prvog, uslovni i predstavljamo ih preko standardnog pristupa koji se koristi u

multivarijacionoj analizi. Znamo da je 𝑇𝑝−12 vrednost 𝑇2 statistike za podvektor 𝑋(𝑝−1)′ =

(𝑥1, … , 𝑥𝑝−1), tj.

𝑇(𝑥1,… ,𝑥𝑝−1)2 = 𝑇1

2 + 𝑇2.12 + 𝑇3.1,2

2 + ⋯ + 𝑇𝑝−1.1,2,…,𝑝−22 .

Slično, 𝑇𝑝−22 je vrednost 𝑇2 statistike za podvektor 𝑋(𝑝−2)′ = (𝑥1, … , 𝑥𝑝−2), tj.

𝑇(𝑥1,… ,𝑥𝑝−2)2 = 𝑇1

2 + 𝑇2.12 + 𝑇3.1,2

2 + ⋯ + 𝑇𝑝−2.1,2,…,𝑝−32 .

Nastavljajući postupak, računamo 𝑇2 vrednosti za sve podvektore vektora X, dok na osnovu poslednjeg podvektora, 𝑋(1) = (𝑥1), računamo bezuslovni 𝑇2 izraz, tj.

𝑇(𝑥1)

2 = 𝑇12.

Sve navedene vrednosti računamo korišćenjem formule:

𝑇(𝑥1,… ,𝑥𝑗)2 = (𝑋(𝑗) − �̅�(𝑗))

′𝑆𝑗𝑗

−1(𝑋(𝑗) − �̅�(𝑗)),

gde 𝑋(𝑗) predstavlja odgovarajući podvektor, �̅�(𝑗) je odgovarajuća podvektorska sredina i 𝑆𝑗𝑗 označava odgovarajuću kovarijansnu podmatricu koja je dobijena iz matrice S brišući

sve neupotrebljene vrste i kolone.

Tako izraze MYT dekompozicije računamo na sledeći način:

𝑇𝑝.1,2,… ,𝑝−12 = 𝑇(𝑥1,… ,𝑥𝑝)

2 − 𝑇(𝑥1,… ,𝑥𝑝−1)2 ;

𝑇𝑝−1.1,2,… ,𝑝−22 = 𝑇(𝑥1,… ,𝑥𝑝−1)

2 − 𝑇(𝑥1,… ,𝑥𝑝−2)2 ;

...

...

...

𝑇2.12 = 𝑇(𝑥1,𝑥2)

2 − 𝑇(𝑥1)2 ;

𝑇(𝑥1)2 =

(𝑥1−𝑥1̅)2

𝑠12 .

Page 49: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

48

-Osobine MYT dekompozicije Razmotrimo p-dimenzionalni vektor 𝑋′ = (𝑥1, … , 𝑥𝑝). Permutovanjem komponenti

ovog vektora dobijamo novi vektor čija će 𝑇2 vrednost biti ista kao i kod originalnog. Kako ima 𝑝! = 𝑝 ∙ (𝑝 − 1) ∙ (𝑝 − 2) ∙ … ∙ 3 ∙ 2 ∙ 1 permutacija komponenti vektora, 𝑇2 vrednost možemo podeliti na 𝑝! različitih načina. Na primer, za p=3 imamo p!=6 dekompozicija 𝑇2 vrednosti, datih sa:

𝑇2 = 𝑇12 + 𝑇2.1

2 + 𝑇3.1,22

= 𝑇12 + 𝑇3.1

2 + 𝑇2.1,32

= 𝑇22 + 𝑇1.2

2 + 𝑇3.1,22

= 𝑇22 + 𝑇3.2

2 + 𝑇1.2,32

= 𝑇32 + 𝑇1.3

2 + 𝑇2.1,32

= 𝑇32 + 𝑇2.3

2 + 𝑇1.2,32 .

Izrazi u okviru jedne dekompozicije su nezavisni, dok sa izrazima u ostalim

dekompozicijama ne moraju biti. Kod p – dimenzionalnog vektora imamo p izraza u svakoj permutaciji i p! permutacija, pa u okviru istog razlikujemo 𝑝𝑝! mogućih predstavljanja 𝑇2 statistike MYT dekompozicijom. Uopšteno, kako izrazi nisu jedinstveni, postoji 𝑝x2(𝑝−1) različitih izraza među svim mogućim dekompozicijama. Za svaki od izraza bi trebalo odrediti doprinos otkrivanju signala. Kada je p veliko, računanje ovih izraza je otežano. Na primer, za p=10 postoji 5000 jedinstvenih izraza u MYT dekompoziciji, pa da bismo prevazišli ovaj problem predlažemo programski paket koji može brzo izračunati komponente dekompozicije za velike skupove promenljivih. Razmotrimo šemu na osnovu koje pojednostavljujemo računanje komponenti dekompozicije.

Korak 1. Izračunamo individualnu 𝑇2 statistiku za svaku komponentu vektora X, pa

upoređivanjem sa odgovarajućom gornjom kontrolnom granicom odstranjujemo promenljive čije su opservacije van kontrole i time smanjujemo skup promenljivih. Proveravamo podvektor preostalih k promenljivih i ponavljamo postupak.

Korak 2. Ako signal ostane u podvektoru k promenljivih, mi računamo sve 𝑇𝑖.𝑗

2 izraze.

Uklanjamo iz razmatranja sve parove promenljivih (𝑥𝑖, 𝑥𝑗) čija je 𝑇𝑖.𝑗2 vrednost van kontrole

i time redukujemo skup promenljivih. Analiziramo otklonjene promenljive kako bismo uočili razlog javljanja signala i računamo 𝑇2 za preostali podvektor. Ukoliko u preostalom podvektoru nema signala, znači da je bio posledica odnosa parova promenljivih koje smo uklonili iz daljeg razmatranja.

Korak 3. Ako podvektor preostalih promenljivih još uvek sadrži signal, računamo sve

𝑇𝑖.𝑗,𝑘2 izraze. Uklanjamo bilo koju kombinaciju tri promenljive (𝑥𝑖, 𝑥𝑗 , 𝑥𝑘) čije su vrednosti

van kontrole i proveravamo da li je signal i dalje prisutan u preostalom podvektoru. Korak 4. Nastavljamo računanje izraza višeg reda na ovaj način sve dok nema

promenljivih u redukovanom skupu. Najgora situacija je ta da se računaju svi izrazi.

Page 50: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

49

Kako možemo izračunati 𝑇2 statistiku za bilo koji podvektor početnog vektora

opservacija, ovo možemo primeniti u situaciji nedostajućih podataka. Da ne bismo prekidali kontrolu usled javljanja signala, najbolje je promenljivu koja dovodi do istog isključiti iz kontrolne procedure i postupak ponoviti za preostali podvektor promenljivih. Postupak ponavljamo sve dok otklonimo sve promenljive koje dovode do signala.

6.3. Interpretacija signala na 𝑇2 komponenti

6.3.1. Slučaj dve promenljive Jednačine 𝑇2 = 𝑇1

2 + 𝑇2.12 i 𝑇2 = 𝑇2

2 + 𝑇1.22 predstavljaju dve moguće MYT

dekompozicije za vektor opservacija 𝑋′ = (𝑥1, 𝑥2). Razmatrajući obe dekompozicije, imamo četiri izraza, dva bezuslovna i dva uslovna. Dobijena 𝑇2 vrednost može biti velika ma koju dekompoziciju koristili za njeno izračunavanje.

Ukoliko izrazi 𝑇12 =

(𝑥1−𝑥1̅̅̅̅ )2

𝑠12 ili 𝑇2

2 =(𝑥2−𝑥2̅̅̅̅ )2

𝑠22 imaju velike vrednosti i ako je opservirana

vrednost promenljive van kontrolnih granica, signal će se javiti na jednom od njih. Dok, interpretacija velike vrednosti na uslovnim izrazima zahteva složeniju analizu. Član 𝑇2.1

2 =(𝑥2−𝑥2.1̅̅ ̅̅ ̅̅ )2

𝑠2.12 , koji predstavlja meru kvadratnog statističkog odstupanja opsrvirane vrednosti 𝑥2

od uslovne sredine 𝑥2.1̅̅ ̅̅ ̅, ispitaćemo grafički predstavljanjem kontrolne oblasti u prostoru (𝑥1, 𝑥2) prikazanom na slici 6.4. Da bismo sproveli postupak analize fiksiramo vrednost promenljive 𝑥1 = 𝑎. Da bi proces bio u stanju kontrole, tj. da se opservirana vrednost nalazi unutar granica elipse, vrednost za 𝑥2 mora da potiče iz osenčenog intervala duž 𝑥2 ose. Dakle, vrednost 𝑥2 biće sadržana u uslovnoj gustini, inače signal će se dobiti na 𝑇2.1

2 komponenti.

Slično možemo objasniti pojavu signala na 𝑇1.2

2 komponenti. Fiksiramo 𝑥2 = 𝑏. Da bi proces bio u stanju kontrole, vrednost za 𝑥1 mora da bude u osenčenom intervalu duž 𝑥1 ose, tj. biće sadržana u uslovnoj gustini. U suprotnom signal će biti prisutan na 𝑇1.2

2 komponenti, što je prikazano na 6.5. Signal na uslovnom izrazu možemo interpretirati kao neželjena pozicija opservirane vrednosti jedne promenljive u odnosu na drugu.

Page 51: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

50

Slika 6.4. Interpretacija 𝑇2.12 komponenti Slika 6.5. Interpretacija 𝑇1.2

2 komponenti

6.3.2. Slučaj više promenljivih Razmotrimo interpretaciju signala 𝑇2 statistike sa komponentama MYT dekompozicije.

Razmatramo opservacioni vektor signalizacija 𝑋′ = (𝑥1, … , 𝑥𝑝) kao

𝑇(𝑥1,… ,𝑥𝑝)2 > 𝑈𝐶𝐿.

Ilustrujmo iterativni postupak za nalaženje promenljivih koje dovode do signala. Koristeći 𝑇2 = 𝑇𝑝−1

2 + 𝑇𝑝.1,2,… ,𝑝−12 i 𝑇2 = 𝑇1

2 + 𝑇2.12 + 𝑇3.1,2

2 + ⋯ + 𝑇𝑝.1,2,…,𝑝−12 , 𝑇2 statistika može biti

konstruisana na bilo kojoj podgrupi promenljivih 𝑥1, … , 𝑥𝑝. Računamo 𝑇2 statistiku za

svaku pojedinačnu promenljivu 𝑥𝑗 , 𝑗 = 1, 𝑝̅̅ ̅̅̅, gde je 𝑇𝑗2 =

(𝑥𝑗−𝑥𝑗̅̅ ̅)2

𝑠𝑗2 , a 𝑥�̅� i 𝑠𝑗

2 ocene odgovarajuće

sredine i varijanse dobijene iz referentnog skupa podataka, i upoređujemo je sa odgovarajućom gornjom kontrolnom granicom, gde je

𝑈𝐶𝐿(𝑥𝑗) =𝑝(𝑛 + 1)(𝑛 − 1)

𝑛(𝑛 − 𝑝)𝐹(𝑝,𝑛−𝑝)(𝛼) =

𝑛 + 1

𝑛𝐹(1,𝑛−1)(𝛼)

izračunato za odgovarajući nivo α i p=1. Isključujemo iz originalnog skupa sve 𝑥𝑗 za koje je

𝑇𝑗2 > 𝑈𝐶𝐿(𝑥𝑗)

pošto opservacije na ovom podskupu promenljivih su van kontrole i dovode do signala. Iz skupa promenljivih koje ne dovode do signala, računamo 𝑇2 statistiku za sve moguće parove promenljivih. Za sve (𝑥𝑖, 𝑥𝑗), 𝑖 ≠ 𝑗 računamo 𝑇(𝑥𝑖 ,𝑥𝑗)

2 i upoređujemo ove vrednosti sa

𝑈𝐶𝐿(𝑥𝑖,𝑥𝑗) =2(𝑛+1)(𝑛−1)

𝑛(𝑛−2)𝐹(𝛼,2,𝑛−2).

Isključujemo sve parove promenljivih za koje važi 𝑇(𝑥𝑖 ,𝑥𝑗)

2 > 𝑈𝐶𝐿(𝑥𝑖,𝑥𝑗).

Isključeni parovi promenljivih, a uz njih isključene pojedinačne promenljive, sadrže grupu promenljivih koje dovode do signala.

Page 52: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

51

Međutim, ovaj metod nam ne pruža uvid u to kako individualne vektorske komponente doprinose signalu, pa ispitujemo individualne izraze MYT dekompozicije i pronalazimo one sa velikim vrednostima. Svaki od izraza upoređujemo sa njegovom odgovarajućom

kritičnom vrednošću i u slučaju p promenljivih 𝑇𝑗2 statistika ima asimptotski

𝑛+1

𝑛𝐹(1,𝑛−1)

raspodelu, dok 𝑇𝑗.1,2,…,𝑗−12 ima asimptotski

(𝑛+1)(𝑛−1)

𝑛(𝑛−𝑘−1)𝐹(1,𝑛−𝑘−1) raspodelu, gde je k jednako

broju uslovnih promenljivih. Korišćenjem ovih raspodela, kritične vrednosti (𝐶𝑉𝑠), za prag značajnosti α i referentni skup podataka obima n, za oba, uslovna, i bezuslovna izraza se dobijaju na sledeći način:

bezuslovni izrazi: 𝐶𝑉 =𝑛+1

𝑛𝐹(𝛼,1,𝑛−1); (6.8)

uslovni izrazi: 𝐶𝑉 =(𝑛+1)(𝑛−1)

𝑛(𝑛−𝑘−1)𝐹(𝛼,1,𝑛−𝑘).

Razmotrimo bezuslovni izraz 𝑇𝑗

2, 𝑗 = 1, 𝑝̅̅ ̅̅̅ koji je kvadrat jednodimenzionalne t

statistike za posmatranu vrednost j-te promenljive opservacionog vektora X. Da bi proces bio pod kontrolom ova vrednost mora biti manja od njene kritične vrednosti, tj.

𝑇𝑗2 <

𝑛+1

𝑛𝐹(1,𝑛−1)(𝛼).

Pošto je 𝑡(𝑛−1)(𝛼

2) = √𝐹(1,𝑛−1)(𝛼), možemo izraziti ovaj uslov na sledeći način:

−√𝑛 + 1

𝑛𝑡(𝑛−1)(

𝛼

2) < 𝑇𝑗 < √

𝑛 + 1

𝑛𝑡(𝑛−1)(

𝛼

2)

ili kao

�̅� − √𝑛+1

𝑛𝑡(𝑛−1)(

𝛼

2)𝑠𝑗 < 𝑥𝑗 < �̅� + √

𝑛+1

𝑛𝑡(𝑛−1)(

𝛼

2)𝑠𝑗,

gde je 𝑡(𝑛−1)(𝛼

2) odgovarajuća vrednost iz t raspodele sa n-1 stepeni slobode. Ovo je

ekvivalentno korišćenju jednodimenzionalne Šuartove kontrolne karte za j-tu promenljivu.

Na slici 6.6. je prikazan slučaj kada je p=3. Kvadar predstavlja kontrolne granice prethodne nejednakosti svake od tri promenljive i ucrtane su u trodimenzionalni prostor. Međutim, prava kontrolna oblast ukupne 𝑇2 statistike je elipsoid i on izlazi van granica kvadra. Ako je opservacioni vektor van kvadra, kao tačka A, onda su promenljive van kontrole. Za razliku od nje, tačka C se takođe nalazi van kvadra, ali ona neće biti smatrana kao tačka van kontrole, jer se nalazi unutar elipsoida, pa njena 𝑇2 vrednost neće biti signalizirana. Dodatan uvid u razlog javljanja signala možemo dobiti ispitivanjem uslovnih članova dekompozicije.

Page 53: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

52

Slika 6.6. Trodimenzionalni prostor promenljivih 𝑥1, 𝑥2 , 𝑥3 Posmatrajmo opštu formu uslovnog izraza datog sa:

𝑇𝑗.1,2,… ,𝑗−12 = (𝑥𝑗 − �̅�𝑗.1,2,…,𝑗−1)

2 𝑠𝑗.1,2,…,𝑗−12⁄ .

Ova vrednost će biti mala u slučaju kada je brojilac u prethodnoj jednakosti mali, jer je imenilac, dobijen na osnovu referentne baze podataka, fiksna veličina. Stoga će komponenta 𝑥𝑗 iz opservacionog vektora X biti sadržana u uslovnoj raspodeli 𝑥𝑗 za dato

𝑥1, … , 𝑥𝑗−1 i upada u elipsoid. U suprotnom, na ovom članu će se javiti signal, tj.

𝑇𝑗.1,2,… ,𝑗−12 >

(𝑛+1)(𝑛−1)

𝑛(𝑛−𝑘−1)𝐹(1,𝑛−𝑘−1)(𝛼),

što nam ukazuje na neki problem u odnosu promenljivih 𝑥1, … , 𝑥𝑗. Na primer, signal na

𝑇𝑗.1,2,… ,𝑗−12 znači da opservirane vrednosti promenljive 𝑥𝑗 nisu na odgovarajućoj poziciji u

odnosu na promenljive 𝑥1, … , 𝑥𝑗−1. Da bismo ilustrovali prethodnu situaciju, razmotrimo

kontrolne oblasti prikazane na slici 6.6. u 𝑥1 i 𝑥3 prostoru prikazanom na slici 6.7. Tačka signala B, na slici 6.6, je smeštena u gornjem desnom uglu slike 6.7, unutar pravougaonog raspona 𝑥1 i 𝑥3 , ali izvan elipsoidne 𝑇2 kontrolne oblasti. Ovo znači da na pojedinačnim kartama za 𝑥1 i 𝑥3 nece biti signala, ali će ga biti na kartama uslovnih komponenti.

Slika 6.7. Prostor promenljivih 𝑥1 i 𝑥3

Page 54: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

53

Uslovne raspodele dobijene su korelacijom među promenljivama, a uslovni pojmovi MYT dekompozicije zavise od ove strukture. Pod pretpostavkom multivarijacione normalnosti, ako su promenljive nekorelirane, to su one i nezavisne prema dobro poznatoj osobini normalne raspodele, pa dekompozicija 𝑇2 statistike neće sadržati uslovne članove. Radi ilustracije posmatrajmo p-dimenzionalnu normalnu raspodelu sa poznatom sredinom µ i poznatom kovarijansnom matricom datom sa

∑ = [𝜎1

2 ⋯ 0⋮ ⋱ ⋮0 ⋯ 𝜎𝑝

2].

𝑇2 vrednost za opservaciju koja potiče iz ove raspodele data je sa 𝑇2 = (𝑋 − 𝜇)′∑−1(𝑋 − µ)

= ∑(𝑥𝑖−𝜇𝑖)2

𝜎𝑖2

𝑝𝑖=1

= 𝑇12 + ⋯ + 𝑇𝑝

2,

gde su svi, 𝑇𝑖2 =

(𝑥𝑖−𝜇𝑖)2

𝜎𝑖2 , izrazi bezuslovni.

Ukoliko se na bezuslovnim izrazima javi signal, to znači da je promenljiva van kontrole jer je izvan kontrolnog raspona određenog referentnom bazom podataka, pa će se opservacioni vektor sa ovim signalom ucrtati hiperpravougaone kutije definisane kontrolnim granicama za bezuslovne pojmove. Ukupni 𝑇2 signali na opservacijama u kutiji imaće velike uslovne izraze, a oni znače da je nešto pogrešno sa odnosom između promenljivih koje su sadržane u izrazu.

6.4. Primer Da bismo rezimirali prethodnu diskusiju o tumačenju signala 𝑇2 statistike,

posmatrajmo primer procesa čije karakteristike kvaliteta treba uskladiti različitim standardima potrošača. Posmatramo 85 opservacija, dobijenih na osnovu merenja sedam promenljivih, i njihovom analizom ćemo doneti zaključak o kvalitetu proizvoda.

U ovom primeru kontrolna procedura kvaliteta proizvoda ima dve svrhe. Prvo, ako

odgovara strukturi referentne baze podataka smatra se da je pogodna za sertifikat i isporuku kupcu. Drugo, analizom odbačenih vrednosti možemo da odredimo razlog odbacivanja upotrebom MYT dekompozicije 𝑇2 statistike. Na primer, predviđamo novu ciljnu vrednost za skup isključenih promenljivih i vršimo dalju analizu razloga javljanja signala na ovim promenljivim.

Page 55: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

54

𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 Sredina 87,15 7,29 3,21 0,335 0,05 0,864 1,0875 Minimum 86,40 6,8 2,8 0,27 0,00 0,8 0,85 Maksimum 87,50 7,9 3,5 0,39 0,12 1,00 1,4 Std Dev 0,26 0,21 0,13 0,02 0,03 0,05 0,11

Tabela 6.1.a. Deskriptivne statistike sedam karakteristika kvaliteta

𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7

𝑥1 1,000 -0,500 -0,623 -0,508 -0,073 -0,464 -0,329 𝑥2 1,000 -0,160 -0,063 -0,471 0,037 -0,473 𝑥3 1,000 0,700 0,432 0,118 0,400 𝑥4 1,000 0,216 0,110 0,309 𝑥5 1,000 -0,030 0,377

𝑥6 1,000 0,368 𝑥7 1,000

Tabela 6.1.b. Korelacije sedam karakteristika kvaliteta

U tabelama 6.1.a i 6.1.b. prikazane su deskriptivne statistike sedam posmatranih

karakteristika kvaliteta, kao i njihova korelacija. Ove statistike igraju glavnu ulogu u interpretaciji signala za individualne komponente dekompozicije.

Na slici 6.8. je prikazana 𝑇2 kontrolna karta 𝑇2 vrednosti podataka iz referentne baze podataka poređane u vremenskom redosledu proizvodnje i prihvatanja od strane potrošača.

Slika 6.8. 𝑇2 kontrolna karta

Sedam posmatranih promenljivih predstavljaju određene hemijske sastave koji su sadržani u proizvodu. Ne samo da se opservacije na ovim promenljivama moraju održavati

Page 56: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

55

u strogo definisanim rasponima, već takođe moraju biti usklađeni sa odnosima određenim korelacionom matricom referentne baze podataka.

Razmotrimo opservacioni vektor 𝑋′ = (89,0; 7,3; 3,2; 0,33; 0,05; 0,86; 1,08) uzet iz skupa odbačenih podataka. Podaci su odbačeni zbog toga što je 𝑇2 vrednost opservacionog vektora veća od njegove gornje kontrolne granice, tj.

𝑇(89,0;7,3;3,2;0,33;0,05;0,86;1,08)2 = 1597,712 > 𝑈𝐶𝐿 = 16,241.

Koristimo veliku vrednost greške prve vrste, α=0,05, kako bi se potrošač zaštitio od primanja proizvoda koji su van kontrole, tj. koji se smatraju škartom.

𝑇2 vrednost ovog signalizirajućeg vektora opservacija razlažemo korišćenjem računske šeme opisane u odeljku 6.2. i računamo kritičnu vrednost na osnovu jednakosti (6.8), pa kako je n=85 i α=0,05 dobijamo CV=4,0011.

𝑇2

komponenta 𝑇1

2 𝑇22 𝑇3

2 𝑇42 𝑇5

2 𝑇62 𝑇7

2

Vrednost 47,0996∗ 0,0014 0,0092 0, 0751 0,0056 0,0071 0,0047

Tabela 6.2. Bezuslovni izrazi za 1. opservaciju Upoređujemo 𝑇2 vrednosti iz tabele 6.2. sa prethodno izračunatom kritičnom vrednošću, redom. Kako je jedino vrednost bezuslovnog izraza 𝑇1

2 veća od kritične vrednosti, zaključujemo da promenljiva 𝑥1 doprinosi opštem signalu.

Upoređivanjem opservirane vrednosti promenljive 𝑥1 sa njenom minimalnom i maksimalnom vrednošću, iz tabele 6.1.a, nalazimo da je ista veća od maksimalne vrednosti sadržane u referentnoj bazi podataka, tj 89 > 87,5. Da bismo proizvod učinili prihvatljivim kupcu, ova vrednost mora biti smanjena.

Uklanjamo ovu vrednost i ispitujemo da li preostali podvektor podataka i dalje sadrži signal. 𝑇2 vrednost za podvektor (7,3; 3,2; 0,33; 0,05; 0,86; 1,08) ima sledeću vrednost

𝑇(7,3;3,2;0,33;0,05;0,86;1,08) 2 = 0,105,

koju upoređujemo sa kritičnom vrednošću 14,3019 i donosimo zaključak da signal nije prisutan.

Dakle, jedini razlog javljanja signala je velika opservirana vrednost promenljive 𝑥1. Potrebno je preduzeti korektivne mere kako bi ova vrednost bila smanjena. Traženu vrednost dobijamo primenom linearne regresije promenljive 𝑥1 na osnovu fiksiranih vrednosti ostalih promenljivih (7,3; 3,2; 0,33; 0,05; 0,86; 1,08). Dobijena je sledeća regresiona jednačina za 𝑥1:

�̂�1 = 99,7515 − 0,9723𝑥2 − 1,0744𝑥3 − 0,6375𝑥5 − 1,2049𝑥6 − 0,9034𝑥7. Promenljivu 𝑥4 smo izostavili iz prethodne jednačine jer ne daje značajan doprinos predviđanju. Primenom prethodne jednačine dobijamo da je predviđena vrednost za 𝑥1 87,16, pa 𝑇2 vrednost, dobijena uključenjem ove vrednosti i posmatranih vrednosti ostalih promenljivih, je:

𝑇(87,16;7,3;3,2;0,33;0,05;0,86;1,08)2 = 0,02.

Page 57: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

56

Na osnovu male 𝑇2 vrednosti, zaključujemo da je moguće korigovati vrednost promenljive 𝑥1, pa se proizvod ne smatra škartom.

Nastavljamo analizu računanjem 𝑇2 uslovnih izraza u cilju pronalaska promenljivih koje doprinose opštem signalu. Ovi izrazi su predstavljeni u tabeli 6.3. Računarska šema otkriva samo jedan značajan izraz, 𝑇3.4

2 . Na ovom nivou, mi uklanjamo opservaciju na trećoj i četvrtoj promenljivoj, pa postupak ponavljamo za preostali podvektor podataka (𝑥1, 𝑥2, 𝑥5, 𝑥6, 𝑥7)’=(87,2; 7,2; 0,05; 0,86; 1,08). Izračunata 𝑇2 vrednost je

𝑇(87,2;7,2; 0,05; 0,86; 1,08)2 = 0,6437.

𝑇𝑖.𝑗

2 Vrednost 𝑇𝑖.𝑗2 Vrednost 𝑇𝑖.𝑗

2 Vrednost 𝑇𝑖.𝑗2 Vrednost

𝑇1.22 0,0012 𝑇1.6

2 0,0249 𝑇2.42 0,1184 𝑇3.1

2 0,8586

𝑇1.32 0,1909 𝑇1.7

2 0,0275 𝑇2.52 0,2646 𝑇3.2

2 0,8363

𝑇1.42 0,8183 𝑇2.1

2 0,1440 𝑇2.62 0,1725 𝑇3.4

2 5,4091

𝑇1.52 0,0303 𝑇2.3

2 0,3135 𝑇2.72 0,2617

Tabela 6.3. Vrednosti uslovnih izraza

Upoređivanjem ove vrednosti sa odgovarajućom kritičnom vrednošću od 12,3696, izračunato za n=85, p=5 i α=0,05, nije pronađen nijedan signal.

Signal na 𝑇3.42 izrazu znači da nešto nije u redu u odnosu između posmatranih vrednosti

na trećoj i četvrtoj promenljivoj (tj. 𝑥3 = 3,1 , 𝑥4 = 0,36). Kao što se može videti iz tabele 6.8, korelacija ovih dveju promenljivih je 0,7, pa su ove dve promenljive međusobno povezane. Ispitivanjem pregleda statistika u tabeli 6.1.a. vidimo da je opservacija na 𝑥3 ispod sredine (tj. mala), dok je opservacija na 𝑥4 iznad sredine (tj. velika) i kao takve su međusobno pridružene jedna drugoj, a to je u kontradikciji sa referentnim odnosom i dovodi do javljanja signala na 𝑇3.4

2 izrazu.

Page 58: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

57

Spisak slika Slika 1.1. Proces kao interakcija ulaznih faktora i rezultata, izvor [2] Slika 2.1. Funkcije gustine hi kvadrat raspodele, izvor [5]

Slika 2.2. Funkcije gustine Fišerove raspodele, izvor [5]

Slika 2.3. Funkcije gustine Beta raspodele, izvor [5]

Slika 3.1. 𝑇2 – grafikon za podatke zavarivanja, izvor [4] Slika 3.2. Kontrolni elipsoid kvaliteta, izvor [4] Slika 3.3. Karte srednjih vrednosti individualnih komponenti, izvor [4] Slika 4.1. Dijagram rasipanja za tri grupe podataka, Multivariate statistical porecess control

with industrial applications [5.1] Slika 4.2. 𝑇2 vrednosti industrijskih podataka, izvor [1] Slika 5.1. Zajednička kontrolna oblast, izvor [1] Slika 5.2. 𝑇2 kontrolna karta merenja komponenti parne turbine, izvor [1] Slika 5.3. 𝑇2 kontrolna karta za industrijski proces podataka, izvor [1] Slika 5.4. Transformacije koordinatnih sistema, izvor [3] Slika 5.5. Grafik prve komponente u prostoru glavnih komponenti, izvor [3] Slika 5.6. Grafik druge komponente u prostoru glavnih komponenti, izvor [3] Slika 5.7. Dijagram rasipanja prve dve glavne komponente, izvor [3] Slika 6.1.a. (𝑥1, 𝑥2) prostor, izvor [1] Slika 6.1.b. (𝑦1, 𝑦2) prostor, izvor [1] Slika 6.2.a. Kontrolni dijagrami glavnih komponenti sa različitim varijansama, izvor [1] Slika 6.2.b. Kontrolni dijagrami glavnih komponenti sa jednakim varijansama, izvor [1] Slika 6.3. (𝑇1, 𝑇2.1) prostor, izvor [1] Slika 6.4. Interpretacija 𝑇2.1

2 komponenti, izvor [1] Slika 6.5. Interpretacija 𝑇1.2

2 komponenti, izvor [1] Slika 6.6. Trodimenzionalni prostor promenljivih 𝑥1, 𝑥2 , 𝑥3, izvor [1] Slika 6.7. Prostor promenljivih 𝑥1 i 𝑥3 , izvor [1] Slika 6.8. 𝑇2 kontrolna karta, izvor [1]

Page 59: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

58

Spisak tabela

Tabela 3.1. Podaci o zavarivanju, izvor [4] Tabela 4.1. Podaci hemijskog procesa, izvor [1] Tabela 4.2. Podaci dobijeni elektronskim putem, izvor [1] Tabela 4.3. Podaci hemijskog procesa, izvor [1] Tabela 4.4. Poređenje korelacija, izvor [1] Tabela 4.5. Podaci temperatura u kotlu, izvor [1] Tabela 4.6. Korelaciona matrica podataka temperatura u kotlu, izvor [1] Tabela 4.7. 𝑇2 vrednosti za prvi korak, izvor [1] Tabela 4.8. Korelaciona matrica preostalih podataka nakon uklanjanja autlejera, izvor [1]

Tabela 4.9. 𝑇2 vrednosti za drugi korak, izvor [1] Tabela 4.10. Koraci uklanjanja autlejera, izvor [1] Tabela 4.11. Rezultat procesa čišćenja koristeći neparametarski metod, izvor [1] Tabela 5.1. Podaci faze I parne turbine, izvor [1] Tabela 5.2. Podaci parne turbine faze II, izvor [1] Tabela 5.3. Nove opservacije industrijskog procesa, izvor [1] Tabela 5.4. Sopstvene vrednosti inverzne kovarijansne matrice, izvor [3] Tabela 6.1.a. Deskriptivne statistike sedam karakteristika kvaliteta, izvor [1] Tabela 6.1.b. Korelacije sedam karakteristika kvaliteta, izvor [1] Tabela 6.2. Bezuslovni izrazi za 1. opservaciju, izvor [1] Tabela 6.3. Vrednosti uslovnih izraza, izvor [1]

Page 60: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

59

Literatura:

1. Multivariate Statistical Process Control With Industrial Applications, sixth edition, Robert L. Mason, John C. Young, The American Statistical Association and the Society for Industrial and Applied Mathematics, 2002

2. Statistical Quality Control, Seventh Edition, Douglas C. Montgomery, Wiley and Sons, Inc,

2013. 3. Multivariate Quality Control Theory and Applications, Camil Fuchs, Ron S. Kennet, MARCEL

DEKKER, New York, 1998

4. Applied Multivariate Statistical Analysis, Sixth Edition, Richard A. Johnson, Dean W. Wichern,

Pearson Education, Inc. Pearson Prentice Hall, 2007 5. https://www.wikipedia.org/

Page 61: VIŠEDIMENZIONALNA OBELEŽJA3 Glava 1 Uvodni pojmovi 1.1. Kvalitet i poboljšanje kvaliteta Kada je reč o kvalitetu, on se može definisati na više načina. Trivijalno se misli na

60

Biografija

Marija Mladenović rođena je 05. marta 1994. godine u Aleksincu. Osnovnu školu „Aca Sinadinović“ završila je 2009. godine kao nosilac Vukove diplome. Iste godine upisala je Gimnaziju „Bora Stanković“, prirodno – matematički smer, u Nišu i istu završila 2013. godine kao nosilac Vukove diplome. Tokom školovanja učestvovala je na takmičenjima iz matematike i hemije.

Osnovne akademske studije upisala je 2013/2014 godine na Departmanu za matematiku Prirodno – matematičkog fakulteta u Nišu i iste završila 2016. godine sa prosečnom ocenom 8,48. U novembru 2016. godine upisala je master akademske studije na smeru Verovatnoća, statistika i finansijska matematika. Poslednji ispit na master akademskim studijama položila je juna 2018. godine i zaključno sa njim ostvarila prosečnu ocenu 9,57.