Pmm Faktorska Analiza Predavanje

Preview:

Citation preview

Tema

FAKTORSKA ANALIZA*

Sveučilište u Zagrebu Filozofski fakultet

Odsjek za psihologiju

Primjena multivarijatnih metoda

* Ova prezentacija predstavlja radni materijal

Faktorska analiza je skup matematičko-statističkih postupaka koji omogućuju da se u većem broju varijabli, među kojima postoji povezanost, utvrdi manji broj temeljnih varijabli koje objašnjavaju takvu međusobnu povezanost. Te temeljne varijable nazivaju se faktori.

Varijable koje promatramo nazivaju se manifestne varijable, a faktori koje utvrđujemo u postupku faktorske analize nazivaju se latentne varijable.

Sadržaj teme:

 

1. Cilj faktorske analize

 2. Rekapitulacija osnovnih pojmova i operacija

 3. Problemi u primjeni faktorske analize

 4. Izvođenje faktorske analize u programu SPSS

 5. Interpretacija rezultata

I. REPETITORIJ OSNOVNIH POJMOVA:

 

1. Definicija i ciljevi FA

2. Parsimonija i interpretabilnost

3. Manifestne i latentne varijable

4. Korelacije među manifestnim varijablama kao indikacija zajedničkih faktora

5. Multifaktorski model strukture manifestnih varijabli (linearni efekti faktora, ortogonalnost latentnih varijabli, jednadžba specifikacije manifestne varijable = višestruka regresijska jednadžba)

6. Odnosi između manifestnih i latentnih varijabli (faktorska zasićenja ili saturacije=regresijski koeficijenti faktora za varijable kao kriterije)

7. Dijelovi varijance manifestnih varijabli u FA

8. Objašnjenje manifestnih varijabli pomoću faktora, rezidualne vrijednosti

9. Objašnjenje korelacija među manifestnim varijablama pomoću njihovih saturacija s faktorima (rezidualne korelacije)

10. Varijanca skupa varijabli objašnjena pomoću faktora.

11. Geometrijski prikaz odnosa manifestnih varijabli i faktora

12. Neodređenost multifaktorskih rješenja (jednostavna struktura, rotacije)

13. Psihologijska interpretacija faktora

II. PROBLEMI U PRIMJENI FAKTORSKE ANALIZE

 

1. Prikladnost podataka za primjenu FA

- kvantitativne varijable i njihove distribucije

- Bartlettov test (R=I)

- KMO i MSA

 2. Komponentni model i model zajedničkih faktora

- metode za ekstrakciju faktora

- problem određivanja komunaliteta

3. Određivanje broja značajnih faktora

 4. Postizanje jednostavne strukture

 5. Matrice faktorskog sklopa (obrasca) i faktorske strukture

 6. Izračunavanje i procjena faktorskih rezultata

 7. Kosokutne rotacije, korelacije među faktorima i faktori viših redova

8. Evaluacija primjene faktorske analize (objašnjena varijanca, rezidualni r, interpretabilnost)

U prijašnjim fazama faktorska analiza upotrebljavala se isključivo kao eksploratorna strategija. Prije 1970. termin FA koristio se bez riječi eksploratorna. Ovaj izraz uveden je kasnije kako bi se razlikovala od konfirmatorne FA uvedne približno 1969. radovima Joreskoga.

Cilj je EFA da utvrdi temeljne faktore ili izvore varijacija i kovarijacija među promatranim varijablama. Kod CFA situacija je drugačija. FA se pojavljuje kao objektivan test određenog strukturalnog modela ili teorije.

Osnivač je FA engleski psiholog C. Spearman koji je ujedno postavio i prvu empirijsku teoriju inteligencije.

Zj = fjG + Sj

Spearmanova psihološka teorija o dva faktora kasnije je zamijenjena teorijama o više faktora. Tako je nastala multifaktorska analiza. Po toj koncepciji u svakoj manifestnoj ili promatranoj intelektualnoj aktivnosti sudjeluje nekoliko faktora ili latentnih varijabli. Prvi je takvu koncepciju iznio Garnett (1919), a termin multifaktorska analiza prvi je upotrijebio Thurstone (1931).

Zj = fjA + gjB + hjC + ... + Sj

Engleski psiholozi Burt (1938) i Vernon (1961) stvaraju psihološke modele prema kojima postoji hijerarhija pojedinih faktora inteligencije. Na vrhu je G faktor koji participira u svim intelektualnim aktivnostima, ispod njega su grupni faktori višeg reda, a zatim grupni faktori nižeg reda itd.

Glavni ciljevi EFA

1. Odrediti broj zajedničkih faktora koji uvjetuju variranje skupa manifestnih varijabli

2. Odrediti jačinu povezanosti između svakog faktora i svake manifestne varijable

Načelno postoje dvije strategije korištenja faktorske analize. Jedna strategija naziva se eksploratorna faktorska analiza, a druga konfirmatorna faktorska analiza.

Cilj je eksploratorne faktorske analize da utvrdi temeljne faktore ili izvore varijacija i kovarijacija među promatranim varijablama. Cilj je ovakve strategije faktorska deskripcija određenog područja istraživanja.

Pri konfirmatornim strategijama faktorske analize istraživač polazi od unaprijed formuliranog modela, hipoteze ili teorije o strukturi temeljnih izvora varijacija i kovarijacija među manifestnim varijablama. Faktorska analiza u ovom slučaju predstavlja test pretpostavljene strukture, odnosno omogućuje testiranje strukturalnih teorija.

Treba naglasiti da se oba pristupa mogu dopunjavati, te da formalno gledajući oba pristupa omogućuju testiranje teorijskih modela.

1. MULTIFAKTORSKI MODEL STRUKTURE BRUTO REZULTATA

U teoriji pouzdanosti bruto rezultat je strukturiran kao linearna kombinacija:

X = T + E

bruto rezultat = pravi rezultat + pogreška

U teoriji valjanosti pravi rezultat se dalje rastavlja.

T = H + S

Jednadžba bruto-rezultata može se u skladu s izrečenim napisati:

X = H + S + E

Nadalje u teoriji valjanosti se pretpostavlja da je H složenica linearnog tipa. Razumno je pretpostaviti da se nekim mjernim postupkom može pobuditi određeni broj odijeljenih psiholoških osobina. Ako pretpostavimo da su njihovi efekti linearno kombinirani dobivamo izraz:

H = H1 + H2 + ... + Hk

tako da se jednadžba bruto rezultata može pisati:

X = H1 + H2 + ... + Hk + S + E

Ukoliko pretpostavimo da su sve varijable u prethodnoj jednadžbi standardizirane i neka se u svakom rezultatu zx nalazi izvjesna komponenta svih gore opisanih elemenata, a količina njihova prisustva neka je označena različitim koeficijentima, dobijamo jednadžbu specifikacije bruto rezultata: zx = 1zh1 + 2zh2 + ... + kzhk + szs + eze Ponderi predstavljaju zasićenja ili saturacije ili opterećenja. Pretpostavimo u ovom trenutku da su zajednički faktori h1, h2, ..., hk međusobno nezavisni. Tada je varijancu bruto rezultata moguće dekomponirati u terminima varijanci članica gornje linearne kombinacije (sve su kovarijance nulte): Vt(z) = 1 = h1

2 + h22 + ... + hk

2 + s2 + e2

Posljednje jednadžbe predstavljaju bit multifaktorske teorije strukture bruto-rezultata L.L Thurstone-a, a pretposljednji izraz generalizirani linearni model.

1. KOMUNALITET je onaj dio totalne varijance koji je uvjetovan zajedničkim faktorima, tj. onaj dio varijance koji varijabla dijeli s drugim varijablama. h2 = h1

2 + h22 + ... + hk

2 U terminima komunaliteta varijanca bruto rezultata može biti izražena kao: Vt(z) = 1 = h2 + s2 + e2 U ovom trenutku cilj FA se može reformulirati kao nastojanje da se odredi broj i veličina komponenata komunaliteta neke varijable. Budući da su te komponente očito proporcije totalne varijance, možemo ih shvatiti kao koeficijente determinacije varijable i faktora, pa je dakle cilj faktorske analize nalaženje korelacije između varijabli i faktora.

2. SPECIFICITET je onaj dio varijance bruto-rezultata koji je uvjetovan stabilnim faktorima svojstvenim samo toj varijabli. s2 = 1- (h2 + e2) 3. UNIKVITET je onaj dio ukupne varijance koji jedinstven za datu varijablu, te nije objašnjiv na osnovi preostalih varijabli. Predstavlja zbroj varijanci specificiteta i pogreške. u2 = s2 + e2 = 1- h2 Koeficijent pouzdanosti, definiran kao proporcija prave varijance u varijanci bruto-rezultata, u terminima fundamentalnih pojmova FA može biti izražen kao: rxx = 1 - e2 = h2 + s2 stoga se varijanca komunaliteta h2 može razmatrati kao donja granica pouzdanosti.

Prikaz različitih faktorskih struktura pomoću dijagrama puta a) jedan zajednički faktor i više manifestnih varijabli

bi - standardizirani regresijski koeficijenti ili koeficijenti puta ili faktorske saturacije V1 = b1F1 + d1U1 Dijagram implicira da je korelacija F,U=0, te da je Ui,Uj=0

V1

V2

V3

V4

F1

U1

U2

U3

U4

b1

b2

b3

b4

d1

d2

d3

d4

b) dva ortogonalna zajednička faktora i više manifestnih varijabli

V1 = b11F1 + b12F2 + d1U1 V2 = b21F1 + b22F2 + d2U2 Dekompozicija varijance za Vi: V(Vi) = bi1

2 + bi22 + di

2

V1

V2

V3

V4

F1

U2

U3

U4

b11

b21

b31

b41

d1

d2

d3

d4

V5

F2 b51

U5 d5

b12

b32

b52

b42

U1

b22

d) dva kosokutna zajednička faktora i više manifestnih varijabli

r(F1,V1) = b11 + b12 r(F1,F2)

V1

V2

V3

V4

F1

U2

U3

U4

b11

b21

b31

b41

d1

d2

d3

d4

V5

F2 b51

U5 d5

b12

b32

b52

b42

U1

b22

2.1. OSNOVNE PRETPOSTAVKE ZA PROVOĐENJE FAKTORSKE

ANALIZE

Istraživački problemi na koje FA može dati odgovor

Slučajevi kada FA nije dobar izbor za analizu podataka

2.2. PODOBNOST KORELACIJSKE MATRICE ZA FAKTORIZACIJU

Prije provođenja FA potrebno je provjeriti podobnost korelacijske matrice za faktorizaciju.

Bartlettov test sfericiteta koristiti se za testiranje hipoteze da je korelacijska matrica identična matrici identiteta (čije su izvandijagonalne vrijednosti nula, a na dijagonali su jedinice). Test zahtijeva da su podaci uzorak iz multivarijatne normalne populacije. Što je veća dobivena vrijednost hi-kvadrata to je manja vjerojatnost da je opažena korelacijska matrica jednaka matrici identiteta. Ako je dobiveni p veliki prihvaćamo hipotezu da se matrica ne razlikuje značajno od matrice identiteta i u tom slučaju treba razmotriti opravdanost FA.

2 = - (N-1 - (2k+5)/6) loge |R|

2.3. PODOBNOST KORELACIJSKE MATRICE ZA FAKTORIZACIJU

- Kaiser-Meyer-Olkin (KMO - measure of sampling adequacy) koeficijent mjera je podobnosti korelacijske matrice za faktorizaciju, a njegova logika jest da u omjer dovede sumu opaženih i parcijalnih korelacija u matrici.

22

2

ijij

ij

ar

rKMO

ij Kaiser (1974) navodi da je vrijednost iznad 0,9 izvrsna, između 0,5 i 0,6 tek prihvatljiva, a ispod 0,5 neprihvatljiva.

2.3. PODOBNOST KORELACIJSKE MATRICE ZA FAKTORIZACIJU

MSA (measure of sampling adequacy) - mjera je podobnosti svake pojedine varijable za faktorizaciju, te ima u osnovi istu logiku kao i KMO koeficijent, osim što u omjer dovodi sumu korelacija jedne varijable sa svim drugim varijablama i parcijalne korelacije jedne varijable sa svim preostalim. Varijable koje imaju niske vrijednosti MSA bilo bi poželjno izbaciti iz FA, budući da njihov varijabilitet nije objašnjiv skupom preostalih varijabli.

22

2

ijij

ij

ar

rMSA

ji

2.3. UTJECAJ KARAKTERISTIKA VARIJABLI: FAKTORIZACIJA ČESTICA

Literatura ukazuje na moguće probleme vezane uz faktorizaciju čestica. (Bernstein, Teng, 1989.)

Korelacija dvije čestice bit će uvjetovana njihovim sadržajem ali i oblikom njihovih distribucija. Može se demonstrirati kako razlika u distribucijama utječe na korelaciju dva inače sadržajno slična zadatka.

Ovaj efekt poznat je pod nazivom «težinski faktor» (Carrol, 1945; Gorsuch, 1983).

2.4. KRITERIJI ZADRŽAVANJA FAKTORA:

1. Guttman i Kaiser (K1)

Guttman, 1954

Kaiser, 1960

Komponenta bi trebala objašnjavati toliko varijance koliko i pojedina manifestna varijabla

2.4. KRITERIJI ZADRŽAVANJA FAKTORA:

2. Cattelov scree test

Cattell (1966) predlaže scree test.

Ovaj test obično sugerira manje faktora nego G-K kriterij kada je prosječna korelacija mala i broj varijabli velik. Primjedba je subjektivnost.

2.4. KRITERIJI ZADRŽAVANJA FAKTORA:

3. Interpretabilnost

4. A priori odluke na osnovi teorije

5. Kombinacija više kriterija

2.4. KRITERIJI ZADRŽAVANJA FAKTORA:

6. Paralelne analize

sugerirali Humprey i Ilgen (1969)

2.4. KRITERIJI ZADRŽAVANJA FAKTORA:

7. Postotak objašnjene varijance

- obično daje prevelik broj faktora

- ovisi o prosječnoj korelaciji u skupu podataka

8. Bartlettovi testovi značajnosti (1950, 1954)

hi kvadrat test koji testira hipotezu da su preostali kk jednaki ili da je rezidualna korelacijska matrica različita od nulte.

često vodi zadržavanju trivijalnih faktora

2.5. ROTACIJA FAKTORA

- Svrha rotacije

- Thurstoneova načela jednostavne strukture

- Ortogonalne i kosokutne rotacije

Varimax – Minimalizira broj varijabli koje imaju visoke saturacije s pojedinim faktorom

Olakšava interpretaciju faktora.

Recommended