6
DS/draft2/11/7/2006 1 Suport L6L7 Analiza factoriala (AF) ş i analiza path Obiectivul metodei: a) economia, să extragă un numă r de factori redus ş i b) interpretabilitatea (s ă ajungă la saturaţ ii mari pentru acelaş i indicator numai într-un singur factor. Realizarea celor dou ă obiective se face prin algoritmi specifici de extragere a factorilor pentru economie (prin PCA, PAF, ML etc) si de rotire a lor pentru interpretabilitate (VARIMAX, OBLIMIN, QUARTIMAX, EQUAMAX etc.). O structura factoriala este cu atat mai simpla cu cat are mai putini factori/variabile latente/dimensiuni. Introducerea metodei prin inputuri ş i output-uri esenţ iale Intrebare: cum se grupează în mentalul colectiv opiniile referitoare la „problemele actuale ale Romaniei”?. Cum poate fi redus un set de 11 indicatori de agenda publică la cateva dimensiuni? Date de intrare în AF: matricea coeficienţ ilor de corela ţ ie Bravais-Pearson între toţ i itemii care urmeaz ă a fi redusi la dimensiuni sau factori Output esential:matricea rotita a factorilor Rotated Component Matrix(a) Component nume variabila variabila 1 calitatea vietii 2 institutii 3 coruptie apret5 preturi ,805 ,076 ,187 amunca5 locurile de munca ,765 ,082 ,098 apensii5 pensiile ,715 ,080 ,334 alocuinta5 locuinte ,646 ,305 ,116 asanat5 sanatatea ,591 ,300 ,301 ainstloc5 institutiile locale ,113 ,895 ,162 ainstc5 institutiile centrale ,121 ,888 ,211 aeduc5 educatie ,281 ,673 ,215 ainfract5 infractionalitatea ,198 ,177 ,820 acorupt5 coruptia ,340 ,146 ,771 ajust5 justitia ,155 ,290 ,766 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a Rotation converged in 5 iterations. KMO=0.86 indica un potential foarte bun de factorializare a datelor (veyi mai departe detalii de despre KMO). Coeficienti de saturaţ ie (loadings) –echivalentul coeficienţ ilor beta din regresia multipl ă . Masoara intensitatea influenţ ei factorului asupra indicatorului . Ex de citire: cresterea cu o abatere standard pe scala factorului 1 este insotita de creş terea cu 0.805 abateri standard pe scala item-ului referitor la perceptia gravitatii problemei FACTORI SAU VARIABILE LATENTE. Sensul factorului este dat de itemii cu saturaţ ie maxima. Este rezultat de interpretare

analiza factoriala

Embed Size (px)

DESCRIPTION

psihologie

Citation preview

Page 1: analiza factoriala

DS/draft2/11/7/2006 1

Suport L6L7 Analiza factoriala (AF) şi analiza path

Obiectivul metodei: a) economia, săextragăun număr de factori redus şi b) interpretabilitatea (săajungăla saturaţii mari pentru acelaşi indicator numai într-un singur factor. Realizarea celor douăobiective se face prin algoritmi specifici de extragere a factorilor pentru economie (prin PCA, PAF,ML etc) si de rotire a lor pentru interpretabilitate (VARIMAX, OBLIMIN, QUARTIMAX,EQUAMAX etc.). O structura factoriala este cu atat mai simpla cu cat are mai putinifactori/variabile latente/dimensiuni.

Introducerea metodei prin inputuri şi output-uri esenţiale

Intrebare: cum se grupeazăîn mentalul colectiv opiniile referitoare la „problemele actuale aleRomaniei”?. Cum poate fi redus un set de 11 indicatori de agenda publicăla cateva dimensiuni?Date de intrare în AF: matricea coeficienţilor de corelaţie Bravais-Pearson între toţi itemii careurmeazăa fi redusi la dimensiuni sau factoriOutput esential:matricea rotita a factorilor

Rotated Component Matrix(a)

Component

nume variabila

variabila

1 calitateavietii

2institutii

3coruptie

apret5 preturi ,805 ,076 ,187amunca5 locurile de munca ,765 ,082 ,098apensii5 pensiile ,715 ,080 ,334alocuinta5 locuinte ,646 ,305 ,116asanat5 sanatatea ,591 ,300 ,301ainstloc5 institutiile locale ,113 ,895 ,162ainstc5 institutiile centrale ,121 ,888 ,211aeduc5 educatie ,281 ,673 ,215ainfract5 infractionalitatea ,198 ,177 ,820acorupt5 coruptia ,340 ,146 ,771ajust5 justitia ,155 ,290 ,766

Extraction Method: Principal Component Analysis.Rotation Method: Varimax with Kaiser Normalization.

a Rotation converged in 5 iterations. KMO=0.86 indica un potential foarte bun de factorializare a datelor (veyi maideparte detalii de despre KMO).

Coeficienti de saturaţie(loadings) –echivalentulcoeficienţilor beta dinregresia multiplă. Masoaraintensitatea influenţeifactorului asupraindicatorului . Ex de citire:cresterea cu o abaterestandard pe scala factorului 1este insotita de creşterea cu0.805 abateri standard pescala item-ului referitor laperceptia gravitatii problemei

FACTORI SAU VARIABILE LATENTE. Sensulfactorului este dat de itemii cu saturaţie maxima.Este rezultat de interpretare

Page 2: analiza factoriala

DS/dra

Introducerea metodei prin AF confirmatorieDoua tipuri de factorialã – exploratorie, fará model teoretic şi confirmatorie, cu model teoretic asociat.

Datele de intrare pentru um model didactic, simplificat fata de cel din tabelul anterior – o matrice decorelaţii de tipul 4*4. Ingrijorarile fata de preturi si locurile de munca sunt mai puternic legate intre eledecat cu cele referitoare la functionarea institutiilor centrale sal locale.

Date de intrare, o matrice de corelaţii de tipul 4*4

Correlation Matrix

amunca5 apret5 ainstc5 ainstloc5amunca5 1,000 ,528 ,215 ,194apret5 ,528 1,000 ,236 ,222ainstc5 ,215 ,236 1,000 ,816

Correlation

ainstloc5 ,194 ,222 ,816 1,000amunca5 ,000 ,000 ,000apret5 ,000 ,000 ,000ainstc5 ,000 ,000 ,000

Sig. (1-tailed)

ainstloc5 ,000 ,000 ,000

Un model factorial confirmatoriu: exisitădouătipuri de ingrijorări majore, legate de calitateavietii si de instituţii. Cele douătipuri de îngrijorări sunt correlate pozitiv între ele.

FiguraChi-squ. Modelcaractermodele

Coeficient path (beta): creşterea cu o unitate standard pe scala factorului „îngrijorări asupra calităţii vieţii” esteînsoţită, în medie, de creşterea îngrijorării referitoare la preţuri cu 0.77 abateri standard

ft2/11/7/2006 2

1.Diagrama path a unui model factorial de tip confirmatoriu (cu model teoretic pre-existent).are = ,477, Degrees of freedom = 1, Probability level = ,490, Model construit cu Amos 6

ul prezentat face parte din seria modelelor de ecuatii structurale (structural equation models SEM)izate prin faptul căopereazăsimultan cu mai multe variabile dependente. Rezolvarea unor astfel dese face şi prin soft-uri de tip AMOS sau LISREL (Linear Structural Equations Models).

CALIT.VIETII

,48

amunca5U1,69

,59

apret5

U2

,77

INSTITUTII

,75

ainstloc5U3

,88

ainstc5

U4

,87

,94

,33

CALIT.VIETIIexplica 48% dinvariaţia indiceluiamunca5

Page 3: analiza factoriala

DS/draft2/11/7/2006 3

AF exploratorie, fara model teoretic, varianta ortogonala, cufatori independenti

In AF exploratorie de tip PCA (analiza componentelor principale), fatorii sunt independenti (ortogonali)iar saturatiile sunt calculate pentru relatiile intre toate perechile indicatori-factori. Cercetatorul nu mai areposibilitatea, precum in analiza confirmatorie as predetermine numărul de factori si relaţiile dintrevariabilele manifeste si factori.

Figura 2. Reprezentarea relaţiilor dintre factori şi variabile pentru modelul bifactorial, extragere PCA,rotire VARIMAX

KMO and Bartlett's Test

,556

2987,4116

,000

Kaiser-Meyer-Olkin Measure of SamplingAdequacy.

Approx. Chi-SquaredfSig.

Bartlett's Test ofSphericity

Toate cele patru variabile din model au un indice KMO mai mare de 0.50, asa cum rezulta din valorilemarcate cu a in matricea de mai jos.

Anti-image Matrices

,712 -,356 -,004 -,029-,356 ,704 -,020 -,026-,004 -,020 ,334 -,267-,029 -,026 -,267 ,330,586a -,502 -,007 -,060-,502 ,599a -,042 -,054-,007 -,042 ,537a -,804-,060 -,054 -,804 ,540a

amunca5 loc.muncaapret5 preturiainstloc5 instit.localeainstc5 instit.centraleamunca5 loc.muncaapret5 preturiainstloc5 instit.localeainstc5 instit.centrale

Anti-image Covariance

Anti-image Correlation

amunca5loc.munca apret5 preturi

ainstloc5instit.locale

ainstc5instit.centrale

Measures of Sampling Adequacy(MSA)a.

Valori KMO mai mici de 0.50 indicădate inadecvate pentruAF.KMO=suma patratelorcorelatiilor dintre variabile/(sumapatratelor corelatiilor+sumapatratelor corelatiilor partiale dinmatrice). KMO indica valori ridicateale corelatiilor partiale, semn decomunalitate redusa in matricea dedate. KMO=0.55 indica o adecvareredusa a datelor pentru factorializare.

Page 4: analiza factoriala

D

M

M

S/draft2/11/7/2006 4

Total Variance Explained

2,129 53,216 53,216 2,129 53,216 53,216 1,811 45,280 45,2801,216 30,392 83,608 1,216 30,392 83,608 1,533 38,328 83,608,472 11,788 95,397,184 4,603 100,000

Component1234

Total % of VarianceCumulative % Total % of VarianceCumulative % Total % of VarianceCumulative %Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings

Extraction Method: Principal Component Analysis.

atricea factorilor dupa extragere, fara rotire

Component Matrixa

,842 -,445,831 -,467,591 ,647,616 ,617

ainstc5ainstloc5amunca5apret5

1 2Component

Extraction Method: Principal Component Analysis.

2 components extracted.a.

atricea factorilor dupărotire

Rotated Component Matrixa

,943 ,137,946 ,113,096 ,871,134 ,862

ainstc5 instit.centraleainstloc5 instit.localeamunca5 loc.muncaapret5 preturi

1 2Component

Extraction Method: Principal Component Analysis.Rotation Method: Varimax with Kaiser Normalization.

Rotation converged in 3 iterations.a.

Communalities

1,000 ,7681,000 ,760

1,000 ,9071,000 ,909

amunca5apret5ainstc5ainstloc5

Initial Extraction

Extraction Method: Principal Component Analysis.

Comunalitatile -echivalente casemnificatie cu determinatia múltipladin regresia múltipla. Cei dói factoriprincipali explica 77% din variatiaitemului de ingrijorare fata de munca.Itemii cu valoare redusa a comunalităţiisunt candidati la excludere din model

Valoare proprie a factorului, ponderea variatieivariabilelor explicata de factor, data de sumapatratului saturatiilor din factor. Factorul 1 explică,după rotire, 45% (=1.811*100/4) din variatiadatelor. Variatia totala în matricea de date este egalacu numarul de variabile pentru ca fiecare dintreacestea sunt standardizate, implicit, cu scorul z si, inconsecinta au varianta egala cu 1. Impreuna, cei doifactori explică83.6% din variaţia matricei de date.

Factorul 1 este definit de îngrijorareafatăde funcţionarea instituţiilor, itemiicu saturaţii maxime în factor

Factorul 2 este definit de îngrijorareafatăde obţinerea locurilor de muncăşi fata de preturi

Page 5: analiza factoriala

DS/draft2/11/7/2006 5

Matricea scorurilor factoriale

Component Score Coefficient Matrix

,535 -,063,542 -,080

-,089 ,594-,066 ,581

ainstc5 instit.centraleainstloc5 instit.localeamunca5 loc.muncaapret5 preturi

1 2Component

Extraction Method: Principal Component Analysis.Rotation Method: Varimax with Kaiser Normalization.

Scorurile factoriale permit construrea unor indici de reducere a unei multimi de variabile launa de tip sintetic.

Pe exemplu dat, solutia ortogonală, cu factori independenti, este aplicata legitim, deoarece infactorialã de tip oblic (prin rotire OBLIMIN) corelatia dintre cei doi factori este de 0.26, ceea ceinseamna o determinatie simpla mai mica de 10%.

Sintaxa comenzii pentru exemplu prezentatFACTOR

/VARIABLES amunca5 apret5 ainstloc5 ainstc5 /MISSING LISTWISE/ANALYSIS

amunca5 apret5 ainstloc5 ainstc5/PRINT INITIAL KMO AIC EXTRACTION ROTATION FSCORE/FORMAT SORT/CRITERIA MINEIGEN(1) ITERATE(25)/EXTRACTION PC/CRITERIA ITERATE(25)/ROTATION VARIMAX/METHOD=CORRELATION .

Condiţii de aplicare a AF, probleme de interpretare –aceleaşi ca si la regresia múltiplaVariabile.

o număr relativ egal de variabile pe factor. Útil as se lucreze cu metoda step-wise in selectia variabilelor si cu pornnire de la setul de itemi pentru careasocierile sunt clar interpretabile.

o numarul de cazuri/variabila, cel puţin 5 iar numarul total de cazuri cel puţin200 (vezi detalii in Garson)

o cel puţin trei variabile pe factor (Thurstone)o variabile care au saturatii apropiate in factori diferiti trebuie eliminate ca

“factor de zgomot” in matricea factorialaDatele de intrare.

o KMO as fie mai maré de 0.60. datele nu sunt factorializabile daca valoareaKMO este mai mica de 0.50. Pentru KMO acceptabil se studiaza valorile devariabila ale indicelui aflate pe diagonala matricei de corelatii anti-imagine.

o Cumularea unor esantioane diferite pentru factorializare se poate face numaidaca acestea au, independent, structura factorialã asemanatoare (Garson)

Semnificatie.o Factorii trebuie sa aiba validitate intuitiva (face validity). Útil as fie folositi mai

multi judecatori pentru a defini factorii.o Varianta PCA nu are test de semnificatie. Extrageri de tipul ML, GLS etc. au

asociate teste de semnificatieo Rotirea prin VARIMAX maximizeaza variaţiile pe coloana, între saturatiile

aceluiasi factor iar QUARTIMAX maximizeaza variaţiile interfactoriale pentru

Cresterea cu o abatere standard pe scalaingrijorării faţă de funcţionareainstituţiilor centrale duce la creştereaîngrijorării faţăde instituţii cu 0.53abateri standard.

Page 6: analiza factoriala

DS/draft2/11/7/2006 6

aceasi variabilă. Prima metoda sporeste interpretabilitatea factorilor iar ceade-a doua sporeste interpretabilitatea variabilelor functie de factori.EQUAMAX este o metoda intermediara intre QUARTIMAX si VARIMAX.

o OBLIMIN se adopta pentru ipoteza factorilor corelati (factorialã oblica) dar sipentru a testa independenta lor, ca etapa premergatoare in adoptareafactorialei ortogonale.

Variante importante de AF: R –grupare de variabile şiQ- grupare de cazuri

ReferinţePentru introducere în AF, vezi

David Garsonhttp://www2.chass.ncsu.edu/garson/pa765/factor.htm ,Dumitru Sandu, “Analiza factorială”, în Catalin Zamfir, Lazăr

Vlasceanu (coord) Dictionar de sociologie, Bucuresti :Babel, 1993.Pentru detalii de interpretare în analiza factorialăpe o temă

specificăvezi Dumitru Sandu , „Agenda publica înRomania de azi”, în Barometrul de Opinie Publică. Mai2006. Percepţii despre mass-media , FSD, 2006.

Pentru o aplicatie a analizei path , vezi Dumitru SanduSociologia tranzitiei. Valori şi tipuri sociale înRomânia , Bucuresti:Staff, 1996, cap.7