23
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Diszkriminancia- analízis az SPSS-ben Petrovics Petra Doktorandusz

Diszkriminancia-analízis az SPSS-ben

Embed Size (px)

DESCRIPTION

Diszkriminancia-analízis az SPSS-ben. Petrovics Petra Doktorandusz. Diszkriminancia-analízis folyamata. Feladat Megnyitás: Employee_data.sav. Milyen tényezőktől függ a dolgozók beosztása?. Adatok, változók X: Metrikus változók / Dummy változók - PowerPoint PPT Presentation

Citation preview

Page 1: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet

Diszkriminancia-analízis az SPSS-ben

Petrovics PetraDoktorandusz

Page 2: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet

Diszkriminancia-analízis folyamata

Page 3: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet

FeladatMegnyitás: Employee_data.sav

Milyen tényezőktől függ a dolgozók beosztása?

Page 4: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet

1. Adatok, változók

X: Metrikus változók / Dummy változók

(age, education level, current salary, beginning salary, month since hire, previous experience, minority classification)

Adatok kizárólagossága:

Pl. aki vezető, az nem hivatalnok

Mindenki valamelyik csoport tagja, stb

Page 5: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet

2. Normális eloszlás Graph / Histogram

Nonparametric Tests / 1-Sample K-S TestStb.

• n• Mahalanobis

távolság

Page 6: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet

3. Multikollinearitás (vagy Pooled Within-Groups Matrices)

Faktoranalízis (?)

Page 7: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet

4. Outlier: Mahalanobis távolság

5. Homoszkedaszticitás: Box’s M

Analyze / Classify / Discriminant…

Elemzés lefuttatásával

Page 8: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet

Változók bevonása: •milyen mértékben csökken a Wilks’ λ•Milyen mértékben csökken a nem magyarázott variancia•Kisebb M-távolság•Legnagyobb F-érték•Rao’s V értékének növekedése

Multikollinearitás (r)

Homoszkedaszticitás: nemcsak variancia állandóság, de variancia-kovariancia mátrixok egyezősége is feltétel

OutlierNormál eloszlás

Page 9: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet

mert nem ugyanannyi menedzser van, mint pl. hivatalnok

Page 10: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet Output

Magas F érték, alacsony Wilks’ Lambda !!!A kevés diszkriminatív értékkel bíró változók a stepwise diszkriminanciaelemzés segítségével eltávolíthatók.

Megmutatja, hogy vannak-e különbségek a csoportosító változó által kialakított csoportok átlagai között: ha a csoportosító változó a varianciának nagy részét magyarázza, akkor a csoportok átlagai között szignifikáns eltérés mutatkozik, és a mutató értéke 0-hoz közelít. Így az egyes változók az alapján kerülhetnek bevonásra a diszkriminanciaelemzésbe, hogy milyen mértékben képesek a Wilks’ λ értékét csökkenteni.

- Month since hire- Minority- Age (?)STEPWISE

Page 11: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet OutputStepwise Statistics:

1. Education Level2. Previous Experience3. Current Salary4. Age5. Beginning Salary

Page 12: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet

Group Statistics

Employment Category Mean Std. Deviation Valid N (listwise)

Unweighted Weighted

Clerical Educational Level (years) 12.86 2.330 362 362.000

Current Salary 27818.90 7569.196 362 362.000

Beginning Salary 14079.05 2893.376 362 362.000

Months since Hire 81.11 10.093 362 362.000

Previous Experience (months) 85.12 95.393 362 362.000

Minority Classification .24 .428 362 362.000

age 33.06 12.140 362 362.000

Custodial Educational Level (years) 10.19 2.219 27 27.000

Current Salary 30938.89 2114.616 27 27.000

Beginning Salary 15077.78 1341.235 27 27.000

Months since Hire 81.56 8.487 27 27.000

Previous Experience (months) 298.11 101.426 27 27.000

Minority Classification .48 .509 27 27.000

age 48.59 9.532 27 27.000

Manager Educational Level (years) 17.25 1.612 84 84.000

Current Salary 63977.80 18244.776 84 84.000

Beginning Salary 30257.86 9980.979 84 84.000

Months since Hire 81.15 10.410 84 84.000

Previous Experience (months) 77.62 73.260 84 84.000

Minority Classification .05 .214 84 84.000

age 31.50 6.433 84 84.000

Total Educational Level (years) 13.49 2.886 473 473.000

Current Salary 34418.45 17093.723 473 473.000

Beginning Salary 17009.25 7877.562 473 473.000

Months since Hire 81.14 10.048 473 473.000

Previous Experience (months) 95.95 104.680 473 473.000

Minority Classification .22 .415 473 473.000

age 33.67 11.784 473 473.000

Output

Page 13: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet Output

Vs.

Page 14: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet Output

Egyező log determinánsok

(nagyon alacsony log determinánssal rendelkező csoportokat célszerű törölni, ha M szignifikáns – minél magasabb kritikus p-érték)

H0: homoszkedasztikus (egyező kovariancia mátrixok)

H1: heteroszkedasztikus

p<0.000 szignifikancia-szinten fogadjuk el, hogy homoszkedasztikus

(nagy mintaelemszámnál a szignifikancia eredménye kevésbé jelentős)

Page 15: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet

Kevésbé járul a magyarázó erő növekedéséhez

Nő a magyarázó erő

Output

Szignifikáns diszkriminancia függvény p=0.000λ=22,3% a nem magyarázott variancia (≈ ANOVA H2 inverze)

KANONIKUS DISZKRIMINANCIA FÜGGVÉNY

Stepwise:

Min {p;Y kategóriáinak száma-1} = 2

A különbözőség azon része, amit a DF1 nem foglal magába

Page 16: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet Output

• Többszörös korreláció a magyarázó változók és a diszkriminancia fv. között

• H komplementere• 1 fv. esetében a négyzete ≈R2 (modell

illeszkedés) • A DF1 0,8262=68,23%-ban magyarázza

a csoportosító változó varianciáját

DF külső szórásnégyzetDF belső szórásnégyzet

DF által magyarázott különbözőségDF által nem magyarázott különbözőség

DF-k a magyarázott különbözőség hány %-t magyarázzák (∑100%)

Az DF1 83,4%-ban járul hozzá a különbözőség magyarázatához, míg a DF2 csak 16,6%-ban.

Page 17: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet Output

Diszkrimináló hatás értelmezése → DF elnevezése

• DF-k és a magyarázó változók közötti korreláció• Változók relatív fontossága (a

korreláció abszolút mértékének sorrendjében)• ≈ faktor loading (határ: >0,3 fontos)

• Változók fontossága • Kapcsolat iránya• ≈ β együtthatók (parciális)Pl. DF1-t a leginkább a

jelenlegi fizetés, míg DF2-t a korábbi munkatapasztalat határozza meg

Page 18: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet Output

bi együtthatók

Diszkriminancia függvény paraméterei:

1,748age 0,038experience previous 0,013leveleducation -0,201DF

4,923-age 0,019experience previous 0,002-leveleducation 0,082DF

2

1

b: a változók parciális hozzájárulása a DF-ekhez (a többi változó változatlansága mellett)

Dummy változók használata esetén: elemzés a használatuk nélkül → használatukkal (a kanonikus korreláció négyzetében mért különbség a Dummy változók magyarázó ereje)

(A mértékegységek különbözősége miatt nem látszik a jelentősége, de ezek is diszkriminálnak)

Page 19: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet

Átlagos D értékek

OutputEgy egyed ahhoz a csoporthoz tartozik, amely csoport centroidjához a legközelebb esik a diszkriminancia értéke (discriminant score) (Mahalanobis távolság alapján)Pl: 1. személy: manager

Discriminant score

Predicted group membership

Page 20: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet Output

Page 21: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet Output

Page 22: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet Output

Találati arány Helyes kategorizálás

Új dolgozó: abba csoportba tartozik, amelyik centroidjától a kiszámított Mahalanobis távolság értéke a legalacsonyabb

Page 23: Diszkriminancia-analízis  az SPSS-ben

Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet

Köszönöm a figyelmet!