Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Diszkriminancia-analízis az SPSS-ben
Petrovics PetraDoktorandusz
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Diszkriminancia-analízis folyamata
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
FeladatMegnyitás: Employee_data.sav
Milyen tényezőktől függ a dolgozók beosztása?
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
1. Adatok, változók
X: Metrikus változók / Dummy változók
(age, education level, current salary, beginning salary, month since hire, previous experience, minority classification)
Adatok kizárólagossága:
Pl. aki vezető, az nem hivatalnok
Mindenki valamelyik csoport tagja, stb
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
2. Normális eloszlás Graph / Histogram
Nonparametric Tests / 1-Sample K-S TestStb.
• n• Mahalanobis
távolság
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
3. Multikollinearitás (vagy Pooled Within-Groups Matrices)
Faktoranalízis (?)
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
4. Outlier: Mahalanobis távolság
5. Homoszkedaszticitás: Box’s M
Analyze / Classify / Discriminant…
Elemzés lefuttatásával
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Változók bevonása: •milyen mértékben csökken a Wilks’ λ•Milyen mértékben csökken a nem magyarázott variancia•Kisebb M-távolság•Legnagyobb F-érték•Rao’s V értékének növekedése
Multikollinearitás (r)
Homoszkedaszticitás: nemcsak variancia állandóság, de variancia-kovariancia mátrixok egyezősége is feltétel
OutlierNormál eloszlás
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
mert nem ugyanannyi menedzser van, mint pl. hivatalnok
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet Output
Magas F érték, alacsony Wilks’ Lambda !!!A kevés diszkriminatív értékkel bíró változók a stepwise diszkriminanciaelemzés segítségével eltávolíthatók.
Megmutatja, hogy vannak-e különbségek a csoportosító változó által kialakított csoportok átlagai között: ha a csoportosító változó a varianciának nagy részét magyarázza, akkor a csoportok átlagai között szignifikáns eltérés mutatkozik, és a mutató értéke 0-hoz közelít. Így az egyes változók az alapján kerülhetnek bevonásra a diszkriminanciaelemzésbe, hogy milyen mértékben képesek a Wilks’ λ értékét csökkenteni.
- Month since hire- Minority- Age (?)STEPWISE
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet OutputStepwise Statistics:
1. Education Level2. Previous Experience3. Current Salary4. Age5. Beginning Salary
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Group Statistics
Employment Category Mean Std. Deviation Valid N (listwise)
Unweighted Weighted
Clerical Educational Level (years) 12.86 2.330 362 362.000
Current Salary 27818.90 7569.196 362 362.000
Beginning Salary 14079.05 2893.376 362 362.000
Months since Hire 81.11 10.093 362 362.000
Previous Experience (months) 85.12 95.393 362 362.000
Minority Classification .24 .428 362 362.000
age 33.06 12.140 362 362.000
Custodial Educational Level (years) 10.19 2.219 27 27.000
Current Salary 30938.89 2114.616 27 27.000
Beginning Salary 15077.78 1341.235 27 27.000
Months since Hire 81.56 8.487 27 27.000
Previous Experience (months) 298.11 101.426 27 27.000
Minority Classification .48 .509 27 27.000
age 48.59 9.532 27 27.000
Manager Educational Level (years) 17.25 1.612 84 84.000
Current Salary 63977.80 18244.776 84 84.000
Beginning Salary 30257.86 9980.979 84 84.000
Months since Hire 81.15 10.410 84 84.000
Previous Experience (months) 77.62 73.260 84 84.000
Minority Classification .05 .214 84 84.000
age 31.50 6.433 84 84.000
Total Educational Level (years) 13.49 2.886 473 473.000
Current Salary 34418.45 17093.723 473 473.000
Beginning Salary 17009.25 7877.562 473 473.000
Months since Hire 81.14 10.048 473 473.000
Previous Experience (months) 95.95 104.680 473 473.000
Minority Classification .22 .415 473 473.000
age 33.67 11.784 473 473.000
Output
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet Output
Vs.
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet Output
Egyező log determinánsok
(nagyon alacsony log determinánssal rendelkező csoportokat célszerű törölni, ha M szignifikáns – minél magasabb kritikus p-érték)
H0: homoszkedasztikus (egyező kovariancia mátrixok)
H1: heteroszkedasztikus
p<0.000 szignifikancia-szinten fogadjuk el, hogy homoszkedasztikus
(nagy mintaelemszámnál a szignifikancia eredménye kevésbé jelentős)
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Kevésbé járul a magyarázó erő növekedéséhez
Nő a magyarázó erő
Output
Szignifikáns diszkriminancia függvény p=0.000λ=22,3% a nem magyarázott variancia (≈ ANOVA H2 inverze)
KANONIKUS DISZKRIMINANCIA FÜGGVÉNY
Stepwise:
Min {p;Y kategóriáinak száma-1} = 2
A különbözőség azon része, amit a DF1 nem foglal magába
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet Output
• Többszörös korreláció a magyarázó változók és a diszkriminancia fv. között
• H komplementere• 1 fv. esetében a négyzete ≈R2 (modell
illeszkedés) • A DF1 0,8262=68,23%-ban magyarázza
a csoportosító változó varianciáját
DF külső szórásnégyzetDF belső szórásnégyzet
DF által magyarázott különbözőségDF által nem magyarázott különbözőség
DF-k a magyarázott különbözőség hány %-t magyarázzák (∑100%)
Az DF1 83,4%-ban járul hozzá a különbözőség magyarázatához, míg a DF2 csak 16,6%-ban.
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet Output
Diszkrimináló hatás értelmezése → DF elnevezése
• DF-k és a magyarázó változók közötti korreláció• Változók relatív fontossága (a
korreláció abszolút mértékének sorrendjében)• ≈ faktor loading (határ: >0,3 fontos)
• Változók fontossága • Kapcsolat iránya• ≈ β együtthatók (parciális)Pl. DF1-t a leginkább a
jelenlegi fizetés, míg DF2-t a korábbi munkatapasztalat határozza meg
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet Output
bi együtthatók
Diszkriminancia függvény paraméterei:
1,748age 0,038experience previous 0,013leveleducation -0,201DF
4,923-age 0,019experience previous 0,002-leveleducation 0,082DF
2
1
b: a változók parciális hozzájárulása a DF-ekhez (a többi változó változatlansága mellett)
Dummy változók használata esetén: elemzés a használatuk nélkül → használatukkal (a kanonikus korreláció négyzetében mért különbség a Dummy változók magyarázó ereje)
(A mértékegységek különbözősége miatt nem látszik a jelentősége, de ezek is diszkriminálnak)
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Átlagos D értékek
OutputEgy egyed ahhoz a csoporthoz tartozik, amely csoport centroidjához a legközelebb esik a diszkriminancia értéke (discriminant score) (Mahalanobis távolság alapján)Pl: 1. személy: manager
Discriminant score
Predicted group membership
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet Output
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet Output
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet Output
Találati arány Helyes kategorizálás
Új dolgozó: abba csoportba tartozik, amelyik centroidjától a kiszámított Mahalanobis távolság értéke a legalacsonyabb
Miskolci Egyetem Gazdaságtudományi KarÜzleti Információgazdálkodási és Módszertani Intézet
Köszönöm a figyelmet!