Upload
annisaromadhani
View
270
Download
11
Embed Size (px)
Citation preview
ANALISIS CLUSTER DAN ANALISIS FAKTOR
disusun guna memenuhi tugas pengganti pertemuan
Mata Kuliah Statistika Multivariat
Dosen Pengampu : Putriaji Hendrikawati
oleh:
Pramusinto Gati Widodo
4112311007
Statistika Terapan dan Komputasi
Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Negeri Semarang
2014
ANALISIS CLUSTERA. PENGERTIAN
Analisis Cluster adalah suatu analisis statistik multivariate yang bertujuan untuk
mengetahui struktur data dengan menempatkan kesamaan obyek observasi ke dalam
satu kelompok data sehingga dapat dibedakan antara kelompok satu dengan
kelompok yang lain atau dengan cara memisahkan kasus/obyek ke dalam beberapa
kelompok yang mempunyai sifat berbeda antar kelompok yang satu dengan yang lain.
Dalam analisis ini tiap-tiap kelompok bersifat homogen antara anggota dalam
kelompoknya atau dapat dikatakan variasi obyek/individu dalam satu kelompok yang
terbentuk sekecil mungkin (Anderberg,1973).
Analisis cluster merupakan teknik multivariat yang mempunyai tujuan utama
untuk mengelompokkan objek-objek berdasarkan karakteristik yang dimilikinya.
Analisis cluster mengklasifikasi objek sehingga setiap objek yang paling dekat
kesamaannya dengan objek lain berada dalam cluster yang sama. Cluster-cluster yang
terbentuk memiliki homogenitas internal yang tinggi dan heterogenitas eksternal yang
tinggi. Berbeda dengan teknik multivariat lainnya, analisis ini tidak mengestimasi set
vaiabel secara empiris sebaliknya menggunakan setvariabel yang ditentukan oleh
peneliti itu sendiri. Fokus dari analisis cluster adlah membandingkan objek
berdasarkan set variabel, hal inilah yang menyebabkan para ahli mendefinisikan set
variabel sebagai tahap kritis dalam analisis cluster. Set variabel cluster adalah suatu
set variabel yang merpresentasikan karakteristik yang dipakai objek-objek. Bedanya
dengan analisis faktor adalah bahwa analisis cluster terfokus pada pengelompokan
objek sedangkan analisis faktor terfokus pada kelompok variabel.
Solusi analisis cluster bersifat tidak unik, anggota cluster untuk tiap
penyelesaian/solusi tergantung pada beberapa elemen prosedur dan beberapa solusi
yang berbeda dapat diperoleh dengan mengubah satu elemen atau lebih. Solusi cluster
secara keseluruhan bergantung pada variabel-variaabel yang digunakan sebagai dasar
untuk menilai kesamaan. Penambahan atau pengurangan variabel-variabel yang
relevan dapat mempengaruhi substansi hasi analisisi cluster.
B. TUJUAN
Adapun tujuan analisis cluster adalah :
1. Menyederhanakan data dan untuk menyajikannya ke dalam bentuk grafik atau
dendogram.
2. Mengelompokkan obyek – obyek menjadi kelompok – kelompok yang
mempunyai sifat yang homogen atau variasi obyek yang terbentuk sekecil
mungkin.
3. Membedakan dengan jelas antara satu kelompok cluster dengan kelompok
yang lain.
4. Mengetahui ada tidaknya perbedaan yang nyata (signifikan) antar kelompok
yang terbentuk, dalam hal ini cluster yang dihasilkan.
5. Melihat profil serta kecenderungan-kecenderungan dari masing-masing
cluster yang terbentuk.
6. Melihat posisi masing-masing obyek terhadap obyek lainnya dari cluster yang
terbentuk.
C. MANFAAT
Secara umum, analisis cluster ini memiki manfaat sebagai berikut :
1. Untuk menerapkan dasar – dasar pengelompokan dengan lebih konsisten.
2. Untuk mengembangkan suatu metode generalisasi secara induktif, yaitu
pengambilan kesimpulan secara umum dengan berdasarkan fakta – fakta
khusus.
3. Menemukan tipologi yang cocok dengan karakter obyek yang diteliti.
4. Mendeskripsikan sifat – sifat atau karakteristik dari masing – masing
kelompok (cluster).
D. CARA KERJA ANALISIS CLUSTER
Secara garis besar ada tiga hal yang harus terjawab dalam proses kerja analisis
cluster, yaitu :
1. Bagaimana mengukur kesamaan ?
Ada tiga ukuran untuk mengukur kesamaaan antar objek, yaitu ukuran
korelasi, ukuran jarak, dan ukuran asosiasi.
2. Bagaimana membentuk cluster ?
Prosedur yang diterapkan harus dapat mengelompokkan objek-objek yang
memiliki kesamaan yang tinggi ke dalam sutau cluster yang sama.
3. Berapa banyak cluster/kelompok yang akan dibentuk ?
Pada prinsipnya jika jumlah cluster berkurang maka homogenitas dalam
cluster secara otomatis akan menurun.
E. PROSES ANALISIS CLUSTER
Sebagaimana teknik multivariat lain proses analisis cluster dapat dijelaskan dalam
enam tahap sebagai berikut :
1. Tahap 1 : Tujuan Analisis Cluster
Tujuan utama analisis cluster adalah mempartisi suatu set objek menjadi dua
kelompok atau lebih berdasarkan kesamaan karakteristik khusus yang
dimilikinya. Dalam pembentukan kelompok/cluster dapat dicapai tiga tujuan,
yaitu :
a) Deskripsi Klasifikasi (taxonomy description)
Penerapan anallisis cluster secara tradisisonal bertujuan mengeksplorasi
dan membentuk suatu klasisfikasi/taksonomi secara empiris. Karena
kemampuan partisinya analisis cluster dapat diterapkan secara luas. Meskipun
secara empiris merupakan teknik eksplorasi analisis cluster dapat pula
digunakan untuk tujuan konfirmasi.
b) Identifikasi Hubungan (relationship identification)
Hubungan antar objek diidentifikasi secara empiris. Struktur analisis
cluster yang sederhana dapat menggambarkan adanya hubungan atau
kesamaan dan perbedaan yang tidak dinyatakan sebelumnya.
c) Pemilihan pada Pengelompokan Variabel
Tujuan analisis cluster tidak dapat dipisahkan dengan pemilihan variabel
yang digunakan untuk menggolongkan objek ke dalam clucter-cluster. Cluster
yang terbentuk merefleksikan struktur yang melekat pada data seperti yang
didefinisikan oleh variabel-variabel. Pemilihan variabel harus sesuai dengan
teori dan konsep yang umum digunakan dan harus rasional. Rasionalitas ini
didasarkan pada teori-teori eksplisit atau penelitian sebelumnya. Variabel-
variabel yang dipilih hanyalah variabel yang dapat mencirikan objek yang
akan dikelompokkan dan secara spesifik harus sesuai dengan tujuan analisis
cluster.
2. Tahap 2 : Desain Penelitian dalam Analisis Cluster
Tiga hal penting dalam tahap ini adalah pendeteksian outlier, mengukur
kesamaan, dan standarisasi data.
a) Pendeteksian Outlier
Outlier adalah suatu objek yang sangat berbeda dengan objek lainnya.
Outlier dapat digambarkan sebagai observasi yang secara nyata kebiasaan,
tidak mewakili populasi umum, dan adanya undersampling dapat pula
memunculkan outlier. Outlier menyebabkan menyebabkan struktur yang tidak
benar dan cluster yang terbentuk menjadi tidak representatif.
b) Mengukur Kesamaan antar Objek
Konsep kesamaan adalah hal yang fundamental dalam analisis cluster.
Kesamaan antar objek merupakan ukuran korespondensi antar objek. Ada tiga
metode yang dapat diterapkan, yaitu : ukuran korelasi, ukuran jarak, dan
ukuran asosiasi.
(1) Ukuran Korelasi
Ukuran ini dapat diterapkan pada data dengan skala metrik, namun
jarang digunakan karena titik bertnya pada nilai suatu pola tertentu,
padahal titik berat analisis cluster adalah besarnya objek. Kesamaan antar
objek dapat dilihat dari koefisien korelasi antar pasangan objek yang
diukur dengan beberapa variabel.
(2) Ukuran Jarak
Merupakan ukuran yang paling sering digunakan. Diterapkan untuk
data berskala metrik. Sebenarnya merupakan ukuran ketidakmiripan,
dimana jarak yang besar menunjukkan sedikit kesamaan sebaliknya jarak
yang pendek/kecil menunjukkan bahwa suatu objek makin mirip dengan
objek lain. Bedanya dengan ukuran korelasi adalah bahwa ukuran jarak
fokusnya pada besarnya nilai. Cluster berdasarkan ukuran korelasi bisa
saja tidak memiliki kesamaan nilai tapi memiliki kesamaan pola,
sedangkan cluster berdasarkan ukuran jarak lebih memiliki kesamaan nilai
meskipun polanya berbeda.
(3) Ukuran Asosiasi
Ukuran asosiasi dipakai untuk mengukur data berskala nonmetrik
(nominal atau ordinal).
c) Standarisasi Data
(1) Standarisasi Variabel
Bentuk paling umum dalam standarisasi variabel adalah konversi
setiap variabel terhadap skor atandar ( dikenal dengan Z score) dengan
melakukan substraksi nilai tengan dan membaginya dengan standar
deviasi tiap variabel.
(2) Standarisasi Data
Berbeda dengan standarisasi variabel, standarisasi data dilakukan
terhadap observasi/objek yang akan dikelompokkan.
3. Tahap 3 : Asumsi-asumsi dalam Analisis Cluster
Seperti hal teknik analisis lain,analisis cluster juga menetapkan adanya suatu
asumsi. Ada dua asumsi dalam analisis cluster, yaitu :
a) Kecukupan Sampel untuk merepresentasikan / mewakili Populasi
Biasanya suatu penelitian dilakukan terhadap populasi diwakili oleh
sekelompok sampel. Sampel yang digunakan dalam analisis ckuster harus
dapat mewakili populasi yang ingin dijelaskan, karena analisis ini baik jika
sampel representatif. Jumlah sampel yang diambil tergantung penelitinya,
seorang peneliti harus yakin bahwa sampil yang diambil representatif
terhadap populasi.
b) Pengaruh Multukolinieritas
Ada atau tidaknya multikolinieritas antar variabel sangat diperhatikan
dalam analisis cluster karena hal itu berpengaruh, sehingga variabel-variabel
yang bersifat multikolinieritas secara eksplisit dieprtimbangkan dengan lebih
seksama.
4. Tahap 4 : Proses Mendapatkan Cluster dan Menilai Kelayakan Secara
Keseluruhan
Pada tahap ini, ada dua proses penting yaitu algoritma cluster dalam
pembentukan cluster dan menentukan jumlah cluster yang akan dibentuk.
Keduanya mempunyai implikasi substansial tidak hanya pada hasil yang
diperoleh tetapi juga pada interpretasi yang akan dilakukan terhadap hasil
tersebut.
a) Algoritma Cluster
Algoritma cluster harus dapat memaksimalkan perbedaan relatif cluster
terhadap variasi dalam cluster. Dua metode paling umum dalam algoritma
cluster adalahmetode hirarkhi dan metode non hirarkhi. Penentuan metode
mana yang akan dipakai tergantung kepada peneliti dan konteks penelitian
dengan tidak mengabaikan substansi, teori dan konsep yang berlaku.
Keduanya memiliki kelebihan sendiri-sendiri. Keuntungan metode hirarkhi
adalah cepat dalam proses pengolahan sehingga menghemat waktu, namun
kelemahannya metode ini dapat menimbulkan kesalahan. Selain itu tidak baik
diterapkan untuk menganalisis sampel dengan ukuran besar. Metode Non
Hirarkhi memiliki keuntungan lebih daripada metode hirarkhi. Hasilnya
memiliki sedikit kelemahan pada data outlier, ukuran jarak yang digunakan,
dan termasuk variabel tak relevan atau variabel yang tidak tepat.
Keuntungannya hanya dengan menggunakan titik bakal nonrandom,
penggunaan metode non hirarkhi untuk titik bakal random secara nyata lebih
buruk dari pada metode hirarkhi.
Alternatif lain adalah dengan mengkombinasikan kedua metode ini.
Pertama gunakan metode hirarkhi kemudian dilanjutkan dengan metode non
hirarkhi.
(1) Metode Hirarkhi
Tipe dasar dalam metode ni adalah aglomerasi dan pemecahan. Dalam
metode aglomerasi tiap observasi pada mulanya dianggap sebagai cluster
tersendiri sehingga terdapat cluster sebanyak jumlah observasi. Kemudian
dua cluster yang terdekat kesamaannya digabung menjadi suatu cluster
baru, sehingga jumlah cluster berkurang satu pada tiap tahap. Sebaliknya
pada metode pemecahan dimulai dari satu cluster besar yang mengandung
seluruh observasi, selanjutnya observasi-observasi yang paling tidak sama
dipisah dan dibentuk cluster-cluster yang lebih kecil. Proses ini dilakukan
hingga tiap observasi menjadi cluster sendiri-sendiri.
Hal penting dalam metode hirarkhi adalah bahwa hasil pada tahap
sebelumnya selalu bersarang di dalam hasil pada tahap berikutnya,
membentuk sebuah pohon.
Ada lima metode aglomerasi dalam pembentukan cluster, yatiu :
(a) Pautan Tunggal (Single Linkage)
Metode ini didasarkan pada jarak minimum. Dimulai dengan dua
objek yang dipisahkan dengan jarak paling pendek maka keduanya
akan ditempatkan pada cluster pertama, dan seterusnya. Metode ini
dikenal pula dengan nama pendekatan tetangga terdekat.
(b) Pautan Lengkap (Complete Linkage)
Disebut juga pendekatan tetangga terjauh. Dasarnya adalah jarak
maksimum. Dalam metode ini seluruh objek dalam suatu cluster
dikaitkan satu sama lain pada suatu jarak maksimuma atau dengan
kesamaan minimum.
(c) Pautan Rata-rata (Average Linkage)
Dasarnya adalah jarak rata-rata antar observasi. pengelompokan
dimulai dari tengan atau pasangan observasi dengan jarak paling
mendekati jarak rata-rata.
(d) Metode Ward (Ward’s Method)
Dalam metode ini jarak antara dua cluster adalah jumlah kuadrat
antara dua cluster untuk seluruh variabel. Metode ini cenderung
digunakan untuk mengkombinasi cluster-cluster dengan jumlah kecil.
(e) Metode Centroid
Jarak antara dua cluster adalah jarak antar centroid cluster tersebut.
Centroid cluster adalah nilai tengah observasi pada variabel dalam
suatu set variabel cluster. Keuntungannya adalah outlier hanya sedikit
berpengaruh jika dibandingkan dengan metode lain.
(2) Metode Non Hirarkhi
Metode ini dipakai jika banyaknya kelompok sudah diketahui dan
biasanya metode ini dipakai untuk mengelompokkan data yang berukuran
besar, yang termasuk dalam metode ini adalah metode K’means
Masalah utama dalam metoda non hirarkhi adalah bagaimana memilih
bakal cluster. Harus disadari pengaruh pemilihan bakal cluster terhadap
hasil akhir analisis cluster. Bakal cluster pertama adalah observasi pertama
dalam set data tanpa missing value. Bakal kedua adalah observasi lengkap
berikutnya (tanpa missing data) yang dipisahkan dari bakal pertama oleh
jarak minimum khusus.
Ada tiga prosedur dalam metode non hirarkhi, yaitu :
(a) Sequential threshold
Metode ini dimulai dengan memilih bakal cluster dan menyertakan
seluruh objek dalam jarak tertentu. Jika seluruh objek dalam jarak
tersebut disertakan, bakal cluster kedua terpilih, kemudian proses terus
berlangsung seperti sebelumnya.
(b) Parallel Threshold
Metode ini memilih beberapa bakal cluster secara simultan pada
permulaannya dan menandai objek-objek dengan jarak permulaan ke
bakal terdekat.
(c) Optimalisasi
Metode ketiga ini mirip dengan kedua metode sebelumnya kecuali
pada penandaan ulang terhadap objek-objek.
Hal penting lain dalam tahap keempat adalah menentukan jumlah cluster yang
akan dibentuk. Sebenarnya tidak ada standar,prosedur pemilihan tujuan eksis.
Karena tidak ada kriteria statistik internal digunakan untuk inferensia, seperti tes
signifikansipada teknik multivariat lainnya, para peneliti telah mengembangkan
beberapa kriteria dan petunjuk sebagai pendekatan terhadap permasalahan ini
dengan memperhatikan substansi dan aspek konseptual.
Untuk menyatakan suatu observasi atau variabel menpunyai sifat yang lebih
dekat dengan observasi tertentu daripada dengan observasi yang lain digunakan
fungsi yang disebut jarak (distance). Suatu fungsi disebut jarak jika mempunyai
sifat :
a) Tak negatif d ij≥0 dan d ij=0 jika i=j
b) Simetri d ij=d ji
c) d ij≤d ik+d jk panjang salah satu sisi segitiga selalu lebih kecil atau sama-
dengan jumlah dua sisi yang lain
Beberapa macam jarak yang biasa dipakai di dalam analisis kelompok :
Nomor Jarak Formula
1 Euclideand ij=√∑k=1
p
{xik−x jk }2
2 Manhattand ij=∑
k=1
p
|x ik−x jk|
3 Pearsond ij=√∑k=1
p (xik−x jk )2
var (xk )4 Korelasi d ij=1−rij
5 Korelasi Mutlak
d ij=1−|r ij|
Metode-metode pengelompokan hirarki dibedakan berdasarkan konsep jarak
antar kelompok, penentuan jarak antar kelompok untuk metode-metode tersebut
adalah :
No. Metode Jarak antara kelompok (i,j) dengan k
1 Single linkage d(i , j )k=min (d ik , d jk )
2 Complete linkage d(i , j)k=max ( dik , d jk )
3 Average linkage d(i , j)k=average (d ik , d jk )
4 Median linkage d(i , j)k=median(d ik , d jk )
Tahap-tahap pengelompokan data dengan menggunakan metode hirarki
adalah :
a) Tentukan matriks jarak antar data yang dikelompokkan
b) Tentukan dua data yang mempunyai jarak terkecil kemudian gabungkan dua
data ini ke dalam satu kelompok
c) Modifikasi matriks jarak sesuai aturan jarak antar kelompok yang sesuai
dengan metode pengelompokan yang dipakai
d) Lakukan langkah 2 dan 3 sampai matriks jarak berukuran 1x1
Sedangkan tahap-tahap pengelompokan data dengan menggunakan metode
tak-hirarki K’means adalah :
a) Mulai
b) Tentukan k buah pusat awal
c) Tentukan jarak setiap data ke tiap pusat
d) lakukan pengelompokan setiap data ke pusat terdekat
e) Tentukan nilai pusat baru sebagai rata-rata data dalam kelompok
f) Lakukan langkah 3-5 sampai nilai pusat kelompok tak berubah lagi
g) Selesai
5. Tahap 5 : Interpretasi terhadap Cluster
Tahap interpretasi meliputi pengujian tiap cluster dalam term untuk menamai
dan menandai dengan suatu label yang secara akurat dapat menjelaskan
kealamian cluster. Proes ini dimulai dengan suatu ukuran yang sering digunakan
yaitu centroid cluster.
Membuat profil dan interpretasi cluster tidak hanya tidak hanya untuk
memoeroleh suatu gambaran saja melainkan pertama, menyediakan suatu rata-
rata untuk menilai korespondensi pada cluster yang terbentuk, kedua, profil
cluster memberikan araha bagi penilainan terhadap signifikansi praktis.
6. Tahap Keenam: Proses Validasi dan Pembuatan Profil Cluster
A. Proses validasi solusi cluster
Proses validasi bertujuan menjamin bahwa solusi yang dihasilkan dari
analisis cluster dapat mewakili populasi dan dapat digeneralisasi untuk objek
lain. Pendekatan ini membandingkan solusi cluster dan menilai korespondensi
hasil. Terkadang tidak dapat dipraktekkan karena adanya kendala waktu dan
biaya atau ketidaktersediaan objek untuk analisis cluster ganda.
B. Pembuatan Profil Solusi Cluster
Tahap ini menggambarkan karakteristik tiap cluster untuk menjelaskan
cluster-cluster tersebut dapat dapat berbeda pada dimensi yang relevan. Titik
beratnya pada karakteristik yang secara signifikan berbeda antar cluster dan
memprediksi anggota dalam suatu cluster khusus.
F. CONTOH
Disajikan data harapan hidup perempuan dan harapan hidup laki-laki negara-
negara pendiri ASEAN sebagai berikut :
COUNTRY LIFEEXPF LIFEEXPM
Indonesia 65 61
Malaysia 72 66
Philippines 68 63
Singapore 79 73
Thailand 72 65
Scatter-plot negara-negara ASEAN tersebut adalah :
Langkah awal analisis kelompok metode hirarki adalah membentuk matriks jarak
antar observasi :
Malaysia Philippines Singapore Thailand
Indonesia 74 13 340 65
Malaysia 25 98 1
Philippines 221 20
Singapore 113
Matriks jarak di atas digitung berdasarkan kuadrat jarak Euclidean, misalkan
d(Indonesia, Malaysia)= (65-72)2 + (61-66)2 = 49 + 25 = 74. Setelah matriks jarak
sudah terbentuk maka langkah berikutnya adalah menentukan dua observasi yang
mempunyai jarak terdekat dan kemudian digabung dalam satu kelompok.
(Mal,Tha) Philippines Singapore
Indonesia … 13 340
(Mal,Tha) … …
Philippines 221
Jarak antara Indonesia dengan (Malaysia, Thailand) untuk berbagai metode
adalah :
Nomor Metode Jarak antara kelompok (Mal,Tha) dengan
Indonesia
1 Single linkage min(dina mal, dina tha)=min(74, 65)=65
2 Complete linkage max(dina mal, dina tha)=max(74, 65)=74
3 Average linkage Average(dina mal, dina tha)=average(74, 65)=69.5
4 Median linkage Median(dina mal, dina tha)=min(74, 65)=69.5
Jika digunakan metode single linkage maka matriks jaraknya adalah :
(Mal,Tha) Philippines Singapore
Indonesia65 13 340
(Mal,Tha) 20 98
Philippines 221
Setelah tahap ini, maka observasi yang mempunyai jarak terdekat adalah
Indonesia dengan Philippines, sehingga dua negara ini digabung :
(Mal,Tha) Singapore
(Ina, Phi) 20 221
(Mal,Tha) 98
Jarak terdekat adalah 20 sehingga kelompok (Ina Phi) bergabung dengan (Mal
Tha) sehingga matriks jarak berubah menjadi :
Singapore
(Ina, Phi, Mal, Tha) 98
Penggabungan terakhir adalah Singapore dengan (Ina Phi Mal Tha) pada jarak
penggabungan 98, secara ringkas pengekompokan negara-negara di ASEAN dengan
menggunakan metode single linkage adalah :
Tahap Jarak Yang digabung Banyak Kelompok
Penggabungan cluster 1 cluster 2 Kelompok
0 5
(Ina) (Mal)
(Phi) (Sin)
(Tha)
1 1 Mal Tha 4
(Ina) (Mal
Tha) (Phi)
(Sin)
2 13 Ina Phi 3
(Ina Phi) (Mal
Tha) (Sin)
3 20 (Mal Tha) (Ina Phi) 2
(Ina Phi Mal
Tha) (Sin)
4 98 (Ina..Tha) Sin 1 (Ina Phi Mal
Tha Sin)
Berdasarakan kriteria loncatan jarak penggabungan terbesar (dari 20 ke 98) maka
banyaknya kelompok adalah 2 yaitu (Ina Phi Mal Tha) (Sin).
Selain loncatan jarak penggabungan terbesar, banyaknya kelompok dapat
ditentukan dengan kriteria :
a. Maksimum nisbah (ratio) keragaman data antar kelompok dengan keragaman
data di dalam kelompok. Statistik uji ini dapat dihitung melalui statistik uji F
dalam oneway anova atau statistik uji Wilk dalam oneway Manova.
b. Maksimum statistik Hartigan (1975) :H (k )={ W (k )
W (k+1 )−1}/ (n−k−1 )
c. Maksimum rata-rata statistik silhoutte yang diajukan oleh Kaufman dan
Rousseuw (1990) s( i )= b ( i )−a( i)
max [a( i) , b( i) ] dan a(i) adalah rata-jarak observasi ke-i
dengan observasi yang lain dalam cluster yang sama, b(i) adalah rata-rata jarak
observasi ke-i dengan cluster terdekat. Statistik ini disajikan oleh program
SPLUS.
Untuk pengelompokan variabel, banyaknya kelompok dapar ditentukan dengan
menggunakan kriteria banyaknya eigen value yang lebih besar dari satu dari matriks
korelasi.
ANALISIS FAKTORA. PENGERTIAN
Teknik analisis faktor dikembangkan pada awal abad ke-20. Teknik analisis ini
dikembangkan dalam bidang psikometrik atas usaha akhli statistikaw Karl Pearson,
Charles Spearman, dan lainnya untuk mendefinisikan dan mengukur intelegensia
seseorang.
Analisis faktor adalah salah satu teknik statistika yang dapat digunakan untuk
memberiikan deskripsi yang relatif sederhana melalui reduksi jumlah peubah yang
disebut faktor. Analisis faktor adalah prosedur untuk mengidentifikasi item atau
variabel berdasarkan kemiripannya. Kemiripan tersebut ditunjukkan dengan nilai
korelasi yang tinggi. Item-item yang memiliki korelasi yang tinggi akan membentuk
satu kerumunan faktor.Prinsip dasar dalam analisis faktor adalah menyederhanakan
deskripsi tentang data dengan mengurangi jumlah variabel/ dimensi.
Pada dasarnya analisis faktor atau analisis komponen utama mendekatkan data
pada suatu pengelompokan atau pembentukan suatu variabel baru yang berdasarkan
adanya keeratan hubungan antardemensi pembentuk faktor atau adanya konfirmatori
sebagai variabel baru atau faktor. Meskipun dari p buah variabel awal atau variabel
asal dapat diturunkan atau dibentuk sebanyak p buah faktor atau komponen untuk
menerangkan keragaman total sistem, namun sering kali keragaman total itu dapat
diterangkan secara sangat memuaskan hanya oleh sejumlah kecilfaktor
yangterbentuk, katakanlah oleh sebanyak k buah faktor atau komponen yang
terbentuk, di mana k < p; umpamanya dari sejumlah variabel p yaitu sebanyak 10
demensi atau item, dari 10 demensi tersebut terbentuk sebanyak k = 2 buah faktor
atau komponen yang dapat menerakan kesepuluh demensi atau item semula. Jika
demikian halnya, maka akan diperperoleh sebagian terbesar informasi tentang
struktur ragam-peragam dari p buah variabel asal yang dapat diterangkan oleh k buah
faktor atau komponen yang terbentuk. Dalam hal ini k buah faktor atau komponen
utama dapat mewakili p buah variabel asalnya, sehingga lebih sederhana.
Data asli yang dianalisis dalam analisis faktor dinyatakan dalam bentuk matriks
berukuran n x p (di manan jumlah sampel dan p variabel pengamatan), yang dapat
direduksi ke dalam matriks yang berukuran lebih kecil dan mengandung sejumlah n
pengukuran pada k buah komponen utama atau faktor, sehingga matriks yang
terbentuk berukuran n x k (n jumlah sampel dan k komponen utama atau faktor), dan
k <p. Jumlah faktor yang terbentuk adalah sebanyak variabel asal = p, dan k adalah
sejumlah faktor yang memenuhi kriteria atau aturan.
Analisis faktor sering kali dilakukan tidak saja merupakan analisis akhir dari
suatu pekerjaan analisis statistika atau pengolahan data, tetapi dapat merupakan
tahapan atau langkah awal bahkan langkah antara dalam kebanyakan analisis
statistika yang bersifat lebih besar atau lebih kompleks. Sebagai misalnya dalam
analisis regresi faktor (factor regresion), maka analisis faktor akan merupakan tahap
antara suatu analisis statistika dari data awal untuk membentuk variabel baru yang
akan menuju ke analisis regresi. Oleh karena itu, analisis faktor digunakan sebagai
input dalam membangun analisis regresi yang lebih lanjut, demikian pula dalam
analisis gerombol atau cluster analysis di mana faktor atau variabel baru yang
terbentuk dipergunakan sebagai input untuk melakukan analisis pengelompokan
terhadap suatu set data.
Untuk mempermudah pengertian dalam analisis faktor perlu pemahaman tentang
istilah-istilah seperti: komponen atau faktor, variabel, dan indikator, sub variabel,
atau item seperti:
1. Variabel adalah data pengamatan atau data bentukan yang nilai-nilainya
bervariasi secara acak atau random.
2. Faktor atau komponen adalah sebuah variabel bentukan yang dibentuk
melalui indikator-indikator atau item-item yang teramati (obserabel variable).
Karena faktor merupakan variabel bentukan maka faktor disebut variabel laten
(latent variable) atau unobserabel variable. Faktor merupakan variabel baru
yang bersifat unobservable variable atau variabel tidak teramati atau variabel
laten atau konstruks atau ada yang menyebut non visible variable, karena
sifatnya yang abstrak yaitu variabel tersebut tidak dapat diukur atau diamati
secara langsung oleh peneliti. Akan tetapi, pada analisis faktor, di mana faktor
merupakan kumpulan atau gabungan yang bersifat linier berbobot dari
beberapa pengukuran, atau beberapa indikator, atau beberapa variabel
pengamatan (obserabel variable).
3. Sub-variabel juga disebut variabel pengamatan (obserabel variable) atau
variabel manifest, atau indikator adalah suatu konsep yang merupakan
variabel yang dapat diukur atau diamati secara langsung, sehingga disebut
observable variable atau variabel manifest atau indikator, atau item, dan hasil
pengukurannya adalah bervariasi dan nyata.
Sebagai contoh, faktor atau variabel laten kepandaian seseorang tidak dapat
diamati atau diukur secara langsung, tetapi dapat diketahui atau diukur melalui
berbagai variabel pengukuran kepandaian seperti: kepasihan membaca, kecakapan
berhitung,kepandaian ilmu sosial, kepadaian menulis, kepasisan berbahasa, pintar
mengarang, dan lain-lain sebagainya yang diukur dari nilai rapor. Hasil analisis faktor
berbeda dengan nilai kepandaian yang dinyatakan dengan IP= indeksprestasi.
Maksud melakukan analysis faktor adalah mencari variable baru yang disebut
faktor yang tidak saling berkorelasi, bebas satu sama lain, lebih sedikit dari variable
asli, tapi dapat menyerap sebagian besar informasi yang terkandung dalam variable
asli atau yang dapat memberikan sumbangan terhadap varian seluruh variable. Lalu
berapa faktor yang perlu disajikan? Ada beberapa cara;
1. Penentuan Apriori
Kadang karena peneliti sebelumnya sudah mengetahui berapa faktor yang
digunakan maka kita akan menentukan dulu berapa faktor yang akan digunakan.
2. Penentuan Berdasar Eigenvalue
Faktor dengan eigenvalue lebih besar dari satu yang dipertahankan jika lebih
kecil dari satu faktornya tidak diikutsertakan dalam model. Suatu eigenvalue
menunjukkan besar sumbangan dari faktor terhadap varian seluruh variable asli.
Hanya faktor dengan varian lebih dari 1 yang dimasukkan dalam model. Faktor
dengan varian kurang dari 1 tidak baik karena variable asli telah dibakukan yang
berarti rata-ratanya 0 dan variansnya 1. Bila banyak variable asli asli kurang dari
20 pendekatan ini menghasilkan sejumlah faktor yang konservatif.
3. Penentuan Berdasar Screeplot
Dapat dilihat dari grafik screeplot dimana scree mulai terjadi menunjukkan
banyak faktor yang benar, tepatnya ketika scree mulai mendatar. Kenyataan
menunjukkan bahwa penentuan banyaknya faktor dengan screeplot akan
mencapai satu atau lebih banyak dari penentuan dengan eigenvalue.
4. Penentuan Didasarkan pada Presentase Varian
Banyak faktor diekstraksi ditentukan sedemikian rupa sehingga kumulatif
presentase varian yang diekstraksi oleh faktor mancapai suatu level tertentu yang
memuaskan. Ekstraksi faktor dihentikan jika kumulatif presentase varian sudah
mencapai paling sedikit 60% atau 75% dari seluruh varian variable asli.
B. TUJUAN ANALISIS FAKTOR
Tujuan utama analisis faktor adalah untuk menjelaskan struktur hubungan
diantara banyak variabel dalam bentuk faktor atau variabel laten atau variabel
bentukan. Faktor yang terbentuk merupakan besaran acak (random quantities) yang
sebelumnya tidak dapat diamati atau diukur atau ditentukan secara langsung.
Selain tujuan utama analisis faktor, terdapat tujuan lainnya adalah:
1. Tujuan kepertama untuk mereduksi sejumlah variabel asal yang jumlahnya
banyak menjadi sejumlah variabel baru yang jumlahnya lebih sedikit dari
variabel asal, dan variabel baru tersebut dinamakan faktor atau variabel laten
atau konstruk atau variabel bentukan..
2. Tujuan kedua adalah untuk mengidentifikasi adanya hubungan antarvariabel
penyusun faktor atau dimensi dengan faktor yang terbentuk, dengan
menggunakan pengujian koefisien korelasi antarfaktor dengan komponen
pembentuknya. Analisis faktor ini disebut analisis faktor kofirmatori.
3. Tujuan ketiga adalah untuk menguji valisitas dan reliabilitas instrumen
dengan analisis faktor konfirmatori.
4. Tujuan keempat salah satu tujuan analisis faktor adalah validasi data untuk
mengetahui apakah hasil analisis faktor tersebut dapat digeralisasi ke dalam
populasinya, sehingga setelah terbentuk faktor, maka peneliti sudah
mempunyai suatu hipotesis baru berdasarkan hasil analisis faktor.
C. JENIS ANALISIS FAKTOR
1. Analisis Faktor Eksploratori (Exploratory Factor Analysis)
Analisis faktor eksploratori merupakan suatu teknik untuk mereduksi data dari
variabel asal atau variabel awal menjadi variabel baru atau faktor yang jumlahnya
lebih kecil dari pada variabel awal. Proses analisis faktor eksploratori mencoba
untuk menemukan hubungan antarvariabel baru atau faktor yang terbentuk yang
saling independen sesamanya, sehingga bisa dibuat satu atau beberapa kumpulan
variabel laten atau faktor yang lebih sedikit dari jumlah variabel awal yang bebas
atau tidak berkorelasi sesamanya. Jadi antarfaktor yang terbentuk tidak
berkorelasi sesamanya. Analisis faktor eksplanatori menggunakan matriks
korelasi ( r ) untuk mengestimasi faktor strukturnya. Pada analisis faktor
ekplanatori umumnya dikembangkan untuk menjelaskan adanya korelasi yang
sangat erat di antara variabel pembentuk faktornya. Sebagai contoh, jika semula
terdapat sepuluh variabel awal yang saling dependen sesamanya, dengan analisis
faktor ekplanatori mungkin bisa diringkas atau terbebtuk hanya menjadi satu atau
dua kumpulan variabel laten atau variabel baru atau komponen baru atau faktor,
Selanjutnya, kumpulan variabel baru tersebut dikenal dengan nama faktor atau
komponen atau konstruk. Faktor yang terbentuk tetap mewakili atau
mencerminkan variabel asli atau variabel awalnya. Analisis faktor eksploratori
atau analisis komponen utama (PCA) yang menitik beratkan pada bagian variasi
total yang dapat diterangkan oleh faktor bersama yang terbentuk, di mana item-
item pembentuknya berkontribusi dengan item lainnya membentuk himpunan
variabel baru atau faktor atau komponen atau variabel laten.
Analisis faktor eksploratori atau analisis komponen utama(PCA = principle
component analysis) yaitu suatu teknik analisis faktor di mana beberapa faktor
yang akan terbentuk berupa variabel laten yang belum dapat ditentukan sebelum
analisis dilakukan. Pada prinsipnya analisis faktor eksploratori di mana
terbentuknya faktor-faktor atau variabel laten baru adalah bersifat acak, yang
selanjutnya dapat diinterprestasi sesuai dengan faktor atau komponen atau
konstruk yang terbentuk. Analisis faktor eksploratori persis sama dengan anlisis
komponen utama (PCA). Dalam analisis faktor eksploratori di mana sipeneliti
tidak atau belum mempunyai pengetahuan atau teori atau suatu hipotesis yang
menyusun struktur faktor-faktornya yang akan dibentuk atau yang terbentuk,
sehingga dengan demikian pada analisis faktor eksploratori merupakanteknik
untuk membantu membangun teori baru. Analisis faktor eksploratori merupakan
suatu teknik untuk mereduksi data dari variabel asal atau variabel awal menjadi
variabel baru atau faktor yang jumlahnya lebih kecil dari pada variabel awal.
Proses analisis faktor eksploratori mencoba untuk menemukan hubungan
antarvariabel baru atau faktor yang terbentuk yang saling independen sesamanya,
sehingga bisa dibuat satu atau beberapa kumpulan variabel laten atau faktor yang
lebih sedikit dari jumlah variabel awal yang bebas atau tidak berkorelasi
sesamanya. Jadi antarfaktor yang terbentuk tidak berkorelasi sesamanya.
Analisis faktor eksplanatori menggunakan matriks korelasi ( r ) untuk
mengestimasi faktor strukturnya. Pada analisis faktor ekplanatori umumnya
dikembangkan untuk menjelaskan adanya korelasi yang sangat erat di antara
variabel pembentuk faktornya. Sebagai contoh, jika semula terdapat sepuluh
variabel awal yang saling dependen sesamanya, dengan analisis faktor ekplanatori
mungkin bisa diringkas atau terbebtuk hanya menjadi satu atau dua kumpulan
variabel laten atau variabel baru atau komponen baru atau faktor, Selanjutnya,
kumpulan variabel baru tersebut dikenal dengan nama faktor atau komponen atau
konstruk. Faktor yang terbentuk tetap mewakili atau mencerminkan variabel asli
atau variabel awalnya. Analisis faktor eksploratori atau analisis komponen utama
(PCA) yang menitik beratkan pada bagian variasi total yang dapat diterangkan
oleh faktor bersama yang terbentuk, di mana item-item pembentuknya
berkontribusi dengan item lainnya membentuk himpunan variabel baru atau
faktor atau komponen atau variabel laten.
2. Analisis faktor konfirmatori (CFA)
Analisis faktor konfirmatori yaitu suatu teknik analisis faktor di mana
secara apriori berdasarkan teori dan konsep yang sudah diketahui dipahami
atau ditentukan sebelumnya, maka dibuat sejumlah faktor yang akan
dibentuk, serta variabel apa saja yang termasuk ke dalam masing-masing
faktor yang dibentuk dan sudah pasti tujuannya. Pembentukan faktor
konfirmatori (CFA) secara sengaja berdasarkan teori dan konsep, dalam upaya
untuk mendapatkan variabel baru atau faktor yang mewakili beberapa item atau
sub-variabel, yang merupakan variabel teramati atau observerb variable.
Sebagai misal faktor kepandaian diukur secara langsung, melalui variabel
kepasihan membaca, kecakapan berhitung, kepandaian ilmu sosial, kepadaian
menulis, kepasisan berbahasa, pintar mengarang. Contoh lain faktor
keberhasilan seseorang dapat diukur dengan variabel: kepandaian, keuletan,
kekayaan, dan kamujuran. Pada dasarnya tujuan analisis faktor konfirmatori
adalah: kepertama untuk mengidentifikasi adanya hubungan antarvariabel
dengan melakukan uji korelasi. Tujuan kedua untuk menguji valisitas dan
reliabilitas instrumen. Dalam pengujian terhadap valisitas dan reliabilitas
instrumen atau kuisner untuk mendapatkan data penelitian yang valid dan
reliabel dengan analisis faktor konfirmator. Teknik analisis faktor konfirmatori
persis sama dengan tehnik analisis faktor eksploratori dengan menghitung
factor loading atau koefisien faktor atau nilai lamda (λi) yang serupa dengan
nilai koefisien regresi βi yaitu faktor loding antara indikator Xi dengan faktor
Fj yang terbentuk. Apabila nilai loding faktor atau nilai lamda (λi) yang
diperoleh lebih besar atau sama dengan setengah (λi≥ 0,5) atau dapat diuji
dengan uji t, dan apabila variabel menunjukkan signifikan berarti variabel Xi
atau instrumen atau item tersebut sahih untuk dijadikan sebagai anggota faktor
yang bersangkutan.
Pada dasarnya teknik analisis faktor konfirmatori (FCA), sebagai lawan dari
analisis faktor eksploratori (PCA). Tehnik analisis konfirmatori digunakan untuk
menguji sebuah konsep atau teori secara teoritis. Mungkin sebuah teori yang baru
dikembangkan oleh peneliti atau teori yang sudah dikembangkan sejak lama
oleh orang lain, yang untuk pembuktiannyadibutuhkan sebuah pengujian empirik.
Pengujian empirik itulah kadangkala dilakukan melaui analisis SEM (Sistem
Equation Modeling). Analisis SEM digunakan untuk menguji kausalitas yang
sudah jelas ada dasar teorinya. Akan tetapi, bukan digunakan untuk
membentuktikan sebuah teori kausalitas. Oleh karena itu, pengembangan
sebuah teori yang berdasarkan landasan ilmiah adalah syarat utama dan pertama
sebelum menggunakan analisis SEM.
Untuk proses uji validasi reliabilitas dengan metode analisis faktor
konfirmatori ada beberapa macam syarat hang harus dipenuhi yaitu:
a) Pada tahap kepertama menilai apakah semua sub-variabel atau item atau
indikator pembentuk faktor layak untuk diikutkan pada analisis faktor
atau tidak. Apabila tidak layak maka sub-variabel tersebut tidak diikutkan
sertakan pada analisisfaktor, dan sebaliknya apabila sub-variabel tersebut
layak maka diikutkan pada analisis.
b) Pada tahap kedua, item-item yang tidak layak untuk difaktorkan, maka
dilakukan faktoring atau mereduksi item dengan jalan sub-variabel yang
tidak layak difaktorkan dikeluarkan dari analisis faktor. Selanjutnya,
dilakukan analisis ulang, sehingga terbentuk satu faktor yang dapat
mewakili sub-variabel dengan item pembentuk faktor yang baru.
c) Pada langkah selanjutnya, setelah faktornya terbentuk, maka dapat
dilakukan analisis data lanjutan dengan menggunakan nilai skor faktor
(SF)
D. FUNGSI ANALISIS FAKTOR
Analisis faktor memiliki fungsi penting dalam pengembangan alat ukur. Beberapa
fungsi tersebut antara lain sebagai berikut.
1. Pengujian Dimensionalitas Pengukuran
Dimensionalitas pengukuran adalah banyaknya atribut yang diukur oleh
sebuah alat ukur. Alat ukur yang unidimensi mengukur satu atribut psikologis saja
sedangkan alat ukur yang multidimensi mengukur lebih dari satu atribut ukur.
Pengukuran dalam bidang psikologi didominasi oleh pengukuran unidimensi
karena alat ukur yang dikembangkan peneliti psikologi biasanya mengukur satu
target ukur saja. Misalnya Skala Kecemasan, skala ini diharapkan mengukur
atribut kecemasan saja dan tidak mengukur atribut yang lain. Untuk mengetahui
apakah alat ukur yang dikembangkan oleh peneliti mengukur satu atribut atau
banyak atribut diperlukan analisis faktor.
2. Pengujian Komponen atau Aspek dalam Alat Ukur
Penyusunan alat ukur psikologi biasanya diawali dari penurunan konsep
menjadi komponen atau aspek konsep sebelum diturunkan menjadi aitem berupa
pernyataan skala. Untuk mengidentifikasi apakah item-item yang diturunkan dari
komponen alat ukur mewakili komponen tersebut maka diperlukan analisis faktor.
Analisis faktor juga dapat menunjukkan apakah antar komponen memiliki
keterkaitan ataukah tidak (independen).
E. METODE ANALISIS FAKTOR
Terdapat dua cara yang dapat dipergunakan dalam analisis faktor khususnya
koefisien skor faktor, yaitu Principal component dan Common factor analysis.
1. Principal component
Jumlah varian dalam data dipertimbangkan. Diagonal matrik korelasi terdiri
dari angka satu dan full variance dibawa dalam matriks faktor. Principal
component direkomendasikan jika hal yang pokok adalah menentukan bahwa
banyaknya faktor harus minimum dengan memperhitungkan varians maksimum
dalam data untuk dipergunakan di dalam analysis multivariate lebih lanjut.
2. Common factor analysis
Faktor diestimasi hanya didasarkan pada common variance, communalities
dimasukkan dalam matrik korelasi. Metode ini dianggap tepat jika tujuan
utamanya mengenali/mengidentifikasi dimensi yang mendasari dan common
variance yang menarik perhatian.
F. LANGKAH-LANGKAH ANALISIS CLUSTER
1. Melakukan uji korelasi antar variabel asal dengan tujuan agar penyusutan
variabel analisis faktor menjadi lebih sederhana dan bermanfaat, tanpa
kehilangan banyak informasi sebelumnya.
2. Uji kelayakan data (menggunakan basis faktor) apakah cocok dilakukan
analisis faktor.
3. Mencari akar ciri dan matriks Σ atau R.
4. Mengurutkan akar ciiri yang terbentuk dari terbesar sampai terkecil.
5. Mencari proporsi keragaman atau berguna untuk mengetahui berapa faktor
yang akan terbentuk.
6. Mengalokasikan setiap variabel asal kedalam faktor sesuai dengan nilai
loading.
7. Apabila terdapat nilai loading yang identik atau hampir sama maka lakukan
rotasi baik dengan cara orthogonal ataupun non orthogonal.
8. Setelah yakin dengan faktor yang terbentuk , maka berikan penamaan pada
faktor tersebut dengan cara melihat variabel-variabel apa saja yang menyusun
faktor tersebut.
G. CONTOH ANALISIS FAKTOR
Suatu kelompok peternak pemelihara sapi ingin mengetahui keberhasilan
pemeliharaan ternak sapinya yang didasarkan pada berat bibit awal yang
dipeliharanya (X1), jumlah makanan hijauan (X2), makanan kering jerami
(X3), makanan dedak (X4), jenis suplemen (X5), jenis obat-obatan (X6),
tenaga kerja yang dicurahkan pada usaha ternaknya (X6), dan jenis kandang
(D) yang digunakan pada pemeliharaan ternaknya. Kandang yang
digunakan adalah kandang permanen D = 1, dan kandang tradisional D =
0. Keberhasilan diukur dengan berat sapi yang dijualnya (Y) setelah
pemeliharaan. Cobalah lakukan analisis faktor ekspolatori dan analisis faktor
konfirmatori dari data pada tabel di bawah ini.
Untuk menjawab pertanyaan di atas, ada dua macam analisis faktor yaitu:
1). Analisis faktor eksploratori dan 2). Analisis faktor konfirmatori, masing-masing
dengan uraian:
1. Analisis faktor eksploratori
Untuk menjelaskan data Tabel 8.4 di atas dapat digunakan hasil
perhitungan seperti: (1) Kaiser-Meyer-Olkin (KMO test), (2) anti-image
correlassion test,(3) total variance explained test,(4) cumunality,(5) component
matrix,(6) component scor coefisient matrix, dan (7) factor rotation.
a) Kaiser-Meyer-Olkin and Bartlett's Test.
Yang perlu diperhatikan dalam KMO and Bartlett's test yaitu nilai KMO-
MSA dan nilai peluang (sig. = p.), dengan uraian seperti berikut. Dari
hasil analisis kelayakan faktor di atas, didapatkan nilai KMO-MSA (Kaiser-
Meyer-Olkin measure of sampling adequacy) sebesar 0,853>0,05 dan dengan
nilai peluang (p) < 0,05 ini berarti bahwa semua sub-variabel pengukuran
atau dimensi yang menentukan keberhasilan pemeliharaan ternak sapi (dari
X1 sd D) syah untuk difaktorkan seperti pada tabel berikut.
b) Anti-image correlassion test. Selanjutnya, dari tabel di bawah ternyata dari
delapan sub-variabel pengukuran atau dimensi yang difaktorkan
menunjukkan semua variabel pengukuran mempunyai nilai anti image
korelasi > 0,5 yang berarti bahwa semua sub-variabel pengukuran atau
dimensi berhak dijadikan komponen faktor bersama penentu keberhasilan
pemeliharaan ternak sapi. Dan apabila nilai anti-image < 0,5 maka variabel
pengukuran tersebut harus dikeluarkan dari komponen faktor bersama dan
data dianalisis ulang tanpa mengikut sertakan data yang nilai anti-image-
nya< 0,5
c) Total variance explained test. Pada tabel di bawah, jumlah faktor
bersama yang terbentuk adalah sebanyak variabel penyusunnya atu
dimensi, dalam hal contoh ini sebanyak delapan faktor bersama. Faktor
bersama dengan nilai initial eigenvalue total yang ≥ 1, merupakan
faktor yang mewakili sub-variabel pembentuknya. Sumbangan faktor
bersama yang terbentuk dalam analisis dapat dilihat dari nilai Total
variance explained. Ternyata dari tabel di bawah diketahui bahwa dari tujuh
variabel pengukuran atau dimensi (X1 sd D) terbentuk dua faktor
bersama, yaitu faktor berama satu (F1) dengan persentase variansnya =
81,61 dan faktor bersama dua (F2) dengan persentase varians = 14,46
serta komulatif persentase varians yang terbentuk dari ke-dua faktor
bersama adalah sebesar = 96,07 dan sisanya 3,97% terdiri atas enam
faktor bersama yang masing-masing nilainya dapat dilihat pada tabel
berikut. Jadi jumlah faktor bersama yang mewakili delapan sub-variabel
pengukuran atau dimensi (X1 sd D) ditentukan oleh nilai initial
eigenvalue total yang ≥ 1 yaitu sebanyak dua buah faktor yaitu F1 dan F2.
d) Communalities atau peranan faktor. Pada penjelasan (c) di atas
bahwa terbentuk dua faktor bersama F1 dan F2. Dalam komunaliti
(Communalities) faktor yang terbentuk merupakan satu kesatuan,
sehingga peranan atau sumbangan masing-masing dimensi atau sub-
variabel penyusun terhadap faktor secara bersama yaitu F1 dan F2 seperti
pada tabel di bawah ini.
Perhatikan nilai initial dan extraction. Nilai initial mencerminkan
peranan atau sumbangan kalau variabel penyusun faktor secara individual
membentuk faktor tersebut, sedangkan extraction menjelaskan persentase
peranan atau sumbangan masing-masing dimensi atau sub-variabel
penyusun faktor secara individual terhadap vaktor. Dari tabel di atas
diketahui bahwa peranan dimensi yang terbesar adalah sub-variabel X5
sebesar 0,983 atau 98,3% dan yang terkecil adalah X7 sebesar 0,907 atau
90,7%.
e) Component matrix (dimensi penyusun faktor). Pada penjelasan (c) di
atas bahwa terbentuk dua faktor bersama F1 dan F2, masing-masing dimensi
penyusun faktornya terdapat pada tabel di bawah. Perhatikan nilai-nilai
pada setiap komponen faktor
Perhatikan komponen faktor satu (F1) dari X1 sd D, apabila nilai
komponen faktornya ≥ 0,5 berarti bahwa dimensi atau sub-variabel
pengukuran faktor tersebut merupakan anggota faktor yang terbentuk.
Sebaliknya, jika nilai komponen faktor < 0,5 berarti bahwa dimensi sub-
variabel pengukuran bukan anggota faktor tersebut.
Apabila antara komponen faktor satu dan komponen faktor dua
terdapat nilai-nilai dalam satu variabel pengukuran yang ≥ 0,5 pada
kedua faktor maka analisis faktor harus diulang dan dilakukan rotasi
faktor dengan metode varimax atau yang lain sampai tidak terdapat nilai-
nilai komponen bersama yang ≥ 0,5 pada dua komponen
faktor atau lebih. Nilai komponen faktor dapat pula diartikan sebagai
korelasi antara faktor yang terbentuk dengan komponennya (rFjXi).
Sebagai contoh korelasi antara F1 dengan X1 dan F2 dengan X1 masing-
masing komponen faktor sebesar 0,679 dan 0,719; dan nilai korelasi
yang tertinggi pada F1 adalah korelasi antara F1 dengan X5 (rF1X5)
sebesar 0,991.
f) Component scor coefient matrix atau koefisien dimensi penyusun
faktor. Pada penjelasan pembicaraan ini, menekankan pada bentuk hubungan
atau model atau persamaan antara faktor dengan variabel penyusunnya tabel
di bawah. Scor coefient merupakan kontanta atau koefisien serupa dengan
koefisien regresi (βi ) pada persamaan regresi berganda.
Perlu dipahami bahwa pada analisis faktor semua dimensi atau sub-
variabel penyusun faktor atau item telah ditranspormasi ke dalam data
standar atau data Z (data Z mempunyai rata-rata = 0, varians = 1, dan
data tanpa satuan atau relatif).
Nilai faktor untuk setiap sampel disebut dengan nilai skor faktor
(SF) dan setiap nilai skor faktor merupakan data baru yang menyusun
sebuah variabel baru dari sub-variabel penyusun atau dimensi atau itemnya.
Persamaan umum skor faktor Fj = a1 ZX1 + a2 ZX2+ . . .+ ap ZXp + εj
Di mana:
Fj (j = 1, 2, . .., k) merupakan skorfaktor atau komponen bersama ke-j
ZXi = sub-variabel atau dimensi atauitem yang distandarkan
ai (i = 1, 2, . . ., p; dan j = 1, 2., . . ., k) merupakan
parameter yang merefleksikan pentingnya faktor komponen ke-j.ai dalam
analisis faktor disebut bobot(loading) atau Component Scor Coefisien
Matrix dari respons ke-i pada faktor bersama ke-j.
εj (i = 1, 2, . . ., k) merupakan galat dari respons ke-j, dalam analisis
disebut sebagai faktor/ komponen spesifik ke-i yang bersifat acak.
Nilai koefisien scor matrix atau bobot faktor diambil dari tabel di
atas, sehingga persamaan skor faktor dari contoh analisis menjadi:
Untuk skor faktor satu F1 = 0,104 ZX1 + 0,137 ZX2 + 0,149 ZX3 +
0,151 ZX4 + 0,152ZX5 + 0,148 ZX6 +
0,143 ZX7 + 0,115 ZD
Untuk skor faktor dua F2 = 0,621 ZX1 + 0,355 ZX2 - 0,063 ZX3 -
0,044 ZX4+ 0,029ZX5 - 0,093 ZX6 -
0,168ZX7 - 0,555 ZD
g) Factor rotation. Apabila antara komponen faktor yang satu dan komponen
faktor yang lain terdapat nilai-nilai komponen faktor dalam satu variabel
pengukuran yang ≥ 0,5 pada kedua faktor bersaama, maka analisis faktor
harus diulang dengan cara lain atau dilakukan rotasi faktor (factor
rotation). Rotasi faktor dilakukan dengan metode varimax atau equamax atau
yang lain sampai tidak terdapat nilai komponen bersama yang ada pada
sub-variabel ≥ 0,5 pada dua komponen faktor atau lebih.
2. Analisis Faktor Konfirmatori
Pola perhitungan dengan faktor konfirmatori hampir sama seperti analisis
faktor eksploratori yang telah dibicarakan. Kecuali tidak melakukan rotasi
faktor sehinga yang ditentukan: (1) Kaiser-Meyer-Olkin (KMO test), (2) anti-
image correlassion test, (3) cumunality, (4) cumunality, (5) component matrix,
dan (6) component scor coefisient matrix.
Yang membedakan analisis faktor konfirmatori dengan analisis faktor
eksploratori adalah penentuan sub-variabel pengukuran sudah ditentukan jauh
sebelum analisis dilakukan. Faktor makanan yang dapat dibentuk dari makanan
hijauan (X2), makanan jerami kering (X3), makanan dedak (X4), jenis suplemen
(X5), dan jenis obat-obatan (X6). Selanjutnya, faktor makanan dapat dipilah
menjadi: (1) faktor makanan utama yang terdiri atas: makanan hijauan (X2),
makanan jerami kering (X3), dan makanan dedak (X4); dan (2) faktor
makanan utambahan yang terdiri atas jenis suplemen (X5) dan jenis obat-
obatan (X6). Tergantung pada teori dan konsep yang diajukan atau dipostulatkan.
Hasil analisis faktor konfirmatori faktor makan menjadi:
a) Kaiser-Meyer-Olkin and Bartlett's Test. KMO and Bartlett's test dan
nilai peluang (sig. = p.) sebesar 0, 853 > 0,05 dan dengan nilai
peluang (p) < 0,05 ini berarti bahwa semua sub-variabel pengukuran
makanan layak sebagai faktor makanan (dari X2 sd X6) seperti pada tabel di
bawah ini.
b) Anti-image correlassion test. Dari tabel di bawah ternyata dari enam sub-
variabel pengukuran penyusun faktor makanan (X2 sd X6) menunjukkan
semua variabel mempunyai nilai anti image korelasi > 0,5 yang berarti
bahwa semua variabel tersebut syah untuk difaktorkan menjadifaktor
makanan
c) Total variance explained test. Seperti pada tabel di bawah, terlihat
bahwa hanya
sebuah faktor bersama makanan yang terbentuk dari sub-variabel
penyusunnya. Faktor bersama makanan tersebut dengan nilai initial
eigenvaluetotal sebesar 4,679≥1, merupakan faktor yang mewakili sub-
variabel pembentuknya. Sumbangan faktor bersama makanan yang
terbentuk dari dimensi X2 sdX6 dengan persentase varians sebesar 93,580.
Jadi jumlah faktor bersama yang mewakili lima sub-variabel pengukuran
atau dimensi X2 sd X6 ditentukan oleh satu faktor bersama makanan.
d) Communalities atau peranan faktor. Dalam komunaliti faktor
makanan yang terbentuk merupakan satu kesatuan, sehingga peranan atau
sumbangan masing-masing dimensi atau sub-variabel penyusun faktor
terhadap faktornya, seperti peranan sub-variabel makanan terhadap
variabel makanan tertinggi ditentukan oleh sub variabel X5 (jenis
suplemen) sebesar 99,2% dan terkecil oleh sub variabel
X2 (makanan hijauan) sebesar 81,8% seperti pada tabel di bawah ini.
e) Component matrix (dimensi penyusun faktor). Pada penjelasan total
variance explained test di bawah bahwa terbentuk satu faktor bersama
makanan, semua dimensi penyusun faktornya (X2 sd X6) terdapat pada
tabel di bawah ini. Perhatikan nilai-nilai pada setiap komponen faktor.
Perhatikan komponen faktor makanan X2 sd X6, ternyata nilai komponen
faktor ≥ 0,5 berarti bahwa dimensi faktor makanan X2 sd X6 tersebut
merupakan anggota faktor makananan yang terbentuk. Ternyata dari tabel
di bawah tidak perlu dirotasi, karena terbentuk satu faktor bersama makanan.