37
ANALISIS DISKRIMINAN Di susun untuk memenuhi tugas matakuliah Analisis Statisik Multivariat yang dibimbing oleh Ibu Trianingsih Eni Lestari Anggota: Cindy Meilinda Wijaya (409312417678) Andrie Kurniawan (409312417687) Herlin Dwi Kartikasari (409312419799) Firqin Setara (409312419800) MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS NEGERI MALANG Oktober 2011

Analisis Diskriminan

Embed Size (px)

DESCRIPTION

UNIVERSITAS NEGERI MALANGFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAMPROGRAM STUDI MATEMATIKA

Citation preview

Page 1: Analisis Diskriminan

ANALISIS DISKRIMINAN

Di susun untuk memenuhi tugas matakuliah Analisis Statisik Multivariat

yang dibimbing oleh Ibu Trianingsih Eni Lestari

Anggota: Cindy Meilinda Wijaya (409312417678)

Andrie Kurniawan (409312417687)

Herlin Dwi Kartikasari (409312419799)

Firqin Setara (409312419800)

MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

ALAM UNIVERSITAS NEGERI MALANG

Oktober 2011

Page 2: Analisis Diskriminan

BAB I

PENDAHULUAN

1.1.Latar Belakang

Analisis diskriminan merupakan teknik menganalisis data, dimana variabel dependen

merupakan data kategorik ( nominal dan ordinal ) sedangkan variabel independen berupa

data interval atau rasio . Misalnya berdasarkan data dari nasabah peminjam kredit suatu

bank, seperti penghasilan, umur, pekerjaan, tingkat pendidikan, ingin meramalkan apakah

seseorang nasabah yang baru termasuk jujur atau tidak jujur. Analisis diskriminan ini

termasuk dalam analisis multivariat dengan metode dependensi. Ada dua metode dalam

analisis multivariat yaitu metode dependensi dan metode interdenpendensi . Metode

dependensi yaitu variabel-variabelnya tidak saling bergantung satu dengan yang lain,

sedangkan metode interdenpendensi adalah antarvariabelnya ada saling ketergantungan.

Variabel dependen adalah data kategorikal. Jika data kategorikal terdiri dari dua kelompok

atau kategori disebut Two-Group Discriminant Analysis , sedangkan jika lebih dari dua

kategori disebut dengan Multiple Discriminant Analysis. Adapun yang menjadi latar

belakang penelitian ini adalah terkait dengan peranan dan aplikasi analisis diskriminan

yang merupakan salah satu dari teknik statistik multivariat yang banyak digunakan dalam

berbagai bidang ilmu yang terjadi dalam sebuah fenomena sosial, keuangan dan ekonomi.

Analisis diskriminan digunakan asalkan pertanyaan penelitian mengarah pada variabel tak

bebas (dependent variable) yang berupa data kategori seperti : macet-lancar,untung-rugi,

puas-tidak puas dan lainnya.

Analisis diskriminan adalah metode untuk mencari dasar pengelompokan individu

berdasarkan lebih dari satu variabel bebas. Analisis Diskriminan dipakai untuk menjawab

pertanyaan bagaimana individu dapat dimasukkan ke dalam kelompok berdasarkan

beberapa variabel. Persamaan Fungsi Diskriminan yang dihasilkan untuk memberikan

peramalan yang paling tepat untuk mengklasifikasi individu kedalam kelompok

berdasarkan skor variabel bebas . Pada penelitian bidang kesehatan , analisis diskriminan

dilakukan untuk mengetahui apakah dari keempat variabel prediktor, yaitu perasaan

cemas (feeling anxious), gelisah (restless), depresi (depressed), putusasa (hopeless) dapat

menentukan apakah seorang pasien akan didiagnosis pada kelompok tidak stress (normal)

Page 3: Analisis Diskriminan

atau stress . Pada Bank, analisis diskriminan juga dilakukan untuk mengklasifikasi

Formulir Aplikasi untuk pinjaman, kartu kredit, dan asuransi dalam kategori berisiko

rendah atau berisiko tinggi.

1.2.Rumusan Masalah

1. Bagaimana definisi analisis diskriminan?

2. Apa saja hal – hal pokok yang mempengaruhi diskriminan analisis?

3. Bagaimana proses pengambilan keputusan untuk analisis diskriminan?

4. Bagaiman aplikasi dalam menganalisis model diskriminan?

1.3.Tujuan

1. Mengetahui pengertian tentang analisis diskriminan

2. Untuk mengetahui tujuan dan syarat dari analisis diskriminan, menentukan banyaknya

sampel, dan mengetahui proses-proses dalam mencari model diskriminan.

3. Mengetahui proses pengambilan keputusan untuk analisis diskriminan.

4. Menganalisis model diskriminan dengan bantuan SPSS.

Page 4: Analisis Diskriminan

BAB 2

PEMBAHASAN

2.1 DEFINISI DISKRIMINAN ANALISIS

Analisis diskriminan adalah teknik statistik yang sesuai ketika variabel dependen

adalah kategori (nominal atau nonmetrik) variabel dan variabel independen adalah variabel

metrik. Dalam banyak hal, variabel dependen terdiri dari dua kelompok atau klasifikasi

(contoh. laki-laki dibandingkan perempuan atau tinggi versus rendah). Dalam kasus lain,

lebih dari dua kelompok yang terlibat, seperti rendah, sedang, dan klasifikasi tinggi. Analisis

diskriminan mampu menangani baik dua kelompok atau beberapa kelompok (tiga atau lebih).

Ketika dua klasifikasi yang terlibat, teknik ini disebut sebagai dua kelompok analisis

diskriminan. Ketika tiga atau lebih klasifikasi diidentifikasi, teknik ini disebut sebagai

analisis diskriminan ganda (MDA).

Analisis diskriminan melibatkan menurunkan suatu variat. Diskriminan variat adalah

kombinasi linear dari variabel independen dua (atau lebih) yang akan membedakan terbaik

antara obyek (orang, perusahaan, dll) dalam kelompok didefinisikan suatu priori.

Diskriminasi dicapai dengan menghitung bobot untuk masing-masing variate variabel

independen untuk memaksimalkan perbedaan antara kelompok (yaitu varians antara

kelompok relatif terhadap varians dalam kelompok). Para variate untuk analisis diskriminan,

juga dikenal sebagai fungsi diskriminan, berasal dari persamaan seperti yang terlihat pada

regresi berganda. Dibutuhkan bentuk sebagai berikut:

Page 5: Analisis Diskriminan

dimana

= diskriminan Z skor diskriminan j fungsi untuk objek k

= intercept

= bobot diskriminan untuk variabel independen

= variabel independen untuk objek

Analisis diskriminan adalah teknik statistik yang sesuai untuk menguji hipotesis

bahwa kelompok berarti satu set variabel independen untuk dua atau lebih kelompok yang

sama. Dengan rata-rata skor diskriminan untuk semua individu dalam suatu kelompok

tertentu, kita sampai pada kelompok rata-rata. Kelompok rata-rata ini disebut sebagai suatu

titik berat. Ketika analisis melibatkan dua kelompok ada dua centroid, dengan tiga kelompok

ada tiga centroid, dan sebagainya. Para centroid menunjukkan letak paling khas dari setiap

anggota dari kelompok tertentu, dan perbandingan dari centroid kelompok menunjukkan

seberapa jauh kelompok-kelompok yang dalam bentuk adalah fungsi diskriminan.

Uji untuk signifikansi statistik dari fungsi diskriminan adalah ukuran umum dari jarak

antara centroid kelompok, dihitung dengan membandingkan distribusi dari skor diskriminan

untuk kelompok. Jika tumpang tindih cukup besar, fungsi adalah diskriminator yang buruk

antara kelompok-kelompok. Dua distribusi skor diskriminan ditunjukkan pada gambar 1

lebih menggambarkan konsep ini. Diagram atas mewakili distribusi skor diskriminan untuk

fungsi yang memisahkan kelompok-kelompok dengan baik, menunjukkan tumpang tindih

Page 6: Analisis Diskriminan

minim (daerah yang diarsir) antara kelompok. Diagram bawah menunjukkan distribusi skor

diskriminan pada fungsi diskriminan yang merupakan diskriminator relatif miskin antara

kelompok A dan B. daerah yang diarsir tumpang tindih merupakan contoh di mana

misclassifying objek dari grup A ke kelompok B dan sebaliknya dapat terjadi.

2.2 HAL-HAL POKOK TENTANG ANALISIS DISKRIMINAN

Tujuan Analisis Diskriminan

Karena bentuk multivariat dari analisis diskriminan adalah dependen, maka variabel

dependen adalah variabel yang menjadi dasar analisis diskriminan. Variabel dependen bisa

berupa kode grup 1 atau kode grup 2 atau lainnya, dengan tujuan diskriminan secara umum

adalah :

Ingin mengetahui apakah ada perbedaan yang jelas antar grup pada variabel

dependen, atau bisa dikatakan apakah ada perbedaan antara anggota grup 1

dengan anggota grup 2.

Jika ada perbedaan, variabel independen manakah pada fungsi diskriminan

yang membuat perbedaan tersebut.

Membuat fungsi atau model diskriminan, yang pada dasarnya mirip dengan

persamaan regresi.

Melakukan klasifikasi terhadap objek (dalam teminologi SPSS disebut baris),

apakah suatu objek (bisa nama orang, nama tumbuhan, benda atau lainnya)

termasuk grup 1 atau grup 2, atau lainnya.

Syarat-Syarat yang harus Dipenuhi untuk Menggunakan Teknik Analisis Diskriminan

Variabel tergantung hanya satu dan bersifat non-metrik, artinya data harus

kategorikal dan berskala nominal.

Variabel bebas terdiri lebih dari dua variabel dan berskala interval.

Semua variabel prediktor sebaiknya mempunyai distribusi normal multivariat,

dan matrices variance-covariance dalam kelompok harus sama untuk semua

kelompok

Page 7: Analisis Diskriminan

Keanggotaan kelompok diasumsikan ekseklusif, maksudnya tidak satupun kasus

yang termasuk dalam kelompok lebih dari satu. dan exhaustive secara kolektif,

maksudnya semua kasus merupakan anggota satu kelompok

Tidak ada korelasi antar variabel independen. Jika dua variabel independen

mempunyai korelasi yang kuat, dikatakan terjadi multikolinieritas.

Multivariate normality, atau variabel independen seharusnya berditribusi normal.

Jika tidak berdistribusi normal, hal ini akan menyebabkan masalah pada

ketetapan fungsi (model) diskriminan. Regresi Logistik (Logistc Regression) bisa

dijadikan alternative metode jika memang data tidak berdistribusi normal.

Matriks kovarians dari semua variabel independen seharusnya sama (equal.)

Tidak adanya data yang sangat ekstrem (outlier) pada variabel independen. Jika

ada data outlier yang tetap diproses, Hal ini bisa berakibat berkurangnya

ketetapan klasifikasi dari fungsi diskriminan.

Proses Dasar dari Diskriminan Analisis

Proses dasar analisis diskriminan meliputi :

Memisah variabel-variabel menjadi variabel dependen dan variabel independen.

Menentukan metode untuk membuat fungsi diskriminan. Pada prinsipnya ada dua

metode dasar untuk itu, yaitu:

1. SIMULTANEOUS ESTIMATION, di mana semua variabel dimasukkan secara

bersama-sama kemudian dilakukan proses diskriminan.

2. STEP-WISE ESTIMATION, dimana variabel dimasukkan satu per satu ke dalam

modeldiskriminan. Pada proses ini, tentu ada variabel yang tetap ada pada model,

dan ada kemungkinan satu atau lebih variabel independen yang ‘dibuang’ dari

model.

Menguji signifikasi dari fungsi diskriminan yang telah terbentuk, menggunakan

Wilk’s Lambda, Pilai, F-test dan lainnya.

Menguji ketetapan klasifikasi dari fungsi diskriminan, termasuk mengetahui

ketepatan klasifikasi secara individual dengan Casewise Diagnotics.

Melakukan interpretasi terhadap fungsi diskrimminan tersebut.

Melekukan uji validasi fungsi diskriminan.

Jumlah Sampel pada Analisis Diskriminan

Page 8: Analisis Diskriminan

Secara pasti tidak ada jumlah sampel yang ideal pada analisis diskriminan. Setiap

variabel independen sebaiknya ada 5-20 data (sampel). Dengan demikian, jika ada enam

variabel independen, seharusnya minimal ada 6x5=30 sampel.

Selain itu, pada analisis diskriminan sebaiknya digunakan dua jenis sampel, yakni

analysis sampel yang digunakan untuk Fungsi Diskriminan, serta holdout sample (split

sample) yang digunakan untuk menguji hasil diskriminan. Sebagai contoh, jika ada 70

sampel, maka sampel tersebut bisa dibagi dua, 35 unntuk analysis sampel dan 35 untuk

holdout sample. Kemudian hasil fungsi diskriminan yang terjadi pada analisis sample

dibandingkan dengan hasil fungsi diskriminan dari holdout sample, apakah terjadi perbedaan

yang besar atau tidak. Jika ketetapan klasifikasi kedua sampel hampir sama besar, dikatakn

fungsi diskriminan dari analisis sampel sudah valid. Inillah yang disebut proses validasi

silang (Cross Validation) dari fungsi diskriminan.

Model dari Analisis Diskriminan

Analisis diskriminan termasuk dalam multivariate dependence method, dengan model :

Y1 = X1+X2+…..+Xn

Non metriks Metrik

Keterangan :

Variabel Independen (X1 dan Seterusnya) adalah data metrik, yakni data berjenis

interval atau rasio, seperti Usia seseorang, tinggi sebuah pohon, kandungan zat besi

dalam tubuh, dan seterusnya.

Variabel Dependen (Y1) adalah data kategorikal atau nominal, seperti golongan

miskin (kode 1), golongan menengah (kode 2), golongan kaya (kode 3) dan

sebagainya. Jika data kategorikal tersebut hanya terdiri atas dua kode saja (missal

kode 1 untuk daerah banjir dan kode 2 untuk daerah non banjir), maka model bisa

disebut Two-Group Discriminant Analysis. Sedang jika kode lebih dari dua kategori

disebut dengan Multiple Discriminant Analysis.

Dari keterangan di atas, perhatikan adanya perbedaan dalam penempatan data yang

sekilas mirip. Seperti Usia seseorang (dalam tahun). Jika usia disebut secara langsung

sekian tahun (17 tahun, 32 tahun dan sebagainya), maka data tersebut adalah rasio dan

Page 9: Analisis Diskriminan

otomatis diperlakukan sebagai variabel independen. Namun, jika usia seseorang

dilakukan penggolongan, dan dimasukkan dalam kategori-kategori tertentu, seperti

jika usia seseorang antara 15-20 tahun, ia digolongkan Remaja, di atas 20 tahun

digolongkan dewasa, maka data seseorang yang berusia 17 tahun tidak ditulis ‘17’,

namun akan ditulis Remaja. Data hasil kategorisasi ini adalah data nominal dan

termasuk variabel dependen.

Dengan demikian, usia 17 tahun bisa menjadi variabel dependen atau independen

tergantung bagaimana data tersebut akan diperlakukan, langsung diinput apa adanya atau

dilakukan penggolongan.

2.3 PROSES PENGAMBILAN KEPUTUSAN UNTUK ANALISIS DISKRIMINAN

Tahap 1 Tujuan dari Analisis Diskriminan

Kajian dari tujuan untuk menerapkan analisis diskriminan lebih lanjut harus

mengklarifikasi sifatnya. Analisis diskriminan dapat mengatasi salah satu tujuan penelitian

sebagai berikut

1. menentukan apakah ada perbedaan statistik yang signifikan antara profil rata skor pada

satu himpunan variabel untuk dua (atau lebih) kelompok didefinisikan priori.

2. menentukan yang mana dari perhitungan variabel independen yang paling terjadinya

perbedaan dalam profil skor rata-rata dua atau lebih kelompok.

3. menetapkan jumlah dan komposisi dimensi diskriminasi antara kelompok-kelompok

yang terbentuk dari himpunan variabel independen

4. menetapkan prosedur untuk mengklasifikasikan objek (individu, perusahaan, produk,

dll) ke dalam kelompok berdasarkan skor mereka pada sekumpulan variabel

independen

Tahap 2 Desain Penelitian untuk Analisis Diskriminan

1. memilih variabel dependen dan independen

2. ukuran sampel

3. pembagian sampel

Tahap 3 Asumsi Analisis Diskriminan

1. dampak pada estimasi dan klasifikasi

Page 10: Analisis Diskriminan

2. dampak pada interpretasi

Tahap 4 Estimasi dari Model Diskriminan serta Menilai Kesesuaian secara Keseluruhan

1. memilih metode estimasi

2. signifikansi statistik

3. menilai secara keseluruhan sesuai dengan model

4. casewise diagonistic

Tahap 5 Interpretasi Hasil

1. bobot diskriminan

2. diskriminan beban

3. parsial nilai F

4. interpretasi dari dua atau lebih fungsi

5. metode interpretatif yang digunakan

Tahap 6 Validasi Hasil

1. validasi prosedur

2. membuat profil perbedaan kelompok

2.4 APLIKASI DALAM MENGANALISIS MODEL DISKRIMINAN

1. Perumusan masalah

Rumuskan permasalah yang akan dianalisis meliputi penentuan variabel independen

dan variabel dependen.

2. Uji variabel

Menguji apakah ada variabel yang berbeda secara nyata antara satu variabel dengan

variabel lain. Menentukan variabel independen mana yang mempengaruhi variabel

dependen. Menguji varians dari setiap variabel.

3. Melakukan analisis diskriminan

Menentukan model diskriminan dari permasalahan yang ada. Menguji ketepatan

pengklasifikasian model.

4. Contoh kegunaan Fungsi Diskriminan

Page 11: Analisis Diskriminan

BAB 3

PENUTUP

Analisis diskriminan adalah teknik statistik yang sesuai ketika variabel dependen

adalah kategori (nominal atau nonmetrik) variabel dan variabel independen adalah variabel

metrik. Dalam banyak hal, variabel dependen terdiri dari dua kelompok atau klasifikasi

(contoh. laki-laki dibandingkan perempuan atau tinggi versus rendah). Dengan fungsi

diskriminan sebagai berikut:

Tujuan dari analisis diskriminan secara umum adalah mengetahui apakah ada

perbedaan yang jelas antar grup pada variabel dependen, menentukan model diskriminan

dari suatu permasalahan. Jika model tersebut sudah diperoleh selanjutnya akan dilakukan

pengujian ketepatan klasifikasi model.

Model dari analisis diskriminan dapat digunakan untuk mencari hubungan antara

variabel dependen dengan variabel dependen dari permasalahan yang didapat.

Page 12: Analisis Diskriminan

BAB II

PEMBAHASAN

2.1.Analisis Diskiminan (Analisis Fungsi Pembeda )

Menurut Johnson dan Wichern (2007) Analisis Diskriminan digunakan untuk

mengklasifikasikan individu ke dalam salah satu dari dua kelompok atau lebih. Suatu

fungsi diskriminan layak untuk dibentuk, bila terdapat perbedaan nilai rataan di antara

kelompok-kelompok yang ada.

Analisis diskriminan merupakan suatu teknis analisis multivariat yang digunakan

untuk mengelompokkan atau mengklasifikasi suatu objek dalam dua kelompok atau lebih

berdasarkan variabel independentnya.

Sebelum fungsi diskriminan dibentuk perlu dilakukan pengujian terhadap perbedaan

nilai rataan dari kelompok-kelompok tersebut. Dalam pengujian tersebut, asumsi analisis

diskriminan yang harus dipenuhi adalah :

1. Variabel independen seharusnya berdistribusi normal multivariat (Multivariate

Normality), jika data tidak berdistribusi normal,akan menyebabkan masalah pada

ketepatan fungsi (model) diskriminan.

2. Matriks varians kovarians grup dari semua variabel independen seharusnya sama.

3. Tidak ada data yang sangat ekstrim (outlier) pada variabel independen, jika ada data

ekstrim yang tetap diproses, hal ini bisa berakibat berkurangnya ketepatan klasifikasi

dari fungsi diskriminan.

4. Tidak ada korelasi yang kuat antar-variabel independen , jika dua variabel independen

mempunyai korelasi yang kuat,dikatakan terjadi multikolinieritas. Untuk mengetahui

adanya multikolinieritas dapat dilakukan dengan melihat korelasi antar variabel

independen (r) yaitu jika nilai r > 0.6 menunjukkan adanya multikolinieritas.

2.2.Fungsi Diskriminan

0 1 1 2 2 ...i i j ijY b b X b X b X

dimana :

Page 13: Analisis Diskriminan

Y = Nilai (skor) fungsi diskriminan dari responden ke-i

0b = Intersep (konstanta), artinya jika nilai variabel 0X , maka besar nilai 0Y b

jb = Koefisien fungsi diskriminan dari variabel ke-j

ijX = Variabel bebas ke-j dari responden ke-i , dimana i = 1,2,...,n

2.3.Jumlah Sampel pada Analisis Diskriminan

Secara pasti tidak ada jumlah sampel yang ideal pada analisis diskriminan. Setiap

variabel independen sebaiknya ada 5-20 data (sampel). Dengan demikian, jika ada enam

variabel independen, seharusnya minimal ada 6x5=30 sampel.

Selain itu, pada analisis diskriminan sebaiknya digunakan dua jenis sampel, yakni

analisis sampel yang digunakan untuk Fungsi Diskriminan, serta holdout sample (split

sample) yang digunakan untuk menguji hasil diskriminan. Sebagai contoh, jika ada 70

sampel, maka sampel tersebut bisa dibagi dua, 35 unntuk analysis sampel dan 35 untuk

holdout sample. Kemudian hasil fungsi diskriminan yang terjadi pada analysis sample

dibandingkan dengan hasil fungsi diskriminan dari holdout sample, apakah terjadi

perbedaan yang besar ataukah tidak. Jika ketetapan klasifikasi kedua sampel hampir sama

besar, dikatakn fungsi diskriminan dari analysis sampel sudah valid. Inillah yang disebut

proses validasi silang (Cross Validation) dari fungsi diskriminan.

2.4.Tujuan Analisis Diskriminan

Karena bentuk multivariat dari analisis diskriminan adalah dependen, maka

variabel dependen adalah variabel yang menjadi dasar analisis diskriminan. Variabel

dependen bisa berupa kode grup 1 atau kode grup 2 atau lainnya, dengan tujuan

diskriminan secara umum adalah :

Ingin mengetahui apakah ada perbedaan yang jelas antar grup pada variabel

dependen? Atau bisa dikatakan apakah ada perbedaan antara anggota grup 1

dengan anggota grup 2?

Jika ada perbedaan, variabel independen manakah pada fungsi diskriminan yang

membuat perbedaan tersebut?

Page 14: Analisis Diskriminan

Membuat fungsi atau model diskriminan, yang pada dasarnya mirip dengan

persamaan regresi.

Melakukan klasifikasi terhadap objek (dalam teminologi SPSS disebut baris),

apakah suatu objek (bisa nama orang, nama tumbuhan, benda atau lainnya)

termasuk grup 1 atau grup 2, atau lainnya.

2.5.Proses Dasar dari Analisis Diskriminan

Proses dasar analisis diskriminan :

Memisah variabel-variabel menjadi variabel dependen dan Variabel Independen.

Menentukan metode untuk membuat fungsi diskriminan. Pada prinsipnya ada dua

metode dasar untuk itu, yaitu:

3. SIMULTANEOUS ESTIMATION, di mana semua variabel dimasukkan

secara bersama-sama kemudian dilakukan proses diskriminan.

4. STEP-WISE ESTIMATION, dimana variabel dimasukkan satu per satu ke

dalam modeldiskriminan. Pada proses ini, tentu ada variabel yang tetap ada

pada model, dan ada kemungkinan satu atau lebih variabel independen

yang ‘dibuang’ dari model.

Menguji signifikasi dari fungsi diskriminan yang telah terbentuk, menggunakan

Wilk’s Lambda, Pilai, F test dan lainnya.

Menguji ketetapan klasifikasi dari fungsi diskriminan, termasuk mengetahui

ketetpan klasifikasi secara individual dengan casewise Diagnotics.

Melakukan interpretasi terhadap fungsi diskrimminan tersebut.

Melekukan uji validasi fungsi diskriminan.

a. Algoritma Pokok Analisis dan Model Matematika

Secara ringkas, langkah-langkah dalam analisis diskriminan adalah sebagai berikut:

1. Pengecekan adanya kemungkinan hubungan linier antara variabel penjelas. Untuk

point ini, dilakukan dengan bantuan matriks korelasi (pembentukan matriks korelasi

sudah difasilitasi pada analisis diskriminan). Pada output SPSS, matriks korelasi bisa

dilihat pada Pooled Within-Groups Matrices.

2. Uji Vektor Rata-rata Kedua Kelompok

Page 15: Analisis Diskriminan

0 1 2

1 1 2

:

:

H

H

Diharapkan dari uji ini adalah hipotesis nol ditolak, sehingga kita mempunyai

informasi awal bahwa variabel yang sedang diteliti memang membedakan kedua

kelompok. Pada SPSS, uji ini dilakukan secara univariate (jadi yang diuji bukan

berupa vektor), dengan bantuan tabel Tests of Equality of Group Means.

3. Dilanjutkan pemeriksaan asumsi homoskedastisitas, dengan uji Box’s M. Diharapkan

dari uji ini hipotesisi nol tidak ditolak ( 0 1 2:H ).

4. Pembentukan model diskriminan

a. Kriteria Fungsi Linier Fisher

Pembentukan Fungsi Linier (teoritis)

Fisher mengelompokkan suatu observasi berdasarkan nilai skor yang

dihitung dari suatu fungsi linier 'Y X dimana ' menyatakan vektor

yang berisi koefisien-koefisien variabel penjelas yang membentuk

persamaan linier terhadap variabel respon, 1 2' , ,..., p

1

2

XX

X

kX menyatakan matriks data padakelomok ke-k

11 12 1

21 22 2

1 2

X . .

X . .

. . .

. . .

. . .

. . .

.

.

k k pk

k k pk

k

n k n k npk

X

X

X

X X X

X

X

1, 2, ....,

1, 2, ....,

1, 2

i n

j p

k

ijkX menyatakan observasi ke-i variabel ke-j pada kelompok ke-k

Di bawah asumsi ( . )k k kX N maka

2

11

2

( )

( )

E X

E X

dan 1 2( ) ( ) ' ;k k k k kE X X

Page 16: Analisis Diskriminan

1

.

. ;

.

k

k k

pk

adalah vektor rata-rata tiap variable X pada kelompok ke-k

11 12 1

22 22

. .

. . . .

. . . . . .

. . . . . .

. . . . .

. p

pp

1 2

1 21 2 1 2

variansi variabel j apabila j =j

kovarians variabel j dan j apabila j ¹j{j j

Fisher mentransformasikan observasi-observasi x yang multivariate

menjadi

observasi y yang univariate. Dari persamaanY X diperoleh

;( ) ( ' ) 'ky k kE Y E X

2 var( ' ) ' ;Y X

ky adalah rata-rata Y yang diperoleh dari X yang termasuk dalam

kelompok ke-k

2

Y adalah varians Y dan diasumsikan sama untuk kedua kelompok.

Kombinasi linier yang terbaik menurut Fisher adalah yang dapat

memaksimumkan rasio antara jarak kuadrat rata-rata Y yang diperoleh

dari x dari kelompok 1 dan 2 dengan varians Y, atau dirumuskan sebagai

berikut: 1

2

2 1 2 1 2

2

( ) '( )( ) '

'

Y Y

Y

Page 17: Analisis Diskriminan

Jika 1 2( ) makapersamaan di atas menjadi2( )

'

. Karena Σ adalah

matriks definit positif, maka menurut teori pertidaksamaan Cauchy-

Schwartz, rasio 2( )

'

dapat dimaksimumkan jika

1 1

1 2' ( )c c

dengan memilih c=1, menghasilkan kombinasi linier yang disebut

kombinasi linier Fisher sebagai berikut:

1

1 2' ( )Y X X

Pembentukan Fungsi Linier (dengan bantuan SPSS)

Pada output SPSS, koefisien untuk tiap variabel yang masuk dalam

model dapat dilihat pada tabel Canonical Discriminant Function

Coefficient. Tabel ini akandihasilkan pada output apabila pilihan

Function Coefficient bagian Unstandardized diaktifkan.

Menghitung discriminant score

Setelah dibentuk fungsi liniernya, maka dapat dihitung skor

diskriminan untuk tiap observasi dengan memasukkan nilai-nilai

variabel penjelasnya.

Menghitung cutting score

Cutting score (m) dapat dihitung dengan rumus sebagai berikut

1 1 2 2

1 2

Y Yn nm

n n

kn adalah jumlah sampel pada kelompok ke-k, k=1,2

Kemudian nilai-nilai discriminant score tiap observasi akan

dibandingkan dengan cutting score, sehingga dapat

diklasifikasikan suatu observasi akan termasuk ke dalam kelompok

yang mana. Suatu observasi dengan karakteristik x akan

diklasifikasikan sebagai anggota kelompok kode 1 jika

1

1 2( ) ' ,y x m selain itu dimasukkan ke dalam kelompok

2(kodenol). Penghitungan m dilakukan secara manual, karena

Page 18: Analisis Diskriminan

SPSS tidak mengeluarkan output m. Namun, kita dapat

menghitung m dengan bantuan tabel Function at Group Centroids

dari output SPSS.

Penghitungan Hit Ratio (dalam model regresi logistik disebut

percentage correct)

Setelah semua observasi diprediksi keanggotaannya, dapatdihitung

hit ratio, yaitu rasio antara observasi yang tepat

pengklasifikasiannya dengan total seluruh observasi.

b. Kriteria posterior probability

Aturan pengklasifikasian yang ekivalen dengan model linier Fisher adalah

berdasarkan nilai peluang suatu observasi dengan karakteristik tertentu (x)

berasal dari suatu kelompok. Nilai peluang ini disebut posterior probability

dan bisa ditampilkan pada sheet SPSS dengan mengaktifkan option

probabilities of group membership padabagian Save di kotak dialog utama.

( )( )

( )

k k

k k

k

p f xP k x

p f x

Dimana

kp adalah prior probability kelompok ke-k dan

1

12 2

1 1( ) exp ( ) ( ); 0,1

2(2 )k k kp

f x x x k

Suatu observasi dengan karakteristik x akan diklasifikasikan sebagai anggota

kelompok 0 jika ( 0 ) ( 1 )P k x P k x .

b. Aplikasi dengan Menggunakan SPSS

KASUS

Sebuah perusahaan bergerak dalam penjualan Air Mineral Dalam Kemasan

mengumpulkan data sekelompok konsumen air mineral dengan variabel berikut;

Tipe konsumen dari banyak tipe Air Mineral yang minum dengan kode:

Page 19: Analisis Diskriminan

Kode 0 = SEDIKIT (konsumne yang termasuk tipe sedikit minum air

mineral)

Kode 1 = BANYAK (konsumen yang termasuk tipe bnayak minum air

Mineral)

Usia konsumen (tahun)

Berat badan konsumen (kilogram)

Tinggi badan konsumen (centimeter)

Pendapatan konsumen (ribuan rupiah/bulan)

Jam kerja konsumen dalam sehari (jam)

Kegiatan olahraga konsumen dalam sehari (jam)

Dari kasus diatas akan dilakukan analisis diskriminan untuk mengetahui:

Apakah ada perbedaan yang signifikan antara konsumen yang banyak minum air

mineral dengan konsumen yang sedikit minum air mineral?

Jika ada perbedaan yang signifikan, variabel apa saja yang membuat perilaku

konsumsi air mineral mereka berbeda?

Membuat model diskriminan dua faktor (tipe sedikit dan tipe banyak) untuk kasus

tersebut

Menguji ketepatan model (fungsi) diskriminan

TAHAPAN PENGUJIAN ANALISIS DISKRIMINAN

A. MENGUJI VARIABEL

MENILAI VARIABEL YANG LAYAK UNTUK ANALISIS

Dari SPSS diperoleh output sebagai berikut,

Tests of Equality of Group Means

.945 4.247 1 73 .043

.934 5.173 1 73 .026

.946 4.186 1 73 .044

.894 8.656 1 73 .004

1.000 .000 1 73 .994

.946 4.183 1 73 .044

USIA

BERAT

TINGGI

INCOME

JAMKERJA

OLAHRAGA

Wilks'

Lambda F df1 df2 Sig.

Page 20: Analisis Diskriminan

Analisis

Tabel diatas adalah hasilpengujian untuk setiap variabel bebas yang ada.

Keputusan bisa diambil lewat dua cara.

Dengan angka Wilk’s Lambda

Angka wilk’s Lambda berkisar antara 0 sampai 1. Jika angka mendekati 0 maka data

tiap group cenderung berbeda, sedangkan jika angka mendekati 1 maka data tiap

group cenderung sama.

Dari tabel terlihat angka Wilk’s Lambda berkisar antara 0.894 sampai 1.000. Dari

kolom signifikan dilihat bahwa hanya variable Jam Kerja yang cenderung tidak

berbeda. Hal ini berarti jam kerja untuk mereka yang sedikit atau banyak

mengkonsumsi air mineral tidak berbeda secara nyata.

Dengan F test

Perhatikan angka signifikan.

Jika sig. > 0.05 berarti tidak ada perbedaan antar grup

Jika sig < 0.05 berarti ada perbedaan antar grup

Analisis dari data diatas adalah

Variabel Usia, angka sig. < 0.05 (yaitu; 0.043). Hal ini berarti ada perbedaan

antar grup, atau usia responden memengaruhi banyak sedikitnya

mengkonsumsi air mineral.

Variabel Berat, angka sig. < 0.05 (yaitu; 0.026). Hal ini berarti ada perbedaan

antar grup, atau berat badan responden memengaruhi banyak sedikitnya

mengkonsumsi air mineral.

Variabel Tinggi, angka sig. < 0.05 (yaitu; 0.044). Hal ini berarti ada perbedaan

antar grup, atau tinggi responden memengaruhi banyak sedikitnya

mengkonsumsi air mineral.

Variabel Income, angka sig. < 0.05 (yaitu; 0.004). Hal ini berarti ada

perbedaan antar grup, atau income responden memengaruhi banyak sedikitnya

mengkonsumsi air mineral.

Variabel Jam Kerja, angka sig. > 0.05 (yaitu; 0.994). Hal ini berarti tidak ada

perbedaan antar grup, atau jam kerja responden tidak memengaruhi banyak

sedikitnya mengkonsumsi air mineral.

Page 21: Analisis Diskriminan

Variabel Olah Raga, angka sig. < 0.05 (yaitu; 0.44). Hal ini berarti ada

perbedaan antar grup, atau olah raga responden memengaruhi banyak

sedikitnya mengkonsumsi air mineral.

Dari 6 varible tersebut ada lima variabel berbeda secara signifikan untuk dua group

diskriminan, yaitu USIA, BERAT, TINGGI, INCOME, OLAH RAGA. Dengan demikian

sedikit atau banyaknya konsumsi air mineral dipengaruhi oleh variabel-variabel tersebut.

UJI VARIANS DARI SETIAP VARIABEL,

Uji selanjutnya adalah menguji varians dari setiap variabel. Dapat dilakukan dengan dua

cara yaitu dengan Box’s M atau dilihat dari output LOG DETERMINANT.

Analisis diskriminan mempunyai asumsi bahwa:

Varians variabel bebas untuk tiap grup seharusnya sama. Jika demikian,

seharusnya varians dari responden yang sedikit mengkonsumsi air mineral sama

dengan varians dari responden yang banyak mengonsumsi air mineral.

Varians diantara variabel-variabel bebas seharusnya juga sama. Jika demikian,

seharusnya varians dari income sama dengan varians dari olah raga.

Kedua pengertian diatas bisa disimpulkan, seharusnya group covariance matrices

adalah relatif sama, yang di uji dengan alat Box’s M dengan ketentuan:

HIPOTESIS

: group covariance matrices adalah relatif sama

: group covariance matrices adalah berbeda secara nyata

Keputusan dengan dasar signifikansi (lihat angka sig.)

Jika sig >0.05 berarti diterima

Jika sig<0.05 berarti ditolak

Dari SPSS diperoleh output sebagai berikut

Page 22: Analisis Diskriminan

Analisis

Dari tabel terlihat bahwa angka sig. > 0,05, yaitu 0.163 yang menerima berarti group

covariance matrices adalah relatif sama. Hal ini berarti data di atas sudah memenuhi

asumsi analisis diskriminan.

Analisis

Terlihat angka log determinant untuk kategori SEDIKIT (14,081) dan BANYAK (14,520)

tidak berbeda banyak, sehingga group covariance matrices akan relatif sama untuk kedua

grup.

B. MELAKUKAN ANALISIS DISKRIMINAN

Dari SPSS diperoleh output sebagai berikut

Test Results

29.866

1.297

21

19569.371

.163

Box's M

Approx.

df1

df2

Sig.

F

Tests null hypothesis of equal populat ion cov ariance matrices.

Log Determinants

6 14.081

6 14.520

6 14.706

MINUM.00

1.00

Pooled within-groups

Rank

Log

Determinant

The ranks and natural logarithms of determinants

printed are those of the group covariance matrices.

Page 23: Analisis Diskriminan

Analisis

Tabel GROUP STATISTICS pada dasarnya berisi data statistic yang utama, yaitu rata-rata

dan standar deviasi dari kedua grup konsumen.

Misalnya, Konsumen yang termasuk tipe SEDIKIT meminum air mineral mempunyai

berat badan rata-rata 57,21 kilogram. Sedangkan konsumen yang termasuk tipe

BANYAK meminum air mineral mempunyai berat badan rata-rata 51,81 kilogram.

Terlihat bahwa ada 38 responden yang tergolong sedikit mengonsumsi air mineral,

sedangkan 37 responden lainnya tergolong banyak mengonsumsi air mineral. Semua

variabel terisi angka 38 atau 37, maka pada kasus ini tidak ada data yang hilang, sehingga

total data untuk semua variabel adalah 75 buah. Tentu ini adalah keadaan yang ideal.

Group Statistics

31.8684 6.1256 38 38.000

57.2105 11.7661 38 38.000

158.4474 5.6650 38 38.000

659.4737 106.7948 38 38.000

5.2684 .1110 38 38.000

3.1974 .5538 38 38.000

28.9459 6.1552 37 37.000

51.8108 8.4848 37 37.000

161.5676 7.4444 37 37.000

578.9189 129.5244 37 37.000

5.2686 .1567 37 37.000

2.9054 .6778 37 37.000

30.4267 6.2734 75 75.000

54.5467 10.5655 75 75.000

159.9867 6.7434 75 75.000

619.7333 124.5313 75 75.000

5.2685 .1345 75 75.000

3.0533 .6312 75 75.000

USIA

BERAT

TINGGI

INCOME

JAMKERJA

OLAHRAGA

USIA

BERAT

TINGGI

INCOME

JAMKERJA

OLAHRAGA

USIA

BERAT

TINGGI

INCOME

JAMKERJA

OLAHRAGA

MINUM

.00

1.00

Total

Mean Std. Dev iat ion Unweighted Weighted

Valid N (listwise)

Page 24: Analisis Diskriminan

Analisis

Tabel ini menyajikan variabel mana dari variabel input yang bisa dimasukkan ke dalam

persamaan diskriminan.

Karena proses adalah stepwise (bertahap), maka akan dimulai dengan variabel yang

mempunyai angka F hitung (statistic) terbesar.

Tahap pemasukan variabel bebas:

Pada tahap pertama, angka F hitung variabel Income adalah terbesar, mencapai 8.656

maka pada tahap ini variabel Income terpilih.

Pada tahap kedua, dengan variabel yang berkurang satu, angka F hitung terbesar

kedua adalah Berat,mencapai 7.170 maka pada tahap kedua ini variabel Berat terpilih.

Pada tahap ketiga, dengan variabel sudah berkurang dua, angka F hitung terbesar

ketiga adalah Tinggi, mencapai 7.343, maka pada tahap ketiga ini variabel Tinggi

terpilih.

Ketiga variabel tersebut mempunyai angka sig. < 0.05 yaitu angka sig. Income adalah

4.367E-03 < 0.05, angka sig. Berat adalah 1.446E-03 < 0.05, angka sig. Tinggi adalah

2.351E-04 < 0.05.

Variables Entered/Removeda,b,c,d

INCOME .462.00 and

1.008.656 1 73.000 4.367E-03

BERAT .776.00 and

1.007.170 2 72.000 1.446E-03

TINGGI 1.208.00 and

1.007.343 3 71.000 2.351E-04

Step

1

2

3

Entered Stat istic

Between

Groups Stat istic df1 df2 Sig.

Exact F

Min. D Squared

At each step, the variable that maximizes the Mahalanobis distance between the two closest

groups is entered.

Maximum number of steps is 12.a.

Maximum signif icance of F to enter is .05.b.

Minimum signif icance of F to remov e is .10.c.

F lev el, tolerance, or VIN insuf f icient f or f urther computation.d.

Page 25: Analisis Diskriminan

Dengan demikian, dari lima variabel yang dimasukkan hanya ada tiga variabel yang

signifikan. Dengan kata lain Income, Berat, Tinggi konsumen memengaruhi perilaku

konsumen tersebut sedikit atau banyak minum air mineral.

Analisis

Pada Step 1, variabel Income adalah variabel pertama yang masuk ke dalam model

diskriminan. Karena variabel tersebut mempunyai angka sig. of F to remove yang

paling sedikit, yaitu 0.004. < 0.05

Pada Step 2, dimasukkan variabel kedua, yaitu Berat. Karena mempunyai angka sig.

0f F to remove sebesar 0.26 < 0.05.

Pada Step 3, dimasukkan variabel ketiga, yaitu Tinggi. Karena mempunyai angka sig.

of F to remove sebesar 0.012 < 0.05.

Variables in the Analysis

1.000 .004

.997 .004 .276.00 and

1.00

.997 .026 .462.00 and

1.00

.993 .004 .647.00 and

1.00

.944 .008 .721.00 and

1.00

.943 .012 .776.00 and

1.00

INCOME

INCOME

BERAT

INCOME

BERAT

TINGGI

Step

1

2

3

Tolerance

Sig. of F to

Remove

Min. D

Squared

Between

Groups

Page 26: Analisis Diskriminan

Analisis

Pada Step 0, keenam variabel secara lengkap ditayangkan dengan angka sig. of F to

remove sebagai fakor uji. Angka sig. of F to remove variabel Income terkecil yaitu

0.004 < 0.05. Maka variabel Income dikeluarkan dari step 0, yang berarti variabel

Income bukan termasuk variabel yang tidak dianalisis.

Variables Not in the Analysis

1.000 1.000 .043 .227.00 and

1.00

1.000 1.000 .026 .276.00 and

1.00

1.000 1.000 .044 .223.00 and

1.00

1.000 1.000 .004 .462.00 and

1.00

1.000 1.000 .994 .000.00 and

1.00

1.000 1.000 .044 .223.00 and

1.00

.318 .318 .542 .484.00 and

1.00

.997 .997 .026 .776.00 and

1.00

.997 .997 .042 .721.00 and

1.00

1.000 1.000 .952 .462.00 and

1.00

.538 .538 .953 .462.00 and

1.00

.317 .316 .458 .812.00 and

1.00

.943 .943 .012 1.208.00 and

1.00

.995 .993 .837 .778.00 and

1.00

.537 .537 .876 .777.00 and

1.00

.316 .316 .524 1.238.00 and

1.00

.958 .908 .779 1.214.00 and

1.00

.523 .523 .798 1.213.00 and

1.00

USIA

BERAT

TINGGI

INCOME

JAMKERJA

OLAHRAGA

USIA

BERAT

TINGGI

JAMKERJA

OLAHRAGA

USIA

TINGGI

JAMKERJA

OLAHRAGA

USIA

JAMKERJA

OLAHRAGA

Step

0

1

2

3

Tolerance

Min.

Tolerance

Sig. of F

to Enter

Min. D

Squared

Between

Groups

Page 27: Analisis Diskriminan

Pada Step 1, tersisa lima variabel. Angka sig. of F to remove variabel Berat terkecil

yaitu 0.026 < 0.05. Maka variabel Berat dikeluarkan dari step 1, yang berarti variabel

Berat bukan termasuk variabel yang tidak dianalisis.

Pada Step 2, tersisa empat variabel. Angka sig. of F to remove variabel Tinggi terkecil

yaitu 0.012< 0.05. Maka variabel Tinggi dikeluarkan dari step 2, yang berarti variabel

Tinggi bukan termasuk variabel yang tidak dianalisis.

Pada Step 3, tersisa tiga variabel. Angka sig. of F to remove ketiga variabel tersebut

lebih dari 0.05. Maka variabel tersebut tidak dikeluarkan dari step 3, yang berarti

variabel Tinggi termasuk variabel yang tidak dianalisis.

Wilk’s Lambda pada prinsipnya adalah varians total dalam discriminant scores yang tidak

bisa dijelaskan oleh perbedaan di antara grup-grup yang ada.

Analisis

Pada Step 1, jumlah variabel yang dimasukkan ada satu Income dengan angka Wilk’s

Lambda adalah 0.894. hal ini berarti 89,4 % varians tidak dapat dijelaskan perbedaan

antara grup-grup.

Pada Step 2, dengan tambahan variabel Berat, angka Wilk’s Lambda turun menjadi

0.834.

Pada Step 3, angka Wilk’s Lambda turun menjadi 0.763. penurunan angka Wilk’s

Lambda baik untuk model diskriminan, karena varians yang tidak bisa dijelaskan juga

semakin kecil.

Summary of Canonical Discriminant Functions

Wilks' Lambda

1 .894 1 1 73 8.656 1 73.000 4.367E-03

2 .834 2 1 73 7.170 2 72.000 1.446E-03

3 .763 3 1 73 7.343 3 71.000 2.351E-04

Step

1

2

3

Number of

Variables Lambda df1 df2 df3 Stat istic df1 df2 Sig.

Exact F

Eigenvalues

.310a 100.0 100.0 .487

Function

1

Eigenvalue % of Variance Cumulat iv e %

Canonical

Correlation

First 1 canonical discriminant functions were used in the

analysis.

a.

Page 28: Analisis Diskriminan

Analisis

Canonical Correlation mengukur keeratan hubungan antara discriminant score dengan

grup (pada kasus ini, karena ada dua tipe konsumen, maka ada dua grup). Angka 0.487

menunjukkan keeratan yang cukup tinggi, dengan skala asosiasi antara 0 sampai 1.

Analisis

Tabel diatas menyatakan angka akhir dari Wilk’s Lambda. Angka Chi-Square sebesar

19.321 dengan tingkat signifikansi yang tinggi menunjukkan perbedaan yang jelas antara

dua grup konsumen.

Analisis

Tabel diatas menjelaskan korelasi antara variabel independen dengan fungsi diskriminan

yang terbentuk. Varibel Income paling erat hubungannya dengan fungsi diskriminan,

diikuti oleh variabel Berat dan Tinggi.

Wilks' Lambda

.763 19.321 3 .000

Test of Function(s)

1

Wilks'

Lambda Chi-square df Sig.

Structure Matrix

.618

.521

.478

.475

-.430

-.069

INCOME

USIAa

BERAT

OLAHRAGAa

TINGGI

JAMKERJAa

1

Function

Pooled within-groups correlations between discriminating

variables and standardized canonical discriminant f unctions

Variables ordered by absolute size of correlat ion within f unction.

This variable not used in the analysis.a.

Page 29: Analisis Diskriminan

Analisis

Tabel diatas menunjukkan FUNGSI DISKRIMINAN:

Kegunaan fungsi ini untuk mengetahui seorang konsumen air mineral masuk pada Grup

yang kesatu atau tergolong pada Grup yang kedua.

Analisis

Karena ada dua tipe konsumen, maka disebut Two-Group Discriminant, dimana grup yang

satu mempunyai Centroid (Grup Means) negative, dan grup yang satu mempunyai

Centroid (Grup Means) positif. Angka pada tabel menunjukkan besaran Z yang

memisahkan kedua grup tersebut.

Gambar :

Canonical Discriminant Function Coefficients

.064

-.093

.006

7.884

BERAT

TINGGI

INCOME

(Constant)

1

Function

Unstandardized coef f icients

Functions at Group Centroids

.542

-.557

MINUM

.00

1.00

1

Function

Unstandardized canonical discriminant

f unct ions ev aluated at group means

0

N=3

8

Z= 0,542 Z= - 0,557

N=3

7

SEDIK

IT

BANYA

K

Page 30: Analisis Diskriminan

Terlihat distribusi anggota grup dengan kode 0 (sedikit) dan kode 1 (banyak) , dimana dari

75 responden, 37 orang pada Grup Banyak, dan 38 orang ada pada Grup Sedikit.

Analisis

Tabel diatas memperihatkan komposisi ke 75 responden, yang dengan model diskriminan

menghasilkan 37 responden ada di Grup Banyak dan 38 responden ada di Grup Sedikit.

Analisis

Memberikan persamaan dengan pembagian berdasrkan Grup.

Konsumen yang minum air mineral dalam kategori Sedikit:

SCORE = -297,882 + 3,506E-2 BERAT + 3,587 TINGGI + 3,641E-02 INCOME

Konsumen yang minum air mineral dalam kategori Banyak:

SCORE = -306,557 – 3,48E-02 BERAT + 3,690 TINGGI + 3,007E-02 INCOME

Prior Probabilities for Groups

.500 38 38.000

.500 37 37.000

1.000 75 75.000

MINUM

.00

1.00

Total

Prior Unweighted Weighted

Cases Used in Analy sis

Classification Function Coefficients

3.506E-02 -3.48E-02

3.587 3.690

3.641E-02 3.007E-02

-297.882 -306.557

BERAT

TINGGI

INCOME

(Constant)

.00 1.00

MINUM

Fisher's linear discriminant functions

Page 31: Analisis Diskriminan

Selisih antara Grup Sedikit dengan Grup Banyak adalah

(-297,882 + 3,506E-2 BERAT + 3,587 TINGGI + 3,641E-02 INCOME) - (306,557 –

3,48E-02 BERAT + 3,690 TINGGI + 3,007E-02 INCOME)

Atau

Z Score = 8,675 + 0,06986 BERAT – 0,103 TINGGI + 0,00634 INCOME

Disebut fungsi diskriminan dari Fisher yang hampir sama dengan fungsi Unstandarized

sebelumnya.

Analisis

Pada tabel Discriminant Score menunjukkan penghitungan score dari perilaku konsumen

dalam mengonsumsi air mineral.

Hasil score tersebut selanjutnya akan dibandingkan dengan cut off score, untuk

mengetahui apakah konsumen masuk dalam Grup Sedikit atau Grup banyak.

Page 32: Analisis Diskriminan

Dari tabel diatas didapat jumlah responden Sedikit adalah 38 orang, sedangkan responden

Banyak adalah 37 orang. Dengan demikian dengan mengaitkannya dengan angka grup

centroid, didapat:

( ) ( ) atau praktis sama dengan

0

Perhitungan (angka kriris):

Dimana:

: Angka kritis, yang berfungsi sebagai cut off score

: jumlah sampel dari grup A dan B, yang dalam kasus ini adalah grup Sedikit

dan Banyak

: angka centroid pada Grup A dan B

Perhitungan :

Penggunaan angka (Discriminating Z score):

Angka skor kasus diatas masuk ke grup Sedikit (kode 0)

Angka skor kasus dibawah masuk ke grup Banyak (kode 1)

Prior Probabilities for Groups

.500 38 38.000

.500 37 37.000

1.000 75 75.000

MINUM

.00

1.00

Total

Prior Unweighted Weighted

Cases Used in Analy sis

Page 33: Analisis Diskriminan

Sebagai contoh:

Case number 1 (Rusdi) mempunyai score 1,571. Karena 1,571 > 0, maka Rusdi

masuk pada grup 0 (Sedikit).

Case number 2 (Nina) mempunyai score 1,724. Karena 1,724 > 0, maka Nina masuk

pada grup 0 (Sedikit).

Case number 15 (Esti) mempunyai score -0,223. Karena -0,223 < 0, maka Esti masuk

pada grup 1 (Banyak).

Kesimpulan:

Konsumen yang masuk pada tipe SEDIKIT adalah Rusdi, Nina, Lanny, Citra, Dina,

Lenny, Rudi, Roby, Bambang, Yunus, Lestari, Erni, Hesty, Lilis, Lita, Rani, Hengky,

Hana, Eli, Renata, Dewe, Jodan, Rina, Herman, Sobari, Rully, Leoni, Agnes, Deddy,

Dodik, Conny, Mary, Susy, James, Joni, Melani, Susana, Titik, Nanik, Nuning.

Konsumen yang masuk pada tipe BANYAK adalah Siska, Lusi, Esti, Hany, Susan, Lina,

Baby, Andre, Gunawan, Lina, Vina, Sugeng, Handoko, Binsar, Fanny, Fenny, Yulita,

Yulia, Richard, Rosy, Dimas, Kiky, Usman, Salim, Joni, Kristanto, Karim, Rusmin,

Sulastri, Liliana, Prihardi, Suhardi, Tatik, Ninik, Gala.

Classification Resultsb,c

27 11 38

13 24 37

71.1 28.9 100.0

35.1 64.9 100.0

27 11 38

13 24 37

71.1 28.9 100.0

35.1 64.9 100.0

MINUM

.00

1.00

.00

1.00

.00

1.00

.00

1.00

Count

%

Count

%

Original

Cross-validateda

.00 1.00

Predicted Group

Membership

Total

Cross validation is done only for those cases in the analysis. In

cross validation, each case is classif ied by the f unctions deriv ed

f rom all cases other than that case.

a.

68.0% of original grouped cases correct ly classif ied.b.

68.0% of cross-validated grouped cases correctly classif ied.c.

Page 34: Analisis Diskriminan

Analisis

Pada tabel diatas, perhatikan bagian Original, terlihat bahwa mereka yang pada data awal

adalah tergolong Sedikit, dan dari klasifikasi Fungsi Diskriminan tetap pada kelompok

Sedikit adalah 27 orang. Sedangkan dengan model diskriminan, mereka yang awalnya

masuk grup Sedikit, ternyata menjadi anggota grup Banyak adalah 11 orang.

Demikian juga dengan grup Banyak yang tetap pada grup Banyak sejumlah 24 orang dan

yang tidak di grup Banyak adalah 13 orang.

Dengan demikian, ketepatan prediksi dari model adalah:

Karena angka ketepatan tinggi maka model diskriminan di atas sebenarnya bisa digunakan

untuk analisis diskriminan.

Setelah terbukti bahwa Fungsi Diskriminan mempunyai ketepatan prediksi yang tinggi,

maka fungsi diskriminan tersebut bisa digunakan untuk memprediksi sebuah kasus,

apakah akan diklasifikasikan ke tipe sedikit atau tipe banyak.

Kesimpulan

Dari proses diskriminan, dimulai uji variabel sampai analisis output, sehingga didapat

kesimpulan yang terkait dengan tujuan awal.

Ada perbedaan yang signifikan antara konsumen yang banyak minum dengan

konsumen yang sedikit minum air mineral. Hal ini dibuktikan pada analisis Wilk’s

Lambda.

Variabel yang membuat perilaku konsumsi air mineral mereka berbeda adalah Berat

Badan, Tinggi Bada, dan Income.

Model atau fungsi diskriminan untuk kasus tersebut adalah:

Page 35: Analisis Diskriminan

Model (fungsi) diskriminan diatas mempunyai ketepatan mengklasifikasi kasus

sebesar 68 %. Karena diatas 50 %, ketepatan model dianggap tinggi dan model bisa

digunakn untuk mengklasifikasi sebuah kasus pada tipe minum tertentu.

Page 36: Analisis Diskriminan

BAB III

PENUTUP

Kesimpulan

Analisis diskriminan merupakan suatu teknis analisis multivariat yang digunakan

untuk mengelompokkan atau mengklasifikasi suatu objek dalam dua kelompok atau lebih

berdasarkan variabel independentnya.

Asumsi analisis diskriminan yang harus dipenuhi adalah :

5. Variabel independen seharusnya berdistribusi normal multivariat (Multivariate

Normality)..

6. Matriks varians kovarians grup dari semua variabel independen seharusnya sama.

7. Tidak ada data yang sangat ekstrim (outlier) pada variabel independen..

8. Tidak ada korelasi yang kuat antar-variabel independen.

Fungsi diskriminannya 0 1 1 2 2 ...i i j ijY b b X b X b X

Secara pasti tidak ada jumlah sampel yang ideal pada analisis diskriminan. Setiap

variabel independen sebaiknya ada 5-20 data (sampel). Dengan demikian, jika ada enam

variabel independen, seharusnya minimal ada 6x5=30 sampel.

Tujuan diskriminan secara umum adalah :

Ingin mengetahui apakah ada perbedaan yang jelas antar grup pada variabel

dependen atau bisa dikatakan apakah ada perbedaan antara anggota grup 1 dengan

anggota grup 2.

Jika ada perbedaan, variabel independen manakah pada fungsi diskriminan yang

membuat perbedaan.

Membuat fungsi atau model diskriminan, yang pada dasarnya mirip dengan

persamaan regresi.

Melakukan klasifikasi terhadap objek (dalam teminologi SPSS disebut baris),

apakah suatu objek (bisa nama orang, nama tumbuhan, benda atau lainnya)

termasuk grup 1 atau grup 2, atau lainnya.

Page 37: Analisis Diskriminan

Proses dasar analisis diskriminan :

Memisah variabel-variabel menjadi variabel dependen dan Variabel Independen.

Menentukan metode untuk membuat fungsi diskriminan. Pada prinsipnya ada dua

metode dasar untuk itu, yaitu:

5. SIMULTANEOUS ESTIMATION, di mana semua variabel dimasukkan

secara bersama-sama kemudian dilakukan proses diskriminan.

6. STEP-WISE ESTIMATION, dimana variabel dimasukkan satu per satu ke

dalam modeldiskriminan. Pada proses ini, tentu ada variabel yang tetap ada

pada model, dan ada kemungkinan satu atau lebih variabel independen

yang ‘dibuang’ dari model.

Menguji signifikasi dari fungsi diskriminan yang telah terbentuk, menggunakan

Wilk’s Lambda, Pilai, F test dan lainnya.

Menguji ketetapan klasifikasi dari fungsi diskriminan, termasuk mengetahui

ketetpan klasifikasi secara individual dengan casewise Diagnotics.

Melakukan interpretasi terhadap fungsi diskrimminan tersebut.

Melekukan uji validasi fungsi diskriminan.