24
Agung Priyo Utomo - [email protected] 1 MODEL PROBIT BAHAN KULIAH ANALISIS DATA KATEGORIK SEKOLAH TINGGI ILMU STATISTIK Oleh: Agung Priyo Utomo

Model Probit 2013

Embed Size (px)

DESCRIPTION

bahan mata kuliah ADK

Citation preview

Page 1: Model Probit 2013

Agung Priyo Utomo - [email protected] 1

MODEL PROBIT

BAHAN KULIAH ANALISIS DATA KATEGORIK

SEKOLAH TINGGI ILMU STATISTIK

Oleh:

Agung Priyo Utomo

Page 2: Model Probit 2013

Agung Priyo Utomo - [email protected] 2

Model Probit

Contoh 1:

Penelitian untuk mengetahui faktor-faktor yang mempengaruhi apakah seorang kandidat akan memenangkan pemilu atau tidak. Dalam kasus ini maka hasilnya adalah menang atau kalah. Beberapa faktor yg diduga berpengaruh adalah besarnya uang yang dikeluarkan dalam kampanye, lamanya waktu berkampanye negatif dan apakah kandidat memiliki jabatan atau tidak.

Contoh 2:

Penelitian untuk mengetahui apakah latihan OR, usia, dan jenis kelamin berpengaruh terhadap seseorang akan terkena serangan jantung atau tidak.

Page 3: Model Probit 2013

Agung Priyo Utomo - [email protected] 3

Model Probit

Contoh 3:

Beberapa siswa SMU berkeinginan untuk melanjutkan kuliah. Dalam berkas lamarannya, mereka memasukkan skor GRE dan nilai GPA. Beberapa siswa berasal dari sekolah unggulan dan ada juga yang dari sekolah non unggulan. Beberapa bulan setelah siswa mengirimkan aplikasi, siswa tersebut menerima 2 macam amplop (tebal atau tipis) yang menandakan mereka diterima atau ditolak di PT yang bersangkutan.

Page 4: Model Probit 2013

Agung Priyo Utomo - [email protected] 4

Model Probit

Pertama kali ditemukan oleh Chester Bliss (1930)

Probit = Probability Unit

Model logit menggunakan fungsi logistik kumulatif

(cumulative logistic function)

Model probit menggunakan fungsi normal kumulatif

(normal CDF) → disebut juga dengan model normit

Secara prinsip utk memperoleh model probit dpt dilakukan

dg mengganti fungsi logistik kumulatif pd persamaan

dengan fungsi normal kumulatif

iZie1

1P

Page 5: Model Probit 2013

Agung Priyo Utomo - [email protected] 5

Model Probit

Page 6: Model Probit 2013

Agung Priyo Utomo - [email protected] 6

Model Probit

Contoh:

Keputusan untuk membeli/memiliki rumah dilihat dari

pendapatan keluarga.

Ada suatu nilai, semacam indeks kegunaan yg tdk dpt

diamati (unobservable utility index), misal Ii, sedemikian

sehingga makin besar nilai Ii, maka makin besar pula

peluang sebuah keluarga untuk membeli rumah.

Indeks Ii dapat dinyatakan sbb:

Ii = β1 + β2Xi

Xi = pendapatan keluarga ke-i

Page 7: Model Probit 2013

Agung Priyo Utomo - [email protected] 7

Model Probit

Bgmn hubungan Ii dg keputusan utk membeli rumah? Pada model logistik, Y = 1 jika keluarga memiliki rumah dan Y = 0

jika keluarga tidak memiliki rumah

Pada model probit, dapat diasumsikan untuk setiap keluarga ada batasan indeks, misal Ii* sedemikian shg jika Ii > Ii*, maka keluarga tersebut akan membeli rumah

Jika diasumsikan Ii* berdistribusi normal dengan rata-rata dan varian sama, maka Ii* maupun Ii dapat diestimasi

Dibawah asumsi kenormalan, maka

dimana t ~ N(0,1)

i21

2

2ti

2

2tXT

ii*ii dte

2

1dte

2

1)I(F)II(P)1Y(PP

Page 8: Model Probit 2013

Agung Priyo Utomo - [email protected] 8

Model Probit

Jika Pi = peluang sebuah event akan terjadi, maka

peluang untuk memiliki rumah dapat dihitung dari luas di

bawah kurva normal baku dari - s.d. Ii

Pi = F(Ii)

Ii = β1 + β2Xi

Page 9: Model Probit 2013

Agung Priyo Utomo - [email protected] 9

Model Probit

Untuk menghitung indeks Ii, dapat diperoleh dari

Ii = F-1(Ii) = F-1(Pi) = β1 + β2Xi

F-1 merupakan invers dari CDF normal

Pi Pr(Ii*≤Ii)

0 -

Pi = F(Ii) 1

Ii = F-1(Pi)

Page 10: Model Probit 2013

Agung Priyo Utomo - [email protected] 10

Model Probit

Bagaimana memperoleh indeks Ii, jika yg diketahui hanya

Xi (pendapatan) dan Y = 1 atau Y = 0 (tergantung apakah

keluarga tersebut memiliki rumah atau tidak)?

Misal datanya sbb: (X = dalam ribuan $)

X Ni ni

6 40 8

8 50 12

10 60 18

13 80 28

15 100 45

20 70 36

25 65 39

30 50 33

35 40 30

40 25 20

Page 11: Model Probit 2013

Agung Priyo Utomo - [email protected] 11

Model Probit

Untuk mengestimasi indeks Ii dpt dilakukan melalui nilai

Peluang (frekuensi relatif), selanjutnya bandingkan

dengan CDF normal

X Ni ni Est. Pi Ii

6 40 8 0,20 -0.84

8 50 12 0,24 -0.70

10 60 18 0,30 -0.52

13 80 28 0,35 -0.38

15 100 45 0,45 -0.12

20 70 36 0,51 0.03

25 65 39 0,60 0.25

30 50 33 0,66 0.40

35 40 30 0,75 0.67

40 25 20 0,80 0.84

Page 12: Model Probit 2013

Agung Priyo Utomo - [email protected] 12

Model Probit

Dari data tersebut, model probit dapat diperoleh sbb:

Berdasarkan est. Pi (frekuensi relatif), maka dapat diperoleh Ii dari

CDF normal (ada di tabel sebelumnya)

Setelah Ii diperoleh, maka dapat dicari β1 dan β2 dg mudah

Pada analisis probit, Ii disebut normal equivalent deviate

(n.e.d) atau disebut juga normit

Karena Ii atau n.e.d akan bernilai negatif (-) pada saat Pi <

0.5, maka dalam prakteknya ditambahkan dengan nilai 5

dan hasilnya disebut probit

probit = n.e.d + 5 = Ii + 5

β1 dan β2 dapat diestimasi berdasarkan model:

Ii = β1 + β2Xi + ui ; dimana ui = unsur gangguan

Page 13: Model Probit 2013

Agung Priyo Utomo - [email protected] 13

Model Probit

Tahapan dalam model probit:

1. Dari data yang sudah dikelompokkan, estimasi Pi (frekuensi relatif)

2. Berdasarkan estimasi dari Pi, cari n.e.d (Ii) dari CDF normal

3. Gunakan estimasi Ii (Ii*), sebagai variabel terikat dalam regresi

Ii* = β1 + β2Xi + ui

4. Jika diperlukan, tambahkan 5 pada nilai n.e.d (Ii) untuk mengubah menjadi probit dan gunakan sebagai variabel terikat pada

Ii* = β1 + β2Xi + ui

Page 14: Model Probit 2013

Agung Priyo Utomo - [email protected] 14

Logit vs Probit?

Kedua model termasuk dalam model non linier

Untuk membuat menjadi model linier, Logistik

menggunakan transformasi fungsi logit (logaritma natural

dari nilai odds), sedangkan probit menggunakan fungsi

invers dari distribusi kumulatif normal (Z-score)

Dalam prakteknya kedua model seringkali memberikan

hasil yang sama/mirip.

Kedua metode menggunakan metode MLE

Model probit tidak menghasilkan nilai odds ratio seperti

pada model logit.

Page 15: Model Probit 2013

Agung Priyo Utomo - [email protected] 15

Perkiraan Peluang Logit &

Probit

Page 16: Model Probit 2013

Agung Priyo Utomo - [email protected] 16

Contoh: (Aplikasi menggunakan SPSS)

Beberapa siswa SMU berkeinginan untuk melanjutkan

kuliah. Dalam berkas lamarannya, mereka memasukkan

skor GRE dan nilai GPA. Beberapa siswa berasal dari

sekolah unggulan dan ada juga yang dari sekolah non

unggulan. Beberapa bulan setelah siswa mengirimkan

aplikasi, siswa tersebut menerima 2 macam amplop (tebal

atau tipis) yang menandakan mereka diterima atau ditolak

di PT yang bersangkutan.

Data ada di file probit.sav

Page 17: Model Probit 2013

Agung Priyo Utomo - [email protected] 17

Contoh: (Aplikasi menggunakan SPSS)

Variabel tak bebas/terikat = admit

1 = diterima (admitted)

0 = tidak diterima (not admitted)

Variabel bebas =

gre (graduate record exam score),

gpa (grade point average),

topnotch (asal sekolah) :

- 1 jika berasal dari sekolah ungulan

- 0 jika berasal dari sekolah non unggulan

Page 18: Model Probit 2013

Agung Priyo Utomo - [email protected] 18

Contoh: (Aplikasi menggunakan SPSS)

Descriptive Statistics

400 220,00 800,00 587,7000 115,51654

400 2,26 4,00 3,3899 ,38057

400

Graduate Record Exam

Grade Point Av erage

Valid N (listwise)

N Minimum Maximum Mean Std. Dev iation

Asal Sekolah

335 83,8 83,8 83,8

65 16,3 16,3 100,0

400 100,0 100,0

Non Unggulan

Unggulan

Total

Valid

Frequency Percent Valid Percent

Cumulat ive

Percent

Page 19: Model Probit 2013

Agung Priyo Utomo - [email protected] 19

Beberapa Strategi

Regresi OLS

Analisis ini akan bermasalah, karena asumsi OLS akan

terlanggar jika digunakan pada kasus variabel terikatnya

berupa kategorik.

Uji t

Uji ini bisa digunakan jika kasusnya hanya terdiri dari

satu variabel bebas dan bersifat kuantitatif, misal hanya

melihat pengaruh dari GPA terhadap diterima atau

tidaknya seorang siswa di PT.

Regresi Logit

Model ini sangat mirip dengan model probit

Page 20: Model Probit 2013

Agung Priyo Utomo - [email protected] 20

Penggunaan Model Probit

Sebelum menjalankan model probit, maka periksa dulu

apakah ada sel yang kosong/terlalu kecil frekuensinya

(pada tabulasi silang antara variabel bebas kategorik dan

variabel tak bebasnya). Jika terdapat sel yang kosong,

maka akan sulit menjalankan model probit.

Admission Status * Asal Sekolah Crosstabulation

Count

238 35 273

97 30 127

335 65 400

not admitted

admitted

Admission

Status

Total

Non

Unggulan Unggulan

Asal Sekolah

Total

Tidak ada

sel yang kosong

Page 21: Model Probit 2013

Agung Priyo Utomo - [email protected] 21

Model Probit

Sebelum menjalankan model probit, maka periksa dulu

apakah ada sel yang kosong/terlalu kecil frekuensinya

(pada tabulasi silang antara variabel bebas kategorik dan

variabel tak bebasnya). Jika terdapat sel yang kosong,

maka akan sulit menjalankan model probit.

Karena GPA dan GRE

kuantitatif/kontinu

Page 22: Model Probit 2013

Agung Priyo Utomo - [email protected] 22

Model Probit Semua data

valid digunakan

• Digunakan untuk

mengetahui

apakah model dg

beberapa variabel

bebas lebih baik

drpd model tanpa

variabel bebas

(hanya intersep).

• Nilai sig. sebesar

0.000 < (misal

5%) menunjukkan

bahwa model dg

variabel bebas

lebih baik dari

model tanpa

variabel bebas.

Page 23: Model Probit 2013

Agung Priyo Utomo - [email protected] 23

Model Probit • Merupakan perkiraan/pendekatan untuk

R2 seperti pada regresi OLS pada model

non linier. (pada model non linier tidak

bisa dihitung R2 scr langsung spt pada

model regresi OLS).

• Terdapat banyak jenis pseudo R2, dan

masing-masing akan memberikan nilai

perkiraan yg berbeda

GRE & GPA

signifikan

mempengaruhi

status pendaftaran

siswa di PT

• Nilai koef. tdk bisa diinterpretasikan spt pd regresi OLS

• Interpretasi dpt dilakukan melalui probit index atau Z-

score

• Contoh: untuk setiap kenaikan skor GRE, akan

menaikkan Z-score sebesar 0,002

Page 24: Model Probit 2013

Agung Priyo Utomo - [email protected] 24

Cautions !

Ukuran sampel: Baik model logit maupun probit

memerlukan jumlah sampel yg lebih banyak

dibandingkan regresi OLS, karena keduanya

menggunakan metode MLE

Sel kosong/sedikit: jika terdapat sel kosong atau hanya

sedikit frekuensinya, maka kedua model tdk bisa

digunakan/dijalankan

Pseudo R2: nilai ini tdk sama dg R2 pada OLS, ada

banyak jenis pseudo R2

Diagnosa: pada model probit pemeriksaan asumsi

dilakukan seperti pada model logit.