Upload
vodang
View
223
Download
0
Embed Size (px)
Citation preview
Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829
Program Studi Statistika FMIPA Universitas Mulawarman 101
Model Log Linier untuk Empat Dimensi
Log Linier Model for Four Dimentions
M. Aris Budiyono1, Sri Wahyuningsih
2, Ika Purnamasari
3
1Mahasiswa Program Studi Statistika Fakultas MIPA Universitas Mulawarman
2,3Dosen Program Studi Statistika Fakultas MIPA Universitas Mulawarman
E-mail: [email protected], [email protected]
3
Abstract
One of categorical data analysis is log linear models. Log linear models are used to look for patterns of
relationships between a group of categorial variables includes the association of two variables, three
variables, or more. Log linear models that include four associations of categorical variables called log
linear model of the four-dimensional. Log linear models was the most appropriate to interpret the pattern
of relationship. The purpose of this study is to elaborate the log linear model of four dimensions,
determine the minimum sufficient statistics for each model four-dimensional linear log, specify the
expected frequency estimate for the log linear model of four dimensions, and specify the most suitable
four dimensions log linear model for duration of internet access by students MAN Unggul Tenggarong.
Based on the research’s results, it is obtained that the log linear models for the four dimensions are 23
models. Each model has a different minimum sufficient statistics. SPSS is used to estimate the value of the
expected frequency. The results of model’s application on Internet access MAN Unggul Tenggarong
showed that, the most suitable log linear model four dimensions is XYZijk
WXYhij
YZjk
XZik
XYij
WZhk
WYhj
WXhi
Zk
Yj
Xi
Whhijk Log
Keywords: Categorical data analysis, log linear models, four dimention log linear models.
Pendahuluan
Dalam penelitian banyak ditemukan situasi
dimana data yang dikumpulkan dapat
dikategorikan menjadi satu atau lebih kategorik.
Seperti jenis kelamin (laki-laki dan perempuan),
tingkat pendidikan (SD,SMP, dan SMA) dan
masih banyak lagi lainnya. Data yang terdiri dari
beberapa kategori ini disebut data kategorik. Cara
yang digunakan untuk menyajikan data kategorik
agar sistematik perlu disusun dalam suatu tabel
klasifikasi silang yang disebut tabel kontingensi.
Untuk menganalisa data kategorik dapat
digunakan model log linier. Dalam analisis ini
akan dicari pola hubungan antar sekelompok
variabel kategori yang mencakup asosiasi dua
variabel, tiga variabel, atau lebih. Pola hubungan
ini disajikan dalam bentuk model log linier.
Model log linier yang paling tepat akan
digunakan untuk menginterpretasikan pola
hubungannya (Agresti, 2007).
Adapun aplikasi dari analisis log linier dapat
dijumpai di berbagai studi kasus. Seperti saat ini
yang peneliti lakukan yaitu mengenai akses
internet pada pelajar MAN Unggul Tenggarong.
Saat ini internet sudah menjadi kebutuhan pokok
bagi setiap orang terutama pelajar dan
mahasiswa. Hampir setiap hari pelajar mengakses
internet di berbagai warung internet (warnet),
smartphone ataupun melalui modem. Oleh
karena itu frekuensi seberapa lama pelajar
menggunakan fasilitas internet dipengaruhi
beberapa faktor (variabel). Dalam skripsi ini
variabel yang dimaksud yaitu jurusan kelas,
prestasi akademik, banyaknya uang saku
perbulan dan waktu yang diperlukan untuk akses
internet setiap harinya. Selanjutnya masing-
masing variabel tersebut dibagi menjadi beberapa
kategorik. Keempat variabel tersebut yang
mempengaruhi banyak dan sedikitnya jumlah
pelajar MAN Unggul Tenggarong di setiap sel
dalam tabel kontingensi.
Oleh karena model log linier dua dan tiga
dimensi telah banyak diturunkan dan
diaplikasikan, maka dari itu penulis ingin
menjabarkan model log linier dengan empat
dimensi secara umum dengan judul “Model log
linier untuk empat dimensi”.
Variabel Kategori
Variabel kategori adalah salah satu skala
pengukuran yang memiliki seperangkat kategori.
Seperti, philosophy politik yang sering diukur
dengan “liberal”, “moderate”, atau “conservative
(Agresti, 2002).
Tabel Kontingensi (Contingency)
Tabel yang memiliki I baris untuk variabel
X dan J kolom untuk variabel Y dengan IJ
sebagai hasil kombinasi probabilitasnya disebut
tabel kontingensi (contingency table) atau tabel
klasifikasi silang (cross-classification table).
Tabel yang mengklasifikasikan silang antara dua
variabel disebut tabel kontingensi dua arah (two
way contingency table). Tabel yang
Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829
102 Program Studi Statistika FMIPA Universitas Mulawarman
mengklasifikasikan silang tiga variabel disebut
tabel kontingensi tiga arah (three way
contingency table), dan begitu seterusnya.
(Agresti, 2002)
Independence of Categorical Variables
Secara statistik, independensi adalah
ekivalen dengan properti untuk semua
probabilitas gabungan sama dengan produk
probabilitas marjinalnya,
jiij untuk i=1,2,…,I , j=1,2,…,J. (1)
(Agresti, 2002).
Resiko Relatif
Resiko relatif didefinisikan sebagai rasio
2
1
(5)
Hal tersebut dapat berupa bilangan real non-
negatif. (Agresti, 2002).
Odds Rasio
Untuk probabilitas keberhasilan, odds
rasio didefinisikan sebagai
1 (6)
Menurut Agresti (2007), Odds rasio
merupakan bilangan non-negatif, dengan
ketika sukses lebih memungkinkan daripada
gagal. (Agresti, 2007).
Model Log Linier Dua Dimensi
a) Model Independensi
Variabel baris ditunjukkan dengan X dan
variabel kolom dengan Y. Syarat independensi
memiliki rumus perkalian (multiplikatif) yaitu
jiij n . Jadi, model independensi
memiliki rumus Yj
Xiij Log . (7)
Untuk efek pada baris dan kolom berturut-
turut adalah Xi dan Y
j . model ini disebut
model independensi log linier (log linier model of
independence) (Agresti, 2007). Parameter Xi
mempresentasikan efek dari pengklasifikasian
pada baris i. Semakin besar nilaiXi , semakin
besar juga setiap frekuensi harapan pada baris i,
begitu juga untuk Yj . (Agresti, 2007).
b) Model Lengkap (Saturated Model)
Variabel yang secara statistika dependen
biasanya memiliki model log linier yang lebih
kompleks, yaitu XYij
Yj
Xi ij Log (8)
Parameter XYij adalah istilah asosiasi yang
merefleksikan deviasi dari independensi.
Parameter ini mempresentasikan interaksi antara
X dan Y, dimana efek dari satu variabel pada
jumlah sel yang diharapkan bergantung pada
tingkat variabel lain. (Agresti, 2007)
Model Log Linier Tiga Dimensi
a) Model Independensi
Sebuah klasifikasi silang tiga
arah KJI pada variabel respon X, Y, Z
mempunyai beberapa potensi independensi.
Dengan diasumsikan bahwa sebuah distribusi
multinomial mempunyai probabilitas sel ijk ,
dan 1 i j k ijk . Model ini juga
mengaplikasikan sampling Poisson dengan
mean ijk .
Untuk frekuensi harapan ,
independensi yang saling bebas (mutual
independence) mempunyai rumus log linier
sebagai berikut: Zk
Yj
Xiijk Log untuk semua
i,j, dan k. (9)
(Agresti, 2007).
b) Model Lengkap
Model lengkap untuk log linier tiga dimensi
adalah XYZijk
YZjk
XZik
XYij
Zk
Yj
Xiijk Log
. (10)
dimana
IJK
I
i
J
j
K
kijk
1 1 1
log
JK
J
j
K
kijk
Xi
1 1
log
IK
I
i
K
kijk
Yj
1 1
log
IJ
I
i
J
jijk
Zk
1 1
log
,
logloglog1 11 11
IKJKK
I
i
K
kijk
J
j
K
kijk
K
kijk
XYij
,
logloglog1 11 11
IJIKI
I
i
J
jijk
I
i
K
kijk
I
iijk
YZjk
Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829
Program Studi Statistika FMIPA Universitas Mulawarman 103
,
logloglog1 11 11
IJJKJ
I
i
J
jijk
J
j
K
kijk
J
jijk
XZik
IJK
I
iijk
J
jijk
K
kijk
ijkXYZijk
111
logloglog
log
IKJK
I
i
K
kijk
J
j
K
kijk
1 11 1
loglog
+
IJ
I
i
J
jijk
1 1
log
,
Dengan syarat :
K
k
XYZijk
J
j
XYij
I
i
J
j
K
k
I
i
XYij
Zk
Yj
Xi
0...
Analisis Model Log Linier
a) Model Log Linier Dua Dimensi
Uji Goodness of fit
Statistik Chi-square telah banyak dikenal
dan dipergunakan untuk tabel kontingensi dua
dimensi. Nilai statistik dihitung berdasarkan
rumus sebagai berikut:
ji ij
ijij
E
EO
,
2
2 (11)
dengan:
Oij = Observasi pada variabel ke-i dan j
Eij = Frekuensi harapan dalam sel-ij
Statistik dengan distribusi Chi-square
mempunyai db = (i-1)(j-1) dimana i menyatakan
banyaknya baris dan j menyatakan kolom dari
suatu tabel. Tabel kontingensi 2 x 2 diperoleh
statistik Chi-square dengan derajat bebas
(db) = (2-1)(2-1) = 1.
Tabel 1 Tabel Frekuensi Menurut W dan X
Variabel X Variabel W
Jumlah W1 … Wj
X1 O11 … O1j B1
… … … … …
Xi Oi1 … Oij Bi
Jumlah K1 … Kj n
Berdasarkan Tabel 1, nilai Eij dapat dihitung
dengan memakai rumus:
Eij =n
KB ji (12)
Selain menggunakan statistik uji Chi-square,
perhitungan uji goodness of fit pada tabel
kontingensi dua dimensi dapat menggunakan
likelihood rasio yang dinyatakan sebagai
likelihood ratio Chi-square (G2) sebagai berikut:
i j ij
ij
ijE
OOG Log22 (13)
Statistik G2 juga mempunyai derajat bebas
(db) = (i-1)(j-1).
Uji Independensi
Dalam tabel kontingensi dua arah dengan
probabilitas gabungan untuk dua variabel
respon, hipotesis nol untuk independensi statistik
adalah
H0 : Kedua variabel independen
( jiij untuk semua i dan j).
Untuk menguji H0, diidentifikasi
jiijij nn sebagai frekuensi harapan.
Untuk mengestimasi frekuensi harapan, subtitusi
proporsi sampel untuk probabilitas marjinal yang
tidak diketahui, maka
n
nn
n
n
n
nnpnp
jijijiij
(14)
Tanda ij disebut estimasi frekuensi harapan
(estimated expectation frequencies). (Agresti,
2007).
Uji Homogenitas
Uji homogenitas digunakan untuk
mengetahui apakah dua variabel bersifat
homogen atau tidak.
Dengan hipotesis
H0 : Kedua variabel bersifat homogen.
Hipotesis nol (H0) akan ditolak apabila
2hitung ≥
dan derajat bebas (db)
adalah (b-1)(k-1) dengan
bk
bkbk
E
EO2
2hitung .
b) Model Log Linier Tiga Dimensi
Menentukan Statistik Cukup Minimal
dan Fungsi Likelihood
Diasumsikan sebuah sampel ijkn untuk
klasifikasi silang dari variabel-variabel X, Y dan
Z. Diasumsikan variabel X, Y dan Z adalah
variabel random Poisson dengan nilai frekuensi
harapan ijk . Fungsi kepadatan probabilitas
Poisson bersama dari ijkn adalah
i j k ijk
n
ijk
n
e ijkijk
!
)(
(15)
dengan
ijk : frekuensi harapan
ijkn : frekuensi pengamatan pada
beris ke-i, kolom ke-j dan layer
ke-k.
Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829
104 Program Studi Statistika FMIPA Universitas Mulawarman
i j k
: hasil kali seluruh frekuensi sel
dalam tabel.
Model log linier untuk tabel tiga dimensi
secara umum dapat disajikan dalam parsamaan
berikut XYZijk
YZjk
XZik
XYij
Zk
Yj
Xiijk Log
XYZijk
YZjk
XZik
XYij
Zk
Yj
Xiijk exp
kemudian dibentuk log likelihood dari model
di atas sehingga diperoleh
YZjk
j kjk
XZik
i kki
XYij
i jij
Zk
ik
Yj
ij
Xi
ii
nnn
nnnnL
i j
XYZijk
YZjk
XZik
XYij
Zk
Yj
Xi
k
XYZijk
i j kijkn
exp
(16)
dengan adalah parameter dalam model
(Bain dan Engelhardt, 1992).
Differensial terhadap masing-masing
parameternya diperoleh
i j k
YZjk
XZik
Zk
Yj
Xin
L)exp(
)(
Karena
YZjk
XYik
Zk
Yj
Xiijk log
)exp( YZjk
XYik
Zk
Yj
Xiijk
Sehingga
i j kijkn
L
)(
Jika 0)(
Lmaka,
i j k
ijkn 0
i j k
ijkn
n (17)
n
berarti frekuensi harapan total
sama dengan frekuensi pengamatan total
sehingga hasilnya dapat dilihat pada Tabel 3
(Bain dan Engelhardt, 1991).
Estimasi Frekuensi Harapan
Misalkan diberikan sebuah simbol model
(XY, YZ) dengan X dan Y adalah variabel bebas
dan Z merupakan variabel terikat. Probabilitas sel
ke-ij dengan diketahui probabilitas sel ke-k,
dinotasikan dengan untuk X dan Y adalah:
ijkk
ki jk (18)
Karena pengambilan sampel yang
berdistribusi Poisson, maka rumus yang
berkaitan dengan frekuensi harapan
dengan ijkijkijk
ijknF
n
F yaitu:
k
jkki
k
ki jk
k
ki jk
ijk
nnnF
ˆ
ˆˆ
Menurut persamaan (20) dan kk n
maka diperoleh:
k
jkki
ijkn
nn
(19)
Jadi, nilai estimasi frekuensi harapannya
menyesuaikan dengan masing-masing model.
Tabel 3 Tabel Statistik Cukup Minimal
Model Statistik Cukup Minimal
(X,Y,Z)
(XY,Z)
(XZ,Y)
(YZ,X)
(XY,YZ)
(XZ,YZ)
(XY,XZ)
(XY,XZ,YZ)
(XYZ)
Uji Goodness of fit
Untuk tabel kontingensi tiga dimensi, uji
likelihood rasio adalah
i j k ijk
ijk
ijk
nnG
log22
(20)
dan uji Chi-Square adalah
i j k ijk
ijkijkn
ˆ
ˆ2 (21)
Hipotesis yang diuji adalah :
H0 : Model log linier yang digunakan sesuai.
Apabila 2hitung ≥ 2
)(db maka hipotesis nol
(H0) ditolak, dan derajat bebas (db) untuk
masing-masing model log linier tiga dimensi
dapat dilihat pada Tabel 4 (Agung, 2002).
Partisi Chi-Square
Diberikan dua model parameter m1 dan m2
dengan m2 kasus khusus dari m1. Karena m2 lebih
sederhana dari m1 maka model m2 dikatakan
bersusun dengan m1, v1 dan v2 derajat bebas
sesaat dan v1 lebih kecil dari v2 maka
. (22)
Oleh sebab itu, diperoleh
mendekati distribusi Chi-square dengan derajat
bebas v2 - v1 (Agresti, 2002).
Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829
Program Studi Statistika FMIPA Universitas Mulawarman 105
Tabel 4 Derajat Bebas Model Log Linear
Pada Tabel Kontingensi Berdimensi Tiga
No. Model Derajat Bebas
1 ( X,Y,Z) IJK – I – J – K + 2
2 (XY, Z) )1)(1( KIJ
3 (XZ, Y) )1)(1( JIK
4 (YZ, X) )1)(1( IJK
5 (XY, XZ) )1)(1( KJI
6 (XY, YZ) )1)(1( KIJ
7 (XZ, YZ) )1)(1( JIK
8 (XY, XZ, YZ) )1)(1)(1( KJI
9 (XYZ) 0
Variabel Penelitian
Variabel yang digunakan pada penelitian
terdapat 4 variabel, yaitu Jurusan Kelas (variable
W) yang dibagi menjadi 2 kategori, yaitu IPA dan
IPS, Prestasti Akademik (variabel X) yang dibagi
menjadi 3 kategori yaitu tinggi (peringkat 1 –
10), sedang (peringkat 11 – 20) dan rendah
(peringkat lebih dari 20), uang saku perhari
(variabel Y) yang dibagi menjadi 3 kategori yaitu
tinggi (lebih dari Rp. 20.000) , sedang (Rp.
11.000 – Rp. 20.000) dan rendah (kurang dari Rp.
10.000), dan akses internet perhari (variabel Z)
yang dibagi menjadi 4 kategori yaitu sangat lama
(lebih dari 2 jam), lama (1 – 2 jam), cukup
lama(0,5 – 1 jam) dan sebentar (kurang dari 0,5
jam)..
Hasil dan Pembahasan
Model Log Linier Empat Dimensi
a) Model Independensi
Jika W menyatakan variabel baris, X
menyatakan variabel kolom, Y menyatakan
variabel layer pertama dan Z merupakan variabel
layer kedua. Dengann h merupakan jumlah baris,
i merupakan jumlah kolom, j merupakan jumlah
layer pertama dan k merupakan jumlah layer
kedua.
Jika diketahui P (W,X,Y,Z) = hijk yang saling
bebas sehingga :
,kjihhijk
(23)
Peluang pengamatan dapat ditaksir dari frekuensi
pengamatan maka diperoleh Persamaan :
,,,
n
n
n
n
n
n j
ji
ih
h
dan ,
n
n kk
(24)
dengan ,
sehingga frekuensi nilai harapannya diberikan
dalam Persamaan :
,kjih
hijkhijk
n
n
(25)
Jika persamaan (25) dinyatakan dalam
bentuk skala logaritma, maka didapatkan :
,loglog
loglogloglog
kj
ihijk n
(26)
jika semua variabel independen, maka log dari
frekuensi harapan untuk sel (h, i, j, k) sehingga
persamaan (27) ekuivalen dengan
,log Zk
Yj
Xi
Whhijk (28)
dimana :
HIJK
H
h
I
i
J
j
K
khijk
1 1 1 1
log
IJK
I
i
J
j
K
khijk
Wh
1 1 1
log
HJK
H
h
J
j
K
khijk
Xi
1 1 1
log
HIK
H
h
I
i
K
khijk
Yj
1 1 1
log
HIJ
H
h
I
i
J
jhijk
Zk
1 1 1
log
dengan syarat :
H
h
I
i
K
k
Zk
J
j
Yj
Xj
Wh
1 1 11
0
b) Model Lengkap
Model yang memuat interaksi keempat
variabelnya merupakan model lengkap, yaitu :
WXYZhijk
XYZhjk
WYZhjk
WXZhik
WXYhij
YZjk
XZik
XYij
WZhk
WYhj
WXhi
Zk
Yj
Xi
Whhijk
log
(29)
dengan Zk
Yj
Xi
Wh ,,,, Sebagaimana
dinyatakan pada persamaan (28) dan nilai
parameter lainnya adalah:
Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829
106 Program Studi Statistika FMIPA Universitas Mulawarman
HJK
IJKJKH
h
J
j
K
khijk
I
i
J
j
K
khijk
J
j
K
khijk
WXhi
1 1 1
1 1 11 1
log
loglog
HIK
IJKIKH
h
I
i
K
khijk
I
i
J
j
K
khijk
I
i
K
khijk
WYhj
1 1 1
1 1 11 1
log
loglog
HIJ
IJKIJH
h
I
i
J
jhijk
I
i
J
j
K
khijk
I
i
J
jhijk
WZhk
1 1 1
1 1 11 1
log
loglog
HIK
HJKHKH
h
I
i
K
khijk
H
h
J
j
K
khijk
H
h
K
khijk
XYij
1 1 1
1 1 11 1
log
loglog
HJKHJ
H
h
J
j
K
khijk
H
h
J
jhijk
XZik
1 1 11 1
loglog
HIJ
H
h
I
i
J
jhijk
1 1 1
log
HIJHI
H
h
I
i
J
jhijk
H
h
I
ihijk
YZjk
1 1 11 1
loglog
HIK
H
h
I
i
K
khijk
1 1 1
log
HIKHJK
IJKIK
HKJKK
H
h
I
i
K
khijk
H
h
J
j
K
khijk
I
i
J
j
K
khijk
I
i
K
khijk
H
h
K
khijk
J
j
K
khijk
K
khijk
WXYhij
1 1 11 1 1
1 1 11 1
1 11 11
loglog
loglog
logloglog
HIJHJK
IJKJK
IJHJJ
H
h
I
i
J
jhijk
H
h
J
j
K
khijk
I
i
J
j
K
khijk
J
j
K
khijk
I
i
J
jhijk
H
h
J
jhijk
J
jhijk
WXZhik
1 1 11 1 1
1 1 11 1
1 11 11
loglog
loglog
logloglog
HIJHIK
IJKIK
IJHII
H
h
I
i
J
jhijk
H
h
I
i
K
khijk
I
i
J
j
K
khijk
I
i
K
khijk
I
i
J
jhijk
H
h
I
ihijk
I
ihijk
WYZhjk
1 1 11 1 1
1 1 11 1
1 11 11
loglog
loglog
logloglog
HI
JKH
hhijk
I
ihijk
J
jhijk
K
khijk
hijkWXYZhijk
11
11
loglog
loglog
log
HJHI
H
h
J
jhijk
H
h
I
ihijk
1 11 1
loglog
IJHK
I
i
J
jhijk
H
h
K
khijk
1 11 1
loglog
HIJHIK
HJKIJK
JKIK
H
h
I
i
J
jhijk
H
h
I
i
K
khijk
H
h
J
j
K
khijk
I
i
J
j
K
khijk
J
j
K
khijk
I
i
K
khijk
1 1 11 1 1
1 1 11 1 1
1 11 1
loglog
loglog
loglog
dengan syarat :
H
h
I
i
H
h
I
i
J
j
K
k
WXYZhijk
WXhi
K
k
Zk
J
j
Yj
I
i
Xi
H
h
Wh
λλ1 1 1 1 1 1
1111
0
Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829
Program Studi Statistika FMIPA Universitas Mulawarman 107
Analisis Model Log Linier Empat Dimensi
a) Menentukan Statistik Cukup Minimal
Jika sebuah sampel untuk klasifikasi
silang dari variabel-variabel W, X, Y dan Z,
diasumsikan bahwa variabel W, X, Y dan Z
adalah variabel random Poisson dengan nilai
frekuensi harapan , maka fungsi kepadatan
probabilitas Poisson bersama dari adalah
h i j k hijk
nhijk
n
e hijkhijk
!
(30)
dengan
: frekuensi harapan
: frekuensi pengamatan pada baris ke-h,
kolom ke-i, layer pertama ke-j serta, layer kedua
ke-k.
: hasil kali seluruh frekuensi sel
dalam tabel.
Dalam bentuk logaritma, persamaan (40) dapat
ditulis
h i j h i j k
hijkk
hijkhijknL Log)(
Model log linier untuk tabel empat dimensi
secara umum dapat disajikan dalam parsamaan
berikut
WXYZhijk
XYZijk
WYZhjk
WXZhik
WXYhij
YZjk
XZik
XYij
WZhk
WYhj
WXhi
Zk
Yj
Xi
Whhijk
Log
)
exp(
WXYZhijk
XYZijk
WYZhjk
WXZhik
WXYhij
YZjk
XZik
XYij
WZhk
WYhj
WXhi
Zk
Yj
Xi
Whhijk
kemudian dibentuk log likelihood dari model di
atas sehingga diperoleh
Xi
ii
Wh
hh nnnL
WXhi
h ihi
Zk
kk
Yj
jj nnn
WXYZhijk
h i j khijk
XYZijk
i j kijk
WYZhjk
h j kjkh
WXZhik
h i kkhi
WXYhij
h i jhij
YZjk
j kjk
XZik
i kki
XYij
i jij
WZhk
h kkh
WYhj
h jjh
nn
nn
nn
nn
nn
(31)
XYij
WZhk
WYhj
WXhi
Zk
Yj
Xi
Wh
h i j k
exp(
)XYZijk
WYZhjk
WXZhik
WXYhij
YZjk
XZik
dengan adalah parameter dalam model.
Differensial terhadap masing-masing
parameternya sehingga diperoleh
)
exp()(
WXYZhijk
XYZijk
WYZhjk
WXZhik
WXYhij
YZjk
XZik
XYij
WZhk
WYhj
WXhi
Zk
h i j k
Yj
Xi
Whn
L
Karena
WXYZhijk
XYZijk
WYZhjk
WXZhik
WXYhij
YZjk
XZik
XYij
WZhk
WYhj
WXhi
Zk
Yj
Xi
Whhijk
log
)
exp(
WXYZhijk
XYZijk
WYZhjk
WXZhik
WXYhij
YZjk
XZik
XYij
WZhk
WYhj
WXhi
Zk
Yj
Xi
Whhijk
Sehingga
h i j khijkn
L
)(
Jika 0)(
Lmaka,
h i j k
hijkn 0
h i j k
hijkn
nn
Dengan demikian akan diperoleh fungsi
likelihood sebagai berikut:
= n = =
= = =
= = =
= = =
= = =
(32)
Dalam persamaan (32)
dan seterusnya
merupakan koefisien dari masing – masing
parameter maka dan
seterusnya adalah statistik cukup minimal. Tabel
5 menunjukkan contoh model beserta statistik
cukup minimalnya.
Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829
108 Program Studi Statistika FMIPA Universitas Mulawarman
b) Estimasi Frekuensi Harapan
Misalkan sebuah model log linier empat
dimensi (W, X, Y, Z) dengan W, X, Y dan Z
adalah variabel bebas dan berdasarkan persamaan
(32) sehingga estimasi frekuensi harapan untuk
model (W, X, Y, Z) adalah:
n
nnnn kjih
hijk
(33)
c) Uji Goodness of fit
Berdasarkan pada uji goodness of fit pada
tabel kontingensi tiga dimensi, maka dapat
dirumuskan rumus goodness of fit untuk tabel
empat dimensi sebagai berikut:
h i j hijk
hijk
khijk
nnG
log22
(34)
dan uji Chi-square adalah
h i j k hijk
hijkhijkn
2 (35)
Hipotesis yang diuji adalah :
H0 : Model log linier yang digunakan sesuai
H1 : Model log linier yang digunakan tidak
sesuai
Apabila 2hitung ≥
2tabel maka hipotesis nol (H0)
ditolak, dan derajat bebas (db) untuk masing-
masing model log linier empat dimensi dapat
dilihat pada Tabel 6 di bawah ini.
Tabel 6 Derajat Bebas Model Log Linear Empat
Dimensi
d) Pemilihan Model
Pemilihan model terbaik dilakukan secara
bertahap. Dimulai dengan pemilihan model yang
dilakukan dengan memilih nilai G2 yang relatif
kecil (lebih kecil dari ) diantara kombinasi
model yang sesuai dengan dimensinya. Jika
dengan kriteria tersebut diperoleh beberapa
model maka dilakukan pemilihan model terbaik
dengan partisi Chi-square. Sehingga diharapkan
model terbaik yang diperoleh merupakan model
yang sederhana.
Aplikasi Data yang digunakan pada contoh ini
merupakan data lamanya akses internet siswa-
siswi kelas 2 dan 3 MAN Unggul Tenggarong
menurut jurusan kelas, prestasi akademik, dan
uang saku perhari. Data tersebut akan
diaplikasikan dalam analisis model log linier
empat dimensi.
a) Uji Validitas
Dilakukan uji validitas untuk masing – masing
butir pertanyaan dengan hipotesis :
H0 : Butir pertanyaan tidak valid
H1 : Butir pertanyaan valid
Dengan taraf signifikansi = 5% dan
daerah kritik menolak H0 apabila p-value < .
Menggunakan software SPSS versi 20, diperoleh
p-value seperti pada Tabel 7. Keputusan yang
dapat diambil berdasarkan hasil analisis adalah
menolak H0 untuk kesemua butir pertanyaan
karena memiliki nilai p-value < . Dengan
demikian dapat disimpulkan bahwa semua butir
pertanyaan tersebut valid, kemudian butir
pertanyaan yang valid berlanjut dengan pengujian
reliabilitas.
Tabel 7 Hasil Uji Validitas Menggunakan
Software SPSS V.20
Butir pertanyaan Pearson
Correlation
Sig.
(2-
tailed)
N
Jurusan kelas (butir
1) 0,275 0,006 100
Web yang dikunjungi
(butir 2) 0,529 0,000 100
Lamanya akses
internet perhari
(butir 3)
0,511 0,004 100
Uang saku perhari
(butir 4) 0,473 0,005 100
Prestasi akademik
(butir 5) 0,433 0,000 100
b) Uji Reliabilitas
Tabel 8 Hasil Uji Reliabilitas Menggunakan
Software SPSS V.20
Reliability Statistics
Cronbach's Alpha N of Items
0,210 5
Dilakukan uji reliabilitas untuk masing – masing
butir pertanyaan dengan hipotesis :
H0 : Butir pertanyaan tidak reliabel
H1 : Butir pertanyaan reliabel
Dengan taraf signifikansi = 5% dan
daerah kritik menolak H0 apabila Rhitung > Rtabel.
Rtabel. Menggunakan software SPSS versi 20,
diperoleh Rhitung seperti pada tabel 4.4 dengan
taraf signifikansi = 5% berdasarkan tabel R
diperoleh nilai Rtabel = 0,195 untuk db = 98.
Keputusan yang dapat diambil berdasarkan hasil
analisis adalah menolak H0 karena memiliki nilai
Rhitung = 0,210 > Rtabel = 0,195. Dengan demikian
dapat disimpulkan bahwa semua butir pertanyaan
reliabel.
c) Menentukan Statistik Cukup Minimal
Statistik cukup minimal dari model-model
loglinier merupakan koefisien dari masing-
masing parameternya. Koefisien parameter ini
diperoleh dari pengumpulan atau penjumlahan
batas marjinal
Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829
Program Studi Statistika FMIPA Universitas Mulawarman 109
d) Fungsi Likelihood
Setelah diperoleh statistik cukup minimal
masing-masing model, selanjutnya dilakukan
estimasi fungsi likelihood.
e) Estimasi Frekuensi Harapan
Setelah ditentukan statistik cukup minimal
dan fungsi likelihood untuk semua modelnya,
barulah dapat ditentukan estimasi frekuensi
harapan.
f) Uji Goodness of fit
Dari model-model tersebut, kemudian
dilakukan uji kecocokan model (goodness of fit)
dengan data yang digunakan. Uji kecocokan
model ini bertujuan mencari model mana saja
yang cocok dengan data yang digunakan.
Hipotesis yang digunakan adalah :
H0 : Model yang digunakan sesuai
H1 : Model yang digunakan tidak sesuai
dengan taraf signifikansi (α = 0,05) dan statistik
uji
h i j hijk
hijk
khijk
nnG
log22
serta daerah
kritis menolak H0 bila G2 ≥ tabel.
Dengan menggunakan software SPSS versi 20
didapatkan nilai G2 untuk masing-masing model
seperti pada Tabel 9.
Chi-square Table didapat dari tabel Chi-square
dengan derajat bebas (db) dan probabilitas
(α = 0.05) tertentu. Berdasarkan Tabel 12 di atas,
maka terlihat bahwa dari semua model yang ada
terdapat tigabelas(13) model memiliki nilai
likelihood ratio (G2) yang lebih kecil dari nilai
Chi-square table. Sehingga ketigabelas model
tersebut yang cocok adalah model no. 1, 2, 3, 4,
5, 6, 7,8, 9, 10, 12, 14, 15.
g) Partisi Chi-square
Dari ketigabelas model tersebut kemudian
dilakukan pemilihan model terbaik untuk data.
Pemilihan model ini menggunakan statistik uji
partisi Chi-square. Berikut ditampilkan nilai-nilai
likelihood ratio (G2), derajat bebas (db) dan
selisihnya untuk masing-masing model.
1. Model (WXY,WXZ,WYZ,XYZ) cocok
dengan data karena
G2[(WXY,WXZ,WYZ,XYZ)|(WXYZ)] =
7,769 dan lebih kecil dari Chi-square table
dengan derajat bebas 12 dan α = 0.05
(21,026).
2. Model (WXZ,WYZ,XYZ) cocok dengan
data karena G2[(WXZ,WYZ,XYZ)|(
WXY,WXZ,WYZ,XYZ) = 3,075 dan lebih
kecil dari Chi-square table dengan derajat
bebas 4 dan α = 0.05 (9,488).
Perhitungan partisi chi-square untuk model-
model yang lainnya menggunakan cara yang
sama seperti dua pada contoh.
Dari model-model yang cocok dengan data
tersebut, dipilih model terbaik yang memiliki
selisih G2 paling kecil. Sehingga model terbaik
untuk data adalah (WXY,XYZ).
Tabel 10 Selisih Likelihood Ratio dan Derajat
Bebas Untuk Masing-Masing Model.
No Model db Selisih
db G2
Selisih
G2
1 (WXYZ) 0 - 0 -
2
(WXY,WX
Z,XYZ,W
YZ) 12 12 7.769 7.769
3
(WXZ,WY
Z,XYZ) 16 4 10.844 3.075
4
(WXY,WX
Z,XYZ) 18 2 13.869 3.025
5
(WXZ,XY
Z,WY) 22 4 22.977 9.108
6
(WXY,XY
Z) 27 5 23.117 0.14
7
(WXY,WX
Z,YZ) 30 3 33.079 9.962
8
(WXZ,WY,
XY,YZ) 34 4 43.896 10.817
9
(WXY,WZ,
XZ,YZ) 36 2 42.036 -1.86
10
(WXY,XZ,
YZ) 39 3 44.538 2.502
11
(WX,WY,X
Y,XZ,YZ,
WZ) 40 1 51.697 7.159
12
(WX,WY,X
Y,XZ,YZ) 43 3 53.7 2.003
13 (WXY,YZ) 45 2 61.518 7.818
Kesimpulan
Berdasarkan hasil penelitian yang telah
dilakukan dapat disimpulkan bahwa terdapat 23
variasi model log linier yang memungkinkan
untuk di uji pada empat dimensi. Masing-masing
model memiliki statistik cukup minimal yang
berbeda-beda. Estimasi frekuensi harapan untuk
masing-masing modelnya juga berbeda-beda
dengan derajat bebas yang berbeda pula. Namun
dari ke-23 model tersebut dapat dilakukan uji
kecocokan model dengan menggunakan uji chi-
square dan likelihood. Uji partisi chi-square
dilakukan untuk mencari model terbaik. Dalam
contoh kasus lamanya akses internet siswa MAN
Unggul Tenggarong terlihat bahwa, model log
linier empat dimensi yang cocok adalah
Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829
110 Program Studi Statistika FMIPA Universitas Mulawarman
XYZijk
WXYhij
YZjk
XZik
XYij
WZhk
WYhj
WXhi
Zk
Yj
Xi
Whhijk
Log
Daftar Pustaka
Agresti, Alan. 2002. Categorical Data Analysis
Second Edition. New York : John Wiley &
Sons.
___________ . 2007. An Introduction To
Categorical Data Analysis Second Edition.
New York : John Wiley & Sons.
Agung, I Gusti Ngurah. 2002. STATISTIKA:
Analisis Hubungan Kausal Berdasarkan
Data Kategorik. Jakarta: Rajawali Press.
Bain, L.J & Engelhardt, E. 1992. Introduction to
Probability and Mathematical Statistics.
California: Duxbury Press.
Tabel 5 Tabel Statistik Cukup Minimal
No Model Statistik Cukup Minimal
1 (WXYZ) {nhijk}
2 (WXY,WXZ,XYZ,W
YZ) {nhij+}, {nhi+k}, {n+ijk},{nh+jk}
3 (WXY,WXZ,XYZ) {nhij+},{nhi+k},{n+ijk}
4 (WXZ,WYZ,XYZ) {nhi+k},{nh+jk},{n+ijk}
5 (WXY,XYZ) {nhij+},{n+ijk}
6 (WXY,WXZ,YZ) {nhij+},{nhi+k},{n++jk}
7 (WXZ,XYZ,WY) {nhi+k},{n+ijk},{nh+j+}
8 (WXZ,WY,XY,YZ) {nhi+k},{nh+j+},{n+ij+},{n++jk}
9 (WXY,WZ,XZ,YZ) {nhij+},{nh++k},{n+i+k},{n++jk}
10 (WXY,XZ,YZ) {nhij+},{n+i+k},{n++jk}
11 (WXZ,WY,XY) {nhi+k},{nh+j+},{n+ij+}
12 (WXY,YZ) {nhij+},{n++jk}
13 (WXY,Z) {nhij+},{n+++k}
14 (WX,WY,XY,
XZ,YZ,WZ)
{nhi++},{nh+j+},{n+ij+},{n+i+k},{n
++jk},{nh++k}
15 (WX,WY,XY,
XZ,YZ)
{nhi++},{nh+j+},{n+ij+},{n+i+k},{n
++jk}
16 (WX,WY,XY,YZ) {nhi++},{nh+j+},{n+ij+},{n++jk}
17 (WX,WY,WZ) {nhi++},{nh+j+},{nh++k}
18 (WX,XY,YZ) {nhi++},{n+ij+},{n++jk}
19 (WX,WY,XY,Z) {nhi++},{nh+j+},{n+ij+},{n+++k}
20 (WX,YZ) {nhi++},{n++jk}
21 (WX,XY,Z) {nhi++},{n+ij+},{n+++k}
22 (WX,Y,Z) {nhi++},{n++j+},{n+++k}
23 (W,X,Y,Z) {nh+++},{n+i++},{n++j+},{n+++k}
Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829
Program Studi Statistika FMIPA Universitas Mulawarman 111
Tabel 6 Derajat Bebas Model Log Linear Empat Dimensi
No Model Derajat Bebas (db)
1 (WXYZ) 0
2 (WXY,WXZ,XYZ,WYZ)
3 (WXY,WXZ,XYZ)
4 (WXZ,WYZ,XYZ)
5 (WXY,XYZ)
6 (WXY,WXZ,YZ)
7 (WXZ,XYZ,WY)
8 (WXZ,WY,XY,YZ)
9 (WXY,WZ,XZ,YZ)
10 (WXY,XZ,YZ)
11 (WXZ,WY,XY)
12 (WXY,YZ)
13 (WXY,Z)
14 (WX,WY,XY,
XZ,YZ,WZ)
15 (WX,WY,XY,
XZ,YZ)
16 (WX,WY,XY,YZ)
17 (WX,WY,WZ)
18 (WX,XY,YZ)
19 (WX,WY,XY,Z)
20 (WX,YZ)
21 (WX,XY,Z)
22 (WX,Y,Z)
23 (W,X,Y,Z)
Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829
112 Program Studi Statistika FMIPA Universitas Mulawarman
Tabel 9. Nilai-Nilai G2 Beserta Chi-square Table untuk Uji Kecocokan Model
No Model db G2
P-
value
Chi-
square
Table
1 (WXYZ) 0 0 0 0,000
2 (WXY,WXZ,
XYZ,WYZ) 12 7,769 0,803 21,026
3 (WXY,WXZ,
XYZ) 18 13,869 0,738 28,869
4 (WXZ,WYZ,
XYZ) 16 10,844 0,819 26,296
5 (WXY,XYZ) 27 23,117 0,679 40,113
6 (WXY,WXZ,
YZ) 30 33,079 0,319 43,773
7 (WXZ,XYZ,
WY) 22 22,977 0,403 33,924
8 (WXZ,WY,X
Y,YZ) 34 43,896 0,119 48,602
9 (WXY,WZ,X
Z,YZ) 36 42,036 0,226 50,998
10 (WXY,XZ,YZ
) 39 44,538 0,250 54,572
11 (WXZ,WY,X
Y) 40 59,909 0,022 55,758
12 (WXY,YZ) 45 61,518 0,051 61,656
13 (WXY,Z) 51 77,775 0,009 68,669
14 (WX,WY,XY,
XZ,YZ,WZ) 40 51,697 0,102 55,758
15 (WX,WY,XY,
XZ,YZ) 43 53,700 0,127 59,304
16 (WX,WY,XY,
YZ) 49 70,683 0,023 66,339
17 (WX,WY,WZ
) 56 87,990 0,004 74,468
18 (WX,XY,YZ) 51 72,891 0,024 68,669
19 (WX,WY,XY,
Z) 55 86,940 0,004 73,311
20 (WX,YZ) 55 80,885 0,013 73,311
21 (WX,XY,Z) 57 89,148 0,004 75,624
22 (WX,Y,Z) 61 97,142 0,002 80,232
23 (W,X,Y,Z) 63 105,234 0,001 82,529