12
Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829 Program Studi Statistika FMIPA Universitas Mulawarman 101 Model Log Linier untuk Empat Dimensi Log Linier Model for Four Dimentions M. Aris Budiyono 1 , Sri Wahyuningsih 2 , Ika Purnamasari 3 1 Mahasiswa Program Studi Statistika Fakultas MIPA Universitas Mulawarman 2,3 Dosen Program Studi Statistika Fakultas MIPA Universitas Mulawarman E-mail: [email protected] 1 , [email protected] 2 , [email protected] 3 Abstract One of categorical data analysis is log linear models. Log linear models are used to look for patterns of relationships between a group of categorial variables includes the association of two variables, three variables, or more. Log linear models that include four associations of categorical variables called log linear model of the four-dimensional. Log linear models was the most appropriate to interpret the pattern of relationship. The purpose of this study is to elaborate the log linear model of four dimensions, determine the minimum sufficient statistics for each model four-dimensional linear log, specify the expected frequency estimate for the log linear model of four dimensions, and specify the most suitable four dimensions log linear model for duration of internet access by students MAN Unggul Tenggarong. Based on the research’s results, it is obtained that the log linear models for the four dimensions are 23 models. Each model has a different minimum sufficient statistics. SPSS is used to estimate the value of the expected frequency. The results of model’s application on Internet access MAN Unggul Tenggarong showed that, the most suitable log linear model four dimensions is XYZ ijk WXY hij YZ jk XZ ik XY ij WZ hk WY hj WX hi Z k Y j X i W h hijk Log Keywords: Categorical data analysis, log linear models, four dimention log linear models. Pendahuluan Dalam penelitian banyak ditemukan situasi dimana data yang dikumpulkan dapat dikategorikan menjadi satu atau lebih kategorik. Seperti jenis kelamin (laki-laki dan perempuan), tingkat pendidikan (SD,SMP, dan SMA) dan masih banyak lagi lainnya. Data yang terdiri dari beberapa kategori ini disebut data kategorik. Cara yang digunakan untuk menyajikan data kategorik agar sistematik perlu disusun dalam suatu tabel klasifikasi silang yang disebut tabel kontingensi. Untuk menganalisa data kategorik dapat digunakan model log linier. Dalam analisis ini akan dicari pola hubungan antar sekelompok variabel kategori yang mencakup asosiasi dua variabel, tiga variabel, atau lebih. Pola hubungan ini disajikan dalam bentuk model log linier. Model log linier yang paling tepat akan digunakan untuk menginterpretasikan pola hubungannya (Agresti, 2007). Adapun aplikasi dari analisis log linier dapat dijumpai di berbagai studi kasus. Seperti saat ini yang peneliti lakukan yaitu mengenai akses internet pada pelajar MAN Unggul Tenggarong. Saat ini internet sudah menjadi kebutuhan pokok bagi setiap orang terutama pelajar dan mahasiswa. Hampir setiap hari pelajar mengakses internet di berbagai warung internet (warnet), smartphone ataupun melalui modem. Oleh karena itu frekuensi seberapa lama pelajar menggunakan fasilitas internet dipengaruhi beberapa faktor (variabel). Dalam skripsi ini variabel yang dimaksud yaitu jurusan kelas, prestasi akademik, banyaknya uang saku perbulan dan waktu yang diperlukan untuk akses internet setiap harinya. Selanjutnya masing- masing variabel tersebut dibagi menjadi beberapa kategorik. Keempat variabel tersebut yang mempengaruhi banyak dan sedikitnya jumlah pelajar MAN Unggul Tenggarong di setiap sel dalam tabel kontingensi. Oleh karena model log linier dua dan tiga dimensi telah banyak diturunkan dan diaplikasikan, maka dari itu penulis ingin menjabarkan model log linier dengan empat dimensi secara umum dengan judul “Model log linier untuk empat dimensi”. Variabel Kategori Variabel kategori adalah salah satu skala pengukuran yang memiliki seperangkat kategori. Seperti, philosophy politik yang sering diukur dengan “liberal”, “moderate”, atau “conservative (Agresti, 2002). Tabel Kontingensi (Contingency) Tabel yang memiliki I baris untuk variabel X dan J kolom untuk variabel Y dengan IJ sebagai hasil kombinasi probabilitasnya disebut tabel kontingensi (contingency table) atau tabel klasifikasi silang (cross-classification table). Tabel yang mengklasifikasikan silang antara dua variabel disebut tabel kontingensi dua arah (two way contingency table). Tabel yang

Model Log Linier untuk Empat Dimensi - fmipa.unmul.ac.id13] Jurnal M Aris Edit.pdf · tingkat pendidikan (SD,SMP, dan SMA) dan masih banyak lagi lainnya. Data yang terdiri dari beberapa

  • Upload
    vodang

  • View
    223

  • Download
    0

Embed Size (px)

Citation preview

Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 101

Model Log Linier untuk Empat Dimensi

Log Linier Model for Four Dimentions

M. Aris Budiyono1, Sri Wahyuningsih

2, Ika Purnamasari

3

1Mahasiswa Program Studi Statistika Fakultas MIPA Universitas Mulawarman

2,3Dosen Program Studi Statistika Fakultas MIPA Universitas Mulawarman

E-mail: [email protected], [email protected]

2, [email protected]

3

Abstract

One of categorical data analysis is log linear models. Log linear models are used to look for patterns of

relationships between a group of categorial variables includes the association of two variables, three

variables, or more. Log linear models that include four associations of categorical variables called log

linear model of the four-dimensional. Log linear models was the most appropriate to interpret the pattern

of relationship. The purpose of this study is to elaborate the log linear model of four dimensions,

determine the minimum sufficient statistics for each model four-dimensional linear log, specify the

expected frequency estimate for the log linear model of four dimensions, and specify the most suitable

four dimensions log linear model for duration of internet access by students MAN Unggul Tenggarong.

Based on the research’s results, it is obtained that the log linear models for the four dimensions are 23

models. Each model has a different minimum sufficient statistics. SPSS is used to estimate the value of the

expected frequency. The results of model’s application on Internet access MAN Unggul Tenggarong

showed that, the most suitable log linear model four dimensions is XYZijk

WXYhij

YZjk

XZik

XYij

WZhk

WYhj

WXhi

Zk

Yj

Xi

Whhijk Log

Keywords: Categorical data analysis, log linear models, four dimention log linear models.

Pendahuluan

Dalam penelitian banyak ditemukan situasi

dimana data yang dikumpulkan dapat

dikategorikan menjadi satu atau lebih kategorik.

Seperti jenis kelamin (laki-laki dan perempuan),

tingkat pendidikan (SD,SMP, dan SMA) dan

masih banyak lagi lainnya. Data yang terdiri dari

beberapa kategori ini disebut data kategorik. Cara

yang digunakan untuk menyajikan data kategorik

agar sistematik perlu disusun dalam suatu tabel

klasifikasi silang yang disebut tabel kontingensi.

Untuk menganalisa data kategorik dapat

digunakan model log linier. Dalam analisis ini

akan dicari pola hubungan antar sekelompok

variabel kategori yang mencakup asosiasi dua

variabel, tiga variabel, atau lebih. Pola hubungan

ini disajikan dalam bentuk model log linier.

Model log linier yang paling tepat akan

digunakan untuk menginterpretasikan pola

hubungannya (Agresti, 2007).

Adapun aplikasi dari analisis log linier dapat

dijumpai di berbagai studi kasus. Seperti saat ini

yang peneliti lakukan yaitu mengenai akses

internet pada pelajar MAN Unggul Tenggarong.

Saat ini internet sudah menjadi kebutuhan pokok

bagi setiap orang terutama pelajar dan

mahasiswa. Hampir setiap hari pelajar mengakses

internet di berbagai warung internet (warnet),

smartphone ataupun melalui modem. Oleh

karena itu frekuensi seberapa lama pelajar

menggunakan fasilitas internet dipengaruhi

beberapa faktor (variabel). Dalam skripsi ini

variabel yang dimaksud yaitu jurusan kelas,

prestasi akademik, banyaknya uang saku

perbulan dan waktu yang diperlukan untuk akses

internet setiap harinya. Selanjutnya masing-

masing variabel tersebut dibagi menjadi beberapa

kategorik. Keempat variabel tersebut yang

mempengaruhi banyak dan sedikitnya jumlah

pelajar MAN Unggul Tenggarong di setiap sel

dalam tabel kontingensi.

Oleh karena model log linier dua dan tiga

dimensi telah banyak diturunkan dan

diaplikasikan, maka dari itu penulis ingin

menjabarkan model log linier dengan empat

dimensi secara umum dengan judul “Model log

linier untuk empat dimensi”.

Variabel Kategori

Variabel kategori adalah salah satu skala

pengukuran yang memiliki seperangkat kategori.

Seperti, philosophy politik yang sering diukur

dengan “liberal”, “moderate”, atau “conservative

(Agresti, 2002).

Tabel Kontingensi (Contingency)

Tabel yang memiliki I baris untuk variabel

X dan J kolom untuk variabel Y dengan IJ

sebagai hasil kombinasi probabilitasnya disebut

tabel kontingensi (contingency table) atau tabel

klasifikasi silang (cross-classification table).

Tabel yang mengklasifikasikan silang antara dua

variabel disebut tabel kontingensi dua arah (two

way contingency table). Tabel yang

Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829

102 Program Studi Statistika FMIPA Universitas Mulawarman

mengklasifikasikan silang tiga variabel disebut

tabel kontingensi tiga arah (three way

contingency table), dan begitu seterusnya.

(Agresti, 2002)

Independence of Categorical Variables

Secara statistik, independensi adalah

ekivalen dengan properti untuk semua

probabilitas gabungan sama dengan produk

probabilitas marjinalnya,

jiij untuk i=1,2,…,I , j=1,2,…,J. (1)

(Agresti, 2002).

Resiko Relatif

Resiko relatif didefinisikan sebagai rasio

2

1

(5)

Hal tersebut dapat berupa bilangan real non-

negatif. (Agresti, 2002).

Odds Rasio

Untuk probabilitas keberhasilan, odds

rasio didefinisikan sebagai

1 (6)

Menurut Agresti (2007), Odds rasio

merupakan bilangan non-negatif, dengan

ketika sukses lebih memungkinkan daripada

gagal. (Agresti, 2007).

Model Log Linier Dua Dimensi

a) Model Independensi

Variabel baris ditunjukkan dengan X dan

variabel kolom dengan Y. Syarat independensi

memiliki rumus perkalian (multiplikatif) yaitu

jiij n . Jadi, model independensi

memiliki rumus Yj

Xiij Log . (7)

Untuk efek pada baris dan kolom berturut-

turut adalah Xi dan Y

j . model ini disebut

model independensi log linier (log linier model of

independence) (Agresti, 2007). Parameter Xi

mempresentasikan efek dari pengklasifikasian

pada baris i. Semakin besar nilaiXi , semakin

besar juga setiap frekuensi harapan pada baris i,

begitu juga untuk Yj . (Agresti, 2007).

b) Model Lengkap (Saturated Model)

Variabel yang secara statistika dependen

biasanya memiliki model log linier yang lebih

kompleks, yaitu XYij

Yj

Xi ij Log (8)

Parameter XYij adalah istilah asosiasi yang

merefleksikan deviasi dari independensi.

Parameter ini mempresentasikan interaksi antara

X dan Y, dimana efek dari satu variabel pada

jumlah sel yang diharapkan bergantung pada

tingkat variabel lain. (Agresti, 2007)

Model Log Linier Tiga Dimensi

a) Model Independensi

Sebuah klasifikasi silang tiga

arah KJI pada variabel respon X, Y, Z

mempunyai beberapa potensi independensi.

Dengan diasumsikan bahwa sebuah distribusi

multinomial mempunyai probabilitas sel ijk ,

dan 1 i j k ijk . Model ini juga

mengaplikasikan sampling Poisson dengan

mean ijk .

Untuk frekuensi harapan ,

independensi yang saling bebas (mutual

independence) mempunyai rumus log linier

sebagai berikut: Zk

Yj

Xiijk Log untuk semua

i,j, dan k. (9)

(Agresti, 2007).

b) Model Lengkap

Model lengkap untuk log linier tiga dimensi

adalah XYZijk

YZjk

XZik

XYij

Zk

Yj

Xiijk Log

. (10)

dimana

IJK

I

i

J

j

K

kijk

1 1 1

log

JK

J

j

K

kijk

Xi

1 1

log

IK

I

i

K

kijk

Yj

1 1

log

IJ

I

i

J

jijk

Zk

1 1

log

,

logloglog1 11 11

IKJKK

I

i

K

kijk

J

j

K

kijk

K

kijk

XYij

,

logloglog1 11 11

IJIKI

I

i

J

jijk

I

i

K

kijk

I

iijk

YZjk

Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 103

,

logloglog1 11 11

IJJKJ

I

i

J

jijk

J

j

K

kijk

J

jijk

XZik

IJK

I

iijk

J

jijk

K

kijk

ijkXYZijk

111

logloglog

log

IKJK

I

i

K

kijk

J

j

K

kijk

1 11 1

loglog

+

IJ

I

i

J

jijk

1 1

log

,

Dengan syarat :

K

k

XYZijk

J

j

XYij

I

i

J

j

K

k

I

i

XYij

Zk

Yj

Xi

0...

Analisis Model Log Linier

a) Model Log Linier Dua Dimensi

Uji Goodness of fit

Statistik Chi-square telah banyak dikenal

dan dipergunakan untuk tabel kontingensi dua

dimensi. Nilai statistik dihitung berdasarkan

rumus sebagai berikut:

ji ij

ijij

E

EO

,

2

2 (11)

dengan:

Oij = Observasi pada variabel ke-i dan j

Eij = Frekuensi harapan dalam sel-ij

Statistik dengan distribusi Chi-square

mempunyai db = (i-1)(j-1) dimana i menyatakan

banyaknya baris dan j menyatakan kolom dari

suatu tabel. Tabel kontingensi 2 x 2 diperoleh

statistik Chi-square dengan derajat bebas

(db) = (2-1)(2-1) = 1.

Tabel 1 Tabel Frekuensi Menurut W dan X

Variabel X Variabel W

Jumlah W1 … Wj

X1 O11 … O1j B1

… … … … …

Xi Oi1 … Oij Bi

Jumlah K1 … Kj n

Berdasarkan Tabel 1, nilai Eij dapat dihitung

dengan memakai rumus:

Eij =n

KB ji (12)

Selain menggunakan statistik uji Chi-square,

perhitungan uji goodness of fit pada tabel

kontingensi dua dimensi dapat menggunakan

likelihood rasio yang dinyatakan sebagai

likelihood ratio Chi-square (G2) sebagai berikut:

i j ij

ij

ijE

OOG Log22 (13)

Statistik G2 juga mempunyai derajat bebas

(db) = (i-1)(j-1).

Uji Independensi

Dalam tabel kontingensi dua arah dengan

probabilitas gabungan untuk dua variabel

respon, hipotesis nol untuk independensi statistik

adalah

H0 : Kedua variabel independen

( jiij untuk semua i dan j).

Untuk menguji H0, diidentifikasi

jiijij nn sebagai frekuensi harapan.

Untuk mengestimasi frekuensi harapan, subtitusi

proporsi sampel untuk probabilitas marjinal yang

tidak diketahui, maka

n

nn

n

n

n

nnpnp

jijijiij

(14)

Tanda ij disebut estimasi frekuensi harapan

(estimated expectation frequencies). (Agresti,

2007).

Uji Homogenitas

Uji homogenitas digunakan untuk

mengetahui apakah dua variabel bersifat

homogen atau tidak.

Dengan hipotesis

H0 : Kedua variabel bersifat homogen.

Hipotesis nol (H0) akan ditolak apabila

2hitung ≥

dan derajat bebas (db)

adalah (b-1)(k-1) dengan

bk

bkbk

E

EO2

2hitung .

b) Model Log Linier Tiga Dimensi

Menentukan Statistik Cukup Minimal

dan Fungsi Likelihood

Diasumsikan sebuah sampel ijkn untuk

klasifikasi silang dari variabel-variabel X, Y dan

Z. Diasumsikan variabel X, Y dan Z adalah

variabel random Poisson dengan nilai frekuensi

harapan ijk . Fungsi kepadatan probabilitas

Poisson bersama dari ijkn adalah

i j k ijk

n

ijk

n

e ijkijk

!

)(

(15)

dengan

ijk : frekuensi harapan

ijkn : frekuensi pengamatan pada

beris ke-i, kolom ke-j dan layer

ke-k.

Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829

104 Program Studi Statistika FMIPA Universitas Mulawarman

i j k

: hasil kali seluruh frekuensi sel

dalam tabel.

Model log linier untuk tabel tiga dimensi

secara umum dapat disajikan dalam parsamaan

berikut XYZijk

YZjk

XZik

XYij

Zk

Yj

Xiijk Log

XYZijk

YZjk

XZik

XYij

Zk

Yj

Xiijk exp

kemudian dibentuk log likelihood dari model

di atas sehingga diperoleh

YZjk

j kjk

XZik

i kki

XYij

i jij

Zk

ik

Yj

ij

Xi

ii

nnn

nnnnL

i j

XYZijk

YZjk

XZik

XYij

Zk

Yj

Xi

k

XYZijk

i j kijkn

exp

(16)

dengan adalah parameter dalam model

(Bain dan Engelhardt, 1992).

Differensial terhadap masing-masing

parameternya diperoleh

i j k

YZjk

XZik

Zk

Yj

Xin

L)exp(

)(

Karena

YZjk

XYik

Zk

Yj

Xiijk log

)exp( YZjk

XYik

Zk

Yj

Xiijk

Sehingga

i j kijkn

L

)(

Jika 0)(

Lmaka,

i j k

ijkn 0

i j k

ijkn

n (17)

n

berarti frekuensi harapan total

sama dengan frekuensi pengamatan total

sehingga hasilnya dapat dilihat pada Tabel 3

(Bain dan Engelhardt, 1991).

Estimasi Frekuensi Harapan

Misalkan diberikan sebuah simbol model

(XY, YZ) dengan X dan Y adalah variabel bebas

dan Z merupakan variabel terikat. Probabilitas sel

ke-ij dengan diketahui probabilitas sel ke-k,

dinotasikan dengan untuk X dan Y adalah:

ijkk

ki jk (18)

Karena pengambilan sampel yang

berdistribusi Poisson, maka rumus yang

berkaitan dengan frekuensi harapan

dengan ijkijkijk

ijknF

n

F yaitu:

k

jkki

k

ki jk

k

ki jk

ijk

nnnF

ˆ

ˆˆ

Menurut persamaan (20) dan kk n

maka diperoleh:

k

jkki

ijkn

nn

(19)

Jadi, nilai estimasi frekuensi harapannya

menyesuaikan dengan masing-masing model.

Tabel 3 Tabel Statistik Cukup Minimal

Model Statistik Cukup Minimal

(X,Y,Z)

(XY,Z)

(XZ,Y)

(YZ,X)

(XY,YZ)

(XZ,YZ)

(XY,XZ)

(XY,XZ,YZ)

(XYZ)

Uji Goodness of fit

Untuk tabel kontingensi tiga dimensi, uji

likelihood rasio adalah

i j k ijk

ijk

ijk

nnG

log22

(20)

dan uji Chi-Square adalah

i j k ijk

ijkijkn

ˆ

ˆ2 (21)

Hipotesis yang diuji adalah :

H0 : Model log linier yang digunakan sesuai.

Apabila 2hitung ≥ 2

)(db maka hipotesis nol

(H0) ditolak, dan derajat bebas (db) untuk

masing-masing model log linier tiga dimensi

dapat dilihat pada Tabel 4 (Agung, 2002).

Partisi Chi-Square

Diberikan dua model parameter m1 dan m2

dengan m2 kasus khusus dari m1. Karena m2 lebih

sederhana dari m1 maka model m2 dikatakan

bersusun dengan m1, v1 dan v2 derajat bebas

sesaat dan v1 lebih kecil dari v2 maka

. (22)

Oleh sebab itu, diperoleh

mendekati distribusi Chi-square dengan derajat

bebas v2 - v1 (Agresti, 2002).

Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 105

Tabel 4 Derajat Bebas Model Log Linear

Pada Tabel Kontingensi Berdimensi Tiga

No. Model Derajat Bebas

1 ( X,Y,Z) IJK – I – J – K + 2

2 (XY, Z) )1)(1( KIJ

3 (XZ, Y) )1)(1( JIK

4 (YZ, X) )1)(1( IJK

5 (XY, XZ) )1)(1( KJI

6 (XY, YZ) )1)(1( KIJ

7 (XZ, YZ) )1)(1( JIK

8 (XY, XZ, YZ) )1)(1)(1( KJI

9 (XYZ) 0

Variabel Penelitian

Variabel yang digunakan pada penelitian

terdapat 4 variabel, yaitu Jurusan Kelas (variable

W) yang dibagi menjadi 2 kategori, yaitu IPA dan

IPS, Prestasti Akademik (variabel X) yang dibagi

menjadi 3 kategori yaitu tinggi (peringkat 1 –

10), sedang (peringkat 11 – 20) dan rendah

(peringkat lebih dari 20), uang saku perhari

(variabel Y) yang dibagi menjadi 3 kategori yaitu

tinggi (lebih dari Rp. 20.000) , sedang (Rp.

11.000 – Rp. 20.000) dan rendah (kurang dari Rp.

10.000), dan akses internet perhari (variabel Z)

yang dibagi menjadi 4 kategori yaitu sangat lama

(lebih dari 2 jam), lama (1 – 2 jam), cukup

lama(0,5 – 1 jam) dan sebentar (kurang dari 0,5

jam)..

Hasil dan Pembahasan

Model Log Linier Empat Dimensi

a) Model Independensi

Jika W menyatakan variabel baris, X

menyatakan variabel kolom, Y menyatakan

variabel layer pertama dan Z merupakan variabel

layer kedua. Dengann h merupakan jumlah baris,

i merupakan jumlah kolom, j merupakan jumlah

layer pertama dan k merupakan jumlah layer

kedua.

Jika diketahui P (W,X,Y,Z) = hijk yang saling

bebas sehingga :

,kjihhijk

(23)

Peluang pengamatan dapat ditaksir dari frekuensi

pengamatan maka diperoleh Persamaan :

,,,

n

n

n

n

n

n j

ji

ih

h

dan ,

n

n kk

(24)

dengan ,

sehingga frekuensi nilai harapannya diberikan

dalam Persamaan :

,kjih

hijkhijk

n

n

(25)

Jika persamaan (25) dinyatakan dalam

bentuk skala logaritma, maka didapatkan :

,loglog

loglogloglog

kj

ihijk n

(26)

jika semua variabel independen, maka log dari

frekuensi harapan untuk sel (h, i, j, k) sehingga

persamaan (27) ekuivalen dengan

,log Zk

Yj

Xi

Whhijk (28)

dimana :

HIJK

H

h

I

i

J

j

K

khijk

1 1 1 1

log

IJK

I

i

J

j

K

khijk

Wh

1 1 1

log

HJK

H

h

J

j

K

khijk

Xi

1 1 1

log

HIK

H

h

I

i

K

khijk

Yj

1 1 1

log

HIJ

H

h

I

i

J

jhijk

Zk

1 1 1

log

dengan syarat :

H

h

I

i

K

k

Zk

J

j

Yj

Xj

Wh

1 1 11

0

b) Model Lengkap

Model yang memuat interaksi keempat

variabelnya merupakan model lengkap, yaitu :

WXYZhijk

XYZhjk

WYZhjk

WXZhik

WXYhij

YZjk

XZik

XYij

WZhk

WYhj

WXhi

Zk

Yj

Xi

Whhijk

log

(29)

dengan Zk

Yj

Xi

Wh ,,,, Sebagaimana

dinyatakan pada persamaan (28) dan nilai

parameter lainnya adalah:

Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829

106 Program Studi Statistika FMIPA Universitas Mulawarman

HJK

IJKJKH

h

J

j

K

khijk

I

i

J

j

K

khijk

J

j

K

khijk

WXhi

1 1 1

1 1 11 1

log

loglog

HIK

IJKIKH

h

I

i

K

khijk

I

i

J

j

K

khijk

I

i

K

khijk

WYhj

1 1 1

1 1 11 1

log

loglog

HIJ

IJKIJH

h

I

i

J

jhijk

I

i

J

j

K

khijk

I

i

J

jhijk

WZhk

1 1 1

1 1 11 1

log

loglog

HIK

HJKHKH

h

I

i

K

khijk

H

h

J

j

K

khijk

H

h

K

khijk

XYij

1 1 1

1 1 11 1

log

loglog

HJKHJ

H

h

J

j

K

khijk

H

h

J

jhijk

XZik

1 1 11 1

loglog

HIJ

H

h

I

i

J

jhijk

1 1 1

log

HIJHI

H

h

I

i

J

jhijk

H

h

I

ihijk

YZjk

1 1 11 1

loglog

HIK

H

h

I

i

K

khijk

1 1 1

log

HIKHJK

IJKIK

HKJKK

H

h

I

i

K

khijk

H

h

J

j

K

khijk

I

i

J

j

K

khijk

I

i

K

khijk

H

h

K

khijk

J

j

K

khijk

K

khijk

WXYhij

1 1 11 1 1

1 1 11 1

1 11 11

loglog

loglog

logloglog

HIJHJK

IJKJK

IJHJJ

H

h

I

i

J

jhijk

H

h

J

j

K

khijk

I

i

J

j

K

khijk

J

j

K

khijk

I

i

J

jhijk

H

h

J

jhijk

J

jhijk

WXZhik

1 1 11 1 1

1 1 11 1

1 11 11

loglog

loglog

logloglog

HIJHIK

IJKIK

IJHII

H

h

I

i

J

jhijk

H

h

I

i

K

khijk

I

i

J

j

K

khijk

I

i

K

khijk

I

i

J

jhijk

H

h

I

ihijk

I

ihijk

WYZhjk

1 1 11 1 1

1 1 11 1

1 11 11

loglog

loglog

logloglog

HI

JKH

hhijk

I

ihijk

J

jhijk

K

khijk

hijkWXYZhijk

11

11

loglog

loglog

log

HJHI

H

h

J

jhijk

H

h

I

ihijk

1 11 1

loglog

IJHK

I

i

J

jhijk

H

h

K

khijk

1 11 1

loglog

HIJHIK

HJKIJK

JKIK

H

h

I

i

J

jhijk

H

h

I

i

K

khijk

H

h

J

j

K

khijk

I

i

J

j

K

khijk

J

j

K

khijk

I

i

K

khijk

1 1 11 1 1

1 1 11 1 1

1 11 1

loglog

loglog

loglog

dengan syarat :

H

h

I

i

H

h

I

i

J

j

K

k

WXYZhijk

WXhi

K

k

Zk

J

j

Yj

I

i

Xi

H

h

Wh

λλ1 1 1 1 1 1

1111

0

Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 107

Analisis Model Log Linier Empat Dimensi

a) Menentukan Statistik Cukup Minimal

Jika sebuah sampel untuk klasifikasi

silang dari variabel-variabel W, X, Y dan Z,

diasumsikan bahwa variabel W, X, Y dan Z

adalah variabel random Poisson dengan nilai

frekuensi harapan , maka fungsi kepadatan

probabilitas Poisson bersama dari adalah

h i j k hijk

nhijk

n

e hijkhijk

!

(30)

dengan

: frekuensi harapan

: frekuensi pengamatan pada baris ke-h,

kolom ke-i, layer pertama ke-j serta, layer kedua

ke-k.

: hasil kali seluruh frekuensi sel

dalam tabel.

Dalam bentuk logaritma, persamaan (40) dapat

ditulis

h i j h i j k

hijkk

hijkhijknL Log)(

Model log linier untuk tabel empat dimensi

secara umum dapat disajikan dalam parsamaan

berikut

WXYZhijk

XYZijk

WYZhjk

WXZhik

WXYhij

YZjk

XZik

XYij

WZhk

WYhj

WXhi

Zk

Yj

Xi

Whhijk

Log

)

exp(

WXYZhijk

XYZijk

WYZhjk

WXZhik

WXYhij

YZjk

XZik

XYij

WZhk

WYhj

WXhi

Zk

Yj

Xi

Whhijk

kemudian dibentuk log likelihood dari model di

atas sehingga diperoleh

Xi

ii

Wh

hh nnnL

WXhi

h ihi

Zk

kk

Yj

jj nnn

WXYZhijk

h i j khijk

XYZijk

i j kijk

WYZhjk

h j kjkh

WXZhik

h i kkhi

WXYhij

h i jhij

YZjk

j kjk

XZik

i kki

XYij

i jij

WZhk

h kkh

WYhj

h jjh

nn

nn

nn

nn

nn

(31)

XYij

WZhk

WYhj

WXhi

Zk

Yj

Xi

Wh

h i j k

exp(

)XYZijk

WYZhjk

WXZhik

WXYhij

YZjk

XZik

dengan adalah parameter dalam model.

Differensial terhadap masing-masing

parameternya sehingga diperoleh

)

exp()(

WXYZhijk

XYZijk

WYZhjk

WXZhik

WXYhij

YZjk

XZik

XYij

WZhk

WYhj

WXhi

Zk

h i j k

Yj

Xi

Whn

L

Karena

WXYZhijk

XYZijk

WYZhjk

WXZhik

WXYhij

YZjk

XZik

XYij

WZhk

WYhj

WXhi

Zk

Yj

Xi

Whhijk

log

)

exp(

WXYZhijk

XYZijk

WYZhjk

WXZhik

WXYhij

YZjk

XZik

XYij

WZhk

WYhj

WXhi

Zk

Yj

Xi

Whhijk

Sehingga

h i j khijkn

L

)(

Jika 0)(

Lmaka,

h i j k

hijkn 0

h i j k

hijkn

nn

Dengan demikian akan diperoleh fungsi

likelihood sebagai berikut:

= n = =

= = =

= = =

= = =

= = =

(32)

Dalam persamaan (32)

dan seterusnya

merupakan koefisien dari masing – masing

parameter maka dan

seterusnya adalah statistik cukup minimal. Tabel

5 menunjukkan contoh model beserta statistik

cukup minimalnya.

Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829

108 Program Studi Statistika FMIPA Universitas Mulawarman

b) Estimasi Frekuensi Harapan

Misalkan sebuah model log linier empat

dimensi (W, X, Y, Z) dengan W, X, Y dan Z

adalah variabel bebas dan berdasarkan persamaan

(32) sehingga estimasi frekuensi harapan untuk

model (W, X, Y, Z) adalah:

n

nnnn kjih

hijk

(33)

c) Uji Goodness of fit

Berdasarkan pada uji goodness of fit pada

tabel kontingensi tiga dimensi, maka dapat

dirumuskan rumus goodness of fit untuk tabel

empat dimensi sebagai berikut:

h i j hijk

hijk

khijk

nnG

log22

(34)

dan uji Chi-square adalah

h i j k hijk

hijkhijkn

2 (35)

Hipotesis yang diuji adalah :

H0 : Model log linier yang digunakan sesuai

H1 : Model log linier yang digunakan tidak

sesuai

Apabila 2hitung ≥

2tabel maka hipotesis nol (H0)

ditolak, dan derajat bebas (db) untuk masing-

masing model log linier empat dimensi dapat

dilihat pada Tabel 6 di bawah ini.

Tabel 6 Derajat Bebas Model Log Linear Empat

Dimensi

d) Pemilihan Model

Pemilihan model terbaik dilakukan secara

bertahap. Dimulai dengan pemilihan model yang

dilakukan dengan memilih nilai G2 yang relatif

kecil (lebih kecil dari ) diantara kombinasi

model yang sesuai dengan dimensinya. Jika

dengan kriteria tersebut diperoleh beberapa

model maka dilakukan pemilihan model terbaik

dengan partisi Chi-square. Sehingga diharapkan

model terbaik yang diperoleh merupakan model

yang sederhana.

Aplikasi Data yang digunakan pada contoh ini

merupakan data lamanya akses internet siswa-

siswi kelas 2 dan 3 MAN Unggul Tenggarong

menurut jurusan kelas, prestasi akademik, dan

uang saku perhari. Data tersebut akan

diaplikasikan dalam analisis model log linier

empat dimensi.

a) Uji Validitas

Dilakukan uji validitas untuk masing – masing

butir pertanyaan dengan hipotesis :

H0 : Butir pertanyaan tidak valid

H1 : Butir pertanyaan valid

Dengan taraf signifikansi = 5% dan

daerah kritik menolak H0 apabila p-value < .

Menggunakan software SPSS versi 20, diperoleh

p-value seperti pada Tabel 7. Keputusan yang

dapat diambil berdasarkan hasil analisis adalah

menolak H0 untuk kesemua butir pertanyaan

karena memiliki nilai p-value < . Dengan

demikian dapat disimpulkan bahwa semua butir

pertanyaan tersebut valid, kemudian butir

pertanyaan yang valid berlanjut dengan pengujian

reliabilitas.

Tabel 7 Hasil Uji Validitas Menggunakan

Software SPSS V.20

Butir pertanyaan Pearson

Correlation

Sig.

(2-

tailed)

N

Jurusan kelas (butir

1) 0,275 0,006 100

Web yang dikunjungi

(butir 2) 0,529 0,000 100

Lamanya akses

internet perhari

(butir 3)

0,511 0,004 100

Uang saku perhari

(butir 4) 0,473 0,005 100

Prestasi akademik

(butir 5) 0,433 0,000 100

b) Uji Reliabilitas

Tabel 8 Hasil Uji Reliabilitas Menggunakan

Software SPSS V.20

Reliability Statistics

Cronbach's Alpha N of Items

0,210 5

Dilakukan uji reliabilitas untuk masing – masing

butir pertanyaan dengan hipotesis :

H0 : Butir pertanyaan tidak reliabel

H1 : Butir pertanyaan reliabel

Dengan taraf signifikansi = 5% dan

daerah kritik menolak H0 apabila Rhitung > Rtabel.

Rtabel. Menggunakan software SPSS versi 20,

diperoleh Rhitung seperti pada tabel 4.4 dengan

taraf signifikansi = 5% berdasarkan tabel R

diperoleh nilai Rtabel = 0,195 untuk db = 98.

Keputusan yang dapat diambil berdasarkan hasil

analisis adalah menolak H0 karena memiliki nilai

Rhitung = 0,210 > Rtabel = 0,195. Dengan demikian

dapat disimpulkan bahwa semua butir pertanyaan

reliabel.

c) Menentukan Statistik Cukup Minimal

Statistik cukup minimal dari model-model

loglinier merupakan koefisien dari masing-

masing parameternya. Koefisien parameter ini

diperoleh dari pengumpulan atau penjumlahan

batas marjinal

Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 109

d) Fungsi Likelihood

Setelah diperoleh statistik cukup minimal

masing-masing model, selanjutnya dilakukan

estimasi fungsi likelihood.

e) Estimasi Frekuensi Harapan

Setelah ditentukan statistik cukup minimal

dan fungsi likelihood untuk semua modelnya,

barulah dapat ditentukan estimasi frekuensi

harapan.

f) Uji Goodness of fit

Dari model-model tersebut, kemudian

dilakukan uji kecocokan model (goodness of fit)

dengan data yang digunakan. Uji kecocokan

model ini bertujuan mencari model mana saja

yang cocok dengan data yang digunakan.

Hipotesis yang digunakan adalah :

H0 : Model yang digunakan sesuai

H1 : Model yang digunakan tidak sesuai

dengan taraf signifikansi (α = 0,05) dan statistik

uji

h i j hijk

hijk

khijk

nnG

log22

serta daerah

kritis menolak H0 bila G2 ≥ tabel.

Dengan menggunakan software SPSS versi 20

didapatkan nilai G2 untuk masing-masing model

seperti pada Tabel 9.

Chi-square Table didapat dari tabel Chi-square

dengan derajat bebas (db) dan probabilitas

(α = 0.05) tertentu. Berdasarkan Tabel 12 di atas,

maka terlihat bahwa dari semua model yang ada

terdapat tigabelas(13) model memiliki nilai

likelihood ratio (G2) yang lebih kecil dari nilai

Chi-square table. Sehingga ketigabelas model

tersebut yang cocok adalah model no. 1, 2, 3, 4,

5, 6, 7,8, 9, 10, 12, 14, 15.

g) Partisi Chi-square

Dari ketigabelas model tersebut kemudian

dilakukan pemilihan model terbaik untuk data.

Pemilihan model ini menggunakan statistik uji

partisi Chi-square. Berikut ditampilkan nilai-nilai

likelihood ratio (G2), derajat bebas (db) dan

selisihnya untuk masing-masing model.

1. Model (WXY,WXZ,WYZ,XYZ) cocok

dengan data karena

G2[(WXY,WXZ,WYZ,XYZ)|(WXYZ)] =

7,769 dan lebih kecil dari Chi-square table

dengan derajat bebas 12 dan α = 0.05

(21,026).

2. Model (WXZ,WYZ,XYZ) cocok dengan

data karena G2[(WXZ,WYZ,XYZ)|(

WXY,WXZ,WYZ,XYZ) = 3,075 dan lebih

kecil dari Chi-square table dengan derajat

bebas 4 dan α = 0.05 (9,488).

Perhitungan partisi chi-square untuk model-

model yang lainnya menggunakan cara yang

sama seperti dua pada contoh.

Dari model-model yang cocok dengan data

tersebut, dipilih model terbaik yang memiliki

selisih G2 paling kecil. Sehingga model terbaik

untuk data adalah (WXY,XYZ).

Tabel 10 Selisih Likelihood Ratio dan Derajat

Bebas Untuk Masing-Masing Model.

No Model db Selisih

db G2

Selisih

G2

1 (WXYZ) 0 - 0 -

2

(WXY,WX

Z,XYZ,W

YZ) 12 12 7.769 7.769

3

(WXZ,WY

Z,XYZ) 16 4 10.844 3.075

4

(WXY,WX

Z,XYZ) 18 2 13.869 3.025

5

(WXZ,XY

Z,WY) 22 4 22.977 9.108

6

(WXY,XY

Z) 27 5 23.117 0.14

7

(WXY,WX

Z,YZ) 30 3 33.079 9.962

8

(WXZ,WY,

XY,YZ) 34 4 43.896 10.817

9

(WXY,WZ,

XZ,YZ) 36 2 42.036 -1.86

10

(WXY,XZ,

YZ) 39 3 44.538 2.502

11

(WX,WY,X

Y,XZ,YZ,

WZ) 40 1 51.697 7.159

12

(WX,WY,X

Y,XZ,YZ) 43 3 53.7 2.003

13 (WXY,YZ) 45 2 61.518 7.818

Kesimpulan

Berdasarkan hasil penelitian yang telah

dilakukan dapat disimpulkan bahwa terdapat 23

variasi model log linier yang memungkinkan

untuk di uji pada empat dimensi. Masing-masing

model memiliki statistik cukup minimal yang

berbeda-beda. Estimasi frekuensi harapan untuk

masing-masing modelnya juga berbeda-beda

dengan derajat bebas yang berbeda pula. Namun

dari ke-23 model tersebut dapat dilakukan uji

kecocokan model dengan menggunakan uji chi-

square dan likelihood. Uji partisi chi-square

dilakukan untuk mencari model terbaik. Dalam

contoh kasus lamanya akses internet siswa MAN

Unggul Tenggarong terlihat bahwa, model log

linier empat dimensi yang cocok adalah

Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829

110 Program Studi Statistika FMIPA Universitas Mulawarman

XYZijk

WXYhij

YZjk

XZik

XYij

WZhk

WYhj

WXhi

Zk

Yj

Xi

Whhijk

Log

Daftar Pustaka

Agresti, Alan. 2002. Categorical Data Analysis

Second Edition. New York : John Wiley &

Sons.

___________ . 2007. An Introduction To

Categorical Data Analysis Second Edition.

New York : John Wiley & Sons.

Agung, I Gusti Ngurah. 2002. STATISTIKA:

Analisis Hubungan Kausal Berdasarkan

Data Kategorik. Jakarta: Rajawali Press.

Bain, L.J & Engelhardt, E. 1992. Introduction to

Probability and Mathematical Statistics.

California: Duxbury Press.

Tabel 5 Tabel Statistik Cukup Minimal

No Model Statistik Cukup Minimal

1 (WXYZ) {nhijk}

2 (WXY,WXZ,XYZ,W

YZ) {nhij+}, {nhi+k}, {n+ijk},{nh+jk}

3 (WXY,WXZ,XYZ) {nhij+},{nhi+k},{n+ijk}

4 (WXZ,WYZ,XYZ) {nhi+k},{nh+jk},{n+ijk}

5 (WXY,XYZ) {nhij+},{n+ijk}

6 (WXY,WXZ,YZ) {nhij+},{nhi+k},{n++jk}

7 (WXZ,XYZ,WY) {nhi+k},{n+ijk},{nh+j+}

8 (WXZ,WY,XY,YZ) {nhi+k},{nh+j+},{n+ij+},{n++jk}

9 (WXY,WZ,XZ,YZ) {nhij+},{nh++k},{n+i+k},{n++jk}

10 (WXY,XZ,YZ) {nhij+},{n+i+k},{n++jk}

11 (WXZ,WY,XY) {nhi+k},{nh+j+},{n+ij+}

12 (WXY,YZ) {nhij+},{n++jk}

13 (WXY,Z) {nhij+},{n+++k}

14 (WX,WY,XY,

XZ,YZ,WZ)

{nhi++},{nh+j+},{n+ij+},{n+i+k},{n

++jk},{nh++k}

15 (WX,WY,XY,

XZ,YZ)

{nhi++},{nh+j+},{n+ij+},{n+i+k},{n

++jk}

16 (WX,WY,XY,YZ) {nhi++},{nh+j+},{n+ij+},{n++jk}

17 (WX,WY,WZ) {nhi++},{nh+j+},{nh++k}

18 (WX,XY,YZ) {nhi++},{n+ij+},{n++jk}

19 (WX,WY,XY,Z) {nhi++},{nh+j+},{n+ij+},{n+++k}

20 (WX,YZ) {nhi++},{n++jk}

21 (WX,XY,Z) {nhi++},{n+ij+},{n+++k}

22 (WX,Y,Z) {nhi++},{n++j+},{n+++k}

23 (W,X,Y,Z) {nh+++},{n+i++},{n++j+},{n+++k}

Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829

Program Studi Statistika FMIPA Universitas Mulawarman 111

Tabel 6 Derajat Bebas Model Log Linear Empat Dimensi

No Model Derajat Bebas (db)

1 (WXYZ) 0

2 (WXY,WXZ,XYZ,WYZ)

3 (WXY,WXZ,XYZ)

4 (WXZ,WYZ,XYZ)

5 (WXY,XYZ)

6 (WXY,WXZ,YZ)

7 (WXZ,XYZ,WY)

8 (WXZ,WY,XY,YZ)

9 (WXY,WZ,XZ,YZ)

10 (WXY,XZ,YZ)

11 (WXZ,WY,XY)

12 (WXY,YZ)

13 (WXY,Z)

14 (WX,WY,XY,

XZ,YZ,WZ)

15 (WX,WY,XY,

XZ,YZ)

16 (WX,WY,XY,YZ)

17 (WX,WY,WZ)

18 (WX,XY,YZ)

19 (WX,WY,XY,Z)

20 (WX,YZ)

21 (WX,XY,Z)

22 (WX,Y,Z)

23 (W,X,Y,Z)

Jurnal EKSPONENSIAL Volume 6, Nomor 2, Nopember 2015 ISSN 2085-7829

112 Program Studi Statistika FMIPA Universitas Mulawarman

Tabel 9. Nilai-Nilai G2 Beserta Chi-square Table untuk Uji Kecocokan Model

No Model db G2

P-

value

Chi-

square

Table

1 (WXYZ) 0 0 0 0,000

2 (WXY,WXZ,

XYZ,WYZ) 12 7,769 0,803 21,026

3 (WXY,WXZ,

XYZ) 18 13,869 0,738 28,869

4 (WXZ,WYZ,

XYZ) 16 10,844 0,819 26,296

5 (WXY,XYZ) 27 23,117 0,679 40,113

6 (WXY,WXZ,

YZ) 30 33,079 0,319 43,773

7 (WXZ,XYZ,

WY) 22 22,977 0,403 33,924

8 (WXZ,WY,X

Y,YZ) 34 43,896 0,119 48,602

9 (WXY,WZ,X

Z,YZ) 36 42,036 0,226 50,998

10 (WXY,XZ,YZ

) 39 44,538 0,250 54,572

11 (WXZ,WY,X

Y) 40 59,909 0,022 55,758

12 (WXY,YZ) 45 61,518 0,051 61,656

13 (WXY,Z) 51 77,775 0,009 68,669

14 (WX,WY,XY,

XZ,YZ,WZ) 40 51,697 0,102 55,758

15 (WX,WY,XY,

XZ,YZ) 43 53,700 0,127 59,304

16 (WX,WY,XY,

YZ) 49 70,683 0,023 66,339

17 (WX,WY,WZ

) 56 87,990 0,004 74,468

18 (WX,XY,YZ) 51 72,891 0,024 68,669

19 (WX,WY,XY,

Z) 55 86,940 0,004 73,311

20 (WX,YZ) 55 80,885 0,013 73,311

21 (WX,XY,Z) 57 89,148 0,004 75,624

22 (WX,Y,Z) 61 97,142 0,002 80,232

23 (W,X,Y,Z) 63 105,234 0,001 82,529