9
Pemilihan Model Regresi Terbaik Menggunakan Metode Akaike’s Information Criterion Oleh: Dina Paramita; Kisfendie Regga Rahmad Igarta; Rezha Nursina Yuni (3SE3, !""# Abstrak Analisis regresi seringkali digunakan untuk mengkaji hubungan antara beberapa variabel dan meramal suatuvariabel. Agar diperoleh hasil analisis yang optimal, maka diperlukan model regresi terbaik. Beberapa metode dapat digunakan untuk memilih model regresi terbaik, diantaranya adalah dengan metode $%ai%e&s Inf'rmati'n riteri'n (AIC). Tulisan ini bertujuan mengkaji pemilihan model regresi terbaik menggunakan metode AIC kadar lemak tubuh pada sampel kelompok wanita sehat usia !"#$ tahun (%utner et.al, &&$, hal. ' "'). engan menggunakan metode AIC akan dipilih model regresi terbaik untuk mengetahui hubungan antara nilai kadar lemak tubuh pada sampel & wanita sehat usia !"#$ tahun dengan rata"rata nilai %etebalan %ulit Tri*e (+ ), ingkar -aha (+ ) dan ingkar engan (+ # ). %ata kun*i /egresi, 0odel Terbaik, $%ai%e&s Inf'rmati'n riteri'n 1 Pendahuluan Analisis regresi merupakan salah satu teknik analisis data dala statistika yang seringkali digunakan untuk mengkaji hubungan antara beberapa variabel dan meramal suatu variable (%utner, 2a*htsheim dan 2eter, &&$). 3ika suatu model regresi digunakan untuk tujuan peramalan, maka diperlukan model terbaik. 0etode yang dapat digunakan untuk mendapatkan model regresi terbaik,salah satunya adalah dengan metode $%ai%e&s Inf'rmati'n riteri'n (AIC) (4idarjono, &&'). 0etode tersebut mempunyai kelebihan dibanding menggunakan metode koe5sien determinasi (R ) yang banyak digunakan selama ini. %elebihan AIC adalah terutama pada pemilihan model regresi terbaik untuk tujuan peramalan (f're)asting), yaitu dapat menjelaskan ke*o*okan model dengan data yang ada (insam*le f're)asting) dan nilai yang terjadi di masa mendatang ('ut 'f sam*le f're)asting). Adapun kelemahan dari metode R , diantaranya adalah ) metode R hanya digunakan untuk peramalan insam*le yaitu apakah prediksi model bisa sedekat mungkin dengan data yang ada, ) tidak ada jaminan bahwa dengan metode R mampu meramalkan nilai di masa mendatang ('ut 'f sam*le) dengan baik, #) metode R harus digunakan dengan syarat variabel tidak bebas (respon) harus sama, $) nilaiR tidak pernah menurun, jika terus ditambahkan variable prediktor di dalam model walaupun variable prediktor tersebut kurang atau tidak relevan (4idarjono, &&').

Kelompok 5 - Aic Selection Model

Embed Size (px)

DESCRIPTION

aic

Citation preview

Pemilihan Model Regresi Terbaik Menggunakan Metode AkaikesInformation CriterionOleh:Dina Paramita; Kisfendie Regga Rahmad Igarta; Rezha Nursina Yuni(3SE3, 2011)AbstrakAnalisis regresi seringkali digunakan untuk mengkaji hubungan antara beberapa variabel dan meramal suatu variabel. Agar diperoleh hasil analisis yang optimal, maka diperlukan model regresi terbaik. Beberapa metode dapat digunakan untuk memilih model regresi terbaik, diantaranya adalah dengan metode Akaikes Information Criterion (AIC). Tulisan ini bertujuan mengkaji pemilihan model regresi terbaik menggunakan metode AIC kadar lemak tubuh pada sampel kelompok wanita sehat usia 25-34 tahun (Kutner et.al, 2004, hal. 271-272). Dengan menggunakan metode AIC akan dipilih model regresi terbaik untuk mengetahui hubungan antara nilai kadar lemak tubuh pada sampel 20 wanita sehat usia 25-34 tahun dengan rata-rata nilai Ketebalan Kulit Tricep (X1), Lingkar Paha (X2) dan Lingkar Lengan (X3).

Kata kunci : Regresi, Model Terbaik, Akaikes Information Criterion

PendahuluanAnalisis regresi merupakan salah satu teknik analisis data dalam statistika yang seringkali digunakan untuk mengkaji hubungan antara beberapa variabel dan meramal suatu variable (Kutner, Nachtsheim dan Neter, 2004). Jika suatu model regresi digunakan untuk tujuan peramalan, maka diperlukan model terbaik. Metode yang dapat digunakan untuk mendapatkan model regresi terbaik, salah satunya adalah dengan metode Akaikes Information Criterion (AIC) (Widarjono, 2007). Metode tersebut mempunyai kelebihan dibanding menggunakan metode koefisien determinasi (R2) yang banyak digunakan selama ini. Kelebihan AIC adalah terutama pada pemilihan model regresi terbaik untuk tujuan peramalan (forecasting), yaitu dapat menjelaskan kecocokan model dengan data yang ada (insample forecasting) dan nilai yang terjadi di masa mendatang (out of sample forecasting). Adapun kelemahan dari metode R2, diantaranya adalah :1) metode R2 hanya digunakan untuk peramalan insample yaitu apakah prediksi model bisa sedekat mungkin dengan data yang ada,2) tidak ada jaminan bahwa dengan metode R2 mampu meramalkan nilai di masa mendatang (out of sample) dengan baik,3) metode R2 harus digunakan dengan syarat variabel tidak bebas (respon) harus sama,4) nilai R2 tidak pernah menurun, jika terus ditambahkan variable prediktor di dalam model walaupun variable prediktor tersebut kurang atau tidak relevan (Widarjono, 2007).

Oleh sebab itu, kami memilih model regresi linier terbaik menggunakan metode AIC untuk mengetahui faktor-faktor yang mempengaruhi nilai kadar lemak tubuh pada kelompok wanita sehat usia 25-34 tahun.

TujuanMemilih model regresi linier terbaik menggunakan metode AIC pada faktor-faktor yang mempengaruhi nilai kadar lemak tubuh pada kelompok wanita sehat usia 25-34 tahun.

Tinjauan Pustaka

Analisis RegresiIstilah regresi pertama kali dikemukakan oleh Sir Francis Galton (1822-1911), seorang antropolog dan ahli meteorologi terkenal dari Inggris. Dalam makalahnya yang berjudul Regression towards mediocrity in hereditary stature, yang dimuat dalam Journal of the Anthropological Institute, volume 15, halaman 246 sampai dengan 263, tahun 1885. Galton menjelaskan bahwa biji keturunan tidak cenderung menyerupai biji induknya dalam hal besarnya, namun lebih medioker (lebih mendekati rata-rata) lebih kecil daripada induknya kalau induknya besar dan lebih besar daripada induknya kalau induknya sangat kecil (Draper dan Smith, 1992). Dalam analisis regresi, diperlukan suatu model yang digunakan untuk mengetahui hubungan antara variabel tidak bebas (respon) dengan satu atau lebih variabel bebas (prediktor) dan untuk melakukan peramalan terhadap variabel respon. Model regresi dapat diperoleh dengan melakukan estimasi terhadap parameterparameternya menggunakan metode tertentu. Adapun metode yang dapat digunakan untuk mengestimasi parameter model regresi,khususnya parameter model regresi linier berganda adalah dengan metode kuadrat terkecil (ordinary least square) dan metode kemungkinan maksimum (maximum likelihood) (Kutner et.al, 2004). Secara umum model regresi linier berganda dengan k variabel bebas dapat ditulis sebagai berikut (sembiring, 2003):(1)Bila pengamatan mengenai dinyatakan masing-masing dengan dan sisa (error) persamaan (1) dapat dituliskan sebagai:(2)dengan Dalam notasi vektor dan matriks, persamaan (2) dapat ditulis menjadi:

Misalkan lagi

Berdasarkan persamaan (2), (3) dan (4), maka diperoleh model regresi linier berganda sebagai berikut:

dengan: :vektor variabel respon berukuran n x 1 :matriks variabel prediktor berukuran n x p, untuk p = k + 1. :vektor parameter berukuran p x 1. : vektor sisa berukuran n x 1.

Estimasi ParameterEstimasi parameter ini bertujuan untuk mendapatkan model regresi yang akan digunakan dalam analisis. Beberapa metode dapat digunakan untuk mengestimasi parameter model regresi, salah satu diantaranya adalah metode kuadrat terkecil (ordinary least square), yaitu suatu metode estimasi yang meminimumkan jumlah kuadrat sisa (Kutner et.al, 2004). Menurut Sembiring (2003) estimator yang diperoleh dengan metode kuadrat terkecil mempunyai sifat best linear unbiased estimator (BLUE) yaitu estimator yang linier, tidak bias dan mempunyai variansi yang terkecil dari semua estimator linier tidak bias lainnya. Berdasarkan persamaan (5), maka estimator kuadrat terkecil bagi adalah sebagai berikut:

Pengujian ParameterPengujian parameter berguna untuk mengetahui ada atau tidaknya pengaruh variable prediktor terhadap variabel respon. Pengujian parameter dalam analisis regresi linier berganda terdiri dari dua mac m, yaitu pengujian parameter secara serentak (simultan) dan secara individu (parsial). Berikut ini dijelaskan kedua jenis pengujian parameter tersebut.1. Pengujian parameter secara simultan.Langkah-langkah pengujian ini adalah sebagai berikut (Sembiring, 2003) (Variabel prediktor secara simultan tidak berpengaruh terhadap variabel respon)H1 : Paling tidak ada satu tidak sama dengan nol, dengan j = 1, 2, , k.

Statistik uji yang digunakan adalah: (7)dengan p adalah banyaknya parameter dalam model regresi.

Daerah kritik:H0 ditolak bila atauH0 ditolak bila nilai probabilitas <

2. Pengujian parameter secara parsialPengujian ini berguna untuk mengetahui ada atau tidaknya pengaruh masing-masing variable predictor terhadap variabel respon. Langkah-langkah pengujian ini adalah sebagai berikut (Sembiring, 2003):

H0 : (Variabel prediktor ke-j tidak berpengaruh terhadap variabel respon)H1 : (Variabel prediktor ke-j berpengaruh terhadap variabel respon) dengan j= 1, 2, , k.

Statistik uji: (8)dengan:: estimator untuk SE : standar error dari

Daerah kritik :H0 ditolak bila atau H0 ditolak bila nilai probabilitas < .

Metode AIC Metode AIC dan adalah metode yang dapat digunakan untuk memilih model regresiterbaik yang ditemukan oleh Akaike (Grasa, 1989). Metode tersebut didasarkan pada metode maximum likelihood estimation (MLE).Untuk menghitung nilai AIC digunakan rumus sebagai berikut: (9)dengan:k = jumlah parameter yang diestimasi dalam model regresin = jumlah observasie = 2,718u = Sisa (residual)Menurut metode AIC, model regresi terbaik adalah model regresi yang mempunyai nilai AIC terkecil (Widarjono, 2007).

Metodologi PenelitianData diperoleh dari buku Applied Linear Regression Models (Kutner et.al, 2004. Hal. 271-272) Kemudian variabel-variabel yang digunakan adalah sebagai berikut:1. Variabel respon adalah nilai kadar lemak tubuh pada sampel 20 wanita sehat usia 25-34 tahun (Y).2. Variabel prediktor adalah Ketebalan Kulit Tricep (X1), Lingkar Paha (X2) dan Lingkar Lengan (X3)

Berdasarkan tujuan penelitian, maka langkah-langkahnya adalah sebagai berikut:1. Melakukan estimasi parameter untuk mendapatkan model regresi untuk variabel Y dengan X1, Y dengan X2, Y dengan X3, Y dengan X1 dan X2, Y dengan X1 dan X3, Y dengan X2 dan X3 serta Y dengan X1, X2 dan X3.2. Melakukan pengujian parameter model regresi yang diperoleh dari 1 secara simultan dan secara parsial.3. Menghitung nilai AIC dari masing-masing model regresi yang diperoleh dari 1.4. Menentukan nilai AIC yang terkecil dari semua model yang diperoleh pada 1.5. Mendapatkan model regresi terbaik.

Hasil dan Pembahasan

Estimasi ParameterSetelah dilakukan estimasi parameter model regresi dengan metode kuadrat terkecil, maka diperoleh hasil seperti pada Tabel 1 berikut.

Tabel 1. Hasil estimasi parameter model regresi

ModelVariabelKoefisien

1Konstanta-1,49610

X10,85719

2Konstanta-23,63449

X20,85655

3Konstanta14,68678

X30,19943

4Konstanta-19,17425

X10,22235

X20,65942

5Konstanta6,79163

X11,00058

X3-0,43144

6Konstanta-25,99695

X20,85088

X30,09603

7Konstanta117,08469

X14,33409

X2-2,85685

X3-2,18606

Berdasarkan Tabel 1 di atas, maka diperolehmodel regresi sebagai berikut:

Y = -1,49610 + 0,85719 X1 (10)Y = -23,63449 +0,85655 X2 (11)Y = 14,68678 + 0,19943 X3 (12)Y = -19,17425 + 0,22235 X1 + 0,65942 X2 (13)Y = -25,99695 + 0,85088 X2 + 0,09603 X3 (14)Y = 6,79163 + 1,00058 X1 - 0,43144 X3 (15)Y = 117,08469 + 4,33409 X1 - 2,85685 X2 - 2,18606 X3 (16)

Pengujian ParameterUntuk mengetahui ada atau tidaknya pengaruh variabel prediktor terhadap variabel respon, maka dilakukan pengujian parameter secara simultan dan secara parsial. Hasil yangdiperoleh adalah seperti pada Tabel 2.

Tabel 2. Hasil pengujian parameter secara simultan

ModelVariabelKoefFp-value

1Konstanta-1,4961044,304570,00000

X10,85719

2Konstanta-23,6344960,616840,00000

X20,85655

3Konstanta14,686780,372790,54912

X30,19943

4Konstanta-19,1742529,797230,00000

X10,22235

X20,65942

5Konstanta6,7916331,249320,00000

X11,00058

X3-0,43144

6Konstanta-25,9969529,397750,00000

X20,85088

X30,09603

7Konstanta117,0846921,515710,00001

X14,33409

X2-2,85685

X3-2,18606

Berdasarkan Tabel 2 di atas :1. X1 berpengaruh secara signifikan terhadap Y.2. X2 berpengaruh secara signifikan terhadap Y.3. X1 dan X2 secara simultan berpengaruh secara signifikan terhadap Y.4. X1 dan X3 secara simultan berpengaruh secara signifikan terhadap Y.5. X2 dan X3 secara simultan berpengaruh secara signifikan terhadap Y.6. X1, X2 dan X3 secara simultan berpengaruh secara signifikan terhadap Y.Terlihat dari nilai probabilitasnya (0,00) lebih kecil dari tingkat signifikansi ( = 0,05). Hanya X3 yang nilai probabilitasnya lebih besar dari tingkat signifikansi, yaitu 0,55 sehingga disimpulkan bahwa X3 tidak berpengaruh terhadap Y. Sehingga model Y = 14,68678 + 0,19943 X3 tidak akan dimasukkan dalam pemilihan model regresi terbaik menggunakan AIC.

Pemilihan Model Regresi TerbaikSetelah dilakukan estimasi dan pengujian parameter, selanjutnya dilakukan pemilihan model regresi terbaik menggunakan metode AIC. Hasil yang diperoleh adalah seperti pada Tabel 3 berikut.Tabel 3. Hasil pemilihan model regresi terbaik

ModelVariabelkoefAIC

1Konstanta-1,496102.167949

X10,85719

2Konstanta-23,634491.935398

X20,85655

3Konstanta-19,174252.004301

X10,22235

X20,65942

4Konstanta6,791631.967086

X11,00058

X3-0,43144

5Konstanta-25,996952.014786

X20,85088

X30,09603

6Konstanta117,084691.993358

X14,33409

X2-2,85685

X3-2,18606

Dari Tabel 3 di atas, terlihat bahwa model regresi terbaik menurut metode AIC adalah model 2 atau model regresi seperti pada persamaan (11). Hal ini ditunjukkan oleh nilai AIC untuk model 2 yang terkecil (1.935398) dibanding nilai AIC untuk model yang lain. KesimpulanBerdasarkan hasil dan pembahasan, maka dapat disimpulkan bahwa dengan metode pemilihan model AIC, model regresi terbaik dapat digunakan untuk mengetahui faktor yang mempengaruhi Kadar Lemak wanita sehat usia 25-34 tahun adalahY = -23,63449 +0,85655 X2 dengan X2 adalah Lingkar Paha.

Daftar PustakaGrasa, A. A. 1989. Econometric Model Selection: A New Approach, Kluwer.Kutner, M.H., Nachtsheim, C.J. dan Neter, J. 2004. Applied Linear Regression Models. New York: McGraw-Hill/Irwin. Sembiring, R.K. 2003. Analisis Regresi, Edisi Kedua, Bandung: ITB.Widarjono, A. 2007. Ekonometrika: Teori dan Aplikasi untuk Ekonomi dan Bisnis, Yogyakarta: Ekonisia Fakultas Ekonomi Universitas Islam Indonesia.Fathurahman, M. 2009. Jurnal: Pemilihan Model Regresi Terbaik Menggunakan Metode Akaikes Information Criterion dan Schwarz Information Criterion. Universitas Mulawarman Samarinda