13
Oseana, Volume XXVIII, Nomor 1, 2003 : 19 - 31 ISSN 0216-1877 MEMBANDINGKAN DUA PERSAMAAN REGRESI LINEAR SEDERHANA Oleh: Giyanto 1) ABSTRACT COMPARING TWOSIMPLE LINEAR REGRESSION EQUATIONS. Frequently we possess regression equations for two populations and wish to study their similari- ties and differences. First, we might investigate whether the slopes of these regressions are significantly different. If they are not significantly different, we might then ask whether these regression equations are identical or with the other words, the data come from the same population. In this paper, comparing two simple linear regression equations will be reviewed. One study case in marine research will be done as an exercise. PENDAHULUAN Persamaan regresi linear sederhana merupakan persamaan garis lurus yang melibatkan dua peubah (variable), yaitu peubah bebas (independent variable) dan peubah terikat (dependent variable). Persamaan regresi, yang dalam pengertian statistika sering disebut dengan istilah model, diperoleh berdasarkan perhitungan-perhitungan statistika. Oleh karena perhitungannya disusun dari banyak pasangan data kedua peubahnya (peubah bebas dan terikat), maka akan memiliki kesalahan (error). Untuk pasangan data (X i ,Y i ) dimana i=l, 2, .., n akan diperoleh persamaan regresi Y i =α+βX i +ε i , dimana α adalah nilai intersep (intercept), β adalah nilai kemiringan (slope) dan ε adalah nilai kesalahan. Hubungan antara peubah X dan Y tersebut bisa diduga sebagai garis lurus dengan persamaan Y=a+bX, dimana a adalah nilai intersep dan b adalah nilai kemiringan yang masing-masing dihitung berdasarkan sampel data. Dalam statistika, umumnya persamaan regresi linear ini sering dipakai untuk menunjukkan hubungan antara peubah bebas (X) dan peubah terikatnya (Y). Selain itu, persamaan ini juga berguna untuk menduga nilai Y bila diketahui nilai Xnya. Tetapi masalahnya akan timbul bila kita memiliki dua persamaan regresi linear untuk peubah yang sama (tetapi berbeda lokasi atau berbeda waktu pengambilan datanya). Persamaan regresi mana yang kita pakai untuk menduga nilai Y? 1) Bidang Sumber Daya Laut, Pusat Penelitian Oseanografi-LIPI, Jakarta. 19 sumber:www.oseanografi.lipi.go.id Oseana, Volume XXVIII no. 1, 2003

MEMBANDINGKAN DUA PERSAMAAN REGRESI LINEAR …oseanografi.lipi.go.id/dokumen/oseana_xxviii(1)19-31.pdf · tentang teknik analisa regresi dengan berbagai bentuk ujinya sangat diperlukan

Embed Size (px)

Citation preview

Oseana, Volume XXVIII, Nomor 1, 2003 : 19 - 31 ISSN 0216-1877

MEMBANDINGKAN DUA PERSAMAAN REGRESI LINEAR SEDERHANA

Oleh:

Giyanto 1)

ABSTRACT

COMPARING TWOSIMPLE LINEAR REGRESSION EQUATIONS. Frequently we possess regression equations for two populations and wish to study their similari-ties and differences. First, we might investigate whether the slopes of these regressions are significantly different. If they are not significantly different, we might then ask whether these regression equations are identical or with the other words, the data come from the same population. In this paper, comparing two simple linear regression equations will be reviewed. One study case in marine research will be done as an exercise.

PENDAHULUAN

Persamaan regresi linear sederhana merupakan persamaan garis lurus yang melibatkan dua peubah (variable), yaitu peubah bebas (independent variable) dan peubah terikat (dependent variable). Persamaan regresi, yang dalam pengertian statistika sering disebut dengan istilah model, diperoleh berdasarkan perhitungan-perhitungan statistika. Oleh karena perhitungannya disusun dari banyak pasangan data kedua peubahnya (peubah bebas dan terikat), maka akan memiliki kesalahan (error). Untuk pasangan data (Xi,Yi) dimana i=l, 2, .., n akan diperoleh persamaan regresi Yi=α+βXi+εi, dimana α adalah nilai intersep (intercept), β adalah nilai kemiringan (slope) dan ε adalah

nilai kesalahan. Hubungan antara peubah X dan Y tersebut bisa diduga sebagai garis lurus dengan persamaan Y=a+bX, dimana a adalah nilai intersep dan b adalah nilai kemiringan yang masing-masing dihitung berdasarkan sampel data.

Dalam statistika, umumnya persamaan regresi linear ini sering dipakai untuk menunjukkan hubungan antara peubah bebas (X) dan peubah terikatnya (Y). Selain itu, persamaan ini juga berguna untuk menduga nilai Y bila diketahui nilai Xnya. Tetapi masalahnya akan timbul bila kita memiliki dua persamaan regresi linear untuk peubah yang sama (tetapi berbeda lokasi atau berbeda waktu pengambilan datanya). Persamaan regresi mana yang kita pakai untuk menduga nilai Y?

1) Bidang Sumber Daya Laut, Pusat Penelitian Oseanografi-LIPI, Jakarta.

19

sumber:www.oseanografi.lipi.go.id

Oseana, Volume XXVIII no. 1, 2003

CONTOH KASUS

Seorang peneliti menghitung persamaan regresi linear sederhana dari data jumlah individu ikan Chaetodontidae per 500 m2

terhadap persentase tutupan karang batu berdasarkan data yang diperoleh di Kepulauan Seribu. Misalkan persamaannya adalah sebagai berikut Y = 0,120 +.0,276X. Pada saat bersamaan, seorang peneliti lain juga mengambil data persentase tutupan karang batu dan jumlah individu ikan Chaetodontidae per 500 m2 di Taka Bone Rate. Misalkan persamaan yang diperolehnya adalah Y = 0,114 + 0,279X. Pertanyaan yang muncul kemudian adalah:

a. Apakah kedua persamaan regresi tersebut saling berbeda (Gambar la dan lb) sehingga masing-masing persamaan regresi tersebut hanya cocok dipakai pada lokasi data itu diambil?

b. Apakah kedua persamaan regresi tersebut berbeda tetapi memiliki nilai kemiringan yang sama (Gambar 2)?

c. Apakah kedua persamaan regresi tersebut sama (Gambar 3) sehingga perlu dibuat satu persamaan regresi baru yang bisa dipakai di kedua lokasi tersebut?

Untuk dapat menjawab pertanyaan tersebut, perlu dilakukan terlebih dahulu uji statistik untuk membandingkan 2 buah garis regresi linear (Soejoeti, 1986; Santoso & Kusnadi, 1992; Neter et al., 1996; Zar, 1996). Pada tulisan ini, penulis mencoba menerapkan cara seperti yang dibahas oleh Soejoeti (1986) dan Zar (1996), serta contoh aplikasinya pada data penelitian oseanografi.

Misalkan kita memiliki 2 himpunan data berpasangan dari persentase tutupan karang batu (X) dan jumlah individu ikan Chaetodontidae (Y) dari Kepulauan Seribu adalah (X1i,Y1i), i=l, 2, ..., n1, dan dari Taka Bone Rate adalah (X2j,Y2j), j=l, 2, ..., n2 (Tabel 1). Dua persamaan garis regresi linearnya adalah sebagai berikut:

Pertama-tama, yang perlu dilakukan

adalah menguji apakah kedua garis regresi tersebut memiliki nilai kemiringan yang sama. Pengertian "sama" yang dipakai pada tulisan ini adalah "sama" secara statistika dimana ragam kesalahan dipertimbangkan. Jadi berbeda dengan pengertian "sama" secara matematika yang diartikan secara absolut. Misalnya 0.0007 dengan 0.0008 akan diartikan tidak sama secara matematika, tetapi mungkin saja dapat dikatakan sama secara statistika.

20

sumber:www.oseanografi.lipi.go.id

Oseana, Volume XXVIII no. 1, 2003

Ada dua kemungkinan jawaban untuk pertanyaan: Apakah kedua garis regresi tersebut memiliki nilai kemiringan yang sama?

1. Bila jawabannya "Tidak" (Gambar 1a dan 1b). Maka masalahnya selesai hingga disini. Kesimpulannya bahwa sampel yang diambil oleh kedua peneliti tersebut memang berasal dan dua populasi yang berbeda sehingga kedua persamaan garis regresi tersebut hanya cocok untuk lokasi sampel itu diambil. Jadi dalam hal ini ada 2 persamaan regresi yang berbeda, yaitu persamaan garis regresi yang dihitung berdasarkan data dari satu lokasi tidak cocok dipakai di lokasi lainnya, ataupun sebaliknya.

2. Bila jawabannya "Ya" Ini berarti bahwa kedua garis regresi tersebut paralel. Maka pertanyaan yang timbul selanjutnya adalah: Apakah kedua

garis regresi tersebut berhimpit atau tidak? Atau dengan kata lain, apakah kedua garis regresi itu juga memiliki nilai intersep yang sama?

2.a. Bila jawabannya "Tidak" (Gambar 2). Maka kedua garis regresi tersebut paralel tapi tidak berhimpit. Ini dapat diartikan bahwa untuk nilai x yang sama, nilai y di satu lokasi akan lebih tinggi dibandingkan dengan lokasi yang lainnya. Dalam contoh kasus di atas, dapat dikatakan bahwa untuk persentase tutupan karang yang sama, jumlah individu ikan A di satu lokasi berbeda dengan satu lokasi lainnya (mungkin lebih tinggi atau lebih rendah jumlah individunya). Karena kedua garis regresi itu memiliki nilai kemiringan yang sama dan nilai

21

sumber:www.oseanografi.lipi.go.id

Oseana, Volume XXVIII no. 1, 2003

intersep yang berbeda, maka perlu dihitung nilai kemiringan gabungan (koefisien βg) sebagai nilai pengganti β1 dan P2 untuk masing-masing garis regresi yang tadi dibandingkan. Sehingga, dalam hal ini persamaan regresi yang baru menjadi:

2.b. Bila jawabannya "Ya" (Gambar 3). Maka kedua garis regresi tersebut sama atau berhimpit, yang berarti kedua sampel dapat dikatakan datang dari populasi yang sama. Oleh karena itu, perlu dibuat persamaan regresi baru berdasarkan kedua data yang diambil dari dua lokasi yang berbeda itu. Persamaan garis regresi yang baru bisa dipakai baik untuk di Kepulauan Seribu maupun di Taka Bone Rate.

22

sumber:www.oseanografi.lipi.go.id

Oseana, Volume XXVIII no. 1, 2003

Jadi, ada 2 buah uji statistik yang

diperlukan untuk membandingkan antara 2 garis

regresi linear sederhana, yaitu:

1. Uji statistik untuk mengetahui apakah β1=β2

Uji ini untuk mengetahui apakah kedua garis

regresi memiliki nilai kemiringan yang sama.

Jika nilai kemiringannya sama, maka bisa

dipastikan bahwa kedua garis itu paralel.

Oleh karena itu, uji ini juga dikenal sebagai uji

untuk mengetahui apakah kedua garis regresi

paralel.

2. Uji statistik untuk mengetahui apakah α1=α2

Uji ini untuk mengetahui apakah kedua garis regresi memiliki intersep yang sama. Uji ini

hanya dilakukan bila kedua garis regresi

memiliki nilai kemiringan yang tidak berbeda nyata (β1= β2).

Bila dua garis regresi memiliki

nilai kemiringan dan intersep yang sama

(β1= β2 dan α1=α2), maka kedua garis regresi tersebut sama atau berhimpit.

Sebelum melakukan uji beda antar dua

garis regresi, terdapat beberapa hal pokok yang

sebaiknya dipenuhi agar diperoleh hasil uji

yang lebih teliti dan memuaskan. Hal-hal

tersebut antara lain:

a. Persamaan garis regresinya harus sudah diketahui dan sudah diuji secara statistik. Oleh karena itu, pengetahuan yang cukup tentang teknik analisa regresi dengan berbagai bentuk ujinya sangat diperlukan.

b. Data asli dari sampel berpasangan harus ada, karena untuk perhitungannya diperlukan data-data tersebut secara lengkap.

Untuk mempermudah pemahaman tentang tahapan yang dilakukan dalam membandingkan dua buah garis regresi sederhana, dapat dilihat pada Gambar 4. Kedua macam uji statistik tersebut akan dibahas lebih lanjut dalam tulisan ini beserta contoh penerapannya dalam ilmu kelautan. Sepengetahuan penulis, sampai saat ini belum ada software statistik yang memuat program untuk membandingkan 2 buah garis regresi. Oleh karena itu, penulis juga menyertakan contoh perhitungannya dengan menggunakan Microsoft Excel. Pertimbangan lainnya adalah karena Microsoft Excel sangat popular dan umumnya setiap komputer telah memiliki Microsoft Excel.

23

sumber:www.oseanografi.lipi.go.id

Oseana, Volume XXVIII no. 1, 2003

Gambar 4. Tahapan yang dilakukan dalam membandingkan 2 buah garis regresi sederhana

24

sumber:www.oseanografi.lipi.go.id

Oseana, Volume XXVIII no. 1, 2003

25

sumber:www.oseanografi.lipi.go.id

Oseana, Volume XXVIII no. 1, 2003

26

sumber:www.oseanografi.lipi.go.id

Oseana, Volume XXVIII no. 1, 2003

27

sumber:www.oseanografi.lipi.go.id

Oseana, Volume XXVIII no. 1, 2003

Melakukan perhitungan beberapa nilai-nilai untuk pasangan sampel 1 pada sel B21 hingga B32 dan untuk sampel 2 pada sel G21 hingga G32 dengan mengetikkan rumus

(formula) seperti tampak pada Gambar 6a. Bila penulisan rumusnya benar, maka untuk hasilnya akan tampak seperti pada Gambar 6b.

Gambar 6b. Hasil yang diperoleh berdasarkan penulisan rumus seperti pada Gambar 6a.

28

sumber:www.oseanografi.lipi.go.id

Oseana, Volume XXVIII no. 1, 2003

Gambar 7a, sehingga hasilnya tampak seperti pada Gambar 7b.

Gambar 7b. Hasil yang diperoleh berdasarkan penulisan rumus seperti pada Gambar 7a.

29

sumber:www.oseanografi.lipi.go.id

Oseana, Volume XXVIII no. 1, 2003

Gambar 8a, sehingga hasilnya tampak seperti pada Gambar 8b.

30

sumber:www.oseanografi.lipi.go.id

Oseana, Volume XXVIII no. 1, 2003

DAFTAR PUSTAKA

NETER, J.; M.H. KUTNER; C J. NACHTSHEIM and W. WASSERMAN. 1996. Applied linear statistical models. Fourth edi-tion. The Me Graw Hill- Co. Inc. USA: 1408 p.

SANTOSO, R.D. dan M.H. KUSNADI. 1992. Analisis regresi. Edisi pertama. Andi Offset. Yogyakarta: 118 hal.

SOEJOETI, Z. 1986. Buku materi pokok metode statistika II STAT4111. Modul 6-9. Cetakan ketiga. Karunika, Jakarta. 207 hal+tabel.

ZAR, J.H. 1996. Biostatistical analysis. Third Edition. Prentice-Hall International Inc.: 662 pp+App.

31

sumber:www.oseanografi.lipi.go.id

Oseana, Volume XXVIII no. 1, 2003