8
Public Health - University of Indonesia Kampus UI, Depok 16424 Indonesia http://www.fkm. ui. ac.id/ University of Indonesia Tugas Kokurikuler III Mata Kuliah ‘Analisis Regresi Linear’ Dosen Pengajar : dr. Pandu Riono, MD, MPH, PhD A A n n a a l l i i s s i i s s R R e e g g r r e e s s i i d d e e n n g g a a n n V V a a r r i i a a b b e e l l I I n n t t e e r r a a k k s s i i Oleh : Iswandi 0806470421 [email protected] Program Pascasarjana Departemen Biostatistik dan Kependudukan Fakultas Kesehatan Masyarakat Universitas Indonesia Depok, 05 April 2009

Tugas Regresi

  • Upload
    iswandi

  • View
    397

  • Download
    0

Embed Size (px)

DESCRIPTION

Tugas Analisis Regresi 3, Dosen Pengajar : Pandu Riono, PhD

Citation preview

Page 1: Tugas Regresi

Public Health - University of Indonesia Kampus UI, Depok 16424 Indonesia http://www.fkm. ui. ac.id/

University of Indonesia

Tugas Kokurikuler III Mata Kuliah ‘Analisis Regresi Linear’ Dosen Pengajar : dr. Pandu Riono, MD, MPH, PhD

AAnnaalliissiiss RReeggrreessii ddeennggaann

VVaarriiaabbeell IInntteerraakkssii

Oleh :

Iswandi

0806470421

[email protected]

Program Pascasarjana

Departemen Biostatistik dan Kependudukan

Fakultas Kesehatan Masyarakat

Universitas Indonesia

Depok, 05 April 2009

Page 2: Tugas Regresi

Hal 1

Iswandi

NPM : 0806470421 Analisis Regresi Linear - Uji Interaksi

Permasalahan :

Dengan menggunakan data studi Framingham ‘Fram.dta’, carilah efek interaksi variabel age (usia

dalam tahun) dan variabel scl (serum kolesterol dalam 100 mg/100 ml) terhadap hubungan

antara variabel bmi (indeks mass tubuh dalam kg/m2) dan sbp (tekanan darah sistolik dalam mm

Hg).

Penyelesaian : Langkah 1 : mendeskripsikan variabel . des

Contains data from E:\My Documents\UI Material\Slide UI\Semester

2\Regresi_Linear\hw3\Fram.dta

obs: 4,699

vars: 10 11 Jan 1999 19:56

size: 206,756 (98.0% of memory free)

-------------------------------------------------------------------------------

storage display value

variable name type format label variable label

-------------------------------------------------------------------------------

sex float %9.0g sex Sex

sbp float %9.0g Systolic Blood Pressure

dbp float %9.0g Diastolic Blood Pressure

scl float %9.0g Serum Cholesterol

chdfate float %9.0g fate Coronary Heart Disease

followup float %9.0g Follow-up in Days

age float %9.0g Age in Years

bmi float %9.0g Body Mass Index

month float %9.0g Study Month of Baseline Exam

id float %9.0g

-------------------------------------------------------------------------------

Sorted by: followup

sbp

Age scl

bmi

Page 3: Tugas Regresi

Hal 2

Iswandi

NPM : 0806470421 Analisis Regresi Linear - Uji Interaksi

. sum

Variable | Obs Mean Std. Dev. Min Max

-------------+--------------------------------------------------------

sex | 4699 1.56395 .4959463 1 2

sbp | 4699 132.7665 22.8011 80 270

dbp | 4699 82.5416 12.73732 40 148

scl | 4666 228.2925 44.54262 115 568

chdfate | 4699 .313471 .4639534 0 1

-------------+--------------------------------------------------------

followup | 4699 8061.313 3595.311 18 11688

age | 4699 46.04107 8.504363 30 68

bmi | 4690 25.63171 4.094672 16.2 57.6

month | 4699 6.369227 3.683821 1 12

id | 4699 2350 1356.629 1 4699

Tabel deskripsi di atas menginformasikan bahwa terdapat 10 variabel, masing-masing variabel

tersebut adalah :

1. sbp = Tekanan darah sistolik dalam mm Hg 2. dbp = Tekanan darah diastolik dalam mm Hg, 3. age = umur dalam tahun, 4. scl = serum kolesterol dalam mg/100 ml, 5. bmi = indeks mass tubuh (IMT)=berat /tinggi2 dalam kg/m2, 6. sex = jenis kelamin dengan kode 1: bila laki-laki dan 2: bila perempuan, 7. month = bulan pada tahun pelaksanaan studi /(baseline exam) occurred, 8. id = variabel identifikasi pasien (dinomori 1 sd 4699). Informasi tindak-lanjut (follow up) penyakit jantung koroner atau CHD (coronary heart disease) : 9. followup = Masa follow up terhadap subjek dalam hari 10. chdfate = 1: jika subjek terpapar CHD hingga akhir masa follow-up dan 0: bila tidak.

Langkah 2 : mentransformasi data

Transformasi data merupakan suatu proses untuk merubah bentuk data. Transformasi tersebut

dilakukan terhadap variabel yang akan diteliti dengan tujuan agar data siap dianalisis. Banyak

cara yang dapat dilakukan untuk merubah bentuk data dengan menggunakan STATA diantaranya

dengan perintah generate, recode, replace dll.

Dalam hal ini, akan dilakukan perintah generate untuk komputasi/perhitungan matematis yang

melibatkan variabel sbp, bmi, age dan scl. Transformasi yang dilakukan adalah “log

transformation”.

. gen logsbp = log(sbp)

. gen logbmi = log(bmi)

(9 missing values generated)

. gen logage = log(age)

Page 4: Tugas Regresi

Hal 3

Iswandi

NPM : 0806470421 Analisis Regresi Linear - Uji Interaksi

. gen logscl = log(scl)

(33 missing values generated)

Selanjutnya juga dilakukan log transformation terhadap variabel yang diduga berinteraksi :

. gen logbmiage = logbmi*logage

(9 missing values generated)

. gen logbmiscl = logbmi*logscl

(41 missing values generated)

Langkah 3 : melakukan uji interaksi

Setelah data siap untuk dianalisis, maka selanjutnya dapat dilakukan uji interaksi. Uji interaksi

merupakan uji khusus Regresi multiple/berganda linear dimana dalam persamaan regresinya

mengandung unsur interaksi (perkalian dua atau lebih variabel independen).

Dengan menggunakan data tersebut di atas kita ingin mengetahui :

1. Hubungan antara variabel bmi (indeks mass tubuh dalam kg/m2), sbp (tekanan darah sistolik

dalam mm Hg) dan age (umur dalam tahun). Dalam hal ini kita ingin megetahui apakah ada

hubungan interaksi antara bmi dan age.

Hipotesa yang akan duji : Semakin tinggi bmi dan age akan berpengaruh terhadap semakin

tinggi sbp. Untuk menguji apakah age merupakan variabel interaksi, maka persamaan regresi

dapat ditulis sbb :

Sbp = α + β1 (bmi) + β2 (age) + e

Jika variabel age merupakan variabel interaksi, maka koefisien β2 harus signifikan pada 0.05

2. Hubungan antara variabel scl (serum kolesterol dalam mg/100 ml), sbp (tekanan darah sistolik

dalam mm Hg) dan age (umur dalam tahun). Dalam hal ini kita ingin megetahui apakah ada

hubungan interaksi antara bmi dan scl.

Hipotesa yang akan duji : Semakin tinggi bmi dan scl akan berpengaruh terhadap semakin

tinggi sbp. Untuk menguji apakah scl merupakan variabel interaksi, maka persamaan regresi

dapat ditulis sbb :

Sbp = α + β1 (bmi) + β2 (scl) + e

Jika variabel scl merupakan variabel interaksi, maka koefisien β2 harus signifikan pada 0.05

Page 5: Tugas Regresi

Hal 4

Iswandi

NPM : 0806470421 Analisis Regresi Linear - Uji Interaksi

Langkah Analisis dengan STATA :

1. Melakukan perintah regresi tanpa interaksi bmi*age (Model 1)

. reg logsbp logbmi logage

Source | SS df MS Number of obs = 4690

-------------+------------------------------ F( 2, 4687) = 695.20

Model | 27.9201578 2 13.9600789 Prob > F = 0.0000

Residual | 94.118297 4687 .020080712 R-squared = 0.2288

-------------+------------------------------ Adj R-squared = 0.2285

Total | 122.038455 4689 .026026542 Root MSE = .14171

------------------------------------------------------------------------------

logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

logbmi | .2885454 .0136459 21.15 0.000 .2617931 .3152977

logage | .2982245 .0113647 26.24 0.000 .2759443 .3205046

_cons | 2.805653 .0558119 50.27 0.000 2.696236 2.915071

2. Melakukan perintah regresi dengan interaksi bmi*age (Model 2)

. reg logsbp logbmi logage logbmiage

Source | SS df MS Number of obs = 4690

-------------+------------------------------ F( 3, 4686) = 463.82

Model | 27.9413584 3 9.31378613 Prob > F = 0.0000

Residual | 94.0970964 4686 .020080473 R-squared = 0.2290

-------------+------------------------------ Adj R-squared = 0.2285

Total | 122.038455 4689 .026026542 Root MSE = .14171

------------------------------------------------------------------------------

logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

logbmi | .0100482 .2713837 0.04 0.970 -.5219915 .5420879

logage | .0623825 .2298084 0.27 0.786 -.38815 .512915

logbmiage | .0730024 .0710477 1.03 0.304 -.0662846 .2122893

_cons | 3.70498 .8770245 4.22 0.000 1.985599 5.42436

------------------------------------------------------------------------------

3. Melakukan perintah regresi tanpa interaksi bmi dan scl (Model 3)

. reg logsbp logbmi logscl

Source | SS df MS Number of obs = 4658

-------------+------------------------------ F( 2, 4655) = 401.86

Model | 17.8278544 2 8.91392719 Prob > F = 0.0000

Residual | 103.254589 4655 .022181437 R-squared = 0.1472

-------------+------------------------------ Adj R-squared = 0.1469

Total | 121.082444 4657 .026000095 Root MSE = .14893

------------------------------------------------------------------------------

logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

logbmi | .3240883 .0143682 22.56 0.000 .2959198 .3522568

logscl | .1533013 .0115742 13.25 0.000 .1306104 .1759923

_cons | 2.998128 .0716335 41.85 0.000 2.857692 3.138563

------------------------------------------------------------------------------

Page 6: Tugas Regresi

Hal 5

Iswandi

NPM : 0806470421 Analisis Regresi Linear - Uji Interaksi

4. Melakukan perintah regresi dengan interaksi bmi*scl (Model 4)

. reg logsbp logbmi logscl logbmiscl

Source | SS df MS Number of obs = 4658

-------------+------------------------------ F( 3, 4654) = 267.86

Model | 17.8282584 3 5.9427528 Prob > F = 0.0000

Residual | 103.254185 4654 .022186116 R-squared = 0.1472

-------------+------------------------------ Adj R-squared = 0.1467

Total | 121.082444 4657 .026000095 Root MSE = .14895

------------------------------------------------------------------------------

logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

logbmi | .3787855 .405585 0.93 0.350 -.4163532 1.173924

logscl | .1860009 .2425947 0.77 0.443 -.2895997 .6616015

logbmiscl | -.0101276 .0750498 -0.13 0.893 -.1572608 .1370056

_cons | 2.821572 1.310313 2.15 0.031 .2527382 5.390407

------------------------------------------------------------------------------

Langkah 4 : menginterpretasi output

1. Regresi tanpa interaksi bmi dan age (Model 1)

a. Koefisien determinasi

Koefisien determinasi Dari output diketahui besarnya R-Squared adalah 0.2288, hal ini berarti

22.88% variasi sbp dapat dijelaskan oleh variasi dari variabel prediktor bmi dan age.

Sedangkan 77.12% dijelaskan oleh sebab-sebab yang lain di luar model.

b. Uji F (signifikansi simultan)

Uji Anova atau uji F menghasilkan nilai F sebesar 695.20 dengan tingkat signifikansi 0.00001.

Karena probabilitas signifikan jauh lebih kecil dari 0.05, maka model regresi dapat digunakan

untuk memprediksi sbp atau dapat dikatakan bahwa bmi dan age secara bersama-sama

berpengaruh terhadap sbp.

c. Uji t (signifikansi parameter individual)

Dari kedua variabel prediktor yang dimasukkan ke dalam regresi, variabel bmi dan age

keduanya berpengaruh secara signifikan terhadap sbp. Variabel bmi memberikan nilai

koefisien parameter 0.288 dengan tingkat signifikansi 0.0001 dan variabel age memberikan

nilai koefisien parameter 0.298 dengan tingkat signifikansi 0.0001 lebih kecil dari 0.05.

2. Regresi dengan interaksi bmi*age (Model 2)

a. Koefisien determinasi

Page 7: Tugas Regresi

Hal 6

Iswandi

NPM : 0806470421 Analisis Regresi Linear - Uji Interaksi

Tampilan output STATA memberikan besarnya R-squared sebesar 0.2290, hal ini berarti

22.90% variasi sbp yang dapat dijelaskan oleh variabel bmi, age dan interaksi bmi*age.

Sedangkan sisanya dijelaskan oleh sebab-sebab lain di luar model.

b. Uji F (signifikansi simultan)

Uji Anova atau uji F menghasilkan nilai F sebesar 463.82 dengan tingkat signifikansi 0.00001.

Karena probabilitas signifikan jauh lebih kecil dari 0.05, maka model regresi dapat digunakan

untuk memprediksi sbp atau dapat dikatakan bahwa variabel bmi, age dan interaksi bmi*age

secara bersama-sama berpengaruh terhadap sbp.

c. Uji t (signifikansi parameter individual)

Dari ketiga variabel independen yang dimasukkan ke dalam regresi, ternyata ketiganya tidak

satupun yang berpengaruh secara signifikan terhadap sbp. Seluruhnya memberikan tingkat

signifikansi yang lebih besar dari 0.05. Demikian juga variabel interaksi bmi*age tidak

signifikan. Maka dapat disimpulkan bahwa variabel age bukanlah variabel interaksi.

Karena age bukan merupakan var interaksi, maka dengan demikian model 1 di atas

merupakan model akhir yang menggambarkan hubungan antara indeks mass tubuh, tekanan

darah sistolik dan umur pasien dimana tidak ada interaksi antara indeks mass tubuh dengan

umur pasien

3. Regresi tanpa interaksi bmi dan scl (Model 3)

a. Koefisien determinasi

Tampilan output STATA memberikan besarnya R-squared sebesar 0.1472, hal ini berarti hanya

14.72% variasi sbp yang dapat dijelaskan oleh variabel bmi dan scl. Sedangkan sisanya

dijelaskan oleh sebab-sebab lain di luar model.

b. Uji F (signifikansi simultan)

Uji Anova atau uji F menghasilkan nilai F sebesar 401.86 dengan tingkat signifikansi

0.00001.Karena probabilitas signifikan jauh lebih kecil dari 0.05, maka model regresi dapat

digunakan untuk memprediksi sbp atau dapat dikatakan bahwa variabel bmi dan scl secara

bersama¬sama berpengaruh terhadap sbp.

c. Uji t (signifikansi parameter individual)

Dari kedua variabel independen yang dimasukkan ke dalam regresi, yaitu variabel bmi dan scl

keduanya berpengaruh secara signifikan terhadap sbp. Variabel bmi memberikan nilai

Page 8: Tugas Regresi

Hal 7

Iswandi

NPM : 0806470421 Analisis Regresi Linear - Uji Interaksi

koefisien parameter 0.324 dengan tingkat signifikansi 0.0001 dan variabel scl memberikan

nilai koefisien parameter 0.153 dengan tingkat signifikansi 0.0001, keduanya lebih kecil dari

0.05.

4. Regresi dengan interaksi bmi*scl (Model 4)

a. Koefisien determinasi

Tampilan output STATA memberikan besarnya R-squared sebesar 0.1472, hal ini berarti hanya

14.72% variasi sbp yang dapat dijelaskan oleh variabel bmi, scl dan interaksi bmi*scl.

Sedangkan sisanya dijelaskan oleh sebab-sebab lain di luar model.

b. Uji F (signifikansi simultan)

Uji Anova atau uji F menghasilkan nilai F sebesar 267.86 dengan tingkat signifikansi 0.00001.

Karena probabilitas signifikan jauh lebih kecil dari 0.05, maka model regresi dapat digunakan

untuk memprediksi sbp atau dapat dikatakan bahwa variabel bmi, scl dan interaksi bmi*scl

secara bersama-sama berpengaruh terhadap sbp.

c. Uji t (signifikansi parameter individual)

Dari ketiga variabel independen yang dimasukkan ke dalam regresi, ketiganya tidak

berpengaruh secara signifikan terhadap sbp. Demikian juga variabel interaksi bmi*scl ternyata

tidak signifikan. Sehingga dapat disimpulkan bahwa variabel scl bukanlah variabel interaksi.

Dengan demikian model 3 -lah (bukan model 4) sebagai model akhir yang menggambarkan

hubungan antara indeks mass tubuh, tekanan darah sistolik dan serum kolesterol dimana

tidak ada interaksi antara indeks mass tubuh dengan serum kolesterol.

Langkah 5 : Kesimpulan

1. Tidak ada interaksi antara indeks mass tubuh dengan umur pasien pada hubungan antara

indeks mass tubuh, tekanan darah sistolik dan umur pasien. Persamaan regresinya dapat

ditulis sbb (model 1) :

logsbp = 2.805 + 0.288 (logbmi) + 0.298 (logage)

2. Tidak ada interaksi antara indeks mass tubuh dengan serum kolesterol pada hubungan antara

indeks mass tubuh, tekanan darah sistolik dan serum kolesterol. Persamaan regresinya dapat

ditulis sbb (model 3) :

Logsbp = 2.998 + 0.324 (logbmi) + 0.153 (logscl)