Upload
iswandi
View
397
Download
0
Embed Size (px)
DESCRIPTION
Tugas Analisis Regresi 3, Dosen Pengajar : Pandu Riono, PhD
Citation preview
Public Health - University of Indonesia Kampus UI, Depok 16424 Indonesia http://www.fkm. ui. ac.id/
University of Indonesia
Tugas Kokurikuler III Mata Kuliah ‘Analisis Regresi Linear’ Dosen Pengajar : dr. Pandu Riono, MD, MPH, PhD
AAnnaalliissiiss RReeggrreessii ddeennggaann
VVaarriiaabbeell IInntteerraakkssii
Oleh :
Iswandi
0806470421
Program Pascasarjana
Departemen Biostatistik dan Kependudukan
Fakultas Kesehatan Masyarakat
Universitas Indonesia
Depok, 05 April 2009
Hal 1
Iswandi
NPM : 0806470421 Analisis Regresi Linear - Uji Interaksi
Permasalahan :
Dengan menggunakan data studi Framingham ‘Fram.dta’, carilah efek interaksi variabel age (usia
dalam tahun) dan variabel scl (serum kolesterol dalam 100 mg/100 ml) terhadap hubungan
antara variabel bmi (indeks mass tubuh dalam kg/m2) dan sbp (tekanan darah sistolik dalam mm
Hg).
Penyelesaian : Langkah 1 : mendeskripsikan variabel . des
Contains data from E:\My Documents\UI Material\Slide UI\Semester
2\Regresi_Linear\hw3\Fram.dta
obs: 4,699
vars: 10 11 Jan 1999 19:56
size: 206,756 (98.0% of memory free)
-------------------------------------------------------------------------------
storage display value
variable name type format label variable label
-------------------------------------------------------------------------------
sex float %9.0g sex Sex
sbp float %9.0g Systolic Blood Pressure
dbp float %9.0g Diastolic Blood Pressure
scl float %9.0g Serum Cholesterol
chdfate float %9.0g fate Coronary Heart Disease
followup float %9.0g Follow-up in Days
age float %9.0g Age in Years
bmi float %9.0g Body Mass Index
month float %9.0g Study Month of Baseline Exam
id float %9.0g
-------------------------------------------------------------------------------
Sorted by: followup
sbp
Age scl
bmi
Hal 2
Iswandi
NPM : 0806470421 Analisis Regresi Linear - Uji Interaksi
. sum
Variable | Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
sex | 4699 1.56395 .4959463 1 2
sbp | 4699 132.7665 22.8011 80 270
dbp | 4699 82.5416 12.73732 40 148
scl | 4666 228.2925 44.54262 115 568
chdfate | 4699 .313471 .4639534 0 1
-------------+--------------------------------------------------------
followup | 4699 8061.313 3595.311 18 11688
age | 4699 46.04107 8.504363 30 68
bmi | 4690 25.63171 4.094672 16.2 57.6
month | 4699 6.369227 3.683821 1 12
id | 4699 2350 1356.629 1 4699
Tabel deskripsi di atas menginformasikan bahwa terdapat 10 variabel, masing-masing variabel
tersebut adalah :
1. sbp = Tekanan darah sistolik dalam mm Hg 2. dbp = Tekanan darah diastolik dalam mm Hg, 3. age = umur dalam tahun, 4. scl = serum kolesterol dalam mg/100 ml, 5. bmi = indeks mass tubuh (IMT)=berat /tinggi2 dalam kg/m2, 6. sex = jenis kelamin dengan kode 1: bila laki-laki dan 2: bila perempuan, 7. month = bulan pada tahun pelaksanaan studi /(baseline exam) occurred, 8. id = variabel identifikasi pasien (dinomori 1 sd 4699). Informasi tindak-lanjut (follow up) penyakit jantung koroner atau CHD (coronary heart disease) : 9. followup = Masa follow up terhadap subjek dalam hari 10. chdfate = 1: jika subjek terpapar CHD hingga akhir masa follow-up dan 0: bila tidak.
Langkah 2 : mentransformasi data
Transformasi data merupakan suatu proses untuk merubah bentuk data. Transformasi tersebut
dilakukan terhadap variabel yang akan diteliti dengan tujuan agar data siap dianalisis. Banyak
cara yang dapat dilakukan untuk merubah bentuk data dengan menggunakan STATA diantaranya
dengan perintah generate, recode, replace dll.
Dalam hal ini, akan dilakukan perintah generate untuk komputasi/perhitungan matematis yang
melibatkan variabel sbp, bmi, age dan scl. Transformasi yang dilakukan adalah “log
transformation”.
. gen logsbp = log(sbp)
. gen logbmi = log(bmi)
(9 missing values generated)
. gen logage = log(age)
Hal 3
Iswandi
NPM : 0806470421 Analisis Regresi Linear - Uji Interaksi
. gen logscl = log(scl)
(33 missing values generated)
Selanjutnya juga dilakukan log transformation terhadap variabel yang diduga berinteraksi :
. gen logbmiage = logbmi*logage
(9 missing values generated)
. gen logbmiscl = logbmi*logscl
(41 missing values generated)
Langkah 3 : melakukan uji interaksi
Setelah data siap untuk dianalisis, maka selanjutnya dapat dilakukan uji interaksi. Uji interaksi
merupakan uji khusus Regresi multiple/berganda linear dimana dalam persamaan regresinya
mengandung unsur interaksi (perkalian dua atau lebih variabel independen).
Dengan menggunakan data tersebut di atas kita ingin mengetahui :
1. Hubungan antara variabel bmi (indeks mass tubuh dalam kg/m2), sbp (tekanan darah sistolik
dalam mm Hg) dan age (umur dalam tahun). Dalam hal ini kita ingin megetahui apakah ada
hubungan interaksi antara bmi dan age.
Hipotesa yang akan duji : Semakin tinggi bmi dan age akan berpengaruh terhadap semakin
tinggi sbp. Untuk menguji apakah age merupakan variabel interaksi, maka persamaan regresi
dapat ditulis sbb :
Sbp = α + β1 (bmi) + β2 (age) + e
Jika variabel age merupakan variabel interaksi, maka koefisien β2 harus signifikan pada 0.05
2. Hubungan antara variabel scl (serum kolesterol dalam mg/100 ml), sbp (tekanan darah sistolik
dalam mm Hg) dan age (umur dalam tahun). Dalam hal ini kita ingin megetahui apakah ada
hubungan interaksi antara bmi dan scl.
Hipotesa yang akan duji : Semakin tinggi bmi dan scl akan berpengaruh terhadap semakin
tinggi sbp. Untuk menguji apakah scl merupakan variabel interaksi, maka persamaan regresi
dapat ditulis sbb :
Sbp = α + β1 (bmi) + β2 (scl) + e
Jika variabel scl merupakan variabel interaksi, maka koefisien β2 harus signifikan pada 0.05
Hal 4
Iswandi
NPM : 0806470421 Analisis Regresi Linear - Uji Interaksi
Langkah Analisis dengan STATA :
1. Melakukan perintah regresi tanpa interaksi bmi*age (Model 1)
. reg logsbp logbmi logage
Source | SS df MS Number of obs = 4690
-------------+------------------------------ F( 2, 4687) = 695.20
Model | 27.9201578 2 13.9600789 Prob > F = 0.0000
Residual | 94.118297 4687 .020080712 R-squared = 0.2288
-------------+------------------------------ Adj R-squared = 0.2285
Total | 122.038455 4689 .026026542 Root MSE = .14171
------------------------------------------------------------------------------
logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
logbmi | .2885454 .0136459 21.15 0.000 .2617931 .3152977
logage | .2982245 .0113647 26.24 0.000 .2759443 .3205046
_cons | 2.805653 .0558119 50.27 0.000 2.696236 2.915071
2. Melakukan perintah regresi dengan interaksi bmi*age (Model 2)
. reg logsbp logbmi logage logbmiage
Source | SS df MS Number of obs = 4690
-------------+------------------------------ F( 3, 4686) = 463.82
Model | 27.9413584 3 9.31378613 Prob > F = 0.0000
Residual | 94.0970964 4686 .020080473 R-squared = 0.2290
-------------+------------------------------ Adj R-squared = 0.2285
Total | 122.038455 4689 .026026542 Root MSE = .14171
------------------------------------------------------------------------------
logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
logbmi | .0100482 .2713837 0.04 0.970 -.5219915 .5420879
logage | .0623825 .2298084 0.27 0.786 -.38815 .512915
logbmiage | .0730024 .0710477 1.03 0.304 -.0662846 .2122893
_cons | 3.70498 .8770245 4.22 0.000 1.985599 5.42436
------------------------------------------------------------------------------
3. Melakukan perintah regresi tanpa interaksi bmi dan scl (Model 3)
. reg logsbp logbmi logscl
Source | SS df MS Number of obs = 4658
-------------+------------------------------ F( 2, 4655) = 401.86
Model | 17.8278544 2 8.91392719 Prob > F = 0.0000
Residual | 103.254589 4655 .022181437 R-squared = 0.1472
-------------+------------------------------ Adj R-squared = 0.1469
Total | 121.082444 4657 .026000095 Root MSE = .14893
------------------------------------------------------------------------------
logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
logbmi | .3240883 .0143682 22.56 0.000 .2959198 .3522568
logscl | .1533013 .0115742 13.25 0.000 .1306104 .1759923
_cons | 2.998128 .0716335 41.85 0.000 2.857692 3.138563
------------------------------------------------------------------------------
Hal 5
Iswandi
NPM : 0806470421 Analisis Regresi Linear - Uji Interaksi
4. Melakukan perintah regresi dengan interaksi bmi*scl (Model 4)
. reg logsbp logbmi logscl logbmiscl
Source | SS df MS Number of obs = 4658
-------------+------------------------------ F( 3, 4654) = 267.86
Model | 17.8282584 3 5.9427528 Prob > F = 0.0000
Residual | 103.254185 4654 .022186116 R-squared = 0.1472
-------------+------------------------------ Adj R-squared = 0.1467
Total | 121.082444 4657 .026000095 Root MSE = .14895
------------------------------------------------------------------------------
logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
logbmi | .3787855 .405585 0.93 0.350 -.4163532 1.173924
logscl | .1860009 .2425947 0.77 0.443 -.2895997 .6616015
logbmiscl | -.0101276 .0750498 -0.13 0.893 -.1572608 .1370056
_cons | 2.821572 1.310313 2.15 0.031 .2527382 5.390407
------------------------------------------------------------------------------
Langkah 4 : menginterpretasi output
1. Regresi tanpa interaksi bmi dan age (Model 1)
a. Koefisien determinasi
Koefisien determinasi Dari output diketahui besarnya R-Squared adalah 0.2288, hal ini berarti
22.88% variasi sbp dapat dijelaskan oleh variasi dari variabel prediktor bmi dan age.
Sedangkan 77.12% dijelaskan oleh sebab-sebab yang lain di luar model.
b. Uji F (signifikansi simultan)
Uji Anova atau uji F menghasilkan nilai F sebesar 695.20 dengan tingkat signifikansi 0.00001.
Karena probabilitas signifikan jauh lebih kecil dari 0.05, maka model regresi dapat digunakan
untuk memprediksi sbp atau dapat dikatakan bahwa bmi dan age secara bersama-sama
berpengaruh terhadap sbp.
c. Uji t (signifikansi parameter individual)
Dari kedua variabel prediktor yang dimasukkan ke dalam regresi, variabel bmi dan age
keduanya berpengaruh secara signifikan terhadap sbp. Variabel bmi memberikan nilai
koefisien parameter 0.288 dengan tingkat signifikansi 0.0001 dan variabel age memberikan
nilai koefisien parameter 0.298 dengan tingkat signifikansi 0.0001 lebih kecil dari 0.05.
2. Regresi dengan interaksi bmi*age (Model 2)
a. Koefisien determinasi
Hal 6
Iswandi
NPM : 0806470421 Analisis Regresi Linear - Uji Interaksi
Tampilan output STATA memberikan besarnya R-squared sebesar 0.2290, hal ini berarti
22.90% variasi sbp yang dapat dijelaskan oleh variabel bmi, age dan interaksi bmi*age.
Sedangkan sisanya dijelaskan oleh sebab-sebab lain di luar model.
b. Uji F (signifikansi simultan)
Uji Anova atau uji F menghasilkan nilai F sebesar 463.82 dengan tingkat signifikansi 0.00001.
Karena probabilitas signifikan jauh lebih kecil dari 0.05, maka model regresi dapat digunakan
untuk memprediksi sbp atau dapat dikatakan bahwa variabel bmi, age dan interaksi bmi*age
secara bersama-sama berpengaruh terhadap sbp.
c. Uji t (signifikansi parameter individual)
Dari ketiga variabel independen yang dimasukkan ke dalam regresi, ternyata ketiganya tidak
satupun yang berpengaruh secara signifikan terhadap sbp. Seluruhnya memberikan tingkat
signifikansi yang lebih besar dari 0.05. Demikian juga variabel interaksi bmi*age tidak
signifikan. Maka dapat disimpulkan bahwa variabel age bukanlah variabel interaksi.
Karena age bukan merupakan var interaksi, maka dengan demikian model 1 di atas
merupakan model akhir yang menggambarkan hubungan antara indeks mass tubuh, tekanan
darah sistolik dan umur pasien dimana tidak ada interaksi antara indeks mass tubuh dengan
umur pasien
3. Regresi tanpa interaksi bmi dan scl (Model 3)
a. Koefisien determinasi
Tampilan output STATA memberikan besarnya R-squared sebesar 0.1472, hal ini berarti hanya
14.72% variasi sbp yang dapat dijelaskan oleh variabel bmi dan scl. Sedangkan sisanya
dijelaskan oleh sebab-sebab lain di luar model.
b. Uji F (signifikansi simultan)
Uji Anova atau uji F menghasilkan nilai F sebesar 401.86 dengan tingkat signifikansi
0.00001.Karena probabilitas signifikan jauh lebih kecil dari 0.05, maka model regresi dapat
digunakan untuk memprediksi sbp atau dapat dikatakan bahwa variabel bmi dan scl secara
bersama¬sama berpengaruh terhadap sbp.
c. Uji t (signifikansi parameter individual)
Dari kedua variabel independen yang dimasukkan ke dalam regresi, yaitu variabel bmi dan scl
keduanya berpengaruh secara signifikan terhadap sbp. Variabel bmi memberikan nilai
Hal 7
Iswandi
NPM : 0806470421 Analisis Regresi Linear - Uji Interaksi
koefisien parameter 0.324 dengan tingkat signifikansi 0.0001 dan variabel scl memberikan
nilai koefisien parameter 0.153 dengan tingkat signifikansi 0.0001, keduanya lebih kecil dari
0.05.
4. Regresi dengan interaksi bmi*scl (Model 4)
a. Koefisien determinasi
Tampilan output STATA memberikan besarnya R-squared sebesar 0.1472, hal ini berarti hanya
14.72% variasi sbp yang dapat dijelaskan oleh variabel bmi, scl dan interaksi bmi*scl.
Sedangkan sisanya dijelaskan oleh sebab-sebab lain di luar model.
b. Uji F (signifikansi simultan)
Uji Anova atau uji F menghasilkan nilai F sebesar 267.86 dengan tingkat signifikansi 0.00001.
Karena probabilitas signifikan jauh lebih kecil dari 0.05, maka model regresi dapat digunakan
untuk memprediksi sbp atau dapat dikatakan bahwa variabel bmi, scl dan interaksi bmi*scl
secara bersama-sama berpengaruh terhadap sbp.
c. Uji t (signifikansi parameter individual)
Dari ketiga variabel independen yang dimasukkan ke dalam regresi, ketiganya tidak
berpengaruh secara signifikan terhadap sbp. Demikian juga variabel interaksi bmi*scl ternyata
tidak signifikan. Sehingga dapat disimpulkan bahwa variabel scl bukanlah variabel interaksi.
Dengan demikian model 3 -lah (bukan model 4) sebagai model akhir yang menggambarkan
hubungan antara indeks mass tubuh, tekanan darah sistolik dan serum kolesterol dimana
tidak ada interaksi antara indeks mass tubuh dengan serum kolesterol.
Langkah 5 : Kesimpulan
1. Tidak ada interaksi antara indeks mass tubuh dengan umur pasien pada hubungan antara
indeks mass tubuh, tekanan darah sistolik dan umur pasien. Persamaan regresinya dapat
ditulis sbb (model 1) :
logsbp = 2.805 + 0.288 (logbmi) + 0.298 (logage)
2. Tidak ada interaksi antara indeks mass tubuh dengan serum kolesterol pada hubungan antara
indeks mass tubuh, tekanan darah sistolik dan serum kolesterol. Persamaan regresinya dapat
ditulis sbb (model 3) :
Logsbp = 2.998 + 0.324 (logbmi) + 0.153 (logscl)