of 59/59
RINGKASAN KULIAH APLIKASI ANALISA EPIDEMIOLOGI LANJUT 1 Disusun oleh: Resthie Rachmanta Putri NPM 1406519972 PJMK: Prof. Dr. dr. Bambang Sutrisna, MHSc Peminatan Epidemiologi Klinik Fakultas Kesehatan Masyarakat Universitas Indonesia

Ringkasan Cat Kuliah Analisa Epid Lanjut

  • View
    53

  • Download
    3

Embed Size (px)

DESCRIPTION

Ringkasan Cat Kuliah Analisa Epid Lanjut

Text of Ringkasan Cat Kuliah Analisa Epid Lanjut

RINGKASAN KULIAHAPLIKASI ANALISA EPIDEMIOLOGI LANJUT 1

Disusun oleh:Resthie Rachmanta PutriNPM 1406519972

PJMK: Prof. Dr. dr. Bambang Sutrisna, MHSc

Peminatan Epidemiologi KlinikFakultas Kesehatan MasyarakatUniversitas Indonesia

JakartaApril 2015KULIAH PENDAHULUANAPLIKASI ANALISA EPIDEMIOLOGI LANJUT 114 FEBRUARI 2015

Alpha-error = false positive = disebut-sebut ada padahal tidak ada = gosipBeta-error = false negative = ada tapi tidak pernah disebut-sebut = selingkuh

Epidemiologi: ilmu tentang kependudukan. Epidemiologi merupakan suatu ilmu, tetapi juga merupakan suatu pendekatan.

Respons epidemiologi sesuatu yang menjadi masalah kalau bisa dihilangkan (eradikasi)

Penelitian S2-S3 umumnya tujuannya untuk mengungkap hubungan sebab-akibat.

Dalam epidemiologi, ada necessary condition dan ada contributing condition (contoh: penyakit TB, harus ada M. Tuberculosis, tapi tidak selalu M. Tuberculosis menjadi penyakit TB). Kondisi lain adalah sufficient condition (misalnya: buta bisa karena penyakit pada mata, bisa karena trauma, dll).

AAEL-1 fokusnya pada cross sectional dan case control. AAEL-2 fokusnya pada kohort.

Persiapkan proposal kasar, yang desainnya cross sectional atau case control. Pada UTS menyerahkan proposal kasar tersebut. Pada UAS, akan diberikan data set untuk diolah menghasilkan informasi yang diolah menjadi manuskrip untuk dipublikasi.

KULIAH AAEL-121 Februari 2015BERBAGAI ANALISA STATISTIK SEDERHANA

Pengenalan StataStata terdiri dari 7 window: (8 window bila menampilkan grafik). Window pada Stata seperti yang ditunjukkan dengan tanda panah () di bawah ini:Pull down menu

Command pada StataSemua command stata selalu dalam huruf kecil Untuk menutup stata: exit, clear Untuk melihat isi directory folder stata: dir Untuk menghapus variable: clear Untuk melihat variable yang ada di dlm memori stata: Buka file auto.dta, kemudian di command: describe Untuk mentabulasi suatu variabel: tabu Untuk mendeskripsikan isi dari semua variabel: summarize / summ Untuk melihat jenis variabel: describe / descr Untuk melihat buku kode dari variabel: codebook

Mengedit data pada Stata Untuk mengedit data, di pulldown menu, pilih data > data editor.Akan muncul data editor yang formatnya mirip dengan Ms. Excel. Ada berbagai warna: Warna merah: string Hitam: numerik Biru: kategorik

Variabel make nilainya nol karena variabelnya string.

Menyimpan file .logUntuk menyimpan result yang sudah diolah supaya tdk hilang: log using .log, misalnya log using latihan1.log

artinya, fle kul21feb disimpan dalam folder stata 9, yang disimpan adalah semua yang bentuknya text. Jadi kalau ada grafik, harus disimpan terpisah.

Bila setelah melanjutkan pekerjaan, kita akan berhenti mengerjakan, command: log close.

Kelebihan .log file bisa dibuka dengan stata, notepad, ms.word.

Untuk menyambung pekerjaan yang sebelumnya sudah disimpan, command: log using , append

Aplikasi command Stata

Kalau mau mendeskripsikan data pada suatu variabel dengan detail: commandnya summ , detail.

Perbedaan summ dengan summ, detail:Summ yang ditampilkan hanya mean, nilai minimum, nilai maximum. Kalau summ, detail yang ditampilkan ada persentil, varians, skewness, kurtosis, dll.

Kalau datanya numerik, pakainya summarize. Kalau data kategorik, pakainya tabulate.

Untuk menampilkan grafik scatter plot, commandnya scatter . Misalnya: scatter weight mpg. Hasilnya spt di bawah ini:

Untuk menyimpan grafik ini, copy gambarnya dr stata, kmd di-paste ke ms.office. Atau klik kanan, save graph. Kemudian nama file diberi .wmf di belakangnya supaya bisa dibuka di word document.

Kalau mau membuat banyak scatter plot, di pulldown menu pilih graphics > easy graph > scatter plot matrix >(pilih variabel-variabel numerik yang mau dibuat scatter plot). Hasilnya seperti ini:

Kalau mau setengahnya, command ditambah , half

MEMBUAT DATA BARUBuka data editor. Masukkan data pertamanya dulu. Baru kemudian ubah nama variabelnya dengan cara double klik di masing2 data.

LATIHAN (TUGAS DI RUMAH)1. Buat variabel baru low, mengkategorikan kelompok berat bayi lahir dari variabel bwt, dengan kategori:a. BBL = 2500 gram =22. Buat label pada variabel low dengan nama bwt group3. Buat label pada kategori low 1=low, 2=normal4. Buat variabel baru low2, mengganti nilai variabel lowa. 1 menjadi 0 dengan label lowb. 2 menjadi 1 dengan label normal5. Buat variabel baru ln_lwt berasal dari formulasi log natural variabel lwt.

KULIAH AAEL-128 FEBRUARI 2015ANALISA TABEL 2X2

Tujuan AAEL-1: Membuat manuskrip Membuat proposal penelitian dengan desain cross sectional atau case control Mampu mengolah data dengan STATA

Macam-macam research: Diagnostic research: mengembangkan alat diagnostik yang lebih sederhana tapi valid Therapeutic research: mengembangkan obat-obatan untuk terapi (mll uji klinis) Prognostic research Etiologic research

Memulai research proposal:1. Menentukan topik yang Mau diteliti (causal model).2. Mengembangkan matriks fakta-hipotesis. Mana yg sudah jd fakta, mana yg mrpk hipotesis, mana yg kontroversial? Kalau sudah jd fakta, tidak perlu diteliti lagi, kecuali mau bikin penelitian untuk membantah fakta.3. Mengembangkan variabel-indicator matrix. Misalnya variabel status nutrisi, indikatornya BB/U, TB/U, BB/TB, metode pengukurannya bagaimana, dan referensinya.4. Menentukan desain penelitian.5. Bagaimana prosedur samplingnya.6. Pilih metode statistik.*buat dummy table sebelum ada data supaya tahu kira2 datanya akan menghasilkan informasi seperti apa.

Metode mengembangkan hipotesis: Method of difference Method of agreement Method of concomitant variant

Yang sering menjadi masalah dalam membuat penelitian:Masalah kesehatannya ada tapi masalah yang dicantumkan pada tesis tidak ada.

Komponen yang harus ada dalam introduksi proposal:1. Besaran masalah penelitian2. Kalau kita meneliti masalah tersebut, impactnya apa?3. Komponen masalah spesifik (yang dilakukan termasuk diagnostic/ prognostic/ therapeutic/ etiognostic research?)4. Elaborasi (dari berbagai kepustakaan, ada yang kontroversial atau tidak?)5. Kesenjangan (ada kesenjangan antara apa yang seharusnya dan apa yang sudah ada)6. Lain-lain

Kalau penelitian banyak dilakukan, referensi sebaiknya 5 tahun terakhir.

LATIHAN STATALatihan stata hari ini: log using latihan28feb15.log.Buka file lowbwtff.dta.describe.summ

Membuat variabel baru & menghapus variabel Membuat variabel baru diberi nama bblr: gen bblr=bwt Menghapus variabel bblr: drop bblr

Membuat histogramMenyimpan gambar graph sebaiknya dalam bentuk .wmf (windows metafile) bisa dibuka di ms.office.

.histogram ln_lwt, norm

Odds RatioMencari variabel yang berhubungan dengan BBLR:Merokok lebih enak diukur dengan OR (OR digunakan dalam penelitian case control). Case control: .cc bblr2 smoke Proportion | Exposed Unexposed | Total Exposed-----------------+------------------------+------------------------ Cases | 30 29 | 59 0.5085 Controls | 44 86 | 130 0.3385-----------------+------------------------+------------------------ Total | 74 115 | 189 0.3915 | | | Point estimate | [95% Conf. Interval] |------------------------+------------------------ Odds ratio | 2.021944 | 1.029092 3.965864 (exact) Attr. frac. ex. | .5054264 | .0282695 .7478481 (exact) Attr. frac. pop | .2569965 | +------------------------------------------------- chi2(1) = 4.92 Pr>chi2 = 0.0265

Artinya :odds ibu yang merokok 2 kali lebih besar dari ibu yang tidak merokok untuk melahirkan bayi yang berat lahirnya rendah.

0dds diubah menjadi probabilitas dengan rumus p=odds/(odds+1). Pada ibu merokok/ passive smoker, probabilitas anaknya mengalami BBLR sebesar 67% (dari 100 ibu merokok, 67 ibu akan melahirkan anak yang BBLR).

data set terakhir disimpan dengan nama latihan28feb15.dta

KULIAH AAEL-17 MARET 2015ANALISIS DASAR

Persiapan membuat proposal penelitian Referensi: membuat proposal penelitian, jilid 3 (Sopiyudin Dahlan).

Proposal penelitian yang baik: mengungkapkan sesuatu yang dilihat peneliti, tetapi tidak dilihat oleh orang lain.

Isi proposal penelitian:1. Judul penelitian biasanya belakangan saja dibuatnya.2. Latar belakang masalah menjelaskan kenapa kita mau meneliti hal ini, besaran masalahnya. Kalau kita meneliti hal ini ada dampaknya ga? 3. Kepustakaan Komponen elaborasi, dilihat dari jurnal, artikel, dll untuk menghasilkan kerangka teori dan kerangka konsep.4. Dst

JUDULApa: pertanyaan penelitianDi mana: subyek penelitian, lokasiKapan: waktu penelitian

LATAR BELAKANGPenjelasan ringkas identifikasi masalah menjadi masalah penelitian (piramida terbalik). What is known What is unknown What is the aim of our study Why our study is important

RUMUSAN MASALAHRumusan masalah dlm bentuk pertanyaan penelitian.Outcome= f(determinant(s))

Pertanyaan terkait diagnostic research:Tujuan menentukan nilai diagnostik suatu indikator penyakit. Misalnya: bagaimana manfaat MRI dan USG dalam deteksi dini kanker prostat? Prostate cancer prevalence=f(MRI and USG) Desain studi: cross sectional

Pertanyaan terkait etiognostic research:Tujuan mencari hubungan kausal. Misalnya: Bagaimana risiko ca servix pada wanita dengan HPV(+)?

LATIHAN STATALog using latihan7mar15Pakai file lowbwff.dta

Mencari hubungan antar variabelMencari hubungan antara BBLR dengan variabel2 lainnya.Buat dulu tabel silang 2x2, misalnya antara merokok dengan BBLR.

Pakai command .cc (case control)

Tampilan:

OR: 2,02 (odds berbeda dengan risk!) odds bisa lebih dari satu, risk berkisar dari 0-1.

Interpretasi dari hasil di atas:Pada ibu merokok, odds kejadian BBLR 2 kali dibanding pada ibu tidak merokok, atauPada ibu merokok/ passive smoker, probabilitas anaknya mengalami BBLR sebesar 67% (dari 100 ibu merokok, 67 ibu akan melahirkan anak yang BBLR).

Odds tidak sama dengan risk/ probabilitas, kecuali pada rare disease condition (prevalensi penyakitnya kurang dari 10%). Probabilitas lebih dipilih untuk menjelaskan kepada orang awam.

Dapat darimana 67%?

p= odds/(odds+1)odds= p/(1-p)

(bs dilihat Table of gambling odds, odds, prob, & log odds)

Cara lain untuk mendapatkan odds ratio, dengan .logistic (logistic regression)

Hasil OR-nya sama dengan kalau menggunakan command .cc.Melihat hubungan antara merokok, hipertensi dengan BBLR. Tampilan seperti di bawah ini:

Interpretasi:Kalau melihat tabel di atas, mana yg lebih berpengaruh terhadap BBLR? Merokok atau hipertensi??Yang lebih berpengaruh adalah hipertensi (dilihat dari ORnya lebih besar daripada ORnya smoke).Tetapi lihat juga 95%CInya. Meskipun OR smoke lebih rendah tapi CI-nya lebih sempit (1,08-3,84), dibanding CI-nya ht (1,01-11,5). Yang lebih reliable adalah smoke.

Lihat angka OR pada result dari .logistic low smoke ht berbeda dengan OR dari .logistic low smoke saja. Yang dari .logistic low smoke ht ORnya sudah diadjust (adjusted OR).

KULIAH AAEL-114 Maret 2015ANALISIS DASAR

How to interpret scientific research and clinical trial resultsMelihat hasil penelitian, hal pertama yang dilakukan adalah menilai apakah penelitian ini riil atau by chance saja (signifikan atau tidak signifikan) dibantu oleh statistik. Bila secara statistik signifikan, maka mungkin hasil penelitian ini riil. Hal ini disebut juga ENDPOINT.

(P 48 didapat OR 2.39

Dibuat stratanya dulu, mau tahu umur itu confounding atau bukan terhadap kepribadian.Maka dilakukan mantel haenzel, didapatkan Crude 2.37MH 2.23Perbandingan Crude dan Mantel Haenzel= Chi2 = 0.1762

.

. predxcat low, xvar (race smoke) adjust (age ui ht ftv ptl) graph bar *Adjusted* Probabilities and 95% Confidence Intervals Model Type: Logistic Regression Outcome: Low birth wt Chi2 = 0.0244 Likelihood ratio test of interaction for race * smoke: LR Chi2(2) = 3.06 Prob > Chi2 = 0.2162

.

. predxcat low, xvar (ftv smoke) adjust (age ui ht race ptl) graph bar(2 missing values generated)(2 missing values generated)(2 missing values generated)(2 missing values generated)(2 missing values generated) *Adjusted* Probabilities and 95% Confidence Intervals Model Type: Logistic Regression Outcome: Low birth wt Chi2 = 0.1547 Likelihood ratio test of interaction for ftv * smoke: LR Chi2(3) = 2.25 Prob > Chi2 = 0.5226

.

. predxcat low, xvar (ui smoke) adjust (age ht race ptl) graph bar *Adjusted* Probabilities and 95% Confidence Intervals Model Type: Logistic Regression Outcome: Low birth wt Chi2 = 0.0160 Likelihood ratio test of interaction for ui * smoke: LR Chi2(1) = 0.99 Prob > Chi2 = 0.3200

.

Kalau mau melihat efek murni (variabel lain sudah di adjust) rokok murni terhadap low birth weight :. predxcat low, xvar (smoke) adjust (age ht ui race ptl) graph bar *Adjusted* Probabilities and 95% Confidence Intervals Model Type: Logistic Regression Outcome: Low birth wt Chi2 = 0.0125

Interpretasi : Prediksi variabel kategori (terjadinya low), dengan variabel utama (smoke), dan variabel lain di adjust (age, race, ht, ui, ptl), dan sajikan data dalam grafik bar. Dengan mempertimbangkan adanya interaksi, bila tidak merokok, probabilitas low birth weight 21.7% dengan 95%CI 14.4%-31.3%. Bila merokok, meningkatkan probabilitas low birth weight menjadi 41.9% dengan 95%CI 29.9-54.9%.

Sebetulnya command yang manual. logistic low smoke ptl ht ui ftv age lwt race

Logistic regression Number of obs = 189 LR chi2(8) = 30.48 Prob > chi2 = 0.0002Log likelihood = -102.09641 Pseudo R2 = 0.1299

------------------------------------------------------------------------------ low | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]-------------+---------------------------------------------------------------- smoke | 2.553016 1.017276 2.35 0.019 1.169185 5.57473 ptl | 1.719592 .5952687 1.57 0.117 .8725014 3.389102 ht | 6.238376 4.330291 2.64 0.008 1.600371 24.3177 ui | 2.058474 .9534344 1.56 0.119 .8304046 5.102711 ftv | 1.065518 .180888 0.37 0.709 .7639344 1.486158 age | .9647894 .0351876 -0.98 0.326 .8982303 1.036281 lwt | .9876898 .0065331 -1.87 0.061 .9749679 1.000578 race | 1.573691 .3388083 2.11 0.035 1.031953 2.399823------------------------------------------------------------------------------

.Sebetulnya data di atas hipertensi yang pertama menyebabkan lowbwt (OR=2.64), kedua baru smoke (OR=2.35)Yang tidak signifikan di-dropDengan cara : (backward method). logistic low smoke ptl ht ui age lwt race

Logistic regression Number of obs = 189 LR chi2(7) = 30.34 Prob > chi2 = 0.0001Log likelihood = -102.16563 Pseudo R2 = 0.1293

------------------------------------------------------------------------------ low | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]-------------+---------------------------------------------------------------- smoke | 2.523238 1.004551 2.32 0.020 1.15632 5.506029 ptl | 1.715386 .5951233 1.56 0.120 .8690652 3.385879 ht | 6.052051 4.159849 2.62 0.009 1.573378 23.27941 ui | 2.043752 .9471656 1.54 0.123 .8240307 5.06889 age | .9673382 .0346041 -0.93 0.353 .9018384 1.037595 lwt | .9879507 .0065378 -1.83 0.067 .9752197 1.000848 race | 1.562169 .335963 2.07 0.038 1.024866 2.381162------------------------------------------------------------------------------ Kembali me-drop age karena tidak signifikan

Kemudian kembali setelah drop age. logistic low smoke ptl ht ui lwt race

Logistic regression Number of obs = 189 LR chi2(6) = 29.46 Prob > chi2 = 0.0000Log likelihood = -102.60539 Pseudo R2 = 0.1255

------------------------------------------------------------------------------ low | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]-------------+---------------------------------------------------------------- smoke | 2.580986 1.01985 2.40 0.016 1.189713 5.599242 ptl | 1.634687 .5580461 1.44 0.150 .8372463 3.191656 ht | 6.253616 4.316462 2.66 0.008 1.616599 24.19134 ui | 2.112634 .971689 1.63 0.104 .8576714 5.203883 lwt | .987136 .0064704 -1.98 0.048 .9745354 .9998995 race | 1.598605 .3385842 2.21 0.027 1.055496 2.421171

Masih ada yang tidak signifikan

. logistic low smoke ht ui lwt race

Logistic regression Number of obs = 189 LR chi2(5) = 27.33 Prob > chi2 = 0.0000Log likelihood = -103.67021 Pseudo R2 = 0.1165

------------------------------------------------------------------------------ low | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]-------------+---------------------------------------------------------------- smoke | 2.841152 1.10446 2.69 0.007 1.326176 6.086782 ht | 6.335655 4.341321 2.69 0.007 1.653982 24.26902 ui | 2.390032 1.075332 1.94 0.053 .9895275 5.772707 lwt | .9862774 .0064069 -2.13 0.033 .9737997 .998915 race | 1.619502 .3404269 2.29 0.022 1.072643 2.445165------------------------------------------------------------------------------Makin berat ibu, makin kecil OR terjadinya bayi berat badan rendah (OR -0.98, p=0.033, 95%CI 0.97-0.99)

Kemudian baru lanjut ke command predxcat

. predxcat low, xvar (smoke ht) adjust (race ui lwt) graph bar *Adjusted* Probabilities and 95% Confidence Intervals Model Type: Logistic Regression Outcome: Low birth wt Chi2 = 0.0014 Likelihood ratio test of interaction for smoke * ht: LR Chi2(1) = 0.03 Prob > Chi2 = 0.8583

Interpretasi: Merokok dan hipertensi, kemungkinan bblr 82.8%.Tidak hipertensi dengan merokok, kemungkinan bblr 39.8. Jadi, serorang ibu dengan darah tinggi dan prokok, kemungkinan terjadinya bblr adalah sebesar 82.8%. Maka, merokok dan HT dapat dikendalikan, dengan mengendalikan keduanya dapat hanya berisiko bblr (100%-82.8%)

Untuk memprediksi merokok dengan usia 30 tahun, probabilitas untuk terjadi hipertensi:. predcalc ht, xvar (smoke=1 age=30) model

Logistic regression Number of obs = 189 LR chi2(2) = 0.08 Prob > chi2 = 0.9615Log likelihood = -44.653551 Pseudo R2 = 0.0009

------------------------------------------------------------------------------ ht | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]-------------+---------------------------------------------------------------- smoke | 1.111855 .6738534 0.17 0.861 .3389745 3.646946 age | .9879358 .0570646 -0.21 0.834 .88219 1.106357Model: Logistic RegressionOutcome: History of hypertension? 1=yes -- htX Values: smoke=1 age=30Num. Obs: 189

Predicted Value and 95% CI for ht: 0.0623 (0.0191, 0.1850)

. predcalc ht, xvar (smoke=1 ui=0 age=30) model

note: ui != 0 predicts failure perfectly ui dropped and 28 obs not used

Logistic regression Number of obs = 161 LR chi2(2) = 0.19 Prob > chi2 = 0.9101Log likelihood = -42.60503 Pseudo R2 = 0.0022

------------------------------------------------------------------------------ ht | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]-------------+---------------------------------------------------------------- smoke | 1.189476 .7253058 0.28 0.776 .3600142 3.929996 age | .9812369 .056471 -0.33 0.742 .8765698 1.098402

Model: Logistic RegressionOutcome: History of hypertension? 1=yes -- htX Values: smoke=1 ui=0 age=30Num. Obs: 161

Predicted Value and 95% CI for ht: 0.0729 (0.0230, 0.2077)

Hitung prediksi bblr kalau merokok, ui=0, usia=35 tahun:. predcalc ht, xvar (smoke=1 ui=0 age=35) model

note: ui != 0 predicts failure perfectly ui dropped and 28 obs not used

Logistic regression Number of obs = 161 LR chi2(2) = 0.19 Prob > chi2 = 0.9101Log likelihood = -42.60503 Pseudo R2 = 0.0022

------------------------------------------------------------------------------ ht | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]-------------+---------------------------------------------------------------- smoke | 1.189476 .7253058 0.28 0.776 .3600142 3.929996 age | .9812369 .056471 -0.33 0.742 .8765698 1.098402------------------------------------------------------------------------------

Model: Logistic RegressionOutcome: History of hypertension? 1=yes -- htX Values: smoke=1 ui=0 age=35Num. Obs: 161

Predicted Value and 95% CI for ht: 0.0667 (0.0138, 0.2671)

Kalau 35 tahun 6%, dengan range 0.4%-45% karena sampel sedikit.

AAEL 118 April 2015Analisis pada Studi Cross-sectional dan penentuan kontrol pada desain studi case control

Jenis-jenis bias: Information bias Selection bias Confounding bias Sample bias Dari antara keempat bias ini, yang bisa diperbaiki atau dikontrol hanyalah confounding bias. Bias lainnya sebisa mungkin dihindari sejak penentuan desain studi.

Desain dasar epidemiologi: cross sectional & longitudinal (case control/ kohort/ eksperimental). Yang membedakan adalah cross sectional melihat suatu kejadian sebagai suatu potret pada suatu saat tertentu, sedangkan studi longitudinal melihat kejadian dalam suatu rentang waktu.

Bagaimana menganalitikkan studi cross sectional?Desain studi cross sectional tetapi pendekatannya bisa dengan case control/ kohort, analisa dapat menggunakan prevalence odds ratio (POR) atau prevalence ratio (PR).POR suatu studi cross sectional yang diperlakukan sebagai case control.PR suatu studi cross sectional yang diperlakukan sebagai kohort.(Referensi: Buku Practical epidemiology).

Kapan studi cross sectional (CS) dijadikan case control (CC)?CS dijadikan CC, caranya: memotret kasus dan exposurenya, dan memotret bukan kasus dan exposurenya.Contoh: TBC-gizi buruk, caranya: cari kasus TBC, diukur data BB, TB, Hb dengan asumsi gizi buruk sebagai penyebab TBC. Kemudian cari kasus bukan TBC, diukur BB, TB, Hb.Yang menjadi permasalahan, akan timbul pertanyaan gizi buruk menyebabkan TBC atau TBC yang meyebabkan gizi buruk? ini merupakan kelemahan dari studi cross sectional dan studi case control. Studi yang bisa memastikan mana yang penyebab adalah kohort.

TBC merupakan salah satu penyakit menular yang unik. Karena risk of infection risk of developing the disease. Berbeda dengan campak atau varicella, risk of infection = risk of developing the disease.

Tidak semua penyakit infeksi menular. Ada penyakit infeksi yang tidak menular, contohnya tetanus.

Strategy for Mathematical Modeling Membuat perencanaan logis membuat estimasi hubungan antara exposure dengan outcome.

Langkah-langkah modeling:1. Menentukan exposure, potential confounder, dan potential interaction (tentukan dulu sebab-sebab dan akibat, dari antara sebab-sebab yang ada, mana yang merupakan variabel pengganggu? Dari antara variabel-variabel pengganggu, mana yang confounder, mana yang interaction?)2. Buat full model yang terdiri dari exposure, confounder, interaction. (confounder merupakan variabel yang sama dengan variabel utama tapi dapat mengganggu variabel utama dengan akibat). Contoh: merokok dan PJK. Orang merokok lebih berisiko PJK. Tetapi umur juga berpengaruh dengan PJK. Makin tua umur, makin tinggi risiko PJK. Adakah interaksi antara umur dengan merokok? Minum kopi berhubungan dengan PJK, apa benar? Minum kopi berhubungan dengan merokok, tapi apa minum kopi berhubungan langsung dengan PJK? harus dibuat full modelnya dulu. Sebisa mungkin interaksi disederhanakan menjadi 2-3 interaksi.3. Coba mengeliminasi potential interaction yang tidak signifikan secara statistik. Estimasi terbaik adalah meng-adjust efek dari semua confounder. Jika tidak ada interaksi, coonfounding diassess dengan membandingkan OR yang crude dengan OR adjusted dari full model. Kalau >10%, pakai OR yang adjusted.

Elemen dari strategi modeling: Seleksi variabel (sebanyak mungkin variabel yang berhub dengan outcome dimasukkan) Coding variabel Seleksi model Evaluasi interaksi Evaluasi confounding Estimasi titik dan interval Uji hipotesis Assess model fit Pertimbangkan bentuk model yang lain

Seleksi potential confounder:List of potential confounnder should be limited to previously demonstrated independent risk factors for the disease. When no prior information on risk factors, potential confounders may be limited to demographic info, such as age, sex, race.

Relationship between log odds and probability, bentuknya harusnya seperti huruf S. kalau seperti itu, bisa menggunakan logistic model. Kalau bentuknya garis lurus, pakainya regresi linier.1

0,5

Sama dengan model probabilitas: p = odds/(odds+1)

Regression Analysis Syarat: data X dan Y adalah variabel kuantitatif.

Yang dicari adalah 0 dan 1 -> disebut koefisien regresi.

Homoscedasticity: value dari Y tidak bergantung pada value X yang lain

R menyatakan kuatnya hubungan antara x dan Y. Nilai r yang positif menunjukkan korelasi yang positif, makin besar x, makin besar y. Sedangkan nilai r yang negatif menunjukkan korelasi negatif, makin besar x, makin kecil y.

Latihan Statadata anscombe.dtalog using latihan18april.log

Jadi, berdasarkan di atas: Persamaan regresi liniernya Y1= 3 + 0,5X1 R2=0,67, artinya 2/3 untuk terjadinya Y ditentukan oleh variabel X jadi variabel X cukup penting. Dari mana dapat angka R2? R2 = Model/ Residual = 27,51/13,76. Bagaimana korelasinya (R)? R=0,6665 = 0,82 strong correlation. Signifikankah X sebagai determinan dari Y? Dilihat dari Prob > F untuk degree of freedom 1 dari 9 adalah 0,0022 signifikan.

Pertanyaannya, model ini cocok ga? Dapat dijawab dengan membuat grafik.

Garis ini hanyalah garis imajiner

Coba perintah regress y2 x2, kemudian y3 x3, kemudian y4 x4! (lihat angka koefisien regresi, R, dan R-squarednya hampir sama semuanya!)

Grafik regresi y2 x2. twoway (lfitci y2 x2) (scatter y2 x2)

Kalau lihat model y2 x2, baik koefisien regresi, R2, maupun Rnya, nilaiya hampir sama dengan regresi y1 x1. Mana yang lebih baik??? LIHAT GRAFIKNYA. Grafik y1 x1, titik-titiknya tersebar merata di sekitar garis imajiner. Sedangkan pada grafik y2 x2, titik-titiknya tidak tersebar merata, dan cenderung membentuk parabola. Jangan hanya melihat koefisien regresi, R, dan R2, tetapi juga harus melihat gambaran grafiknya.

Grafik y3 x3:outlier

Grafik y3 x3, bentuknya seperti garis lurus tetapi tidak tersebar merata di sekitar garis imajiner. Kenapa?? Karena ada 1 outlier, yang membuat garis imajinernya tidak sejalan dengan titik2nya.

Grafik y4 x4, hampir semua titik berkumpul di satu tempat.

Kesimpulan: tidak semua data kontinyu cocok untuk digunakan sebagai model regresi linier! Setiap membuat model regresi linier, harus dipastikan bahwa model tersebut memenuhi asumsi dasar regresi linier: NORMALITY, LINEARITY, HOMOSCEDASTICITY, INDEPENDENCE.

Jadi bila kita mempunyai data seperti di atas, model mana yang akan paling baik untuk diambil?Koefisien regresi, R, dan R2 memiliki nilai yang hampir sama. Namun melihat sebaran titik-titik di grafik, yang paling sesuai untuk model regresi linier adalah data Y1 X1.

Bagaimana membuat matriks korelasi dari data-data di atas?

Bagaimana membuat matriks grafik dari data-data di atas?