Upload
asih-novea-krediastuti
View
253
Download
0
Embed Size (px)
Citation preview
METODE STATISTIK DALAM ILMU ANESTESI
STANLEY H. ROSENBAUM
POIN KUNCI
Data harus diplotkan. Tren/kecenderungan yang dianggap bernilai signifikan
harus benar-benar dapat terlihat.
Program statistik yang digunakan harus sudah dikenal dengan baik untuk
memastikan kalkulasi dilakukan pada data yang benar.
Data interval tidak boleh diperlakukan seperti data kategorikal, karena hitungan
matematisnya berbeda.
Banyak metode statistik mengasumsikan bahwa data yang terdistribusi dengan
ditandai dengan adanya kurva berbentuk lonceng (bell-shaped) yang simetris;
metode tersebut dapat menyesatkan apabila data tidak terdistribusi dengan
normal.
Standar deviasi (SD) dipakai untuk menjelaskan simpangan data, sementara
standar kesalahan rerata/ standard error of mean (SEM) dipakai untuk
membandingkan sekelompok data.
Regresi multivariat, yang menghubungkan variabel terikat dengan lebih dari 1
faktor, memerlukan lebih banyak data, namun biasanya akan mengambil
korelasi yang mungkin dilewatkan oleh regresi univariat.
Ketika menggunakan regresi multivariat, apabila 2 buah variabel berhubungan
erat satu sama lain, maka analisia statistik dapat melakukan kesalahan pelaporan
dengan menganggap satu variabel memiliki hubungan korelasi dengan hasil
yang ada.
Dalam sebuah uji hipotesis, hasil yang negatif menunjukkan bahwa tidak ada
perbedaan nyata atau sebuah penelitian memiliki kekuatan yang kurang untuk
membuktikan perbedaan yang nyata/signifikan.
Nilai AP merupakan probabilitas munculnya hasil yang diamati, dengan
anggapan bahwa tidak ada perbedaan yang signifikan antar hipotesis yang diuji,
dan bukan merupakan nilai probabilitas dari perbedaan antara hipotesis yang
diuji.
Pendekatan Bayesian terhadap uji diagnostik berprinsip pada kenyataan bahwa
nilai dari sebuah uji bergantung pada populasi pasien; jika suatu uji hampir
selalu bernilai positif dalam populasi, maka hasil negatif palsu akan melebihi
hasil negatif yang sebenarnya, sehingga uji tersebut menjadi kurang bermanfaat.
Hal tersebu juga berlaku apabila semua uji hampir bernilai negatif, sehingga
kasus dengan hasil positif palsu akan menimbulkan suatu kebingungan.
Seleksi terhadap adanya bias membuat studi klinis dalam kehidupan nyata sulit
untuk diinterpretasikan. Oleh karena itu, uji coba klinis acak merupakan jalan
terbaik untuk meminimalisir maslah tersebut.
Waspada terhadap eror dari pengolahan data dalam penentuan adanya
signifikansi. Mengaplikasikan terlalu banyak uji pada data yang tidak
mencukupi akan memberikan data yang seolah-olah bernilai signifikan (padahal
tidak).
Kemajuan ilmu pengetahuan ilmiah selama tengah milenium terakhir
berkaitan erat dengan hubungan antara hasil uji eksperimental dengan penilaian
matematis dari pengamatan empiris. Penilaian tersebut tak lepas dari peran cabang
matematika, yang dikenal dengan sebutan statistik, yaitu suatu bidang ilmu yang
berfungsi untuk menjelaskan hasil sebuah eksperimen dan menganalisa
kemungkinan hubungan sebab-akibat dari sebuah eksperimen. Namun masalah
yang cukup serius dialami oleh para klinisi dan ilmuwan klinis yang akan
memakai metodologi statistik. Hal ini karena metode statistik merupakan cabang
modern dari matematika, yang sebagian besar telah berkembang selama beberapa
abad terakhir. Seringkali perhitungan matematika yang ada di dlamanya melebihi
tingkat pelajaran kalkulus di universitas yang tidak diajarkan pada pendidikan
kedokteran medis. Selain itu, banyak metode statistik yang memerlukan
perhitungan panjang dan sulit dan memerlukan teknik komputerisasi. Kekurangan
tersebut menimbulkan sebuah dilema diantara para klinisi. Klinisi menganggap
meskipun statistik bermanfaat dan penting dalam memahami pengetahuan medis,
namun sulit untuk dipahami dan digunakan.
Program aplikais untuk kalkulasi statistik sudah banyak tersedia di
komputer personal (pc). Banyak dari program tersebut didesain dengan model
pendokumentasian yang mudah dan sederhana untuk dipakai, tanpa perlu banyak
persiapan. Namun program statistik yang tersedia di pc memiliki kekurangan
yaitu asumsi dibalik statistik yang belum jelas. Oleh sebab itu, seseorang dapat
dengan mudah menggunakan metode atau pendekatan yang salah dan program
tetap menghasilkan data hasil yang tampak benar (padahal salah). Maka dari itu,
tujuan dari bab ini adalah untuk memberikan penjelaan yang benar mengenai
statistik dan menunjukkan metodologi statistik sesuai yang bisa dipakai dalam
beberapa penelitian standar. Beberapa kesalahan umum dalam statistik medis juga
diutarakan.
PENDEKATAN STATISTIK
Statistik deskriptif merupakan penggunaan metode matematika untuk
mendeskripsikan atau mengkategorikan sekelompok data yang berasal dari
sekelompok pengamtan empiris. Uji statistik merupakan pendekatan luas untuk
menentukan suatu kesimpulan dari sekelompok pengamatan. Di dalam tiap
kategori, terdapat banyak tekhnik yang terpisah.
JENIS DATA
Harus diingat bahwa dibalik tiap metodologi statistik merupakan
sekelompok definisi dan bukti matematis formal. Meskipun tampaknya hanya
berupa pendekatan intuitif yang sederhana, namun statistik matematis berpotensi
menyesatkan. Bukti dan kalkulasi matematis yang berada di belakang program
komputasi dan tabel statistik membuat pembedaan yang ketat pada beberapa jenis
data (lihat tabel 111-1). Skelompok data, disebut dengan data interval jika
memiliki ukuran numerik yang kontinyu (contoh: 1,2;33,4). Seringkali merupakan
ukuran numerik diskret seperti kuantitas integral dalam kategorisasi yang sama.
Pendekatan tersebut seringkali menyesatkan; adanya pernyataan bahwa “keluarga
tertentu memiliki jumlah anak 2,3” bermakna secara kasar, meskipun kuantifikasi
seorang anak tidak mungkin dinyatakan dalam bentuk pecahan. Dalam
penggunaan praktis, baik data kontinyu maupun diskret dapat diolah dengan
tekhnik yang dipakai untuk data interval. Kelompok data utama lain merupakan
data kategorikal. Salah satu jenisnya adalah data ordinal, yang menunjukkan
susunan atau peringkat dari subjek (ke-1, ke-3, dst). Data binari (naik vs turun,
lebih banyak vs lebih sedikit) merupakan kategori lain yang mirip. Saat
menggunakan kategori binari atau sederhana, memasukkan angka dalam
kelompok untuk memperoleh hasil numerik, bukanlah langkah yang benar.
Diperlukan tekhnik statistik khusus untuk data kategorikal.
STATISTIK DESKRIPTIF
Tujuan statistik paling umum adalah untuk menjelaskan sekelompok data.
Metode paling sederhana yang bisa dipakai yaitu dengan menampilkan seluruh
data kasar. Untuk kelompok data yang kecil, ukuran sebenarnya dapat
ditampilkan. Untuk yang lebih besar, dapat dipakai grafik atau plot statistik dari
data. Seringkali, tren dan pengelompokan dalam bentuk gambar sulit untuk
dijelaskan secara numerik. Sehingga disarankan sebelum menggunakan metode
matematis apapun untuk menganalisa data, plot grafik harus dibuat dulu. Jika data
tampak tidak benar,maka analisa statistik harus dilakukan dengan lebih hati-hati.
Pemilihan format yang benar untuk plot statistik merupakan sebuah seni, dan
manipulasi data khusus dari program komputer dapat berguna untuk mencari
petunjuk visual dari sekelompok data.
DISTRIBUSI NORMAL
Konsep paling kuat dari statistik matematika adalah distribusi normal,
sering disebut kurva bentuk lonceng (bell-shaped). Konsep tesrebut menjelaskan
tentang nilai tengah yang paling mendekati dengan nilai lain yang terdistribusi
secara simetris di kedua sisi. Konsep tersebut merupakan konsep statistik klasik
dengan akar matematis yang dalam. Konsep tersebut sesuai dengan pendekatan
nilai kebenaran dengan pengukuran yang terdistribusi secara normal di sekitar
nilai kebenaran sedemikian rupa sehingga akan lebih banyak nilai yang dekat ke
pusat dibanding yang jauh. Banyak jenis data yang mengikuti distribusi normal di
sekitar titik pusat. Distribusi tersebut terkadang disebut dengan distribusi
Gaussian, yang disimpulkan dari asumsi bahwa sebuah pusat, sebuah nilai
kebenaran, benar-benar ada dan bahwa deviasi dari pusat bersifat acak dan
semakin menghilang seiring menjauhnya nilai dari pusat (Gambar 111-1).
Penggunaan yang ketat dari distribusi normal mencerminkan adanya sejumlah
besar data interval kontinyu. Saat sekelompok data tidak memenuhi kriteria
tersebut, maka diperlukan perkiraan,
Pada umumnya, deskripsi matematis dari penempatan nilai disebut dengan
istilah distribusi. Terdapat banyak distribusi selain distribusi normal. Masing-
masing distribusi memiliki bentuk kurva berbeda dan properti matematika
spesifik. Tidak semua data yang terlihat seperti bentuk kurva lonceng terdistribusi
normal. Jika kurvanya terlalu lebar (banyak nilai yang jauh dari pusat) atau terlalu
sempit, maka hitungan matematis yang diambil dari distribusi normal tidak bisa
diterapkan. Apabila data mengikuti distribusi normal, maka statistik parametrik
bisa digunakan. Istilah parametrik merujuk pada kemampuan untuk
mendeskripsikan distribusi dengan sekelompok nilai spesifik. Namun, apabila
tidak terdistribusi normal, maka statistik non parametrik yang digunakan. Metode
non parametrik memunculkan asumsi matematis yang lebih sedikit mengenai
distribusi data, namun lebih sulit pemakaiannya dan kurang bagus dalam
menemukan perbedaan statistik. Sebaliknya, apabila digunakan metode
parametrik pad adata yang tidak terdistribusi secara normal, maka hasilnya akan
salah atau menyesatkan, Jenis kesalahan tersebut umum terjadi dan dapat dicegah
dengan memakai uji yang sesuai atau memeriksa normalitas data sebelum
dilakukan uji asumsi. Dalam penggunaan praktis, data seringkali dianggap
memiliki distribusi normal. Namun, peneliti yang bijak akan memakai uji dalam
paket komputer statistiknya untuk menilai normalitas data terlebih dulu dan jika
data tidak mengikuti distribusi normal, maka diperlukan metode statistik lain.
UKURAN KECENDERUNGAN SENTRAL
Dalam mendeskripsikan data,langkah pertama adalah memberikan
beberapa indikasi terhadap nilai perkiraan, rentang, atau ukuran dari data yang
akan ditampilkan. Cara pengerjaannya bergantung pada jenis data yang terlibat
(Kotak 111-1). Untuk data kategorikal atau binari, dilakukan penghitungan dalam
tiap kelompok. Untuk data kategorikal dengan banyak kelompok, kelompok yang
paling padat dapat diberi nama dan diurutkan terlebih dulu. Untuk dta aordinal,
deskripsi ringkasan sulit untuk dikerjakan.
Median merupakan titik tengah data apabila data dapat diurutkan dari yang
terkecil hingga terbesar. Median dapat diterapkan baik pada data interval maupun
data kategorikal jenis ordinal. Untuk data interval, banyak tekhnik matematika
yang dapat dipakai. Teknik paling sederhana adalah dengan menghitung
rerata/mean, atau nilai rerata sederhana dari data numerik, dengan tiap titik data
dihitung secara sama. Dalam kasus weighted mean, poin individu dapat
ditambahkan secara tidak merata, dengan beberapa kriteria tambahan dibanding
lainnya (contoh: berat badan). Untuk data interval yang dapat dianalisis secara
matematis, data harus dicocokkkan dengan sebuah kurva, yang berarti bahwa
formula matematis dihitung dengan melihat kedekatan dengan poin data yang
dihitung.Hubungan dapat bersifat sederhana seperti garis lurus atau berupa
formula matematis kompleks dengan eksponensial, polimonial atau fungsi lain.
Berbagai nilai perhitungan dalam formula formula tersebut akan menjadi
parameter kurva. Sehingga data tersebut akan dideskripsikan dengan parameter
dari formula yang didekatkan ke data pengamatan. Untuk kasus sederhana
pendekatan garis lurus pada data, parameter berupa slope dan intersep dari garis
tersebut. Untuk persamaan yang kompleks yang dicocokkan dengan data,
parameter berupa berbagai hitungan angka yang menyusun persamaan tersebut.
‘Modus’ merupakan nilai yang paling banyak muncul dalam sekelompok
poin data. Konsep tersebut dapat disalahartikan jika data benar-benar kontinyu
karena tiap poin data akan bernilai berbeda dari poin lainnya. Dalam kasus
tersebut, untuk mendeskripsikan ‘modus’ data kontinyu dilakukan dengan cara
mengelompokkkan nilai ke dalam interval singkat. Data numerik dapat
dideskripsikan dengan cara mengkategorisasikan nilai ke dalam bentuk persentil
atau kelompok yang mirip. Hal itu berarti, bahwa untuk persentil ke-10, 10% dari
poin data harus ≤ data tersebut. Persentel ke-50 berhubungan dengan median dari
sekelompok data, dan persentil ke-99 adalah nilai ≥ 99% diatas poin data. Hal
serupa juga diterapkan pada data kuartil, uintil atau kelompok data lain. Dengan
metode apapun yang dipakai untuk mendeskripsikan data, maka pilihan deskripsi
dapat membiaskan peneliti dalam memahami data hasil. Dalam sekelompok data
sederhana set (2, 2, 3, 7, 14), maka dapat disimpulkan bahwa modus = 2, median
=3, mean/rerata = 5,6. Tingkat keakuratan dari ketiga data tersebut bergantung
pada bagaimana penggunaannya, karena tidak ada satupun perwakilan data yang
bernilai sempurna.
UKURAN SEBARAN DATA
Seringkali, analis ingin menjaleaskan tidak hanya nilai dari sebuah data
namun juga bagaimana sebaran sebuah data. Untuk data yang mengikuti distribusi
normal, pendekatan klasik bertujuan menghitung standar deviasi (SD) dari data.
Dengan nilai tersebut, sekitar 68% data akan masuk ke dalam 1 SD dari rerata,
dan sekitar 95% masuk ke dalam 2 SD dari nilai rerata. Semakin besar SD nya,
semakin luas kurva bentuk loncengnya; semakin kecil SD nya, maka sempit
kurvanya.
BAGIAN IX: ISU TAMBAHAN DAN KONSEKUENSINYA
Cara lain untuk memeriksa sebuah konsep adalah dengan menganggap jika
analis membuat sebuah pengukuran dari nilai yang tak diketahui dan nilainya
tersebar dalam distribusi normal acak sekitar nilai tersebut, maka sekitar 68% dari
poin data akan berada dalam 1 SD dari nilai kebenaran. Tentu saja hasil tersebut
merupakan kemungkinan hasil yang paling mungkin, dalam sebuah data yang
terdistribusi acak, maka poin yang dihasilkan berupa jenis atipikal. Untuk data
yang tidak mengikuti distribusi normal, menjelaskan persebaran data dalam cara
yang standar akan sulit untuk dilakukan. Seringkali, disajikan rentang data dari
yang terendah hingga paling tinggi. Terkadang data dapat sangat tersebar, dengan
jarak yang sangat jauh, sehingga rentang tidak dapat dimasukkan dalam persentil
25 hingga persentil 75 dari data.
CATATAN
Seringkali data tidak selalu mengikuti distribusi normal dengan sempurna.
Sebagai contoh, terdapat sekleompok data dengan sebaran usia yang luas meliputi
bnayak anak. Untuk memperoleh nilai mean usia sebesar 10 dengan SD 15 mudah
untuk dilakukan. Namun, tidak ada nilai yang berada di bawah akhir dari
distribus-jika usia 5 tahun. Dalam situais tersebut, maka SD bermanfaat untuk
mendeskripsikan persebaran data namun seringkali salah diterapkan.
STANDAR KESALAHAN DARI MEAN/RERATA
Mean data yang dihitung dari sekelompok data multipel dapat
dideskripsikan dengan membuat komputasi yang sama dengan SD, namun tidka
diterapkan pada data yang diukur namun pada mean perhitungan. Jumlah
perhitungan kuantitas tersebut dikenal dengan istilah standar kesalahan mean
(SEM). Semakin banyak perhitungan nilai yang dibuat, maka nilai mean akan
smeakin mendekati nilai kebenaran. PErbedaan antara SD dan SEM snagatlah
penting.SD dipakai untuk mendeskripsikan data, dan SEM diapkai untuk
komputasi terhadap kepastian dari mean sebuah data. Sebuah data yang besar
akan memiliki SEM yang kecil, namun data dengan persebaran luas akan memiiki
SD yang lebar, berapapun banyak data yang diukur.
MEMBUAT GRAFIK UNTUK DATA
Statistikawan yang berpengalaman akan menekankan bahwa sebelum
kalkulais statistik diterapkan ke dalam sekelompok data baru, data harus diplotkan
dulu dalam beberapa format grafik. Jika data sebarany luas, dan tampak simetris,
atau punya pola khusus, maka informasi tersebut akan berguna untuk menentukan
uji statistik yang akan dipakai. Adanya poin outlier yang ekstrim dapat menjadi
petunjuk kesalahan matematis atau eksperimental
ANALISA REGRESI
Data seringkali sesuai dengan formula matematis yang berupa hubungan
linear. Dalam regresi analisis, kekuatan program komputer dipakai
untukmenentukan formula matematis yang paling sesuai dengan data.Untuk
melakukan hal tersebut, program dengan tipe kurva yang dipakai harus tersedia.
Program akan memberikan parameter didalam persamaan yang dipilih yang paling
sesuai degan poin data. Seni dari regresi sangatlah kompleks. Masalah pertama
adalah kebingungan dalam memilih hubungan matematis yang sesuai dengan data.
Dengan membuat grafik dari data, akan membantu proses analisa data. Terdapat
beberapa keraguan dalam mencocokkan data dengan kurva, namun sejauh ini,
metode yang paling umum aalah memakai pendekatan least-squares, yang akan
meminimalisir kuadrat jarak dari tiap poin data dari kurva yang diusulkan.
Meskipun metode tersebut sudah berusis 2 abad, namun manfaatnya semakin
bermakna dengan keberadaany kalkulasi berbasis komputer. Program komputer
untuk analisis regresi menyediakan parameter dari [ersamaan yang sesuai, seperti
bentuk slope dan intercept y untuk garis lurus, serta beberapa informasi mengenai
seberapa baik parameter tersebut sesuai dengan data. Pengguna program harus
waspada dalam memakai persamaan yang telah dicocokkan apabila kesesuaiannya
kurang bagus akibat karena kecocokan dari campuran data terhadap beberapa
persamaan sekaligus, walaupun kesesuainannya kurang bagus. Perlu ditekankan
bahwa penglihatan visual pengguna statistik lah yang lebih bisa diandalkan dalam
menilai tren/kecenderungan data; oleh sebab itu, apabila sebuah grafik dari data
tampak tidak sesuai dengan kurva, maka pengguna yang bijak akan bersikap
skeptis terhadap hasil tersebut.
REGRESI MULTIVARIAT VS UNIVARIAT
Dalam mencocokkan data dalam analisa regresi, langkah pertama yaitu
memilih variabel yang akan dipakai sebagai variabel bebas. Dalam analisa
univariat, hanya 1 variabel yang dipakai untuk penyesuaian data dan data
diplotkan kemudian dilakukan komputasi dengan memakai variabel tunggal
tersebut untuk mendeskripsikan data. Sebagai contoh, berat badan dalam
sekelompok subjek penelitian dapat dibandingkan dengan tinggi badannya.
Namun, dalam dunis nyata, banyak variabel yang memungkinkan untuk dipakai
dalam menentukan sebuah hasil. Dalam analisis multivariat, lebih dari 1 variabel
digunakan untuk mendeskripsikan hasil yang diamati. Dalam contoh berat badan,
berat badan subjek penelitian dapat dianalisa dengan memakai tinggi badan, usia
dan jenis kelamin. Perlu dicatat bahwa dalam contoh multivariat tersebut, hasil
berupa variabel interval kontinyu, namun ditentukan oleh pengumpulan variabel
interval (usia, tinggi badan) dan variabel kategorikal (jenis kelamin).
Tekhnik matematika yang tepat yang dipakai untuk analisa multivariat akan
bergantung pada sdari variabel yang dipakai. Saat pertama kali mendekati analisa
sekelompok data, analisis univariat sederhana dapat membantu memahami
hubungan yang terlibat. Namun, penganalisa data harus berhati-hati terhadap
hubungan yang lemah yang dapat terlewatkan jika memakai analisis univariat jika
variabel yang terkait tidak dipakai. Sebagai contoh, denyut jantung dapat
berhubungan dengan dosis obat nyeri pada pasien yang terluka, namun hubungan
sebab akibat antara keduanya tampaknya juga berhubungan dengan derajat luka.
Dengan analisa regresi multivariat, banyak kesalahan potensial yang bisa dicegah
dengan pemakaian kalkulasi terkomputerisasi. Maslah yang adalah kemungkinan
hubungan/korelasi yang dimiliki antara variabel satu dengan lainnya. Untuk
variabel bebas, nilai dari 1 variabel tidak menggambarkan nilai dari variabel
lainnya. Dalam contoh berat badan vs tinggi badan dan usia, maka tinggi badan
dan usia diharapkan sebagai variabel bebas pada orang dewasa. Secara matematis,
usia dan tinggi badan tidak berhubungan pada orang dewasa. Namun, pada nak-
anak, usia dan tinggi badan sangat berhubungan. Oleh sebab itu, berat badan dapat
diekspresikan sebagai sebuah fungsi dari berat vs usia atau berat vs tinggi. Pada
kasus terakhir tersebut, analisis multivariat yang berfokus pada variabel bebas
akan memunculkan hasil dimana berat badan merupakan fungsi dari tinggi badan
dan menunjukkan adanya hubungan antara berat badan dengan tinggi badan.
Dlaam hal ini, saat banyak variabel terlibat, harus hati-hati sehingga hubungan
yang secara eksperimen bernilai penting tidak terlewatkan karena secara
matematis tidak menambah makna hasil. Paket statistik komputer yang canggih
akan mengatasi jenis masalah tersebut. Mengidentifikasi korelasi signifikan antar
variabel yang berbeda akan menunjukkan bahwa beberapa informasi dapat
menghilang hanya jika variabel bebas dilaporkan. Jika program statistik yang
lebih sederhana digunakan, maka penggunaan analisa multivariat dengan beberapa
variabel yang ditinggalkan, akan lebih baik dalam penentuan apakah akan muncul
hubungan lain yang relevan. Masalah lain yang dalam penentuan hubungan
multivariabel terjadi pada situasi dimana program komputer menghasilkan sebuah
variabel yang hanya berkorelasi lemah dengan data yang diinput namun dengan
reliabilitas yang tinggi. Situsi tersebut akan diekspresikan dalam bentuk analisa
linear dengan sebuah koefisien korelasi kecil namun dengan nilai P yang sangat
bermakna. Dalam hal ini, kebingungan muncul akibat kenyataan bahwa meskipun
korelasi bersifat lemah, dan tidak cukup memberikan penjelasan, namun hasil
perhitungan menunjukkan tingkat kepercayaan yang sangat tinggi.
MENGUJI HIPOTESIS
Penggunaan teknik statistik umumnya dipakai untuk menguji sebuah
pertanyaan, yang disebut dengan istilah hipotesis. Seringkali disebut dengan
istilah uji signifikansi, pendekatan ini memunculkan konsep bermakna dari nilai
P. Nilai P sering dipakai untuk menyimpulkan kekuatan statistik dari analisa data
dalam mendukung atau menolak sebuah hipotesis. Jika peneliti ingin membuat
perbandingan antar kelompok, maka digunakan uji perbandingan terhadap
hipotesis nol, yang menyatakan bahwa tidak ada perbedaan antara 2 kelompok
data yang dibandingkan, dan terhadap hipotesis alternatif, yang menyatakan
bahwa terdapat perbedaan antara kelompok yang dibandingkan. Apabila analisa
dilakukan pada sekelompok data tunggal dan dilakukan perbandingan dari 2
deskripsi datanya, seperti penentuan apakah mean data dari kelompok tersebut
bernilai 0 atau tidak, maka akan muncul 2 hipotesis, yaitu mean = 0 vs mean =
nilai yang diukur, dan ≠ 0. Nilai P dihitung dari data pengamatan dan dianggap
sebagai probabilitas untuk memperoleh satu set data yang diharapkan (konsistensi
dalam reproduksi data yang sama bila penelitian diulang), jika didapatkan
hipotesis nol yang bernilai benar. Penting untuk dicatat, bahwa kalkulasi tersebut
dilakukan dengan asumsi yang berdasarkan atas hipotesis nol (tidak ada
perbedaan). Hal tersebut tidaklah sama dengan pernyataan bahwa P merupakan
probabilitas kebenaran dari hipotesis alternatif. Dalam uji hipotesis, tingkat
signifikansi, disebut dengan nilai alfa (α) ditentukan oleh peneliti. Jika nilai P <
nilai alfa (α), maka hasil analisis data dinyatakan sebagai ‘signifikan secara
statistik’ dan kebenaran analisis dapat diterima. Jika nilai P ≥ nilai alfa (α), maka
hipotesis ditolak (dengan kata lain, hipotesis nol diterima). Perlu diingat sekuens
logis dalam uji hipotesis: alfa(α) ditentukan terlebih dahulu, kemudian nilai P
dihitung dari data penelitian. Jika nilai P < alfa(α), maka hipotesis tersebut
diterima dan hipotesis nol ditolak. Nilai P adalah peluang kebenaran dari hipotesis
nol. Biasnaya, alfa(α) ditentukan sebesar 0,05, dan nilai P harus lebih rendah dari
0,05. Memilih tingkat signifikansi merupakan keputusan yang subjektif. Peneliti
bisa saja menginginkan tingkat ketelitian yang lebih baik dengan memilih nilai
alfa(α) sebesar 0,01. Pada penelitian biomedis, nilai alfa(α) yang sering digunakan
sebesar 0,05. Selain itu, nilai P yang terlampau kecil akan cenderung membuat
hipotesis nol tertolak namun di sisi lain tidak mampu memberikan informasi yang
tepat mengenai kebenaran hipotesis alternatif. Sebagai contoh, saat seseorang
melemparkan koin dengan 2 sisi kepala dan ekor, lau mendapatkan sisi koin yang
sama (sisi kepala) selama 6 kali berturut-turut. Maka hal tersebut akan
mendukung penolakan hipotesis nol yang menyatakan bahwa koin tersebut
merupakan koin yang baik (memiliki 2 sisi yang peluang kemunculannya sama),
namun disisi lain hal tersebut tidak cukup untuk menyatakan bahwa pelemparan
koin akan selalu memberikan hasil berupa sisi kepala. Nilai P dihitung dari data
pengamatan, dengan asumsi bahwa hipotesis nol bernilai benar, dan penggunaan
nilai P yang kecil akan menyebabkan penolakan hipotesis nol tersebut, namun di
sisi lain tidak dapat secara otomatis membuktikan kebenaran hipotesis alternatif.
KEKUATAN (POWER)
Kemampuan sebuah uji statistik untuk menghasilkan keputusan yang valid
bergantung pada jumlah data yang tersedia. Dengan data yang hanya sedikit,
peneliti tidak dapat yakin sepenuhnya dengan kesimpulan uji statistiknya. Jika
tujuannya adalah untuk menentukan sifat alami dari koin tersebut, maka
pelemparan koin sebanyak 2 kali tidak dapat dibagai sebagai penentuan, namun
dengan melemparkan sebanyak 1000 kali akan memberikan gambaran
kecenderungan sifat alami sisi koin. Dalam uji hipotesis statistik, kekuatan
penelitian merupakan deskripsi kemampuan dari penelitian dalam mendeteksi
perbedaan sebenarnya. Uji hipotesis statistik dapat gagal dalam mencapai
signifikansi (nilai P < nilai alfa) yang disebabkan karena data benar-benar tidak
mencerminkan adanya perbedaan atau karena data terlalu sedikit sehingga
perhitungan matematis menghasilkan nilai P yang buruk. Kesalahan beta (β)
didefinisikan sebagai probabilitas kebenaran palsu dari hipotesis nol (dihitung
dengan mengasumsikan bahwa hipotesis alternatif bernilai benar), dengan nilai
kekuatan = 1-beta (β). Agar kekuatannya bernilai baik, yaitu nilai beta yang kecil,
penelitian harus memiliki data yang cukup untuk memastikan bahwa bila dalam
penelitian terdapat perbedaan antara hipotesis nol dan alternatif, maka
reliabilitasnya dapat diterima.
Perhitungan ukuran sampel seringkali dilakukan sebelum penelitian
dimulai untuk menentukan berapa banyak data yang diperlukan untuk membuat
hasil penelitian yang diinginkan memiliki peluang kejadian yang besar. Program
standar komputer dapat melakukan penghitungan jumlah data yang diperlukan
apabila nilai alfa dan kekuatan (power) telah ditetapkan serta telah ditentukan
perhitungan mengenai kemungkinan dari efek yang diamati. Peneliti harus hati-
hati terhadap tiap penelitian yang diinterpretasikan bernilai negatif (sebagai
contoh: tidak adanya perbedaan yang signifikan antar kelompok penelitian).
Karena hal tersebut dapat bermakna bahwa memang tidak ada perbedaan yang
sebenarnya, atau justru pertanda bahwa ukuran sampelnya terlalu kecil untuk
menentukan perbedaan dengan nilai statistik yang signifikan.
CONFIDENCE INTERVAL
Menggunakan confidence intervals sebagai sebuah deskripsi dari penentuan
statistik menjadi hal yang umumdalam melaporkan pengukuran statistik. Rentang
nilai dapat diberikan terlebih dahulu. Atas dasar itu, nilai ditentukan dengan
beberapa kemungkinan bahwa nilai yang sebenarnya berada dalam rentang
tersebut (biasnaya pada nilai 95%). Untuk mengekspresikan hasil yang sederhana,
nilai confidence interval ekuivalen dengan nilai mean ± SD. Metode tersebut
berguna untuk mendeskripsikan hasil ketika menjelaskan konsep ‘tidak terdapat
perbedaan’ dengan cara statistik yang benar. Disini, deskripsi yang sesuai
merupakan perbedaan sebenarnya yang berada pada interval < x dengan nilai
confidence interval 95%. Untuk meringkas penjelasan di atas, syarat berikut harus
dipenuhi dalam melakukan uji hipotesis:
Hipotesis nol (contoh: mean = 0)
Hipotesis alternatif (contoh: mean = m)
Nilai alfa (ditetapkan di awal, contoh, alfa = 0,05)
Kekuatan/power ( ditetapkan di awal dengan melihat kalkulasi ukuran sampel
untuk memastikan poin data, contoh, kekuatan = 0,8)
Nilai P-dihitung dari data pengamatan
Perbedaan antara hipotesis nol dan alternatif bernilai signifikan apabila
nilai P < nilai alfa. Apabila nilai sudah dideskripsikan, maka perbedaan yang
muncul dapat dianggap sebagai confidence interval; dan jika tidak ditemukan
adanya perbedaan, maka perbedaan yang ditemukan dalam interval dapat
dianggap tidak bernilai/tidak bermakna.
DESAIN PENELITIAN
Pentingnya penelitian ilmiah yaitu untuk penentuan beberapa hasil
numerik. Analisis numerik tersebut didekati dengan menggunakan perhitungan
statistik. Namun demikian, tanpa adanya desain penelitian yang sesuai yang
merancang diproduksinya data numerik, analisa statistik formal dari angka-angka
tersebut akan memberikan hasil yang kurang bermanfaat dan bahkan
menyesatkan. Dalam sebuah studi khusus, analis biasanya berupaya untuk
melakukan karakterisasi terhadap beberapa variabel (sebagai contoh: mean atau
tren) atau membuat suatu pilihan untuk menerima atau menolak berbagai variasi
hipotesis yang ada. Tidak peduli jenis pertanyaannya, analis harus waspada
terhadap kemungkinan hasil yang muncul yang harus benar-benar jawaban dari
pertanyaan sebelumnya. Penelitian ilmiah dapat berupa studi pengamatan, data
dikumpulkan bersamaan dengan proses pengamatan tanpa melakukan intervensi
spesifik untuk mempengaruhi subjek penelitian. Karena penelitian merupakan
studi pengamatan/observasional, maka semua data yang ditemukan harus diambil
Oleh sebab itu peneliti selalu dihadapkan dengan faktor lain yang tidak dikenali di
awal yang dapat mempengaruhi interpretasi data atau membatasi kemampuan
peneliti mengkritisi data yang diperoleh.
Dalam sebuah penelitian intervensional, peneliti memilih anggota
kelompok, menentukan jenis perlakuan yang akan dilakukan, dan berupaya untuk
mencari dan mengeliminasi faktor perancu potensial sebelum pengumpulan data
dilakukan. Uji coba klinis merupakan jenis penelitian intervensional dimana
terjadi pembandinganberbagai jenis terapi. Dalam desain studi ilmiah, ketakutan
utama yaitu terjadinya bias statistik, yang merupakan efek sistemik dalam
penelitian yang menghasilkan kesalahan pada interpretasi hasilnya. Saat
mempertimbangkan berbagai desain studi yang mungkin, analis harus
mewaspadai potensial bias yang mungkin muncul. Seleksi bias/perancu terjadi
saat membandingkan berbagai variabel antar kelompok namun analis tidak
menyadari bahwa kelompok yang dibandingkan memiliki perbedaan dalam hal
lain. Karena kelompok subjek penelitian memiliki perbedaan dalam banyak hal,
penetapan subjek di dalam kelompok dapat memberikan hasil berupa pemilihan
yang salah atau ketidakberuntungan acak, dalam kelompok yang sebenarnya tidak
cukup untuk sebanding. Sebagai akibatnya, meskipun hasil dianggap pasti oleh
variabel penelitian, namun sebenarnya hal tersebuut merupakan kesalahan
kesimpulan akibat adanya beberapa faktor. Sebagai contoh, sebuah penelitian
yang membandingkan pembedahan dengan terapi medis dari beberapa penyakit
dan berakhir dengan sebuah pengelompokan dimana sejumlah besar lelaki dan
wanita lebih banyak yang mmeilih terapi bedah. Tiap kesimpulan dari penelitian
mengenai pembedahan vs terapi medis tersebut bersifat rancu dan dapat benar-
benar mencerminkan perbedaan hasil terapi bedah pada lelaki dibanding pada
wanita.
Faktor perancu terjadi ketika multipel variabel salingberhubungan erat
sehingga meskipun variabel tersebut diangap penting dalam sebuah penelitian,
kebenarannya mengungkapkan bahwa variabel perancu bernilai lebih penting.
Sebagai contoh, anggap sebuah penelitian yang berusaha untuk menentukan
pengaruh obesitas pada kelangsungan hidup. Karena diebetes mellitus
berhubungan dengan sangat erat dengan obesitas, maka hasil penelitian lebih
menggambarkan korelasi antara obesitas dengan diabetes. Apabila variabel tidak
berhubungan satusama lain sehingga perubahan dalam 1 variabel tidak mengikuti
perubahan variabel lain, maka variabel tersebut disebut dengan variabel bebas.
Variabel yang berhubungan satu sama lain disebut dengan variabel terikat.
Bias pengukuran terjadi jika metode yang dipakai untuk membuat
pengukuran saat membandingkan kelompok yang berbeda memiliki skala atau
sensitivitas berbeda. Sebagai contoh, penelitian yang bertujuan membandingkan
nyeri dada pada kelompok dengan dan tanpa penyakit arteri koroner. Pasien yang
mengetahui bahwa mereka memiliki penyakit jantung akan lebih mengingat
rasanya nyeri dada singkat dibanding pasien sehat, atau justru mengingkari nyeri
dada yang dirasakan dengan harapan mereka dapat sehat kembali. Disinilah
peneliti memiliki tugas untuk memprediksi dan menghindari bias jenis tersebut.
Dalam sebuah studi yang dibutakan/blinded, bias pengukuran dapat
dihindari jika orang yang melakukan pengukuran tidak mengetahui manakah
kelompok yang diukur, sehingga menghindari bias pengukuran yang kecil
sekalipun dalam menentukan data yang sebenarnya. Sebagai contoh, penelitian
mengenai obat aktif dibandingkan dengan plasebo. Peneliti yang mengetahui
manakah dari pasien yang minum obat aktif akan lebih teliti dalam mengamati
efek samping /manfaat dari obat. Dalam studi klinis dengan pembutaan
ganda/double blinded, baik pasien mapun peneliti yang memperoleh data tidak
mengetahui kelompok asal dari partisipan tersebut untuk menghindari bias
pengukuran. Studi pengamatan dapat dikelompokkan ke dalam kasus, kasus-
kontrol, kohort. Dalam sebuah studi kasus sederhana, dilakukan pelaporan kasus
individu/kelompok. Pelaporan jenis tersebut dapat menunjukkan adanya beberapa
pengaruh, atau memberikan karakterisasi dari subjek pengamatan, dan
menunjukkan terapi atau riwayat alami perjalanan penyakit. Jenis studi tersebut
tidak dapat dipakai untuk membuktikan suatu hipotesa, karena kemungkinan
terdapat pengaruh tersembunyi terhadap hasil pengamatan atau karakteristik yang
diamati memang bersifat khas dalam beberapa hal. Meskipun demikian, sebagian
besar yang dilaporkan dalam dunia medis dalam bentuk pengamatan kasus.
Perbedan antara studi kohort dengan kasus-kontrol sangatlah penting,
namun seling dimisinterpretasikan. Pada kedua kategori, kelompok subjek
penelitian dibandingkan, untuk mencari efek dari sejumlah intervensi. Dalam
studi kasus-kontrol, faktor yang memisahkan kelompok penelitian ditentukan
setelah intervensi. Selanjutnya dilakukan perbandingan antara kelompok
penelitian dengan intervensi (kelompok kasus) dengan kelompok tanpa intervensi
9keelompok kontrol). Karena kelompok tersebut dipisah setelah dilakukan
intervensi, amka bias seleksi dapat menyebabkan keslahan investigasi. Sebagai
contoh, penelitianyang meneliti pengaruh hipertensi terhadap mortalitas bedah.
Jika kelompok penelitian dibagi ke dalam kelompok pasien dengan dan tanpa
kejadian kardiak perioperatif, maka satu kelompok akan berbeda dari kelompok
lain. Namun, hasil tersebut dapat bernilai bias; karena mungkin adanya penyakit
ginjal lebih signifikan dalam mengakibatkan hipertensi (bias faktor perancu).
Kemungkinan lainnya, kemungkinan pasien dengan hipertensi diputuskan
menjalani pembedahan oleh dokter hanya jika pasien tersebut memiliki
permasalahan bedah yang lebih buruk; oleh sebab itu, kedua kelompok tersebut
tidak bisa dibandingkan dengan objektif karena ada bias seleksi.
Dalam studi kohort, kelompok penelitian diawasi sebelum dilakukan
intervensi. Kelompok dirancang semirip mungkin kemudian dilakukan
pengamatan. Penelitian tersebut bermanfaat dalam mendeskripsikan riwayat alami
perjalanan penyakit dan membantu untuk mengetahui penyebab suatu
penyakit.Namun, seperti halnya studi observasional/penmgamatan lainnya, bias
seleksi dan faktor perancu dapat terjadi dan membuat hasil penelitian tidak benar.
Studi kasus kontrol biasanya disebut dengan istilah studi retrospektif karena
analisa hanya bisa dilakukan setelah subjek penelitian menyelesaikan studi, untuk
menentukan pada kelompok manakah subjek seharusnya berada. Sementara itu,
studi kohort merupakan studi prospektif karena data harus dikumpulkan sebelum
dilakukan intervensi. Sayangnya, istilah tersebut dapat disalahgunakan karena
sebenarnya kasus kontrol dapat dirancang secara prospektif. Selain itu, meskipun
sebuah studi bersifat prospektif, setelah data terkumpul, analisa dilakukan secara
retrospektif.
Setelah mempertimbangkan karakteristik dari uji coba
observasional/pengamatan,kekuatan intervensi uji klinis diukur, dimana peneliti
menentukan keanggotaan kelompok penelitian yang akan dibandingkan dan
berupaya untuk membuat kelompok tersebut semiripmungkin. Dalam sebuah uji
coba klinis acak,partisipan ditetapkan secara acak ke dalam kelompok penelitian;
oelh sebab itujika terjadi perubahan pada subjek penelitian/bias seleksi yang kecil,
maka seluruh kelompok juga akan mengalami hal yang sama. Studi model
tersebut paling bagus dalam bentuk prospektif. Uji klinis acak merupakan standar
ideal dalam penelitian medis karena bias yang dihaislkan minimal. Namun
memerlukan biaya yang cukup mahal. Uji coba tersebut memerlukan partisipasi
pasien sebelum dilakukan intervensi medis. Pasien menyerahkan jenis terapi pada
klinisi dan membiarkan terapi yang akan dijalani dipilih secara acak. Sehingga
memerlukan etika medis dan persetujuan pasien.
Meski dengan metodologi uji klinis terbaik pun,kesulitan potensial tetap
muncul dalam hal bias seleksi ringan mengenai pemilihan subjek yang mengikuti
sebuah uji coba klinis. Penelitian yang mendapatkan pengawasan ketat dari
peneliti dan sejawatnya dapat menghasilkan praktik atipikal sehingga tidak bisa
digeneralisasi ke dalam praktik klinis standar.
PILIHAN UJI STATISTIK
STATISTIK NON-PARAMETRIK
Saat menghitung distribusi acak dari beberapa variabel, dapat dengan
mudah dilakukan dengan memvisualisasikan nilai sebagai kluster di sekitar
beberapa nila pusat pada kurva distribusi normal. Namun, tidak semua data
memiliki distribusi normal. Data yang tidak berformat interval, seperti data
nominal (merah, hitam; laki-laki, perempuan) atau data ordinal (pertama, kedua),
tidak dapat dideskripsikan dengan distribusi matematis dengan memakai
parameter seperti mean atau SD. Dalam sistuasi seperti itu dapat digunakan
metode statistik non-parametrik. Langkah pertama dalam mempertimbangkan
pilihan uji statistik adalah memutuskan apakah metode statistik yang
mengasumsikan distribusi normal cocok atau justru data tersebut memerlukan
metodenon-parametrik (Tabel 111-2). Uji normalitas dapat dilakukan dengan
memanfaatkan program komputer. Hasilnya dapat dikonfirmasi dengan
pengamatan sederhana terhadap frekuensi tabulasi dan gambaran grafik.
TABEL KONTINGENSI
Masalah umum pada statistik non-parametrik adalah analisa dari tabel data
dimana tiap sel dalam tabel merupakan komponen perhitungan dalam kategori
tertentu. Fungsi tabel tersebut dipakai untuk menentukan apakah kelompok
penelitian berbeda secara statistik satu sama lain. Sebagai contoh penelitian
mengenai afiliasi politik lelaki dan wanita untuk parta Demokrat vs Republik,
maka tabel kontingensi 2 x 2 diperlukan untuk menganalisa hal tersebut. Apabila
terdapat penambahan kelompok politik misalnya kelompok Hijau dan Golput,
maka tabel kontingensinya menjadi 2 x 4.
DATA BERPASANGAN VS DATA TIDAK BERPASANGAN/TUNGGAL
Penggunaaan metode statistik untuk menganalisa data dari kelompok
multipel dengan setiap anggota berlatar belakang berbeda akan menimbulkan
kesulitan dalam menyimpulkan hasil penelitiannya karena sulit untuk mendeteksi
efek dari intervensi yang diberikan. Sebagai contoh, penelitian terhadap tekanan
darah dalam 2 kelompok pasien, satu kelompok diberi obat dan lainnya dibiarkan.
Maka sulit untuk mengukur efek terapi yang diberikan karena tekanan darah juga
dipengaruhi oleh kondisi medis sebelumny. Namun apabila penelitian dilakukan
pada individu yang sama, dengan pengukuran tekanan darah sebelum dan sesudah
terapi, maka pengaruh dari terapi yang diberikan akan dapat diamati dengan lebih
baik. Pada penelitian bentuk kedua inilah data yang dihasilkan berupa data
berpasangan (sebelum dan sesudah intervensi), yang lebih baik dalam
memunculkan hasil statistik yang signifikan.
ANALISA 2 KELOMPOK VS MULTIPEL
Analisa 2 kelompok hanya dapat menentukan perbedaan antar 2 kelompok
tersebut. Namun dengan melakukan analisa multipel (3 kelompok atau lebih),
peneliti dapat mengajukan 2 pertanyaa, pertama, untuk mengetahaui apakah antar
kelompok tidak sama secara statistik; kedua, jika antar kelompok tersebut secara
statistik tidak sama, manakah dari kelompok tersebut yang berbeda satu sama
lainnya. Prinsipnya terdapat 3 pertanyaan yang harus dipertimbangkan saat
memilih uji hipotesis (Lihat tabel 111-2):
1. Satu kelompok, 2 atau 3?
2. Kelompok berpasangan atau tungga?
3. Metode parametrik atau non-parametrik
Tabel 111-2.
Tujuan perbandingan
parametrik data interval
non-parametrik
data interval
data kategorikal
Deskripsi kelompok
mean ± SD median, modus, persentil
(proporsi dan hitungan)
uji beda dengan nilai t-test Wilcoxon Chi-square
uji beda 2 kelompok tak berpasangan
unpaired t-test Mann-Whitney Chi-square,Fisher
uji beda 2 kelompok berpasangan
paired t-test Wilcoxon McNemar
uji beda 3 kelompok atau lebih
ANOVA Kruskal-Wallis Chi-square
uji beda kelompok multipel berpasangan
repeated-measures ANOVA
Friedman -
regresi Regresi linear Regresi non parametrik
Regresi logistik
PENDEKATAN BAYESIAN TERHADAP PROBABILITAS
Istilah Bayesian seringkali merupakan indikasi bahwa peluang
populasi/pasien terkena suatu penyakit sebaiknya dipertimbangkan dalam
menerapkan tes prediktif. Saat menggunakan tes prediktif, konsep sensitivitas dan
spesifisitas sangat berguna karena tidak bergantung pada populasi. Sensitivitas
adalah kemampuan suatu uji untuk mendeteksi penyakit saat penyakit tersebut
benar-benar ada. Spesifisitas menunjukkan kemampuan suatu uji untuk mencegah
terjadinya positif palsu dari diagnosa suatu penyakit saat penyakit benar-benar
ada. Untuk menggunakan istilah tersebut, dipakai 4 kemungkinan situasi yaitu:
True positive (TP): pasien berpenyakit dan hasil tes positif
False positive (FP): pasien tak berpenyakit, dan hasil tes positif
True negative (TN): pasien tak berpenyakit, dan hasil tesnegatif
False negative (FN): pasien berpenyakit, dan hasil tes negatif
Sehingga formulanya:
Sensitivitas = TP/(TP + FN)
Spesifisitas = TN/ (TN + FP)
METAANALISIS
Kekuatan statistik dalam sebuah penelitian klinis berhubungan dengan
ukuran populasi, namun karena masalah biaya, kesulitan, dan kesulitan pencarian
sampel, maka dapat digunakan alternatif metaanalisa. Teknik tersebut dipakai
untuk menggabungkan penelitian yang mirip untuk mencapai total populasi agar
menghasilkan nilai statistik yang valid.
EVIDENCE-BASED MEDICINE/KEDOKTERAN BERBASIS BUKTI
Evidence-based medicine merupakan istilah untuk pendekatan terhadap
keputusan medis dimana dilakukan penerapan data eksperimen ilmiah secar hati-
hati. Diperlukan uji coba klinis terkontrol dan studi observasional berskala besar
untuk pendekatan tersebut.
RINGKASAN
Klinisi menggunakan metode statistik untuk menganalisa data yang dimiliki
dan menentukan nilai dari laporan ilmiah lainnya. Karena sejatinya analisa data
merupakan bentuk penerapan program komputer, dengan tiap menu, fromat
masing-masing, maka hal utama yang perlu diperhatikan adalah pemahaman
terhadap program tersebut, pembacaan manual program, dan pemlotan data.
Sistem penglihatan manusia memiliki tingkat adaptasi yang baik dalam mengenali
kelompok dan kecenderungan-apabila kesimpulan tampak tidak sesuai dengan
data, maka akan muncul sikap waspada dan skeptis.
Ketika menentukan nilai dari sebuah laporan ilmiah, klinisi yang teliti akan
membaca bagian metode dan mengajukan pertanyaan di awal: “apakah subjek
penelitian dipilih untuk meminimalisisr bias?”; “Apakah metode statistiknya
sesuai?”; “Apakah studi tersebut cukup besar untuk bermakna secara statistik?”
“Apakah kesimpulannya dijamin oleh adanya berbagai bukti?”; “Bisakah
kesimpulan dalam penelitian tersebut digeneralisir pada kasus yang lebih
umum?”. Pada akhirnya, diluar pendekatan klinis terbaik dan prosedur penelitian
paling teliti sekalipun, klinisi yang bijak menyadari bahwa penelitian terbaik
sekalipun dapat memunculkan kesimpulan yang tidak sepenuhnya benar. Studi
yang menghasilkan kesimpulan klinis penting, terutama yang bersifat
membahayakan pemahaman teoritis sebelumnya, mmerlukan konfirmasi dengan
kelompok penelitian lain menggunakan pasien yang berbeda dalam situasi yang
berbeda. Sikap skeptis yang sehat merupakan dasar dari sttistik dan ilmu
pengetahuan yang baik.