49
BAB 2 TINJAUAN TEORI 2.1. ESTIMASI 2.1.1. DEFINISI Estimasi atau pendugaan adalah suatu proses yang menggunakan sampel statistik untuk menduga atau menaksir parameter populasi yang tidak diketahui. Estimasi merupakan pernyataan mengenai parameter populasi yang tidak diketahui berdasarkan informasi dari sampel, dalam hal ini sampel random, yang diambil dari populasi tempat sampel berasal. Jadi dengan pendugaan tersebut, keadaan parameter populasi dapat diketahui. Estimasi adalah suatu metode untuk memperkirakan nilai populasi (parameter) dengan menggunakan nilai sampel (statistik). Taksiran dalam praktik sehari-hari sifat populasi jarang diketahui oleh sebab itu digunakan nilai-nilai statistik (nilai sampel). Nilai statistik yang digunakan untuk menduga disebut “estimator” (penduga). Selain penduga parameter, dikenal juga penduga statstik yaitu nilai-nilai atau angka-angka yang diperoleh dari penduga parameter. 3

BAB 2.docx

Embed Size (px)

Citation preview

BAB 2

TINJAUAN TEORI

2.1. ESTIMASI

2.1.1. DEFINISI

Estimasi atau pendugaan adalah suatu proses yang menggunakan sampel

statistik untuk menduga atau menaksir parameter populasi yang tidak

diketahui. Estimasi merupakan pernyataan mengenai parameter populasi

yang tidak diketahui berdasarkan informasi dari sampel, dalam hal ini

sampel random, yang diambil dari populasi tempat sampel berasal. Jadi

dengan pendugaan tersebut, keadaan parameter populasi dapat diketahui.

Estimasi adalah suatu metode untuk memperkirakan nilai populasi

(parameter) dengan menggunakan nilai sampel (statistik). Taksiran dalam

praktik sehari-hari sifat populasi jarang diketahui oleh sebab itu digunakan

nilai-nilai statistik (nilai sampel). Nilai statistik yang digunakan untuk

menduga disebut “estimator” (penduga). Selain penduga parameter,

dikenal juga penduga statstik yaitu nilai-nilai atau angka-angka yang

diperoleh dari penduga parameter.

Teori estimasi memegang peran yang sangat penting dalam statistika

inferensial karena teori estimasi bersama-sama dengan pengujian hipotesis

merupakan dasar statistika inferensial yang dilandasi oleh teori peluang.

Dalam metode statistika, teori estimasi digunakan untuk menaksir

parameter populasi seperti rata-rata atau proporsivariabel tertentu yang

terdapat dalam populasi melalui perhitungan statistik sampel karena

perhitungan langsung pada seluruh populasi tidak mungkin dilakukan.

Di bidang kedokteran, teori estimasi digunakan untuk menaksir

banyaknya penderita penyakit tertentu di masa yang akan datang,

3

4

menaksirkan jumlah pengunjung atau menaksir prognosa suatu penyakit

dan lain-lain.

2.1.2. ESTIMATOR YANG BAIK

Estimator ialah statistik sampel yang digunakan untuk menaksir

paremeter populasi. Misalnya, rata-rata sampel (x ) digunakan untuk

menaksir rata-rata populasi (µ), proporsi sampel (p ) untuk menaksir

proporsi populasi (p), dan jumlah sampel tertentu (x’) untuk menaksir

jumlah ciri tertentu populasi (x’).

Walaupun statistik sampel dapat digunakan sebagai estimator untuk

menaksir parameter populasi, tetapi tidak semua statistik merupakan

estimator yang baik. Olah karena itu, untuk menentukan statistik sebagai

estimator yang baik terdapat beberapa kriteria sebagai berikut :

1. Tidak bias

Merupakan salah satu kriteria estimator yang penting untuk

menentukan estimator yang baik. Suatu estimator dikatakan tidak bias

bila nilai hasil statistik sampel mempunyai nilai yang sama dengan

parameter populasi. Ini berarti, nilai-nilai statistik yang terletak diatas

nilai parameter populasi sama dengan nilai-nilai statistik yang terletak

dibawah nilai parameter. Misalnya, rata-rata sampel merupakan

estimator yang tidak bias, demikian pula dengan proporsi sampel serta

“jumlah” ciri tertentu sampel.

2. Efisien

Suatu estimator dikatakan efisien bila statistik sampel mempunyai

kesalahan baku yang kecil. Bila kita harus menentukan satu estimator

dari dua statistik maka statistik dengan kesalahan baku yang lebih kecil

kita ambil sebagai estimator karena statistik dengan kesalahan baku

5

yang lebih kecil mempunyai peluang yang besar untuk lebih mendakati

nilai parameternya.

Misalnya, kita akan menaksir rata-rata populasi melalui statistik rata-

rata dan median sampel. Dari distribusi rata-rata sampel diperoleh

kesalahan baku sebesar 1,03 , sedangkan kesalahan baku median

sebesar 1,64 maka dikatakan bahwa “rata-rata” merupakan estimator

yang lebih efisien dibandingkan median.

3. Konsisten

Bila besarnya sampel bertambah maka hampir dapat dipastikan bahwa

nilai statistik sampel akan lebih mendekati nilai parameter populasi,

estimator demikian disebut konsisten. Ini berarti bahwa dengan

estimator yang konsisten maka ketepatan akan meningkat dengan

sampel yang besar. Oleh karena itu, bila kita ingin meningkatkan

ketepatan estimasi terhadapap parameter populasi dengan

meningkatkan sampel maka harus diperhatikan apakah estimator yang

dipilih merupakan estimator yang konsisten. Bila hal ini tidak

diperhatikan maka penambahan jumlah sampel tidak akan

meningkatkan ketepatan taksiran.

Misalnya, rata-rata sampel merupakan estimator yang tidak bias

terhadap median populasi, demikian pula dengan median sampel, tetapi

bila jumlah sampel bertambah maka rata-rata sampel akan lebih

mendekati median populasi daripada median sampel. Dari hasil diatas

dapat dikatakan bahwa rata-rata merupakan estimator yang konsisten

untuk menaksir median populasi daripada median sampel.

6

2.2. ESTIMASI TITIK dan SELANG

2.2.1. DEFINISI ESTIMASI TITIK

Titik estimasi merupakan salah satu cara untuk mengadakan estimasi

terhadap parameter populasi yang tidak diketahui. Titik estimasi ialah nilai

tunggal yang digunakan untuk mengadakan estimasi terhadap parameter

populasi. Pemakain titik estimasi untuk menaksir parameter populasi

sering tidak memuaskan karena dengan titik estimasi kita hanya dapat

mengetahui apakah estimasi tersebut benar atau salah. Misalnya, pada

contoh penderita rawat inap tersebut diperoleh rata-rata 28 penderita per

minggu dan kita katakan bahwa estimasi tersebut salah. Ini berarti bahwa

titik estimasi merupakan nilai taksiran yang kaku.

Oleh karena itu titik estimasi akan lebih bermanfaat bila disertai dengan

penyimpangan yang masih dapat diterima. Ini berarti bahwa perbedaan

dengan nilai titik estimasi tidak berpengaruh terhadap kesimpulan yang

kita buat. Titik estimasi yang dapat kita gunakan untuk mengadakan

estimasi parameter populasi ialah rata-rata sampel terhadap rata-rata

populasi, proporsi sampel terhadap proporsi populasi, jumlah variabel

tertentu yang terdapat dalam sampel untuk menaksir jumlah variabel

tersebut dalam populasi, dan varians atau simpangan baku sampel untuk

menaksir simpangan baku populasi.

Contoh :

Dari suatu penelitian terhadap suatu sampel Ibu Hamil di Kecamatan

Kejajar Kabupaten Wonosobo dari 108 orang ibu hamil diperoleh kadar

Hb rata-rat 8,5 g %. Jika kita menduga kadar Hb Ibu Hamil tersebut

dengan estimasi titik, maka kita akan mengatakan bahwa kadar Hb Ibu

Hamil di Kecamatan Kejajar Kabupaten Wonosobo adalah 8,5 g%.

Sesungguhnya nilai populasi atau µ dapat kita duga dari berbagai nilai

didalam sampel, misalnya nilai median atau nilai mode atau salah satu

nilai pengamatan, namun yang dikatakan tidak bias adalah nilai

mean.namun, estimasi titik ini memiliki kelemahan, yaitu kita tidak dapat

memastikan seberapa kuat kebenaran dugaan itu dan kemungkinan besar

7

akan salah. Kelemahan estimasi ini dapat dihilangkan dengan melakukan

estimasi selang atau interval estimation.

2.2.1.1. JENIS-JENIS ESTIMASI TITIK

1. Titik Estimasi Rata-rata (x ) Terhadap Rata-rata Populasi (µ)

Contoh :

Untuk membuat estimasi rata-rata tinggi badan Mahasiswa

Fakultas Kedokteran dilakukan pengambilan sampel sebanyak

20 orang dengan hasil sebagai berikut :

160, 161, 158, 157, 163, 171, 168, 166, 155, 173, 160, 165, 154,

156, 161, 162, 150, 53, 170, 164

x = 3227 / 20 = 161,4 cm

tinggi badan 161,4 cm merupakan titik estimasi terhadap tinggi

badan mahasiswa Fakultas Kedokteran

2. Titik Estimasi Proporsi Sampel ( p ) Terhadap Proporsi Populasi

(p)

Contoh :

Bila kita ingin mengetahui persentase penduduk suatu kota yang

menderita keratitis. Untuk itu, kita ambil sampel sebanyak 100

orang yang berkunjung ke Rumah Sakit Mata dan ternyata

terdapat 5 orang yang menderita penyakit keratitis. Dari hasil

tersebut dibuat taksiran bahwa 5% penduduk kota tersebut

menderita keratitis dengan perhitungan sebagai berikut.

Proporsi (p) = x/n

x : jumlah penderita keratitis yang ditemukan

n : jumlah sampel

p = 5/100 = 5%

3. Titik Estimasi Proporsi Sampel (x’) Terhadap Ciri Tertentu

Dalam Populasi (X’)

Titik estimasi jumlah ciri tertentu dalam variabel yang terdapat

pada sampel digunakan untuk mengadakan estimasi terhadap

jumlah ciri tersebut dalam populasi.

x’ = (1/f)x

8

x’ : jumlah kategori dalam variabel

f : n/N

n : banyaknya sampel

N : besarnya populasi

x : jumlah hasil (outcome) kategori yang ingin kita ketahui

jumlahnya

contoh :

Kita ingin mengetahui jumlah pengunjung wanita yang terdapat

di suatu rumah sakit. Diketahui jumlah penderita yang

berkunjung sebanyak 500 orang per minggu. Dari jumlah

tersebut diambil sebanyak 50 orang tersebut dan terdapat 10

orang penderita wanita.

f = n/N

= 50/500 = 1/10

x’ = (1/f)x

= (1/ 1/10) 10

= 100

4. Titik Estimasi Deviasi Standar Sampel (s) Terhadap deviasi

Standar Populasi (σ)

Untuk mengadakan estimasi terhadap kadar gula darah telah

dilakukan pemeriksaan gula darah puasa terhadap 35 orang

mahasiswa yang dianggap normal. Dari pemeriksaan tersebut

dihasilkan rata-rata 102 mg%. Dari hasil tersebut kita hitung

devisiasi standar menggunakan rumus berikut :

S= √Σ ( x−x )2n

−1

Hasil s = 6,01 merupakan nilai estimasi devisiasi standar

terhadap gula darah populasi. Hasil ini tidak bias karena sebagai

penyebut digunakan koreksi “n – 1” .

9

2.2.2. DEFINISI ESTIMASI SELANG

Dasar estimasi interval (estimasi selang) adalah bahwa sampel-sampel

yang diambil dari suatu populasi akan berdistribusi normal sekitar µ

dengan standar devisiasi sama dengan SE (sifat dan distribusi sampling).

Dengan ini kita menentukan batas minimum dan maksimum terletaknya

nilai µ. Jarak dari batas tertinggi dan terndah ini ditentukan sebagai

confident interval = confident limit , yaitu luas daerah di bawah kurva

normal ditentukan dengan persentase.

Contoh :

Dari sampel random 100 orang ibu hamil yang diambil di Kecamatan

Kejajar Kabupaten Wonosobo didapat kadar Hb 9,6 g% dengan standar

deviasi 5 g%. Dengan tingkat kepercayaan 95% akan dihasilkan kadar Hb

ibu hamil di Kecamatan Kejajar Wonosobo adalah :

x = 9,6 g%

n = 100

σ = 5 g%

SE= 5

√ 100 = 0,5 g%

Cl = 95% ( di dalam tabel –Z, nilai Z- α/2 = 1,96 )

Maka estimasi selang kadar Hb adalah :

st – Z α/2 SE ≤ parameter ≤ st + Zα / 2 SE, atau µ = ±Z

α/2. SE di mana SE = σ / √ nketerangan :

st = nilai statistik (sampel = X )

Z = deviasi relatif (standar score, besarnya ditentukan oleh confident interval)

SE = standar error

Parameter = nilai populasi yang diduga = µ

Atau

x - Z. SE ≤ µ ≤ x + Z. SE

10

9,6 – 1,96. 0,5 ≤ µ ≤ 9,6 + 1,96 . 0,5

8,6 g% ≤ µ ≤ 10,6 g%

Berdasarkan nilai estimasi selang tersebut, dapat diartikan :

Kita yakin 95% bahwa kadar Hb ibu hamil di Kecamatan Kejajar

Kabupaten Wonosobo berkisar antara 8,6 g% sampai 10,6 g%

Kalau diambil berulang kali sampel yang besar 100, maka 95%

dari mean sampel tersebut berada pada 8,6 g% sampai dengan 10,6

g%.

Dengan estimasi selang kita mengakui bahwa dengan confident

interval 95%, 90% atau 99% kebenaran estimasi ini terbukti.

Dengan kata lain, sejatinya diakui kemungkinan (peluang) salah

adalah 100% - 95% = 5% atau 10% atau 1% di kenal sebagai α

(alfa)

Pada contoh di atas dinyatakan standar deviasi di dalam populasi (σ)

diketahui. Umumnya jika kita mengambil suatu sampel, standar deviasi

populasi jarang diketahui. Jika sampel yang diambil ibu hamil di

Kecamatan Kejajar Kabupaten Wonosobo, bukan 100 orang tetapi 25 orang

ibu hamil saja dan σ tidak diketahui, maka distribusi sampling kita

asumsikan berdistribusi seperti distribusi “student-t” di mana untuk

menentukan

2.2.3. INTERVAL ESTIMASI RATA-RATA

Interval estimasi rata-rata parameter populasi dapat dilakukan

berdasarkan besarnya sampel, simpangan baku populasi, dan besarnya

populasi. Oleh karena itu perhitungannya dibedakan menjadi seperti

berikut :

Populasi terbatas, devisiasi standar diketahui, sampel besar (n >

30)

Populasi terbatas, deviasi statndar tidak diketahui, sampel besar (n

> 30 )

Populasi terbatas, deviasi standar tidak diketahui, sampel kecil ( n

< 30)

Populasi tak terhingga diviasi standar diketahui sampel kecil (n <

30)

11

Populasi tak terhingga deviasi standar tak diketahui dan sampel

besar (n > 30)

Populasi tak terhingga deviasi standar tak diketahui dan sampel

kecil (n < 30)

Misalkan, kita ingin mengadakan estimasi terhadap tingkat kesembuhan

obat anti rheumatik maka diambil sampel sebanyak 100 orang penderita

yang diberi obat tersebut. Dari 100 orang tersebut diperoleh rata-rata

kesembuhan 14 hari. Dari perusahaan farmasi yang memproduksi obat

tersebut didapat informasi bahwa deviasi standar pada α = 0,05 atau

derajat konfidensi 95% adalah 3 hari.

n = 100

x = 14 hari

σ = 3 hari dengan derajat konfidensi 95%

Z = ± 1,96

σ x = σ/ √n = 3/ √100 = 0,3

interval konfidensi : x ±1, 96 σ x

= 14± 1,96 x 0,3

= 14± 0,588

Dari hasil tersebut dapat disimpulkan bahwa kita 95% percaya bahwa

tingkat kesembuhan obat tersebut terletak antara 13,4 hari dan 14,6 hari.

Dalam praktik, kita sering menemukan besarnya deviasi standar populasi

yang tidak diketahui. Dalam hal ini, deviasi standar populasi dapat

diperkirakan berdasarkan perhitungan deviasi standar sampel dengan

rumus berikut :

σ = s = √ Σ ( x−x' ) 2/n−1

σ x = s

√ n x √ ( N−n )(N−1)

Interval Estimasi = x ± Z (s / √n ) x √ ( N−n )(n−1)

12

Contoh :

Sebuah daerah yang terdiri dari 500 KK. Seorang dokter Puskesmas ingin

menaksir besarnya pendapatan per bulan per KK. Untuk itu diambil

sampel 50 KK dan diperoleh rata-rata penghasilan Rp 150.000,00 per

bulan dengan deviasi standar 25.000

Deviasi standar populasi tidak diketahui dan besarnya populasi terbatas

maka untuk menghitung interval konfidensi digunakan rumus :

N = 500 dianggap populasi terbatas

n = 50

s = 25.000

σx = 25000√ 50

X √ (500−50)(500−1)

= 3536 x 0,95 = 3359,2

Bila derajat konfidensi yang diinginkan adalah 99% maka interval

konfidensi= x ±2,58 σx

Limit atas = 150.000 +(2,58 x 3359,2)

= 158.666,7

Limit bawah = 150.000 – 8666,7

= 141.333,3

Dari hasil tersebut dapat disimpulkan bahwa dokter tersebut 99% percaya

bahwa penghasilan penduduk daerah tersebut antara Rp.141.333,00 dan

Rp. 158.666,00 per bulan per KK.

2.3. ESTIMASI RATA-RATA dan PROPORSI

2.3.1. DEFINISI ESTIMASI RATA-RATA

Estimasi rata-rata atau pendugaan rata-rata adalah pendugaan mengenai

nilai parameter µ yang sebenarnya berdasarkan informasi rata-rata sampel

13

Contoh :

Dari hasil penelitian mahasiswa terhadap 100 orang yang ditimbang berat

badannya diperoleh rata-rata berat badan = 45 kg dengan standar deviasi

(σ) = 22 kg. Dengan CL 95% (z = 1,96), maka :

µ = 45 ± 1,96 x 22/ √100 = 40,68 kg ≤ µ ≤ 49,31. Artinya jika diambil

sampel berulang kali maka 95% nilai rata-rata berat badan terletak antara

40,68 kg sampai dengan 49,31 kg.

Rumus besar sampel untuk estimasi rata-rata

Contoh :

Tentukan besar sampel (n) yag harus diambil untuk meneliti waktu rata-

rata yang digunakan kader dalam melakukan penimbangan balita, jika

digunakan tingkat kepercayaan 95% dengan kesalahan duga (E) tidak lebih

dari 0,08 menit dan simpangan baku (s) 0,7 menit

1 – α = 95%, z α/2 = 1,96 (tabel Z)

E= 0,08

S= 0,7

n = ( Z α2

x sE

) 2

n = (1,96 x 0,7

0,08 )2

n = 294,1225 = 295

n = ( Z α2

x sE

) 2

14

jadi besar sampel minimum yang harus diambil adalah 295 orang.

2.3.2. DEFINISI ESTIMASI PROPORSI

Estimasi proporsi atau pendugaan proporsi adalah pendugaan dari proporsi

populasi yang tidak diketahui.

Contoh :

Dari penelitian terhadap 100 orang secara acak diperoleh bahwa 7%

pengunjung Puskesmas adalah penderita DM. Dengan tingkat kepercayaan

90% berapa perkiraan proporsi penderita DM ?

p = 0,07, q = 1 – 0,07 = 0,93

SE = √ 0,07x 0,93100

= 0,025

0,07 – 1,645 . 0,025 ≤ P ≤ 0,07 + 1,645 . 0,025

0,029 ≤ P ≤ 0,11 , artinya jika diambil sampel secara berulang kali maka

90% nlai proporsi penderita DM terletak antara 0,029 (2,9%) sampai

dengan 0,11 ( 11%).

Rumus besar sampel untuk estimasi proporsi

p – Zα / 2SE ≤ P ≤ p + Zα / 2 SE =√ pqn

q = 1- p

jika n < 30 gunakan Tabel T

n = 14

(Z α /2E )2

15

Contoh:

Tentukan besar sampel (n) yang harus diambil untuk mengetahui proporsi

balita gizi kurang dengan tingkat kepercayaan 99% dan kesalahan yang

mungkin terjadi tidak lebih dari 0,09

1 – α = 99%, z α/2 = 2,58

E = 0,09

n = 14

( 2,580,09 )2

n = 205,44 = 206

jadi besar sampel minimum harus diambil adalah 206 orang.

2.4. STATISTIK DESKRIPTIF

2.4.1. DEFINISI

Merupakan suatu metode untuk memaparkan hasil-hasil penelitian yang

telah kita lakukan dalam bentuk statistik popular yang sederhana, sehingga

setiap orang dapat lebih mudah mengerti dan mendapatkan gambaran yang

jelas mengenai hasil penelitian. Statistika deskriptif adalah metode-metode

yang berkaitan dengan pengumpulan dan penyajian suatu gugus data

sehingga memberikan informasi yang berguna.

Statistika deskriptif hanya memberikan informasi mengenai data yang

dipunyai dan sama sekali tidak menarik inferensia atau kesimpulan apapun

tentang gugus induknya yang lebih besar. Contoh statistika deskriptif yang

sering muncul adalah, tabel, diagram, grafik, dan besaran-besaran lain di

majalah dan koran-koran. Dengan Statistika deskriptif, kumpulan data

yang diperoleh akan tersaji dengan ringkas dan rapi serta dapat

16

memberikan informasi inti dari kumpulan data yang ada. Informasi yang

dapat diperoleh dari statistika deskriptif ini antara lain ukuran pemusatan

data, ukuran penyebaran data, serta kecenderungan suatu gugus data

2.4.2. FREKUENSI DISTRIBUSI

Pada suatu penelitian atau survey, seringkali terdapat data-data hasil

penelitian yang jumlahnya cukup besar dan membingungkan, sehingga

untuk memudahkan pengolahan data, kita harus melakukan

pengelompokan data menjadi beberapa kelompok atau kelas dalam suatu

format yang disebut sebagai tabel frekuensi atau frekuensi distribusi.

Tabel frekuensi dapat dibagi menjadi dua berdasarkan jenis data yang

kita pergunakan yaitu :

a Frekuensi Distribusi Numerikal

Bila dalam pengelompokan frekuensinya terdiri dari data kuantitatif

yang menyatakan besar bilangan numerik

b Frekuensi Distribusi Katagorikal

Bila dalam pengelompokkan frekuensinya terdiri dari data kualitatif

yang menyatakan jenis atau mewakili karateristik tertentu seperti

orang, jenis kelamin dan lain-lainnya.

2.4.2.1. Kelas Interval

Dalam keadaan tertentu, dimana batas antara nilai terendah dan

nilai tertinggi dari suatu set data cukup besar serta terdistribusi

secara merata, maka untuk memudahkan pengolahannya data

tersebut dibagi menjadi beberapa group data.

Contoh :

Dari hasil pemeriksaan tinggi badan 100 orang calon mahasiswa

Fakultas Kedokteran, ternyata tinggi badan terendah adalah

150cm dan paling tinggi adalah 172 cm. Supaya jelas dan mudah

dibaca kita dapat membuat tabel frekuensi dengan beberapa kelas

interval seperti tabel di bawah ini :

17

Tabel 1.1

No. Tinggi Badan f

1 150 – 154 20

2 155 – 159 35

3 160 – 164 25

4 165 – 169 15

5 170 – 174 5

Total 100

Ada beberapa petunjuk yang sering dipergunakan dalam memilih

kelas interval yaitu :

Jumlah kelas interval yang sering dipilih yaitu antara

1,2,3,4,5,10, dan 20.

Batas kelas dalam setiap interval dimulai dengan angka

kelipatan (k), misalnya kelas interval sengan k=5 maka

batas kelas dimulai dengan angka 5,10,15,20,25

Kadang-kadang jumlah kelas dapat ditentukan dengan

mempergunakan rumus range = nilai tertinggi dikurangi

nilai terendah dari data observasi dan dibagi dengan

angka kelipatan (k), dengan ketentuan angka jumlah kelas

hasil perhitungan harus mempunyai nilai bulat.

2.4.2.2. Batas Kelas (Class Limit)

Untuk keperluan perhitungan statistik, nilai atas dan nilai bawah

batas kelas yang sesungguhnya dalam setiap kelas interval perlu

diketahui yaitu dengan cara mengurangi nilai bawah dan

menambah nilai atas dengan angka 0,5.

Contoh :

18

Bila batas kelas adalah 95 – 99, maka nilai sesungguhnya adalah

94,5 – 99,5 dengan titik tengah atau midpoint adalah ( 94,5 +

99,5) / 2 = 97 cm

Gambar 1.1

94,5 95 96 97 98 99 99,5

True lower limit midpoint true upper limit

2.4.2.3. Frekuensi Kumulatif dan Relatif

Merupakan penambahan jumlah frekuensi dari setiap kelas

interval dengan jumlah frekuensi kumulatif kelas interval

sebelumnya, sedangkan frekuensi relatif merupakan persentase

dari masing-masing kelas seperti yang terlihat pada tabel

dibawah ini :

Tabel 1.2

No. Tinggi Badan f cf fr (%)

1 150 - 154 20 20 20

2 155 – 159 35 55 35

3 160 – 164 25 80 25

4 165 – 169 15 95 15

5 170 – 174 5 100 5

n = 100

2.4.2.4. Penggambaran Grafik Tabel Frekuensi Kelas Interval

Seringkali disajikan dalam grafik bentuk batang dan garis yang

disebut sebagai histogram dan frekuensi poligon. Grafik

histogram sama seperti bar chart, namun setiap batang mewakili

kelas interval yang ada, sedangkan untuk grafik frekuensi

19

poligon menunjukkan titik tengah atau midpoint dari setiap kelas

interval.

Hasil penyebaran data dari setiap kelas interval ini, bila dibuat

grafik dapat membentuk bermacam-macam kurva seperti lonceng

atau simetris, melenceng ke arah kanan atau kiri, bentuk huruf J

atau U, bimodal, leptokurtosis dan platylkurtosi.

Gambar 1.2 (histogram)

DISTRIBUSI TINGGI CALON MAHASISWA

FAKULTAS KEDOKTERAN

150 - 154 155 - 159 160 - 164 165 - 169 170 - 1740

5

10

15

20

25

30

35

Series 1Column1Column2

Gambar 1.3 (poligon)

150 - 154

155 - 159

160 - 164

165 - 169

170 - 174

0

5

10

15

20

25

30

35

40

Series 1Column1Column2

20

2.4.3. MENGUKUR SENTRAL TENDENSI

Sentral tendensi adalah nilai yang representatif dalam suatu kelompok

observasi atau studi yang dikenal sebagai nilai mean, median dan mode.

2.4.3.1. Mean

Dalam kehidupan sehari-hari dikenal sebagai nilai rata-rata dari

satu set data observasi dan dipergunakan untuk keperluan test

statistik. Mean dari sederetan (sekelompok) angka (bilangan)

adalah jumlah dari keseluruhan angka (bilangan) yg ada, dibagi

dengan banyaknya angka (bilangan) tersebut.

Cara mencari Mean data tunngal

Mx= xN

M x = Mean yg kita carix = jumlah dari skor (nilai2 yg ada )N = number of cases (banyaknya skor2 itu sendiri)

Tabel 2.1Perhitungan Mean nilai hasil UAS

dalam MA Biologi, Maternitas, Anak, KMB, fisiologi, psychologi

seorang Mhs Stikes Yatsi

X=nilai F

9 1

8 1

7 1

6 1

5 1

4 1

39=x 6=N

21

Mx= xN

= 39 = 6,50 nilai rata2 6,50 6

Cara mencari Mean data kelompok

Pada perhitungan Mean metode ini terlebih dahulu dicari Nila Tengah (Midpoint), setelah itu tiap2 midpoint dikalikan dg rekuensi yg dimiliki oleh masing2 interval ybs.

Rumus:

Mx= fxN

M x = Mean yg kita carifx = jumlah dari hasil perkalian antara midpoint masing2 interval dg frekuensinyaN = number of cases (banyaknya skor2 itu sendiri)

Tabel 2.2Nilai hasil tes seleksi bidang studi Bhs Inggris

Dari 800 Mhs Yatsi

IntervalNilai

F

75 – 79 8

70 – 74 16

65 – 69 32

60 – 64 160

55 – 59 240

50 – 54 176

45 – 49 88

40 – 44 40

35 – 39 32

30 – 34 8

22

Total 800=N

Cara mencari Mean data kelompok: Menghitung nilai tengah (mid point) masing2 interval, diberi

lambang X Memperkalikan frekuensi masing2 interval dg midpoint nya (f

dikalikan dg X) shg diperoleh fX Menjumlahkan fX shg diperoleh fX Menghitung Mean nya

Tabel 2.3

Perhitungan Mean Nilai hasil tes seleksi bidang studi Bhs InggrisDari 800 Mhs Yatsi

Interval nilai F X (midpoint) fX

75 – 79 8 77 616

70 – 74 16 72 1152

65 – 69 32 67 2144

60 – 64 160 62 9920

55 – 59 240 57 13680

50 – 54 176 52 9152

45 – 49 88 47 4136

40 – 44 40 42 1680

35 – 39 32 37 1184

30 - 34 8 32 256

total N = 800 𝚺fX = 43920

Maka Mean nya adalah :

Mx= fxN

= 43920 = 54,90 800

23

2.4.3.2. Median

Menunjukkan letak angka paling tengah pada suatu deratan

angka observasi.

Rumus :

Data tunggal

Data kelompok

Md : median

Lm : true lower limit atau batas bawah

n : total observasi

cf : frekuensi komulatif

fm : frekuensi tertinggi

w : besarnya interval

2.4.3.3. Mode

Data tunggal

Merupakan angka yang paling banyak dijumpai dalam data

observasi

Data kelompok

Merupakan angka midpoint dari kelas dengan frekuensi

paling tinggi

2.4.4. MENGUKUR DISPERSI

Penyebaran atau variasi dari data nilai mean desebut dispersi.

2.4.4.1. Range

Md = (n+1 ) 2

2 th

Md = Lm + n/2 – cf x w

fm

24

Adalah selisih antara nilai paling tinggi dan paling rendah dalam

suatu set observasi.

Data tunggal

Range = nilai paling tinggi – nilai paling rendah

Data kelompok

Range = true upper limit – true lower limit

2.4.4.2. Standar Deviasi

Merupakan deviasi atau penyimpangan dari nilai mean suatu

observasi atau studi.

Data tunggal

x 2

Rumus: SD= N

SD : standar deviasix2: jumlah semua deviasi setelah mengalami proses pengkuadratanN : number of cases Data kelompok

fx 2

Rumus: SD= N

2.4.4.3. Percentile, deciles , quartiles

Percentiles

Rumus utk data tunggal:

n/100N - fkb

Pn = L +

fi

utk data kelompok:

n/100N - fkb

Pn = L + x i fi

25

Decile

Rumus decile:

Utk data tunggal:

n/10N - fkb

Dn = L +

fi

Utk data kelompok:

n/10N - fkb

Dn = L + x i

fi

Dn = decile yg ke-n ( disini n dapat diisi dg bilangan: 1,

2, 3, 4, 5, 6, 7, 8, atau 9)

L = lower limit (batas bawah nyata dari skor atau

interval yg mengandung decile ke-n)

N = number of cases

Fkb = frekuensi kumulatif yg terletak dibawah skor atau

interval yg mengandung decile ke-n

fi = frekuensi aslinya

i = interval class

Quartiles

Utk data tunggal

n/4N - fkb

Qn = L + fi

Utk dat kelompok

n/4N - fkb

26

Qn = L + x i fi

Qn = quartile yg ke-n. Krn titik quartile ada 3 buah, maka n

dapat diisi dengan bilangan 1, 2 dan 3

L = lower limit ( batas bawah nyata dr skor atau interval yg

mengandung Qn )

N = number of cases

Fkb = frekuensi kumulatif yg terletak di bawah skoir atau

interval yg mengandung Qn

fi = frekuensi aslinya, yaitu frekuensi dari skor atau intrval

yg mengandung Qn

i = interval class

2.5. STATISTIK INFERENSIAL

2.5.1. DEFINISI

Statistik inferensial adalah teknik analisis da

ta yang digunakan untuk menentukan sejauh mana kesamaan antara

hasil yang diperoleh dari suatu sampel dengan hasil yang akan didapat

pada populasi secara keseluruhan. Jadi statistik inferensial membantu

peneliti untuk mencari tahu apakah hasil yang diperoleh dari suatu sampel

dapat digeneralisasi pada populasisi. Sejalan dengan pengertian statistik

inferensial menurut Creswell, Muhammad Nisfiannoor berpendapat bahwa

statistik inferensial adalah metode yang berhubungan dengan analisis data

pada sampel untuk digunakan untuk penggeneralisasian pada populasi.

Penggunaan statistic inferensial didasarkan pada peluang (probability) dan

sampel yang dipilih secara acak (random).

Oleh karena itu, statistika inferensial disebut juga statistik

induktif atau statistik penarikan kesimpulan. Dalam statistika inferensial,

kesimpulan dapat diambil setelah melakukan pengolahan serta penyajian

data dari suatu sampel yang diambil dari suatu populasi, sehingga agar

27

dapat memberikan cerminan yang mendekati sebenarnya dari suatu

populasi.

2.5.2. KONSEP STATISTIK INFERENSIAL

Standard Error

Peluang setiap sampel sangat identik dengan populasinya sangat kecil

(nill) meskipun inferensi populasi didapat dari informasi

sampel.Penerapan random sampling tidak menjamin karakteristik

sampel sama persis dengan populasi. Variasi prediksi antara mean

disebut sampling error. Sampling error ini tidak bisa dihindari dan ini

bukan kesalahan peneliti. Yang menjadi persoalah adalah apakah error

tersebut semata-mata hasil sampling error atau merupakan perbedaan

yang bermakna yang akan pula ditemukan pada papulasi yang lebih

besar.

Ciri standard error adalah bahwa error yang terjadi bisaanya

berdistribusi normal yang besarnya berbeda-bedadan error tersebut

cenderung membentuk kurva normal yang menyerupai lonceng. Faktor

utama yang mempengaruhi standard error adalah jumlah sampel.

Semakin banyak sampelnya, semakin kecil standard  errornya. Ini

menunjukkan bahwasampel penelitian semakin akurat bila banyak

sampelnya.

Faktor utama yang mempengaruhi standard error adalah jumlah

sampel. Semakin banyak sampelnya, semakin kecil standard

errormeannya yang berarti bahwa semakin kecil standard error-nya,

semakin akurat mean sampel untuk dijadikan estimator untuk mean

populasinya.

Pengujian Hipotesis

Pengujian hipotesis adalah proses pengambilan keputusan dimana

peneliti mengevaluasi hasil penelitian terhadap apa yang ingin dicapai

sebelumnya. Misalnya, kita ingin menerapkan program baru dalam

pelajaran membaca. Pada rencana penelitian dikemukanan hipotesis

penelitian yang memprediksi perbedaan skor siswa yang menjalni

program baru tadi dengan proglam lama, dan hipotesis nol (0), yang

memprediksikan skor kedua kelompok tidak akan berbeda. Setelah data

28

dihitung mean dan standar deviasinya dan hasilnya menunjukkan skor

siswa dengan program baru lebih tinggi (berbeda secara signifikan)

daripada siswa yang mengikuti program lama, maka hipotesis

penelitian diterima dan hipotesis nol ditolak. Yang berarti bahwa

program baru tersebut efektif untuk diterapkan pada program

membaca. Intinya, pengujian hipotesis adalah proses evaluasi hipotesis

nol, apakah diterima tau ditolak.

Uji Signifikansi

Uji signifikasi  adalah cara mengetahui adanya perbedaan antara dua

skor. Signifikansi merujuk pada tingkat statistik dari probabilitas

dimana dengannya kita bisa menolak hipotesis nol. Uji signifikansi

dilakukan dengan menentukan tingkat probabilitas praseleksi yang

dikenal dengan tingkat signifikansi (α). Tingkat probailitas ini

dijadikan dasar untuk menolak atau tidak menolak hipotesis nol.

Standar yang digunakan umumnya 0,05 kesempatan (5 dari 100).

Adapula yang menggunakan 0.01. Semakin kecil nilai probabilitasnya,

semakin kecil pula kemungkinan temuan tersebut diperoleh karena

disebabkan oleh peluang.

2.5.3. TEORI ESTIMASI TERHADAP PARAMETER POPULASI

Jika kita memilih dua atau lebih random sampel dari populasi yang

sama, spintas kita akan menduga bahwa mean setiap random sampel ini

akan berbeda satu dengan yang lain serta tidak sama dengan mean

populasi yang ada. Namun, dalam kenyataannya apabila populasi

terdistribusi secara normal, maka mean setiap sampel akan ikut

terdistribusi secara normal pula tanpa tergantung dengan jumlah sampel

yang diambil. Sebaliknya apabila populasi tidak terdistribusi secara

normal, maka distribusi mean dari seluruh random sampel akan berangsur-

angsur mendekati distribusi normal seiring dengan bertambahnya jumlah

sampel.

Batasan-batasan :

Mean setiap sampel dengan ukuran tertentu = n yang diambil secara

random dari populasi sama, akan mempunyai mean yang sama dengan

mean populasi.

29

µ x = µ

Variance dari mean sampel akan sama dengan variance populasi dibagi

besar ukuran sampel = n

σ x = σ2

n

Standar deviasi dari mean sampel akan sama dengan standar deviasi

populasi di bagi akar dari besar ukran sampel = n

σ x = σ

√n

2.5.4. TES HIPOTESIS TERHADAP PROPORSI

Disini lebih menitikberatkan dan dapat mengambil suatu keputusan

hanya dengan memakai data yang berasal dari sampel, walaupun nilai

sesungguhnya dari proporsi dapat sama, lebih besar atau lebih kecil dari

nilai konstan yang telah ditentukan.

Rumus :

Contoh :

Seandainya kita ingin membuktikan klaim para gizi yang menyatakan

bahwa 75% dari anak pra sekolah di banyak negara menderita diet

defisiensi protein, untuk ini dilakukan sampel survei pada 206 orang anak

dari total 300 orang anak pra sekolah, apakah ada perbedaan bermakna

antara Ho = 0,75 dengan H1 < 0,75 dengan level of significance (α ) =

0,01.

Jawab :

a Ho : p = 0,75

H1 : p # 0,75

b Level of significance (α) = 0,01

(x ± ½ ) – npo

Z =

Npo ( 1- po )

30

c Test statistik

(x ± ½ ) – npo

Z =

Npo ( 1- po )

d Ho ditolak bila

Z ≤ -2,33 atau Z ≥ 2,33

e Komputasi

x = 206 n = 300 po = 0,75

Z = 206+ 1

2−300(0,75)

√300 ( 0,75 )(0,25) = - 2,47

f Kesimpulan

g Ho tidak dapat diterima karena nilai Z < - 2,33 , atau dengan kata lain

tidak mendukung pernyataan ahli gizi bahwa 75% anak pra sekolah di

banyak negara menderita defisiensi protein.

Untuk mengetahui apakah dua sampel proporsi atau lebih mempunyai

perbedaan yang bermakna secara statistik atau hanya oleh karena faktor

kebetulan saja, misalnya metode A berhasil mendeteksi suatu penyakit

kanker sebanyak 19 kali dari 60 percobaan, sedangkan metode B berhasil

mendeteksi sebanyak 31 kali dari 80 percobaan, bila dihitung maka

proporsi metode A adalah 19/60 = 0,32 dan proporsi B adalah 31/80 =

0,39, sekarang kita ingin mengetahui apakah ada perbedaan yang

signifikan antara kedua proporsi ini ?

Seandainya, kita menganggap bahwa Ho : p1 = p2 dan berasal dari

populasi yang sama maka kita dapat menghitung proporsi keseluruhan

atau p seperti pada tabel di bawah ini.

31

Tabel 3.1

percobaan Metoda Total

A B

Berhasil 19 (21,6) 31 (28,8) 50

Tidak Berhasil 41 (38,4) 49 (51,2) 90

Total 60 80 140

P = 50/140 = 0,36

Jumlah frekuensi berhasil atau tidak berhasil dari masing-masing metode

telah diketahui, dan ini disebut sebagai frekuensi observasi (o). Namun

disamping itu bila ingin mempergunakan proporsi keseluruhan (p) maka

kita juga harus mengetahui frekuensi harapan atau expected frequencies

(e) yaitu dengan cara menghitung sebagai berikut :

Metode A

Berhasil : 60 x 0,36 = 21,6

Tidak Berhasil : 60 – 21,6 = 38,4

Metode B

Berhasil : 80 x 0,36 = 28,8

Tidak Berhasil : 80 – 28,8 = 51,2

Rumus:

Perhitungan :

X2 = (19−21,6)

21,6+(31−28,8)2

28,8 + (41−38,4)

38,4+(49−51,2)2

51,2

X2 = 0,312 + 0,17 + 0,176 + 0,095 = 0,753

X2 = 𝚺 (0−e)2

e

32

Kesimpulan :

Dengan demikian Ho tidak dapat ditolak, atau dengan kata lain tidak ada

perbedaan yang bermakna antara metode A dan Metode B dalam

keberhasilannya mendeteksi kanker.

2.5.5. CHI – SQUARE TEST ( TEST X KUADRAT )

Chi – square test atau test x kuadrat berfungsi untuk tes data kualitatif

atau binomial, juga dapat dipakai untuk tes terhadap data multinomial serta

dapat menjawab pertanyaan “apakah ada atau tidak ada asosiasi antara

suatu variabel dengan outcomes” .

2.5.5.1. Degree of Fredom pada Tes X Kuadrat

kebebasan pada test X kuadrat ditentukan oleh banyaknya kolom

(c) dan baris (b) pada contigency table dengan rumus :

df = ( c – 1 ) ( r – 1 )

rumus Test X Kuadrat

keterangan : o = frekuensi observasi

e = frekuensi harapan

e = total baris x total kolom

grand total

2.5.5.2. Batasan- batasan untuk Test X kuadrat

Pada contigency table 2 x 2, nilai frekuensi harapan tidak boleh

kurang dari nilai 5

Pada contigency table yang besar, nilai frekuensi harapan tidak

boleh ada nilai kurang dari 1 dan tidak boleh lebih 20% dari

seluruh sel pada contigency table mempunyai nilai frekuensi

harapan kurang dari nilai 5

X2 = 𝚺 (o−e )2

e

33

Test X kuadrat dengan nilai frekuensi harapan kurang dari nilai 5

pada contigency table 2 x 2, dapat dikoreksi dengan memakia

rumus :

Untuk tes X kuadrat dengan mempergunakan dua variabel

independen pada contigency table 2 x 2, dapat dilakukan secara

langsung tanpa perlu menghitung lagi frekuensi harapan dengan

mempergunakan rumus berikut ini :

Tabel 4.1

A B

C D

A + C B + D

N= (A+C)+(B+D)

Rumus :

2.6. HIPOTESIS

2.6.1. DEFINISI

Pengujian hipotesis diawali dengan suatu pernyataan sementara yang

disebut hipotesis. Oleh karena itu, hipotesis secara umum dapat diartikan

sebagai kesimpulan sementara atau dugaan logis tentang keadaan populasi.

X2 = 𝚺 ((0−e)−0,5)

e

X2 = N ( AD−BC )2

( A+B ) (C+D ) ( A+C )(B+ D)

34

Hipotesis dapat ditentukan berdasarkan hasil penelitian atau pengalaman.

Misalnya, seorang dokter menyatakan bahwa penderita TBC di Indonesia

adalah 4% atau seorang dokter Puskesmas menyatakan bahwa rata-rata

jumlah pengunjung Puskesmas adalah 60 orang per hari.

Secara statistik, hipotesis menyatakan parameter populasi dari suatu

variabel yang terdapat dalam populasi dan dihitung berdasarkan statistik

sampel. Karena hipotesis hanya merupakan pernyataan sementara atau

dugaan logis maka hipotesis mungkin benar, tetapi mungkin juga tidak

benar.

Pengujian hipotesis dilakukan dengan membandingkan hasil statistik

sampel dengan nilai hipotesis. Bila perbedaan antara nilai statistik sampel

dengan nilai hipotesis cukup besar maka kita akan menolak hipotesis.

Sibaliknya, bila perbedaan tersebut kecil maka kita akan menerima

hipotesis tersebut. Dalam hal yang tidak pasti, hipotesis perlu diuji agar

dapat ditarik kesimpulan secara objektif menggunakan kriteria tertentu.

Kesimpulan dari pengujian hipotesis secara statistik hanya berupa

menerima atau menolak hipotesis dan ini tidak membuktikan kebenaran

hipotesis karena statistika sama sekali tidak melakukan pembuktian.

Pengujian hipotesis bertujuan untuk mengambil keputusan tentang

perbedaan antara nilai statistik sampel dengan nilai parameter populasi.

Dalam menguji hipotesis, kita harus membuat suatu pernyataan

sementara atau hipotesis terhadap nilai parameter populasi sebelum kita

mengambil sampel untuk menguji hipotesa tersebut. Hal ini berbeda

dengan teori estimasi, dimana kita menaksir nilai parameter populasi

melalui perhitungan statistik sampel. Pada pengujian hipotesis, parameter

yang akan kita uji disebut hipotesis nol.

35

Simbol yang digunakan untuk menyatakan hipotesis nol adalah H0.

Misalnya, kita menguji hipotesis yang menyatakan bahwa rata-rata

populasi adalah 500 maka kita tulis sebagai berikut:

H0 : µ = 500

Simbol diatas menyatakan bahwa 500 adalah hipotesis nol rata-rata

populasi. Bila nilai hipotesis rata-rata populasi dinyatakan dalam

perhitungan statistik maka hal diatas ditulis sebagai berikut :

µH0

penulisan diatas menyatakan rata-rata nilai hipotesis ppulasi. Misalnya,

kita tulis µH0 = 200 berarti kita mengatakan bahwa rata-rata nilai hipotesis

nol parameter populasi sama dengan 200.

2.6.2. PROSEDUR PENGUJIAN HIPOTESIS

Agar pengujian hipotesis dapat dilakukan dengan baik maka hendaknya

mengikuti prosedur seperti berikut :

1. Rumuskan dengan baik hipotesis penelitian agar dapat dihitung

statistik sampelnya, seperti rata-rata, proporsi:

Pengujian hipotesis dapat dilakukan terhadap satu populasi untuk

pengujian hipotesis rata-rata dua populasi. Misalnya, rata-rata tekanan

darah mahasiswa Fakultas Kedokteran sama dengan tekanan darah

petugas rumah sakit.

H0 : µ1 = µ2

µ1 = rata-rata tekanan darah mahasiswa

µ2 = rata-rata tekanan darah petugas

36

Rata-rata tekanan darah sampel mahasiswa dan petugas adalah x1 dan

x2 .

2. Tentukan derajat kemaknaan α atau kesalahan tipe 1 yang akan

digunakan. Penentuan ini harus dilakukan pada saat perencanaan.

Dalam bidang kedokteran, derajat kemaknaan yang lazim digunakan

adalah 0,05 dan 0,01

3. Tentukan kesalahan tipe 2 atau β. Biasanya penentuan ini dilakukan

pada saat menghitung besarnya sampel.

4. Tentukan distribusi yang akan digunakan dalam perhitungan. Tentuka

metode statistik yang akan digunakan untuk menghitung statistik

sampel.

5. Tentukan kriteria menerima atau menolak hipotesa nol pada derajat

kemaknaan yang telah ditentukan.

6. Buatlah kesimpulan yang tepat pada populasi yang bersangkutan.

2.6.3. HIPOTESIS NOL DAN HIPOTESIS ALTERNATIF

Hipotesis nol (Ho) adalah hipotesis yang menyatakan tidak ada

hubungan atau tidak ada perbedaan atau tidak ada pengaruh antara dua

variabel.

Contoh :

Tidak ada perbedaan berat badan bayi yang dilahirkan dari kelompok

ibu yang mengalami KEK (kurang energi kronik) dan normal ( tidak

KEK)

Tidak ada hubungan Lila (lingkar lengan atas) ibu dengan berat bayi

yang dilahirkan

Hipotesis alternatif (Ha) adalah hipotesis yang menyatakan ada

perbedaan suatu kejadian antar dua kelompok. Hipotesis alternatif

menyatakan ada hubungan satu variabel dengan variabel lainnya.

37

Contoh :

Ada perbedaan berat badan bayi yang dilahirkan dari kelompok ibu

yang mengalami KEK ( kurang energi kronik ) dan normal (tidak

KEK)

Ada hubungan lila (lingkar lengan atas) ibu dengan berat badan bayi

yang dilahirkan.