4-5 Statistik Inferensi

Embed Size (px)

Citation preview

Statistik InferensiKetut Dewi Martha Erli H.

Pendahuluan Pada penelitian terkadang tidak memungkinkan untuk mengumpulkan data atau informasi dari populasi keseluruhan dibatasi oleh waktu, biaya, dan juga tenaga Oleh karena itu, peneliti sering merasa cukup untuk mengambil sampel kasus atau obyek yang menjadi wakil dari populasi yang akan diteliti Ketika peneliti bertujuan untuk mengambil kesimpulan umum dari karakteristik suatu populasi berdasarkan informasi sampel kasus tersebut maka harus dilakukan teknik inferensi (inference = mengambil kesimpulan dari) dari informasi sampel tersebut

PendahuluanPOPULASI PENELITIAN Membuktikan apakah informasi yang diperoleh pada data sampel dapat diberlakukan untuk populasi

SAMPEL

Teknik analisis inferensi bertujuan untuk mengeneralisir karakteristik atau parameter populasi dengan menggunakan informasi sampel Analisis inferensi selain dapat digunakan untuk mendapatkan kesimpulan umum tentang karakteristik dasar dari populasi, juga dapat digunakan untuk mengambil kesimpulan tentang adanya keterkaitan diantara karakteristik objek dalam populasi yang diamati

HAL-HAL YANG PERLU DIPAHAMI DALAM PENERAPAN ANALISIS INFERENSI

1. Sampel ProbabilitasAnalisis inferensi menggunakan informasi sampel untuk mengeneralisir/menyimpulkan populasi

bagaimana cara memilih sampel ini agar dapat digunakan untuk memperkirakan populasi, atau dengan kata lain bagaimana sampel yang dipilih dapat mewakili populasi?

Sampel yang digunakan haruslah bersifat random atau disebut juga sampel probabilitas semua anggota populasi mempunyai kesempatan yang sama untuk dipilih menjadi sampel (EPSEM Equal Probability of Selection Method)

1. Sampel Probabilitas Teknik pengambilan sampel EPSEM: 1) Simple Random Sampling (Sampling Random Sederhana) 2) Sampling Sistematik 3) Sampling Stratifikasi 4) Sampling Cluster

1. Sampel Probabilitas Sampling Random Sederhana Teknik yang paling sederhana Caranya dengan membuat dafftar dari seluruh anggota populasi, kemudian menetapkan sistem untuk memilih sampel dari daftar anggota populasi tsb Contohnya dengan memilih kartu yang telah dikocok dengan baik, melempar koin atau dadu, atau dengan metode arisan, dsb

Sampling Sistematik Hanya anggota sampel pertama yang dipilih secara random, selanjutnya setiap kelipatan k yang dipilih (dimana k adalah perbandingan jumlah sampel yang diambil dengan jumlah populasi) Contoh, misalnya k = 10, anggota sampel pertama no.10, maka anggota sampel selanjutnya adalah 20, 30, 50..dst hingga mencapai jumlah sampel yang ditetapkan

1. Sampel Probabilitas Sampling Stratifikasi Lebih representatif pada sifat-sifat yang dipilih, oleh karena itu peneliti harus tahu struktur populasi Dalam metode ini, populasi dibagi menjadi sub-sub populasi berdasarkan sifat atau karakteristik yang dimiliki Pemilihan anggota sampel ditetapkan secara proporsional berdasarkan jumlah anggota pada sub-sub populasi Anggota sampel dipilih dengan metode sampel sederhan pada masing-masing sub populasi

Sampling Cluster Teknik yang mengantisipasi kesulitan memperoleh daftar anggota populasi Melibatkan unit-unit geografi untuk dijadikan lokasi pemilihan sampel

2. Distribusi Sampling Ketika melakukan inferensi, sampel harus mewakili atau representasi dari populasi distribusi sampel seharusnya menyerupai distribusi populasi Distribusi populasi pada kenyataannya ada, namun tidak diketahui. Distribusi sampel dpat diketahui melalui informasi Bentuk distribusi, Ukuran Kecenderungan Memusat, Ukuran Persebaran Data (variasi) Oleh karena itu, konsep distribusi sampling bertujuan menjembatani pemahaman distribusi sampel terhadap distribusi populasi Distribusi sampling sifatnya teoritis, distribusi probabilistik dari semua hasil sampel yang mungkin (dengan ukuran sampel yang tetap) untuk nilai statistik yang digeneralisasikan pada populasi

2. Distribusi Sampling Teorema:Bila sampel-sampel random diulang-ulang dengan ukuran N yang diambil dari suatu populasi normal dengan ratarata dan standar deviasi , maka distribusi sampling dari rata-rata sampel-sampel akan normal dengan ratarata dan standar deviasi N

Agar dapat digunakan dalam analisis inferensi, maka distribusi sampling harus bersifat normal Bagaimana jika distribusi populasi tidak bersifat normal atau tidak diketahui distribusinya? Maka jumlah sampel haruslah besar, minimal 100

3. Kurva Normal Kurva Normal merupakan model teoritis sejenis frekwensi poligon yang benar-benar simetris dan mulus Kurva Normal dikombinasikan dengan Standar Deviasi dapat digunakan untuk membangun pernyataan deskriptif yang tepat tentang distribusi empiris Pada kurva normal ini dapat memberikan pemahaman yang lebih baik mengenai persentase observasi yang jatuh diantara nilai rata-rata dengan nilai lainnya, ketika jarak antar nilai tersebut diukur dalam Standar Deviasi dengan nilai standarisasi z yang mengkonversi nilai asli ke satuan unit Standar Deviasi:

( xi x ) z= s

3. Kurva Normal

Jika distribusi empiris mendekati normal, maka dapat dikatakan bahwa 68,26% nilai observasi berada diantara 1 unit standar deviasi atau z = 1; atau 95,23% nilai observasi berada diantara 2 unit standar deviasi atau z = 2 Pada analisis inferensi, tabel distribusi normal menunjukkan proporsi/persentase nilai observasi di atas nilai z kaitannya dengan tingkat kepercayaan (atau tingkat kesalahan/error) yang diasumsikan dalam menarik kesimpulan atas populasi berdasarkan sampel

BERAGAM JENIS ANALISIS INFERENSI

Bentuk Analisis Inferensi Penerapan analisis inferensi dapat mengambil dua bentuk: 1) Estimasi karakteristik atau parameter populasi: membuat suatu perkiraan nilai parameter populasi didasarkan pada apa yang diketahui tentang sampel. Bentuk ini dapat dilakukan dengan dua cara: a) Estimasi titik, terdiri dari statistik sampel tunggal yang digunakan untuk memperkirakan suatu nilai populasi b) Rentang kepercayaan, terdiri dari suatu rentang nilai sebagai ganti titik tunggal 2) Uji Hipotesa: membuat pengujian tentang keakuratan dugaan mengenai karakteristik populasi berdasarkan hasil yang diperoleh dari karakteristik sampel

Jenis Analisis Inferensi berdasarkan Bentuk, Sampel, dan Skala Pengukuran DataESTIMASI PARAMETER Kasus Satu Sampel Kasus Dua Sampel Independen SKALA PENGUKURAN DATA NOMINAL Estimasi Proporsi Estimasi Perbedaan Dua Proporsi ORDINAL Estimasi Proporsi Estimasi Perbedaan Dua Proporsi

INTERVAL/RASIO Estimasi Proporsi Estimasi Rata-rata Estimasi Perbedaan Dua Proporsi Estimasi Perbedaan Ratarata Independen

Kasus Dua Sampel Dependen

-

-

Estimasi Perbedaan Rata-rata Berpasangan

Jenis Analisis Inferensi berdasarkan Bentuk, Sampel, dan Skala Pengukuran DataUJI HIPOTESA Kasus Satu Sampel SKALA PENGUKURAN DATA NOMINAL Uji Proporsi

ORDINAL Uji Proporsi Uji Median Sign Test Wilcoxon SignRank Test Uji Perbedaan Dua Proporsi Uji Perbedaan Median Mann-Whitney U Runs Test

INTERVAL/RASIO

Uji Proporsi Uji Rata-rata

Kasus Dua Sampel Independen

Uji Perbedaan Dua Proporsi Uji ChiSquare

Uji Perbedaan Dua Proporsi Uji Perbedaan Rata-rata Independen

Kasus Dua Sampel Dependen

-

Uji perbedaan median: Wilcoxon Signed-Rank Test

Uji Perbedaan Rata-rata Berpasangan

ESTIMASI PARAMETER

1. Estimasi Titik Prosedur estimasi nilai parameter dari suatu populasi dilakukan dengan satu nilai statistik tunggal dari sampel, misalnya rata-rata ( x ) Untuk mencapai tujuan inferensi dari metode ini maka sangat diperlukan ukuran sampel yang besar Kelemahan metode ini: tidak memberikan informasi sebagaimana besar diharapkan nilai statistik sampel tersebut pada nilai parameter populasi Contoh dalam PWK: estimasi rata-rata jumlah penduduk, rata-rata pertumbuhan ekonomi, dsb

2. Estimasi Selang Kepercayaan Lebih advance dibandingkan estimasi titik, karena nilai parameter populasi ditentukan pada nilai yang tidak tunggal dengan mempertimbangkan tingkat kepercayaan (tingkat kesalahan dalam estimasi) Rumus untuk Estimasi Selang Kepercayaan Rata-rata:

s c.i = x z n

s=

( x x )i

2

n 1

Dimana c.i adalah confidence interval; x adalah rata-rata sampel; z adalah nilai yang ditentukan dari tingkat kepercayaan; n adalah jumlah sampel; xi adalah nilai sampel ke-i;

2. Estimasi Selang Kepercayaan Contoh kasus: dari sampel sebanyak 100 kota di suatu negara diketahui bahwa rata-rata kepadatan penduduk kota negara tersebut adalah 200 jiwa/km2, standar deviasi dari sampel tersebut adalah 5 jiwa/km2. Dengan menggunakan tingkat kepercayaan 95% tentukan perkiraan interval kepadatan penduduk kota di negara tersebut! Jawab: s 5 c.i = x z = 200 1.96 = 200 0.98 = 199.02 s/d 200.98 n 100 Penentuan z dihasilkan dari tingkat kepercayaan. Tingkat kepercayaan 95% artinya bahwa 95% dari nilai yang terletak pada selang kepercayaan yang dihasilkan merupakan nilai dari populasi. Dengan kata lain kesalahan estimasi yg diterima adalah 5%. Nilai 5% atau 1 tingkat kepercayaan merupakan nilai . Nilai /2 digunakan utk menentukan nilai z yang dapat dilihat pada tabel distribusi normal

UJI HIPOTESA

Uji Hipotesa Metode ini berbeda dibandingkan dengan estimasi parameter karena peneliti sudah memiliki hipotesa atau dugaan atas nilai suatu parameter populasi yang kemudian diujikan berdasarkan nilai statistik yang ada pada sampel Hipotesa biasanya dibangun atas observasi-observasi yang dilakukan sebelumnya atau berdasarkan teori Sampel yang kemudian digunakan untuk menguji kebenaran hipotesa Pada uji hipotesa ini dibangun dua hipotesa: hipotesa utama atau hipotesa awal (H0 atau Ho) dan hipotesa alternatif (H1 atau Ha) Jika hipotesa awal salah, maka peneliti diharuskan untuk mempercayai hipotesa alternatif

Jenis-jenis Hipotesa1. Hipotesa Exhaustive Hanya terdapat dua kemungkinan nilai:Ho: = A Ha: A

Parameter rata-rata () dapat digantikan dengan parameter lain (misalnya median) Uji hipotesa ini sering disebut sebagai uji dua sisi (two tailed test)

2. Hipotesa Truncated Terdapat lebih dari dua kemungkinan nilai, jika A maka kemungkinan hipotesa alternatif adalah > A atau < A ji hipotesa ini sering disebut sebagai uji satu sisi (one tailed test)

Prosedur/Tahapan Uji Hipotesa1. 2.

Menentukan Hipotesa awal (Ho) dan Hipotesa alternatif (Ha) Menentukan nilai z kritis (jika ukuran sampel besar: > 100) atau nilai t kritis (jika ukuran sampel kecil < 30, namun distribusinya normal). Nilai z kritis ditentukan dari nilai alpha () yang didapat dari (1 - tingkat kepercayaan). Tingkat kepercayaan yang sering digunakan adalah 90%, 95%, dan 99%. Jika hipotesa yang digunakan jenis exhaustive maka alpha dibagi dua, tidak untuk jenis hipotesa truncated. Nilai z kritis dapat dilihat pada tabel Distribusi Normal Menghitung statistik hitung z atau t, berdasarkan jenis uji yang digunakan Menarik kesimpulan dengan membandingkan poin 2 dan 3. Jika nilai perhitungan z atau t jatuh di dalam daerah kritis maka hipotesa awal (Ho) ditolak

3.

4.

A. Uji Hipotesa Rata-rata Uji ini dilakukan pada kasus satu sampel Formula uji hipotesa rata-rata:

x z= s n Dimana x adalah rata-rata sampel; adalah rata-rata populasi; s adalah standar deviasi sampel; n adalah jumlah sampel

Contoh Kasus Uji Hipotesa Rata-rata Berdasarkan pengamatan akademisi dan praktisi bahwa fenomena climate change memberi dampak pada peningkatan rata-rata suhu udara perkotaan menjadi 32 C. Untuk menguji dugaan ini maka dilakukan pengambilan sampel suhu udara di 100 kota dan diperoleh bahwa rata-rata suhu udara sampel kota tsb adalah 31,5 C dengan standar deviasi 10 C. Dengan tingkat kepercayaan 95% apakah hipotesa tersebut diterima? Jawab: 1. Menentukan hipotesa Ho: = 32 Ho: 32 1. Menentukan z kritis: 1-0,95 = 0,5 /2 = 0,25 z kritis = 1,96 (lihat tabel distribusi normal) 31,5 32 2. Menentukan z hitung: z= = 0,5 10 100 3. Kesimpulan: hipotesa awal diterima karena nilai z hitung berada pada interval nilai z kritis, artinya bahwa signifikan terjadi peningkatan suhu udara perkotaan mencapai 32 C

B. Uji Hipotesa Rata-rata Independen Uji hipotesa ini diaplikasikan pada kasus dua sampel independen Sampel independen artinya tidak ada pengaruh/keterkaitan satu sama antar sampel yang berbeda, sifatnya berdiri sendiri Biasanya dapat dilihat dari pengambilan data sampel yang satu tidak mempengaruhi cara pengambilan data sampel yang lainnya Formula uji hipotesa:

( x1 x2 ) ( 1 2 ) z=s12 s2 2 + n1 n2

Dimana 1 dan 2 menunjukkan sampel 1 dan sampel 2

Contoh Kasus Uji Hipotesa Rata-rata Independen Sebuah penelitian bertujuan untuk mengetahui apakah terdapat kesenjangaan ekonomi wilayah antara kawasan perkotaan di Indonesia bagian timur (KTI) dengan bagian barat (KBI). Oleh karena itu dilakukan survey 100 sampel kota di KBI dan KTI. Diketahui bahwa rata-rata PDRB per kapita di KBI adalah Rp. 15 juta dengan standar deviasi 9 juta dan di KTI Rp. 5 juta dengan standar deviasi 2 juta. Dengan tingkat kepercayaan 95%, ujilah dugaan kesenjangan ekonomi wilayah tsb!

Contoh Kasus Uji Hipotesa Rata-rata Independen Jawab:1. Menentukan hipotesa Ho: (KTI) = (KBI) Ha: (KTI) (KBI) 2. 3. Menentukan z kritis: 1-0,95 = 0,5 /2 = 0,25 z kritis = 1,96 (lihat tabel distribusi normal) Menentukan z hitung:

( 5 15 ) ( 0) z=22 92 + 50 50

10 = = 7.7 1.3038

4.

Kesimpulan: Ho ditolak karena nilai z hitung berada di daerah kritis (diluar nilai 1,96). Artinya, rata-rata PDRB per kapita di KTI signifikan berbeda dengan di KBI yang berarti menunjukkan adanya kesenjangan ekonomi wilayah

C. Uji Hipotesa Rata-rata Dependen Uji hipotesa ini diaplikasikan pada kasus dua sampel berpasangan (dependen) Berbeda dengan kasus dua sampel independen, cara pengambilan data sampel pada kasus ini mempengaruhi data sampel lainnya Penerapannya dapat dilakukan pada pasangan kasus yang terjadi secara alami, misalnya kembar, hubungan suami-istri, atau pada individu yang sama namun diuji sebelum dan setelah mendapat perlakuan Formula uji hipotesa: D

z=

D

sD n

Dimana D adalah perbedaan nilai dari kasus berpasangan

Contoh Kasus Uji Hipotesa Rata-rata Dependen Pengembangan kebijakan pengendalian penduduk mulai diprioritaskan di wilayah perkotaan. Survey yang dilakukan pada 50 kota di Indonesia ini menunjukkan perbedaan rata-rata jumlah penduduk sebelum dan sesudah diberlakukannya kebijakan tersebut adalah -1,2 juta jiwa, dengan standar deviasi 7,45 juta jiwa. Ujilah hipotesa bahwa kebijakan tersebut efektif dalam penekanan pertumbuhan jumlah penduduk di perkotaan pada tingkat kepercayaan 95%!

Contoh Kasus Uji Hipotesa Rata-rata Dependen Jawab: 1. Menentukan hipotesa: Ho: (sebelum) = (sesudah) Ha: (sebelum) (sesudah) 2. Menentukan z kritis: 1-0,95 = 0,5 /2 = 0,25 z kritis = 1,96 3. Menentukan z hitung: z = (1.2) 0 = 1.14

7.45

504. Kesimpulan: nilai z hitung berada pada nilai batas kritis sehingga Ho diterima, artinya tidak ada perbedaan rata-rata jumlah penduduk sebelum dan sesudah diberlakukannya kebijakan pengendalian penduduk. Hal ini berarti bahwa kebijakan tersebut belum efektif mempengaruhi ledakan jumlah penduduk di perotaan

Homework!1. Berikan masing-masing contoh kasus dalam bidang PWK dengan menggunakan metode inferensi uji hipotesa rata-rata independen dan dependen! 2. Penelitian mengenai sejauhmana pengaruh infrastruktur terhadap pengembangan ekonomi wilayah dilakukan pada 100 sampel desa di Pulau Madura dengan survey pendapatan per kapita desa sebelum dan sesudah adanya Jembatan Suramadu. Jelaskan metode apa yang digunakan untuk penelitian tersebut! Hipotesa apa yang dapat dikembangkan dari kasus tersebut? 3. Pada 50 sampel kota ditemukan rata-rata pengangguran mencapai 1.500 jiwa dengan standar deviasi 50 jiwa, sementara pada 100 sampel desa ditemukan rata-rata pengangguran mencapai 500 jiwa dengan standar deviasi 20 jiwa. Berdasarkan informasi tersebut, hipotesa apa yang dapat dikembangkan? Ujilah hipotesa tersebut dengan tingkat kepercayaan 95%!

SEKIAN DAN TERIMA KASIH