Upload
mazwied74
View
636
Download
15
Embed Size (px)
Citation preview
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 19 Jam terampil mengolah data dengan Program Stata
I. Modul Belajar Stata 8.0 & 9.0
Modul ini disusun dengan tujuan sebagai materi pelengkap bagi mahasiswa /praktisi /peneliti
agar lebih mudah memanfaatkan program stata diperkuliahan /pekerjaan sehari‐hari. Berlatar
belakang pengalaman penulis sebagai statistisi diharapkan materi ini lebih ptaktis sebagai bahan
belajar. Sangat diharapkan membaca sumber aslinya untuk memperkaya ilmu.
Menu‐menu Help dalam Stata 8.0 < help contents> Top ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ Category listings A. Basics language syntax, expressions and functions, ... B. Data management inputting, editing, creating new variables, ... C. Statistics summary statistics, tables, estimation, ... D. Graphics scatter plots, bar charts, ... E. Programming and matrices do‐files, ado‐files, Mata, matrices Help file listings Language syntax advice on what to type Manual datasets download datasets from the Reference manuals Copyrights
Bagan 1. Kontens Stata
Basics
Manejeman Data
Statistik
Grafik
Pemrograman (do & ado files)
Basics : berisikan syntax stata, fungsi operasi dan berbagai aturan dalam penulisan perintah
Data Management: Berisi input data, Editing, Membuat Variabel, Labelling variabel dan data, dll.
Statistics : berisi ringkasan statistik, pembuatan tabel , estimasi statistik dll
Grafik : Scatter Plot, Batang, Pie, dll
Pemrograman : File do stata, ado dan beberapa fasilitas syntax dalam stata
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 29 Jam terampil mengolah data dengan Program Stata
Basic Course (Univariate – Analisis Satu Variabel) 1. Struktur Data 2. Pengantar Pemakaian Stata 8.0 3. Ukuran Statistik /Ringkasan Statistik 4. Penyajian Tabel (Basic Table and Custom Table) 5. Penyajian Grafik 6. Pengujian Distribusi Data 7. Uji T Test (Satu Sampel) 8. Penyajian hasil output Stata
Pengantar
Kursus ini bertujuan memberikan materi terkait berbagai teknik komputasi statistik. Beberapa pengujian yang ada akan dikenalkan. Metode pembelajaran berbasis kasus menjadikan setiap peserta terampil menyelesaikan permasalahan kasus nyata. Munculnya program Stata, menjadikan proses komputasi menjadi lebih mudah. Berbagai teknik yang kompleks dapat secara mudah diselesaikan dengan program ini. Pengenalan data dengan struktur data yang sesuai dengan type data akan menjadi dasar meringkas, menyajikan dan interpretasi hasil. Output kursus ini adalah dapat menjadikan praktisi statistik yang memiliki dasar pengolahan data yang baik, dengan pemrograman Stata. Bagaimana Belajar Stata secara Mudah? Banyak pertanyaan yang sering saya peroleh. Bagaimana cara belajar Stata mas? Bahkan beberapa di antaranya sudah memiliki dasar pengolahan data, artinya hanya tinggal “mengupdate” dengan bahasa pemrograman baru yaitu Stata (versi 8 atau 9). Stata dapat dipelajari secara sederhana. Beberapa cara yang ada dengan sumber‐sumber on line yang ada, yaitu bersumber dari: 1. Help di Program Stata 2. Web Stata (http://www.stata.com/) 3. Belajar On Line di UCLA (http://http//www.ats.ucla.edu/stat) Ucla adalah salah satu sumber belajar online yang sangat ..sangat membantu belajar. Beberapa program pengolahan data, antara lain: (1). Stata, (2). SPSS dan (3). SAS secara lengkap …dapat diperoleh sumber ini artinya referensinya sangat terpercaya, karena updatenya yang selalu dilakukan.
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 39 Jam terampil mengolah data dengan Program Stata
Dua hal berikut ini yang akan menjadi fokus kursus pada modul ini yaitu: I. Top > A. Basics ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ Category listings A1. Syntax how‐to guide for commands, variables, expressions, functions, ... A2. Memory considerations Stata stores the dataset in RAM; you can change how much memory Stata uses and compress your dataset A3. Logging making copies of your Stata session A4. Using the Internet finding and installing help, additions, and updates A5. Using the windows and console viewing files and logs, launching dialogs, setting the fonts, ... A6. Utility commands and commands that everyone should know change directory, copy files, type files, plus many more A7. Customizing Stata Stata executes profile.do when it is invoked Help file listings Language syntax advice on what to type II. Top > B. Data management ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ Category listings B1. Inputting data inputting data from the keyboard, from a file, or from a spreadsheet B2. Editing data using the data editor B3. Creating and changing variables generate newvar = ... and replace oldvar = ... also recoding, smoothing, renaming, dropping, ... variables B4. Saving and reusing data in both Stata and non‐Stata (export) format B5. Data reorganization sort, stack, reshape, make dataset of means or other summary statistics, ... B6. Merging and appending datasets two datasets combined into one, either by tacking on new observations (appending) or by tacking on new variables (merging) B7. Utilities describing, comparing, ... ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 49 Jam terampil mengolah data dengan Program Stata
2. Pengoperasional Program Stata Beberapa hal yang harus diketahui adalah (1) Menjalankan Stata di lingkungan Windows (baik XP, Vista, dan lainnya) (2) Pemanfaatan menu “help” secara efektif dan efisien tanpa harus membaca keseluruhan (3) Stata Console (4) Menu Bar dan Tools Bar (5) Membuat “log file” (6) Mengatur memory kerja (7) membaca isi data (8) Labelling variabel 2.1. Menjalankan Stata di Windows Dari menu program (shortcut di desktop) jalankan program stata. Tampilan awal
2.2. Pemanfaatan Menu “Help” Dari menu bar pilih Help Content’s Atau dari stata command ketik help <Enter> atau help contents <Enter> Fasilitas help ini secara mudah akan membawa ke manual perintah stata yang tidak kita mengerti misal : help label , help save , help set, dll 2.3. Stata Console
Review Aktivitas
Variabel Aktif Perintah
Stata dijalankan
Hasil Eksekusi command
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 59 Jam terampil mengolah data dengan Program Stata
2.4. Menu bar dan Tools bar
Menu Bar membantu pengguna menjalankan perintah‐perintah aplikasi stata, mengingatkan
pengguna apabila “command syntax” terlupa.
Tools Bar membantu pengguna secara cepat untuk beberapa fungsi kerja seperti Open, Save,
Printing, Begin Log, Do Editor, File Data Editor, Browsing Data dan lain sebagainya.
2.5. Log Files Untuk mengetahui riwayat proses pengolahan data yang dilakukan stata memberi fasilitas “Log
Files”. Hal‐hal yang sudah dilakukan dapat di koreksi atau di chek kembali dengan melihat “Log
Files”.
Kursus pelatihan yang dilakukan juga dapat di simpan agar dapat di ulang kembali setelah selesai
pelatihan.
Simpan Log File anda dengan nama “kursus.smcl”
Syntax log using latihan, replace log close
Tools Bar
Menu Bar
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 69 Jam terampil mengolah data dengan Program Stata
2.6. Memory Kerja Agar pemrosesan data dapat lebih efisien dan maksimal, dibutuhkan pengaturan memory kerja.
Semakin tepat pengaturan alokasi memori maka akan mendukung jalannya komputasi lebih
optimal.
Tips : Pengolahan Data besar akan membutuhkan pengaturan memori, namun untuk data secara umum dengan format/setting “default” program sudah memberikan solusi secara umum.
Perintah umumnya set memory #[b|k|m|g] [, permanently ] memory query memory (see help SpecialEdition) set virtual { on | off } where # is specified in terms of bytes, kilobytes, megabytes, or gigabytes, and b, k, m, and g may be typed in uppercase. Contoh : set mem 10m <Enter> (men‐set memori kerja sebesar 10 mega byte) Melihat memory yang teralokasi memory <Enter> bytes -------------------------------------------------------------------- Details of set memory usage overhead (pointers) 0 0.00% data 0 0.00% ---------------------------- data + overhead 0 0.00% free 1,048,568 100.00% ---------------------------- Total allocated 1,048,568 100.00% -------------------------------------------------------------------- Other memory usage system overhead 745,090 set matsize usage 16,320 programs, saved results, etc. 105 --------------- Total 761,515 ------------------------------------------------------- Grand total 1,810,083
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 79 Jam terampil mengolah data dengan Program Stata
2.7. Membaca Isi Data Dari tools bar dapat secara mudah di pilih /di klik yaitu
Dengan tools bar “Editor” data stata dapat dibaca dan diedit secara mudah. Perintah dari Command Syntax adalah “edit <Enter>” 2.8. Labeling variable Bertujuan memberi informasi untuk variabel agar dapat diketahui maksudnya secara jelas. Misal variabel jk di label “jenis kelamin”, variabel umur di label “Umur (thn)”. Dari command stata di ketik perintah
label var jk “Jenis Kelamin” label var umur “Umur (Thn)”
3. Struktur Data
Tipe Data Numerikal
Rasio (Tipe 4)
Tinggi Badan Berat Badan Pendapatan Pengeluaran Kesehatan,
Interval (Tipe 3)
Kepuasan, IQ Persepsi, Suhu
Kategorikal Ordinal (Tipe 2)
Tingkat Pendidikan, Golongan PNS, Status Pernikahan
Nominal (Tipe 1)
Jenis Kelamin, Agama, Golongan Darah.
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 89 Jam terampil mengolah data dengan Program Stata
Perintah Stata untuk dapat melihat strukutur data dengan command describe <Enter> atau F3 Contains data obs: 15 vars: 4 size: 270 (99.9% of memory free) ------------------------------------------------------------------ storage display value variable name type format label variable label ------------------------------------------------------------------ No byte %8.0g Nama str11 %11s Umur byte %8.0g Jenis_kelamin byte %9.0g Jenis_kelamin ------------------------------------------------------------------ Sorted by: Note: dataset has changed since last saved Pembagian data menurut (Machin & Campbell, 2005)
1. Data Kualitatif atau Kategorik - Nominal : Jenis Kelamin, Laki‐laki dan perempuan - Ordinal : Diagnosis Pasien, Suspect a; Keparahan Penyakit (Stadium I, II,III)
2. Data Kuantitatif atau Numerik
- Diskret : Jumlah kasus Influensa (0, 1, 2, dst) - Kontinu : Kehamilan (Bln), Tinggi (cm), Berat (Kg)
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 99 Jam terampil mengolah data dengan Program Stata
Kasus & Ringkasan Deskriptif Input data berikut ke dalam program STATA 8.0. No Nama Umur Jenis_kelamin
1 Syarif 25 Laki‐laki
2 Adi 26 Laki‐laki
3 Harwanto 28 Laki‐laki
4 Suyatno 19 Laki‐laki
5 Zulia 22 Perempuan
6 Paidi 21 Laki‐laki
7 Muhklas 19 Laki‐laki
8 Ahmad 25 Laki‐laki
9 Ida Wahmuda 26 Perempuan
10 Sutinah 22 Perempuan
11 Surti 23 Perempuan
12 Widiatun 25 Perempuan
13 Sularso 25 Laki‐laki
14 Winarno 26 Laki‐laki
15 Painah 25 Perempuan
Langkah‐langkah 1. Buka Stata 8.0 atau 9.0 2. Ketik “edit” 3. Entry kan data tersebut!
Setelah selesai entry proses selanjutnya adalah 4. Membuat nama varibel 5. Labelling Variabel 6. Labelling Value
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 109 Jam terampil mengolah data dengan Program Stata
TIPS : Jangan lupa mendefault folder kerja kita dengan perintah cd “c:/Kursus Stata” Simpan file kerja dengan perintah “saveold latihan.dta, replace”
4. Membuat Nama Variabel
a. rename var1 No b. rename var2 Nama c. rename var3 Umur d. rename var4 Jenis_kelamin
5. Labelling Variabel
1. lab var No “Nomer Urut” 2. lab var Nama “Nama Responden” 3. lab var Umur “Umur Responden (Thn)” 4. lab var Jenis_kelamin “Jenis Kelamin”
6. Labeling Value
Variabel yang memiliki jenis skala kategorikal misal: Jenis Kelamin Perintah memberi label untuk variable ini adalah dengan cara label def Jenis_kelamin 1 “Laki‐laki” 2 “Perempuan” label val Jenis_kelamin Jenis_kelamin Hasil akhir
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 119 Jam terampil mengolah data dengan Program Stata
Melihat hasil kerja dengan ringkasan sederhana Dari command stata ketik
tab Jenis_kelamin <Enter> Hasil . tab Jenis_kelamin Jenis_kelam | in | Freq. Percent Cum. ------------+----------------------------------- Laki-laki | 9 60.00 60.00 Perempuan | 6 40.00 100.00 ------------+----------------------------------- Total | 15 100.00
Ringkasan Deskriptif sesuai dengan tipe skala data. Tipe Skala Ukuran Ringkasan Rasio Interval
Ukuran Pusat (Central Tendency)
Mean Median Modus Summary
Ukuran Sebaran (Dispersi)
Standar Deviasi Minimum Maksimum Range Variansi
Distribusi (Distribution)
Skewness Kurtosis
Nominal Ordinal
Ukuran Pusat (Central Tendency)
Jumlah (n) %
Ukuran Sebaran (Dispersion)
Minimum Maksimum Range
Lakukan pengolahan data dengan ringkasan yang tepat untuk contoh data di atas!.
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 129 Jam terampil mengolah data dengan Program Stata
4. Penyajian Tabel (Basic Table dan Custom Table)
Setelah teknik meringkas anda kuasai, tahapan selanjutnya adalah menyajikan
ringkasan statistik dalam berbagai strata analisis. Misalkan rata-rata usia per Lokasi, per
jenis kelamin, dll. Rencana ringkasan data dapat direncanakan terlebih dahulu. Contoh:
Tabel Deskripsi umur per jenis kelamin.
Usia (Thn)
Mean Median Minimum Maksimum Standar Deviasi
Jenis Kelamin Laki-laki Perempuan
Tabel Deskripsi umur per lokasi wilayah.
Usia (Thn)
Mean Median Minimum Maksimum Standar Deviasi
Lokasi Sleman Luar Sleman
Fasilitas Stata sudah memberikan kemudahan perhitungan rancangan tabel tersebut
di atas. Dari menu Stata
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 139 Jam terampil mengolah data dengan Program Stata
Dari ”Command Stata” ketik
table Jenis_kelamin, contents(mean Umur min Umur max Umur sd Umur ) Hasil ringkasan data umur adalah ---------------------------------------------------------- Jenis_kel | amin | mean(Umur) min(Umur) max(Umur) sd(Umur) ----------+----------------------------------------------- Laki-laki | 23.7778 19 28 3.270236 Perempuan | 23.8333 22 26 1.722401 ---------------------------------------------------------- Interpretasi Tabel Output di atas Laki-laki memiliki rata-rata umur 23,78 tahun dan perempuan memiliki rata-rata umur 23,83
tahun. Standar deviasi laki-laki lebih besar dari perempuan, artinya distribusi umur laki-laki
variansinya lebih lebar daripada jenis kelamin perempuan.
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 149 Jam terampil mengolah data dengan Program Stata
Data Kasus yang sudah di Entry
Ringkasan Statistik Untuk melihat ringkasan /deskriptif data secara detail dapat kita lakukan dengan perintah :
1. Data Numerik (rasio dan interval) : 1. sum usia 2. sum usia, detail
2. Data Kategorik (Ordinal dan Nominal) a. tab variabel_dipilih b. tab1 variabel1 variabel2 variabeln
Kombinasi perintah antara data kategorik dan data numerikal tabulate lokasi, sum(usia) sum usia if lokasi==1 (kode 1 adalah untuk wilayah Sleman) Hasilnya Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- usia | 14 25 2.908872 19 29
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 159 Jam terampil mengolah data dengan Program Stata
Hasilnya : . table lokasi, contents( mean usia sd usia min usia max usia ) ------------------------------------------------------------ lokasi | tinggal | mean(usia) sd(usia) min(usia) max(usia) ------------+----------------------------------------------- sleman | 25 2.908872 19 29 luar sleman | 23.5455 2.621589 20 28 ------------------------------------------------------------ 1. Deskripsikan tabel tersebut! 2. Lakukan ringkasan usia untuk kategorik jenis kelamin! Solusi ketik ! table jk, c( mean usia sd usia min usia max usia ) Merubah Skala Rasio menjadi Ordinal (Kategorikal) dengan perintah ”recode” Tujuan merubah skala adalah menyesuaikan data untuk kebutuhan pengolahan lanjutan. Kasus kali ini adalah ingin melihat kelompok per usia respoden dengan kriteria kelompoknya didefinisikan sebagai berikut:
1. Kode 1 ==> usia <25 Thn 2. Kode 2 ==> usia >=25 Thn
Langkah-langkah membuat variabel baru gen usia_k=1 if usia<25 replace usia_k=2 if usia >= 25 lab var usia_k ”Kategori Usia Responden” lab def usia_k 1 ”Usia < 25 Thn” 2 ”Usia >= 25 Thn”, modify lab val usia_k usia_k tab usia_k
Atau dengan syntax recode usia min/24=1 25/max=2, gen(usia_k)
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 169 Jam terampil mengolah data dengan Program Stata
5. Inferensi Statistik Misal dengan kasus: ”ingin diketahui apakah ada perbedaan rata-rata usia antar jenis kelamin dan antar lokasi responden”. Dengan Catatan Kesamaan Variansi (Homogenitas) di penuhi, Langkah-langkahnya adalah 1. ttest usia, by( jk) Hasilnya Two-sample t test with equal variances ------------------------------------------------------------------------------ Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- laki-lak | 15 24.6 .8607859 3.333809 22.7538 26.4462 perempua | 10 24 .6146363 1.943651 22.6096 25.3904 ---------+-------------------------------------------------------------------- combined | 25 24.36 .5653318 2.826659 23.19321 25.52679 ---------+-------------------------------------------------------------------- diff | .6 1.17214 -1.824757 3.024757 ------------------------------------------------------------------------------ Degrees of freedom: 23 Ho: mean(laki-lak) - mean(perempua) = diff = 0 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0 t = 0.5119 t = 0.5119 t = 0.5119 P < t = 0.6932 P > |t| = 0.6136 P > t = 0.3068
T test antara Usia dengan Lokasi Perintah sederhana
2. ttest usia, by(lokasi) Hasilnya . ttest usia, by(lokasi)
Two-sample t test with equal variances ------------------------------------------------------------------------------ Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- sleman | 14 25 .7774288 2.908872 23.32047 26.67953 luar sle | 11 23.54545 .7904387 2.621589 21.78425 25.30666 ---------+-------------------------------------------------------------------- combined | 25 24.36 .5653318 2.826659 23.19321 25.52679 ---------+-------------------------------------------------------------------- diff | 1.454545 1.123159 -.8688854 3.777976 ------------------------------------------------------------------------------ Degrees of freedom: 23 Ho: mean(sleman) - mean(luar sle) = diff = 0 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0 t = 1.2950 t = 1.2950 t = 1.2950 P < t = 0.8959 P > |t| = 0.2082 P > t = 0.1041
Interpretasikan hasil tersebut!
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 179 Jam terampil mengolah data dengan Program Stata
Misal kasusnya adalah”ingin diketahui apakah ada perbedaan Proporsi kelompok usia antar jenis kelamin dan lokasi responden”. Perintah pengolahannya adalah
1. tabulate jk usia_k, row all 2. tabulate lokasi usia_k, row all
Hasilnya . tab jk usia_k, row all +----------------+ | Key | |----------------| | frequency | | row percentage | +----------------+ | Kategori Usia jenis | Responden kelamin | Usia < 25 Usia >= 2 | Total -----------+----------------------+---------- laki-laki | 5 10 | 15 | 33.33 66.67 | 100.00 -----------+----------------------+---------- perempuan | 5 5 | 10 | 50.00 50.00 | 100.00 -----------+----------------------+---------- Total | 10 15 | 25 | 40.00 60.00 | 100.00 Pearson chi2(1) = 0.6944 Pr = 0.405 likelihood-ratio chi2(1) = 0.6922 Pr = 0.405 Cramer's V = -0.1667 gamma = -0.3333 ASE = 0.372 Kendall's tau-b = -0.1667 ASE = 0.199
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 189 Jam terampil mengolah data dengan Program Stata
Hasil 2 . tab lokasi usia_k, row all +----------------+ | Key | |----------------| | frequency | | row percentage | +----------------+ | Kategori Usia lokasi | Responden tinggal | Usia < 25 Usia >= 2 | Total ------------+----------------------+---------- sleman | 4 10 | 14 | 28.57 71.43 | 100.00 ------------+----------------------+---------- luar sleman | 6 5 | 11 | 54.55 45.45 | 100.00 ------------+----------------------+---------- Total | 10 15 | 25 | 40.00 60.00 | 100.00 Pearson chi2(1) = 1.7316 Pr = 0.188 likelihood-ratio chi2(1) = 1.7408 Pr = 0.187 Cramer's V = -0.2632 gamma = -0.5000 ASE = 0.317 Kendall's tau-b = -0.2632 ASE = 0.195 Interpretasikan hasil tabulasi silang di atas !!
Menggunakan recode untuk membuat variabel baru tab usia usia (thn) | Freq. Percent Cum. ------------+----------------------------------- 19 | 2 8.00 8.00 20 | 1 4.00 12.00 21 | 2 8.00 20.00 22 | 2 8.00 28.00 23 | 1 4.00 32.00 24 | 2 8.00 40.00 25 | 6 24.00 64.00 26 | 3 12.00 76.00 27 | 3 12.00 88.00 28 | 2 8.00 96.00 29 | 1 4.00 100.00 ------------+----------------------------------- Total | 25 100.00 Nilai minimal adalah 19 tahun dan maksimal adalah 29 tahun Ingin dikelompokkan menjadi 19-20 thn 1 21-24 thn 2 25-29 thn 3
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 199 Jam terampil mengolah data dengan Program Stata
Perintah recode
recode usia_k2 19/20=1 21/24=2 25/29=3, gen (usia_k2) atau
recode usia_k2 min/20=1 21/24=2 25/max=3, gen (usia_k2) labelling data dengan cara
lab var usia_k2 ”Kelompok usia” lab def usia_k2 1 ”19-20 thn” 2 ”21-24 thn” 3 ”25-29 thn”, modify lab val usia_k2 usia_k2
Melihat hasil tab1 usia_k usia_k2
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 209 Jam terampil mengolah data dengan Program Stata
6. Penyajian Grafik. Stata memberikan fasilitas penyajian dalam bentuk grafik. Informasi dari menu help adalah: The graph command graph ... The commands that draw graphs are command description ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ graph twoway scatterplots, line plots, etc. graph matrix scatterplot matrices graph bar bar charts graph dot dot charts graph box box and whisker plots graph pie pie charts other more commands to draw statistical graphs ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
Fasilitas grafik di stata antara lain:
1. Grafik dua arah : scatterplots, line plots, dll. 2. Grafik berupa matrik‐matrik : matrik scatterplots 3. Grafik Batang 4. Grafik Titik 5. Grafik Box : Box dan Whiskes Plots 6. Grafik Pie 7. Grafik lain: untuk menggambarkan grafik statistik.
Exercise
Dari data 2_data_kursus.dta yang ada lihat struktur datanya! Prosedur standar persiapan data kerja 1. Pastikan folder kerja anda ! misal : cd “c:\Pelatihan Stata” 2. Lihat isi data di folder kerja ! command syntax : dir <enter> melihat seluruh file yang ada;
dir *.dta <enter> melihat file stata (*.dta) di folder kerja 3. Buka file kerja anda ! misal ==> use 2_data_kursus.dta, clear 4. Lihat isi data: F3 <enter> mendescrib data; command ==> edit <enter> membuka dan
mengedit data kerja; list <enter> menampilkan data kerja dalam output stata. Setelah mengetahui isi data, type data, value data, jumlah variabel maka langkah selanjutnya anda siap untuk melakukan pengolahan data sesui dengan tujuan peneliti.
Catatan Ringkasan deskriptif untuk variabel berskala numerik (usia dan tinggi badan) dengan ringkasan tendensi pusat dan dispesi (Sebaran) Ringkasan deskriptif untuk variabel berskala kategorik (Jenis Kelamin dan Lokasi) dengan ringkasan distribusi frekuensi
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 219 Jam terampil mengolah data dengan Program Stata
6.1. Grafik Dua Arah : Scatter dan Garis Menggambarkan sebaran data dan pola data. a. Grafik Scatter Kasus : Ingin diketahui sebaran data antara Usia (X) dan Berat Badan (Y) antar wilayah (Sleman dan Luar Sleman). Dari Menu Bar
Result : di stata result “twoway (scatter tb usia), by(lokasi )” dan grafik
115
120
125
130
20 25 30 20 25 30
sleman luar sleman
Ting
gi B
adan
(Cm
)
Umur (Thn)Graphs by Lokasi Tinggal
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 229 Jam terampil mengolah data dengan Program Stata
b. Grafik Garis Kasus : Ingin diketahui pola sebaran data antara Usia (X) dan Berat Badan (Y) antar jenis Kelamin (Laki‐laki dan Perempuan). Dari Menu Bar
Result : di stata result “twoway (line tb usia, sort), by(jk )” dan grafik
115
120
125
130
20 25 30 20 25 30
laki-laki perempuan
Ting
gi B
adan
(Cm
)
Umur (Thn)Graphs by Jenis Kelamin
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 239 Jam terampil mengolah data dengan Program Stata
Grafik 6.2., 6.3., dan 6.4 dapat di pelajari lebih lanjut. Untuk relevansi dengan inferensi grafik 6.5. Grafik Box Plot dilanjutkan sebagai latihan. 6.5. Grafik Box Plot Petunjuk: Box Plot di pakai untuk melihat ukuran pemusatan dan ukuran penyebaran dari data. Daerah yang berada di antara Q1 s/d Q3 merupakan inferensi data untuk populasi. Batas bawah dan batas atas kelas interval menggambarkan sebaran data.
Kasus : Ingin diketahui estimasi untuk faktor usia responden antar wilayah (sleman dan luar sleman)? Secara matematik ingin diketahui apakah rata‐rata usia responden di Sleman > Usia di Luar Sleman?
Menu Bar
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 249 Jam terampil mengolah data dengan Program Stata
Hasil di stata result “graph box usia, medtype(line) by(lokasi )” dan grafik 20
2530
sleman luar sleman
Um
ur (T
hn)
Graphs by Lokasi Tinggal
Interpretasi grafik Box Plot di atas adalah Secara matematik : rata‐rata usia responden di Sleman lebih besar dari pada di luar sleman. Variansi data usia lebih besar di luar Sleman (Catatan : interpretasi ini belum secara pengujian statistik, baru merupakan gambaran estimasinya). Sebagai penutup penyajian grafik pada sesi ini, 1. Penyajian grafik digunakan untuk memeriksa data dan penyajian lanjutan untuk keperluan
analisis. 2. Teknik penyajian grafik dipakai untuk memeriksa data, melukiskan data, dan evaluasi uji
statistik (misal : plot residual). 3. Visualisasi grafik memberi dampak lebih informatif, meningkatkan pemahaman terhadap data
dan dapat memaksimalkan kemungkinan analisis yang ada, Sehingga bagi peneliti visualisasi dari hasil grafik akan memberikan informasi lanjutan untuk hipotesis yang akan di uji.
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 259 Jam terampil mengolah data dengan Program Stata
Dasar untuk Inferensi Statistik. 7. Pengujian T test Uji beda rata‐rata antara 2 kategorik atau beda rata‐rata dengan suatu konstanta pembanding. Dalam kasus ini ada variabel dependen dan variabel independen. Untuk kasus uji dengan suatu konstanta, maka nilai awal konstanta harus di definisikan dahulu di awal untuk pengujian statistiknya.
Definisi Variabel Dependen (tergantung) adalah variabel yang nilainya di pengaruhi oleh variabel lain. Independen (bebas) adalah variabel yang nilainya tidak di pengaruhi oleh variabel lain. Variabel dependen secara teori dipengaruhi oleh variabel independen
Matrik untuk belajar pemilihan pengujian statistik dapat bersumber tabel berikut: Dependen Numerik
- Rasio - Interval
Kategorik - Ordinal - Nominal
Independen
Numerik - Rasio - Interval
Korelasi Pearson Regresi Linier
Regresi Logistik
Kategorik - Ordinal - Rasio
t‐test Anova Regresi Linier (dummy)
Korelasi spearman Chi‐square Regresi Logistik
Kasus. 1. Satu sampel T test
a. Apakah rata‐rata usia responden penelitian tersebut tidak jauh berbeda dari usia 25 tahun?
b. Apakah rata‐rata Tinggi Badan Responden penelitian tersebut tidak berbeda dari nilai 120 Cm?
c. Apakah rata‐rata Berat Badan Responden penelitian tersebut tidak berbeda dari nilai 55 Cm?
Penyelesaian Dari command stata
help ttest <Enter> Pelajari contohnya secara cepat agar lebih mudah dalam mereplikasi contoh yang ada dengan kasus yang di hadapi. Solusi kasus ini
1. ttest usia==25 2. ttest tb==120 3. ttest bb==55
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 269 Jam terampil mengolah data dengan Program Stata
Hasil . ttest usia==25 One-sample t test ------------------------------------------------------------------------------ Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- usia | 25 24.36 .5653318 2.826659 23.19321 25.52679 ------------------------------------------------------------------------------ Degrees of freedom: 24 Ho: mean(usia) = 25 Ha: mean < 25 Ha: mean != 25 Ha: mean > 25 t = -1.1321 t = -1.1321 t = -1.1321 P < t = 0.1344 P > |t| = 0.2688 P > t = 0.8656 . ttest tb==120 One-sample t test ------------------------------------------------------------------------------ Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- tb | 25 122.04 .7926327 3.963164 120.4041 123.6759 ------------------------------------------------------------------------------ Degrees of freedom: 24 Ho: mean(tb) = 120 Ha: mean < 120 Ha: mean != 120 Ha: mean > 120 t = 2.5737 t = 2.5737 t = 2.5737 P < t = 0.9917 P > |t| = 0.0167 P > t = 0.0083 . ttest bb==55 One-sample t test ------------------------------------------------------------------------------ Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- bb | 25 54.88 1.229255 6.146273 52.34294 57.41706 ------------------------------------------------------------------------------ Degrees of freedom: 24 Ho: mean(bb) = 55 Ha: mean < 55 Ha: mean != 55 Ha: mean > 55 t = -0.0976 t = -0.0976 t = -0.0976 P < t = 0.4615 P > |t| = 0.9230 P > t = 0.5385
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 279 Jam terampil mengolah data dengan Program Stata
8. Manajemen Data (Lanjutan) 8.1. Merge File (menggabung File /menambah Variabel) Description merge joins corresponding observations from the dataset currently in memory (called the master dataset) with those from the Stata-format dataset stored as filename (called the using dataset)into single observations. If filename is specified without an extension, .dta is assumed. merge can perform both one-to-one and match merges. In either case, the variable _merge (or the variable specified in _merge() if provided) is added to the data containing _merge==1 obs. from master data _merge==2 obs. from using data _merge==3 obs. from both master and using data
“merge” adalah perintah untuk menggabungkan beberapa file (2 atau lebih) menjadi satu file
gabungan. Tujuannya : (1) menyatukan variabel‐variabel penelitian menjadi 1 data set yang
terstruktur; (2) menggabungkan berbagai file menjadi satu data set untuk kebutuhan pengolahan
lanjutan.
Langkah‐langkah “merge Files”
1. Pastikan folder kerja anda ! Semua data yang akan digabung dimasukkan dalam 1 folder kerja.
misal : cd “c:\kursus stata” <Enter> atau
cd “c:\pelatihan stata” <Enter>
2. buka file data ke‐2 (File Using), urutkan berdasar ”id key” /id kunci / nomor identitas
responden, kemudian simpan ulang.
misal : use ” 2_data_kursus2.dta” sort id save “2_data_kursus2.dta”, replace
3. buka file data ke‐1 (file master), urutkan berdasar “id key”
misal : use ” 2_data_kursus.dta” sort id
4. gabungkan data master (data ke 1/data yang sekarang aktif) dengan data using (data ke 2),
kemudian urutkan berdasar “id key”.
misal : merge id using ”2_data_kursus2” sort id tab _merge drop _merge
5. simpan file data set gabungan menjadi file dengan nama yang berbeda
misal : save gab_data_kursus.dta
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 289 Jam terampil mengolah data dengan Program Stata
8.2. Append File (Menggabung File /menambah kasus) Append datasets append using filename [, nolabel keep(varlist) ] Note: You may enclose filename in double quotes and must do so if filename contains blanks or other special characters. Description append appends a Stata-format dataset stored on disk to the end of the dataset in memory.(Stata also has the capability to join observations from two datasets into a single observation; see help merge. Also see [U] 25 Commands for combining data for a comparison of append, merge,and joinby.) If filename is specified without an extension, .dta is assumed. Examples . append using newdata . append using newemploy, keep(id salary status hiredate) . append using mydata, keep(value pop*)
Perintah “append” berguna untuk menggabungkan data (dalam hal ini dari data yang berbeda untuk cases /responden yang berbeda). Langkah‐langkah “append Files”
1. Pastikan folder kerja anda ! Semua data yang akan digabung dimasukkan dalam 1 folder kerja.
misal : cd “c:\kursus stata” <Enter> atau
cd “c:\pelatihan stata” <Enter>
2. buka file data ke‐1 (file master)
misal : use ” 2_data_kursus.dta”
3. gabungkan data master (data ke 1/data yang sekarang aktif) dengan data using (data ke 2).
Chek cases yang memiliki entry ganda!
misal : append using ”2_data_kursus3” tab id
4. simpan file data set gabungan menjadi file dengan nama yang berbeda
misal : save gab_data_kursus2.dta
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 299 Jam terampil mengolah data dengan Program Stata
8.3. Transfer Data File Proses komputasi dengan program stata mensyaratkan data tentu saja dalam format stata format (*.dta). Bagi kita yang sudah terbiasa dengan format data base lain tidak perlu ragu untuk memanfaatkannya. Karena stata transfer secara cepat akan dapat menyelesaian masalah tersebut. Artinya tidak perlu entry ulang dari data base yang sudah ada. Stata menurut pengembangnya adalah
Menu input dan output file stata transfer
Misal merubah dari dbase (Input) ke format stata (Output)
Catatan: stata transfer yang dipakai ini adalah stata transfer versi 7.0 sehingga bagi anda pengguna Stata versi 8 atau versi 9 atau versi di atasnya agar dapat di transfer ke berbagai format harus di turunkan versi simpannya dengan prosedur ”saveold”. File Stata versi bawah (misal 7) pasti akan dapat di buka di Stata versi atas (misal 8), namun tidak berlaku sebaliknya.
Folder sumber file berada
Folder lokasi hasil dan nama file
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 309 Jam terampil mengolah data dengan Program Stata
8.4. Transfer Hasil komputasi Proses menyajikan hasil dalam format dokumentasi (Format MS Word, MS Excel dan lain‐lain) merupakan bagian penting dari pengolahan data. Bagi pengolah setelah berhasil mengeluarkan output dengan program pengola data tertentu diharapkan dapat menyajikannya menjadi format laporan umum yang dapat di analisis oleh team yang lain. Pada sesi ini akan disajikan berbagai fasilitas dan tip yang dimiliki program stata, bertujuan untuk mentransfer hasil /output stata menjadi dukumen.
Langkah transfer tabel output ke MS Word 1. setelah output di hasilkan, select dengan mouse tabel yang ingin disajikan (catatan : pastikan
dari awal tabel sampai akhir tabel). 2. Select “Copy Text” 3. ke Program MS Word dan “Paste” ke dalam lembar kerja MS Word Hasilnya :
Jenis | Kelamin | Freq. Percent Cum. ------------+----------------------------------- laki-laki | 15 60.00 60.00 perempuan | 10 40.00 100.00 ------------+----------------------------------- Total | 25 100.00
4. Untuk merapikan output tersebut “select are table” pilih jenis font “courier new” dengan besar
10
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 319 Jam terampil mengolah data dengan Program Stata
Hasil akhir
Jenis | Kelamin | Freq. Percent Cum. ------------+----------------------------------- laki-laki | 15 60.00 60.00 perempuan | 10 40.00 100.00 ------------+----------------------------------- Total | 25 100.00 Penyajian lebih tepat adalah dengan mengetik kembai dan hanya menyajikan informasi yang diperlukan saja misal: Tabel karakteristik responden (Jenis Kelamin)
Jenis Kelamin Frekuensi % Laki‐laki 15 60,0 Perempuan 10 40,0 Total 25 100,0
Sumber : Pengolahan Data Primer
Langkah transfer tabel output ke MS Excel 1. setelah output di hasilkan, select dengan mouse tabel yang ingin disajikan (catatan : pastikan
dari awal tabel sampai akhir tabel). 2. Select “Copy Table” 3. ke Program MS Excel dan “Paste” ke dalam lembar kerja MS Word
Hasilnya :
4. Untuk merapikan hasil tersebut dengan fasilitas tabel yang di MS Excel
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 329 Jam terampil mengolah data dengan Program Stata
8.5. Pemrograman stata dengan do‐files Seorang programmer pengeolah data (daam kasus ini adalah stata) tentu akan merasa sangat terbantu apabila setiap proses yang telah dikerjakan dapat di jalankan kembali dengan satu sentuhan /”Klik” dan semua proses yang sama dilakukan tanpa harus bersusah‐susah dengan berbagai langkah sudah runtin dilakukan. Sebagi solusi stata memberikan fasilitas “do files”.
Contoh : Do file menggabung data
* ke Direktori Data cd "c:\pelatihan stata" * File Using use "2_data_kursus2.dta" sort id save "2_data_kursus2.dta", replace * File Master use "2_data_kursus.dta" sort id * Menggabung merge id using "2_data_kursus2" sort id tab _merge drop _merge * Menyimpan hasil save gab_data_kursus.dta, replace Seluruh perintah tersebut di atas dapat dipindahkan dalam menu editor do dan dapat dijalankan.
Gambar Editor Do File Ketikan semua “command” yang sesuai dengan kebutuhan anda. Seluruh perintah tersebut akan sangat membantu untuk keperluan pengulangan dalam komputasi statistiknya.
Menjalankan do file dengan cara “select” area command kemudian pilih “Tools Bar” do curent files. Kontak
Modul Bantu Belajar Stata
Oleh : Ki Hariyadi 339 Jam terampil mengolah data dengan Program Stata
Ki Hariyadi PMPK Fakultas Kedokteran UGM FKM UAD Yogyakarta +62818267286 [email protected] Judul Modul : “9 Jam terampil mengolah data dengan Program Stata”
Gambaran Kursus
Kursus Singkat dengan metode “QSS” Maksimal 5 peserta (min 3 Org) Dengan masing‐masing memiliki komputer (rekomendasi laptop) Program stata dan stata transfer sudah di miliki. Fasilitas Modul dan komunikasi berbagai topik yang terkait. Memiliki Latar Belakang Pernah Kuliah...