22
LAPORAN PRAKTIKUM ANALISIS DATA EKSPLORATIF Dosen Pengampu : Sri Haryatmi, M.Sc.,Dr.,Prof. Asisten Dosen : 1. Wahyu Kartika(12523) 2. Susi Utami (12769) Oleh : Adhitya Akbar 10/297716/PA/13065 LABORATORIUM KOMPUTASI MATEMATIKA DAN STATISTIKA JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS GADJAH MADA 2011

Analisis Data Eksploratif

Embed Size (px)

Citation preview

Page 1: Analisis Data Eksploratif

LAPORANPRAKTIKUM ANALISIS DATA

EKSPLORATIF

Dosen Pengampu :Sri Haryatmi, M.Sc.,Dr.,Prof.

Asisten Dosen :1. Wahyu Kartika(12523)2. Susi Utami (12769)

Oleh :

Adhitya Akbar10/297716/PA/13065

LABORATORIUM KOMPUTASIMATEMATIKA DAN STATISTIKA

JURUSAN MATEMATIKAFAKULTAS MATEMATIKA DAN ILMU

PENGETAHUAN ALAMUNIVERSITAS GADJAH MADA

2011

Page 2: Analisis Data Eksploratif

BAB I

PERMASALAHAN

1. Bangunlah data dalam variable “data” yang berdistribusi binomial dengan banyak data n=50 dan banyak percobaan 500, serta peluang sukses 0.20, lakukan sebanyak 2 kali (‘data1’ dan ‘data2’). Lalu :

a. Buatlah daftar tally dan steam and leaf (menggunakan 1 digit pertama sebagai batang, 2 digit pertama sebagai batang, dan 3 digit pertama sebagai batang) dengan panjang kelas terserah, interpretasikan hasilnya secara lengkap!

b. Carilah rata-rata, max, minimum, dan standar deviasi dari masing-masing data tersebut.

c. Carilah rata-rata, max, minimum, dan standar deviasi dari kedua data tersebut! Lalu bandingkan!

d. Buatlah boxplot untuk kedua data tersebut, dan lakukan standardisasi menggunakan mean dan median. Lalu buat boxplot baru hasil standardisasi tersebut. Bandingkan dengan boxplot sebelum standardisasi.

e. Diketahui data seperti berikut :

Data 1

601.4 597.6 598.8 598.8 601 601 598 601.2 597.8 601.4601.6 601.6 601.4 599.4 601.4 601.4 598 601 598.2 599

598 599.4 598.4 597.2 601.4 601 598.8 600.8 598.2 601.4601.4 601.2 601.6 600.8 598.8 601.2 601 601.2 598.2 601.8599.4 598.4 598.8 600.6 598.8 601.4 600.8 601.6 599.2 601.6

600 599.2 601.2 599.6 598.8 601.8 598.8 601.4 599.2 601.2600.2 598.8 599.6 599.4 598.2 601.6 599.4 601.4 600.6 601.2601.2 601.4 601.2 598 601.8 601 601 600 601.2 601.2598.4 599 598.2 600.8 601 600.2 598.8 599 598.4 601.2

599 601 598.8 597.8 601.4 599 599.6 600.4 602.2 601

Page 3: Analisis Data Eksploratif

Data 2

44.2 42.4 43.1 49.1 45 50.744.3 42.2 43.2 48.9 44.8 50.744.4 41.8 42.8 49.4 44.9 50.943.4 40.1 43 50 45.2 50.542.8 42 42.8 50 45.2 51.244.3 42.4 42.5 49.6 45 50.744.4 43.1 42.6 49.9 45.5 50.344.8 42.4 42.3 49.6 46.2 49.244.4 48.3 42.9 44.7 46.8 48.143.1 42.6 43.6 44.5 47.5 48.3

Buatlah boxplot untuk kedua data tersebut, lalu jika belum simetri , lakukanlah transformasi sampai didapatkan boxplot yang simetri.

Page 4: Analisis Data Eksploratif

BAB II

PEMBAHASAN

Output: Data random binomial dengan n=50, number of trials=500, dan probability of success=0.2

DATA1 DATA290 107102 9892 106104 10295 92102 103105 89102 100101 91102 10388 8993 9693 9989 10486 97111 101104 111110 95108 11092 9595 10394 107104 96104 95102 97115 9978 103101 99106 9894 9393 78109 10090 9296 107102 102

Page 5: Analisis Data Eksploratif

94 101101 9698 98106 10695 10887 98106 107104 101104 101101 91106 9396 101113 11593 107100 100

a) Output: Daftar Tally ‘DATA1’ (simple)

Tally for Discrete Variables: DATA1

DATA1 Count 78 1 86 1 87 1 88 1 89 1 90 2 92 2 93 4 94 3 95 3 96 2 98 1 100 1 101 4 102 6 104 6 105 1 106 4 108 1 109 1 110 1 111 1 113 1 115 1 N= 50

Interpretasi: Jumlah data(N)=50, Count menampilkan hitungan atau frekuensi setiap

kelas, untuk daftar Tally diatas tidak mempunyai interval/panjang kelas, sehingga

datanya individual dan dapat dilihat nilai keseluruhan dari data, data diurutkan dari data

terkecil ke data terbesar(ascending).

Page 6: Analisis Data Eksploratif

Daftar Tally di atas menunjukkan data yang bernilai 78 berjumlah 1, 86 berjumlah 1, 87

berjumlah 1, 88 berjumlah 1, 89 berjumlah 1, 90 berjumlah 2, 92 berjumlah 2, dst.

Daftar Tally diatas merupakan daftar Tally yang sederhana dan dapat dikerjakan secara manual. Untuk daftar Tally yang lebih kompleks dapat dilihat di bawah ini.

Output: Daftar Tally ‘DATA1’ (complicated)

Tally for Discrete Variables: DATA1

DATA1 Count CumCnt Percent CumPct 78 1 1 2.00 2.00 86 1 2 2.00 4.00 87 1 3 2.00 6.00 88 1 4 2.00 8.00 89 1 5 2.00 10.00 90 2 7 4.00 14.00 92 2 9 4.00 18.00 93 4 13 8.00 26.00 94 3 16 6.00 32.00 95 3 19 6.00 38.00 96 2 21 4.00 42.00 98 1 22 2.00 44.00 100 1 23 2.00 46.00 101 4 27 8.00 54.00 102 6 33 12.00 66.00 104 6 39 12.00 78.00 105 1 40 2.00 80.00 106 4 44 8.00 88.00 108 1 45 2.00 90.00 109 1 46 2.00 92.00 110 1 47 2.00 94.00 111 1 48 2.00 96.00 113 1 49 2.00 98.00 115 1 50 2.00 100.00 N= 50

Untuk daftar Tally diatas terlihat CumCnt (cumulative counts) yaitu menampilkan

frekuensi kumulatif setiap kelas, Percent menampilkan frekuensi relatif setiap kelas, dan

CumPct (cumulative percents) menampilkan frekuensi relatif kumulatif setiap kelas.

Output: Daftar Tally ‘DATA2’(simple)

Tally for Discrete Variables: DATA2

DATA2 Count 78 1 89 2 91 2 92 2 93 2 95 3 96 3 97 2 98 4

Page 7: Analisis Data Eksploratif

99 3 100 3 101 5 102 2 103 4 104 1 106 2 107 5 108 1 110 1 111 1 115 1 N= 50

Interpretasi: Jumlah data(N)=50, Count menampilkan hitungan atau frekuensi setiap

kelas, untuk daftar Tally diatas tidak mempunyai interval/panjang kelas, sehingga

datanya individual dan dapat dilihat nilai keseluruhan dari data, data diurutkan dari data

terkecil ke data terbesar(ascending).

Daftar Tally diatas menunjukkan data yang bernilai 78 berjumlah 1, 89 berjumlah 2, 91

berjumlah 2, 92 berjumlah 2, 93 berjumlah 2, 95 berjumlah 3, 96 berjumlah 3, dst.

Output: Daftar Tally ‘DATA2’ (complicated)

Tally for Discrete Variables: DATA2

DATA2 Count CumCnt Percent CumPct 78 1 1 2.00 2.00 89 2 3 4.00 6.00 91 2 5 4.00 10.00 92 2 7 4.00 14.00 93 2 9 4.00 18.00 95 3 12 6.00 24.00 96 3 15 6.00 30.00 97 2 17 4.00 34.00 98 4 21 8.00 42.00 99 3 24 6.00 48.00 100 3 27 6.00 54.00 101 5 32 10.00 64.00 102 2 34 4.00 68.00 103 4 38 8.00 76.00 104 1 39 2.00 78.00 106 2 41 4.00 82.00 107 5 46 10.00 92.00 108 1 47 2.00 94.00 110 1 48 2.00 96.00 111 1 49 2.00 98.00 115 1 50 2.00 100.00 N= 50

Untuk daftar Tally diatas terlihat CumCnt (cumulative counts) yaitu menampilkan

frekuensi kumulatif setiap kelas, Percent menampilkan frekuensi relatif setiap kelas, dan

CumPct (cumulative percents) menampilkan frekuensi relatif kumulatif setiap kelas.

Page 8: Analisis Data Eksploratif

Kelebihan daftar Tally:

Dapat melihat bentuk distribusi data

Dapat menghitung frekuensi dengan cepat

Melihat ada/tidaknya data ekstrim

Output: Stem and Leaf ‘DATA1’ dengan increment=100

Stem-and-Leaf Display: DATA1

Stem-and-leaf of DATA1 N = 50Leaf Unit = 10

22 0 7888899999999999999999(28) 1 0000000000000000000000001111

Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=100→leaf unit(unit

daun)=10. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom

kedua adalah batang(ratusan) dan kolom ketiga adalah daun(puluhan). Terlihat(dapat

dibuktikan dengan boxplot) bahwa distribusi angkatan di atas menjurai ke bawah. Tanda

kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut.

Output: Stem and Leaf ‘DATA1’ dengan increment=10

Stem-and-Leaf Display: DATA1

Stem-and-leaf of DATA1 N = 50Leaf Unit = 1.0

1 7 8 5 8 6789 22 9 00223333444555668(24) 10 011112222224444445666689 4 11 0135

Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=10→leaf unit(unit

daun)=1. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom

kedua adalah batang(puluhan) dan kolom ketiga adalah daun(satuan). Terlihat(dapat

dibuktikan dengan boxplot) bahwa distribusi angkatan di atas menjurai ke bawah. Tanda

kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut.

Page 9: Analisis Data Eksploratif

Output: Stem and Leaf ‘DATA1’ dengan increment=1

Stem-and-Leaf Display: DATA1

Stem-and-leaf of DATA1 N = 50Leaf Unit = 0.10

1 78 0 1 79 1 80 1 81 1 82 1 83 1 84 1 85 2 86 0 3 87 0 4 88 0 5 89 0 7 90 00 7 91 9 92 00 13 93 0000 16 94 000 19 95 000 21 96 00 21 97 22 98 0 22 99 23 100 0(4) 101 0000 23 102 000000 17 103 17 104 000000 11 105 0 10 106 0000 6 107 6 108 0 5 109 0 4 110 0 3 111 0 2 112 2 113 0 1 1141 115 0

Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=1→leaf unit(unit

daun)=0.1. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom

kedua adalah batang(karena panjang kelasnya hanya 1, maka data dijabarkan seluruhnya

secara ascending) dan kolom ketiga adalah daun(satuan), karena pada batang telah

dijabarkan keseluruhan nilai dari data, maka otomatis daunnya pun bernilai 0.

Terlihat(dapat dibuktikan dengan boxplot) bahwa distribusi angkatan di atas menjurai ke

Page 10: Analisis Data Eksploratif

bawah. Tanda kurung (….) menunjukkan median(nilai tengah) data berada pada kelas

tersebut.

Output: Stem and Leaf ‘DATA2’ dengan increment=100

Stem-and-Leaf Display: DATA2

Stem-and-leaf of DATA2 N = 50Leaf Unit = 10

LO 7

24 0 88999999999999999999999(25) 1 0000000000000000000000011

HI 11

Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=100→leaf unit(unit

daun)=10. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom

kedua adalah batang(ratusan) dan kolom ketiga adalah daun(puluhan). Terlihat(dapat

dibuktikan dengan boxplot) bahwa distribusi angkatan di atas mendekati normal. Tanda

kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut. Terlihat

adanya data ekstrim bawah(LO) dan data ekstrim atas(HI). Data ekstrim bawah berada

pada batang 0 dan daun 7(LO 7) atau data (0,7)→bernilai 78. Data ekstrim atas berada

pada batang 1 dan daun 1(HI 11) atau data (1,1)→bernilai 115.

Output: Stem and Leaf ‘DATA2’ dengan increment=10

Stem-and-Leaf Display: DATA2

Stem-and-leaf of DATA2 N = 50Leaf Unit = 1.0

LO 78

3 8 99 24 9 112233555666778888999(23) 10 00011111223333466777778 3 11 01

HI 115

Page 11: Analisis Data Eksploratif

Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=10→leaf unit(unit

daun)=1. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom

kedua adalah batang(ratusan) dan kolom ketiga adalah daun(puluhan). Terlihat(dapat

dibuktikan dengan boxplot) bahwa distribusi angkatan di atas mendekati normal. Tanda

kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut. Terlihat

adanya data ekstrim bawah(LO) dan data ekstrim atas(HI). Data ekstrim bawah berada

pada batang 0 dan daun 7(LO 7) atau data (0,7)→bernilai 78. Data ekstrim atas berada

pada batang 1 dan daun 1(HI 11) atau data (1,1)→bernilai 115.

Output: Stem and Leaf ‘DATA2’ dengan increment=1

Stem-and-Leaf Display: DATA2

Stem-and-leaf of DATA2 N = 50Leaf Unit = 0.10

LO 780

3 89 00 3 90 5 91 00 7 92 00 9 93 00 9 94 12 95 000 15 96 000 17 97 00 21 98 0000 24 99 000(3) 100 000 23 101 00000 18 102 00 16 103 0000 12 104 0 11 105 11 106 00 9 107 00000 4 108 0 3 109 3 110 0 2 111 0

HI 1150

Interpretasi: Jumlah data(N)=50, dengan increment(panjang kelas)=100→leaf unit(unit

daun)=10. Kolom paling kiri menunjukkan jumlah data dalam setiap kelas(baris). Kolom

kedua adalah batang(ratusan) dan kolom ketiga adalah daun(puluhan). Terlihat(dapat

Page 12: Analisis Data Eksploratif

dibuktikan dengan boxplot) bahwa distribusi angkatan di atas mendekati normal. Tanda

kurung (….) menunjukkan median(nilai tengah) data berada pada kelas tersebut. Terlihat

adanya data ekstrim bawah(LO) dan data ekstrim atas(HI). Data ekstrim bawah berada

pada batang 0 dan daun 7(LO 7) atau data (0,7)→bernilai 78. Data ekstrim atas berada

pada batang 1 dan daun 1(HI 11) atau data (1,1)→bernilai 115.

b)

Output: Mean, StDev, Minimum, Maximum ‘DATA1’

Descriptive Statistics: DATA1

TotalVariable Count Mean StDev Minimum MaximumDATA1 50 99.12 7.65 78.00 115.00

Output: Mean, StDev, Minimum, Maximum ‘DATA2’

Descriptive Statistics: DATA2

TotalVariable Count Mean StDev Minimum MaximumDATA2 50 99.600 6.636 78.000 115.000

c)

Output: Mean, StDev, Minimum, Maximum dari kedua data(data gabungan)

Descriptive Statistics: DATA1+2

TotalVariable Count Mean StDev Minimum MaximumDATA1+2 100 99.360 7.132 78.000 115.000

Output: Perbandingan Mean, StDev, Minimum, Maximum dari DATA1, DATA2, dan DATA1+2(data gabungan)

Descriptive Statistics: DATA1, DATA2, DATA1+2

TotalVariable Count Mean StDev Minimum MaximumDATA1 50 99.12 7.65 78.00 115.00DATA2 50 99.600 6.636 78.000 115.000DATA1+2 100 99.360 7.132 78.000 115.000

Page 13: Analisis Data Eksploratif

Perbandingan mean antara DATA1, DATA2, dan data gabungan

o Selisih antara mean DATA1 dengan DATA2 adalah 0.48

o Selisih antara mean DATA1 dengan data gabungan adalah 0.24

o Selisih antara mean DATA2 dengan data gabungan adalah 0.24

Selisih mean antara DATA1 dan DATA2 dengan data gabungan adalah

sama 0.24, tetapi bukan berarti mean DATA1 dan DATA2 adalah sama,

mean DATA1 0.24 dibawah mean data gabungan, sedangkan mean

DATA2 0.24 diatas mean data gabungan.

Perbandingan standar deviasi antara DATA1, DATA2, dan data gabungan

o Selisih antara st.dev DATA1 dengan DATA2 adalah 1.014

o Selisih antara st.dev DATA1 dengan data gabungan adalah 0.518

o Selisih antara st.dev DATA2 dengan data gabungan adalah 0.496

Nilai minimum dan maksimum DATA1 dan DATA2 sama, maka otomatis nilai

minimum dan maksimum data gabungan pun sama.

d)Output: Boxplot data gabungan DATA1 dan DATA2

Page 14: Analisis Data Eksploratif

Interpretasi:

Boxplot menunjukkan bentuk distribusi data(normal/menjurai ke atas/menjurai ke bawah)

Boxplot diatas sedikit menjurai ke bawah.

Dari boxplot, kita dapat memperkirakan nilai dari Q1, median, Q3, nilai maksimum dan

minimum. Garis tengah dalam kotak menunjukkan median(bernilai 100.5). Garis

horizontal atasnya menunjukkan Q3(bernilai 104). Garis horizontal bawahnya

menunjukkan Q1(bernilai 94.25). Ujung atas garis vertikal menunjukkan nilai

maksimum(bernilai 115), dan ujung bawah garis vertikal menunjukkan nilai

minimum(bernilai 78←ditunjukkan oleh outlier).

Output: Boxplot hasil standarisasi mean

Interpretasi:

Standarisasi mean yaitu mengurangi setiap data dengan mean lalu dibagi dengan

standar deviasi(s). Standarisasi mean ini menghasilkan pusat data menjadi

0.159853(dapat dilihat pada pusat data di atas).

Page 15: Analisis Data Eksploratif

Output: Boxplot hasil standarisasi median

Standarisasi median yaitu mengurangi setiap data dengan median lalu

membaginya dengan range(jangkauan). Standarisasi median ini menghasilkan

pusat data menjadi 0(dapat dilihat pada pusat data di atas). Jadi dapat disimpulkan

bahwa standarisasi median lebih baik, karena tujuan dari standarisasi adalah

membuat pusat data menjadi 0.

Output: Boxplot sebelum dan sesudah standarisasi

Page 16: Analisis Data Eksploratif

e)

Boxplot di atas(hasil dari gabungan data1 dan data2) sama sekali belum

simetri(sangat menjurai ke bawah), untuk itu, perlu dilakukan transformasi

sampai data berdistribusi normal(pusat data berada di tengah-tengah). Berikut ini

adalah boxplot hasil transformasi yang sudah cukup simetris.