BAB II
PENGGAMBARAN DATA
2.1 Penggambaran Data Kualitatif
Metode penggambaran data merupakan hal yang esensial dalam statistik
deskriptif. Sebelum kita menarik kesimpulan dari sekumpulan data, kita harus
terlebih dahulu melakukan proses statistik deskriptif. Berikut ini adalah beberapa
definisi dalam statistik deskriptif yang penting.
Kelas adalah salah satu dari katergori dimana data, baik kualitatif maupun
kuantitatif, dapat dikelompokkan.
Frekuensi Kelas adalah banyaknya observasi dalam kumpulan data yang
masuk pada kelas tertentu.
Frekuensi Relatif Kelas adalah frekuensi kelas dibagi dengan banyaknya
observasi; yang dirumuskan:
Frekuensi Relatif =
Dengan n adalah banyaknya observasi.
Penggambaran data kualitatif dapat dilakukan dengan 2 cara, yaitu pie
chart dan bar graph. Di bawah ini adalah contoh penggambaran data kualitatif
dengan pie chart dan bar graph untuk hasil studi aphasia yang dimuat dalam
Journal of Communication Disorder (Mar. 1995).
Tabel 2.1. 22 orang dewasa yang menderita aphasia dan jenisnya
Subyek Jenis Aphasia
1 Broca
2 Anomic
3 Anomic
4 Conduction
5 Broca
6 Conduction
7 Conduction
8 Anomic
9 Conduction
10 Anomic
11 Conduction
12 Broca
13 Anomic
14 Broca
15 Anomic
16 Anomic
17 Anomic
18 Anomic
19 Broca
20 Anomic
21 Conduction
22 Anomic
Tabel 2.2. Rangkuman data 22 orang penderita aphasia
KelasTipe Aphasia
Frekuensi Banyak Subject
Frekuensi Relatif Proporsi
Broca 5 0.227Conduction 7 0.318
Anomic 10 0.455Total 22 1.000
Penggambaran dengan pie chart:
Gambar 2.1. Penggambaran data dengan pie chart
Penggambaran dengan bar graph:
Anomic Broca Conduction
Gambar 2.2. Penggambaran data dengan bar graph
Conduction(0.318)
Anomic(0.455)
Broca(0.227)
10
5
2.2 Penggambaran Data Kuantitatif
Data kuantitatif dapat digambarkan dengan 3 metode, yaitu:
1. Metode dot-plot
2. Metode stem-leaf (batang daun)
3. Histogram atau distribusi frekuensi
Contoh 1.1
Penggambaran data peringkat 100 mobil dalam hal pemakaian bahan baker
(dalam mpg = mile per gallon) menurut EPA (Environmental Protection Agency)
yang tabelnya tercantum di bawah ini adalah:
36.3 41.0 36.9 37.1 44.9 36.8 30.0 37.2 42.1 36.9
32.7 37.3 41.2 36.6 32.9 36.5 33.2 37.4 37.4 39.5
40.5 36.5 37.6 33.9 40.2 36.4 37.7 37.7 37.7 34.5
36.2 37.9 36.6 37.9 35.9 38.2 38.3 35.7 35.7 35.8
38.5 39.0 35.5 34.8 38.6 39.4 35.3 34.4 34.4 39.3
35.3 36.8 32.5 36.4 40.5 36.6 36.1 38.2 38.2 39.7
41.0 31.8 37.3 33.1 37.0 37.6 37.0 38.7 38.7 35.1
37.0 37.2 40.7 37.4 37.1 37.8 35.9 35.6 35.6 34.2
37.1 40.3 36.7 37.0 40.1 40.1 38.0 35.2 35.2 33.6
39.9 36.9 32.9 33.8 34.0 34.0 36.8 35.0 35.0 36.7
1. Metode dot-plot . . . . . . . .. .. …… . . .. . . . . ……… ………. .. . ……………………................ . . .
30 35 40 45
2. Metode stem-leaf (diagram batang-daun)
Frekuensi Stem Leaf
1 30 0
1 31 8
4 34 5799
6 33 126899
6 34 024588
11 35 01235667899
20 36 01233445566777888999
21 37 000011122334456677899
10 38 0122345678
8 39 00345789
7 40 0123557
3 41 002
1 42 1
0 43
1 44 9Dengan n = 100 dan unit leaf = 0.10
3. Histogram atau distribusi frekuensi
Ukuran Kelas Frekuensi Frekuensi Relatif
30.0 – 31.5 1 0.01
31.5 – 33.0 5 0.05
33.0 – 34.5 9 0.09
34.5 – 36.0 14 0.14
36.0 – 37.5 33 0.33
37.5 – 39.0 18 0.18
39.0 – 40.5 12 0.12
40.5 – 42.0 6 0.06
42.0 – 43.5 1 0.01
43.5 – 45.0 1 0.01
Total 100 1.00
Apabila banyaknya ukuran data dalam kumpulan data bertambah,
penggambaran data yang baik dapat diperoleh dengan menurunkan lebar interval
kelas. Jika interval kelas menjadi cukup kecil, maka histogram akan menjadi
kurva yang “mulus” (smooth).
Kumpulan data kecil kumpulan data lebih besar kumpulan data besar
Gambar 2.3. Gambar berbagai histogram apabila n meningkat semakin besar
2.3. Notasi Jumlahan (Sigma)
Kumpulan data kuantitatif dilambangkan dengan symbol:
X1, X2, X3, X4 ….. Xn.
Untuk menyingkat/meringkas jumlahan dengan bentuk X1 + X2 + X3 + X4 + … + =
Xn
sehingga
X1 + X2 + X3 + X4 + … + = Xn =
Berapa aturan pada notasi sigma yang mendasar adalah sebagai berikut:
FR
0 20
FR
0
FR
0 2020
Aturan 1
Jika Xi = k (suatu konstanta) maka
= X1 + X2 + X3 + X4 + … + Xn
= k + k + k + … + k = nk
Aturan 2
Jika k suatu konstanta maka,
= kX1 + kX2 + kX3 + … + kXn
= k(X1 + X2 + X3 + … Xn)
=
Aturan 3
(Xi + Yi) = (X1 + Y1) + (X2 + Y2) + ….+ (Xn + Yn)
= (X1 + X2 + + X3 + ….+ Xn) + (Y1 + Y2 + …. + Yn)
=
Contoh 2.2
1-1/3 + 1/5 + 1/7 + 1/9 + 1/11 + 1/13 + 1/15 + =
2.4. Ukuran Pusat (Sentral) dan Ukuran Penyebaran (Variabilitas)
Ukuran pusat dari kumpulan pengukuran adalah kecenderungan data
untuk mengelompok atau memusat pada nilai numeric tertentu, sedangkan ukuran
variabilitas data adalah nilai penyebaran data. Berbagai ukuran pusat yang sering
digunakan adalah:
pusat penyebaran
Gambar 2.4. Gambar ukuran pemusatan dan penyebaran data
1. Mean, yaitu jumlah pengukuran dibagi dengan banyaknya pengukuran. Mean
dirumuskan sebagai:
Dengan = mean sample dan = mean populasi
2. Median, yaitu bilangan tengah apabila data pengukuran tersebut diatur (urut
naik/turun). Median dihitung dengan cara mengurutkan data dari yang terkecil
sampai yang terbesar. Jika n ganjil, meannya adalah data yang ditengah. Jika n
genap, meannya adalah rata-rata dari dua data yang ditengah.
3. Modus, yaitu data yang paling sering muncul.
Contoh 2.3
Modus kumpulan data 8, 7, 9, 6, 8, 10, 9, 9, 5, 7 adalah 9.
Perbandingan antara letak mean dan median pada kemencengan data
dapat digambarkan sebagai berikut:
Jika data menceng ke kanan, mean lebih besar dari pada median
Med
Gambar 2.5 Gambar sekumpulan data yang menceng ke kanan
Jika data simetris, mean sama dengan median
Med
Gambar 2.6. Gambar sekumpulan data yang simetris bentuknya
Jika data menceng ke kiri, mean lebih kecil dari pada median
Med
Gambar 2.7. Gambar sekumpulan data yang menceng ke kiri
Ukuran-ukuran penyebaran (variabilitas) adalah sebagai berikut:
1. Range/jangkauan, yaitu data terbesar dikurangi data terkecil.
2. Variansi sample
atau
3. Deviasi standar sample
dimana
: variansi sample
s : deviasi standar sampel
2 : variansi populasi
: deviasi standar populasi
2.5. Interpretasi Deviasi Standar
Deviasi standar menyajikan ukuran penyebaran data dan menjawab
pertanyaan seperti “Berapa banyak ukuran data yang terletak di dalam 1 deviasi
standar terhadap mean atau data-data yang terletak antara - 2s hingga + 2s?”.
Suatu kumpulan data disebut berdistribusi bentuk “mound” apabila mean, media
dan modusnya sama.
Interpretasi deviasi standar dengan aturan Chebyshev
1. Tak ada informasi untuk data pengukuran yang terletak dalam 1 standar
deviasi terhadap mean.
2. Paling sedikit ¾ data pengukuran akan terletak dalam 2 standar deviasi
terhadap mean atau terletak dalam interval ( - 2s, + 2s).
3. Paling sedikit 8/9 data pengukuran akan terletak dalam 3 standar deviasi
terhadap mean atau terletak dalam interval ( - 3s, + s).
4. Kira-kira 99,7 % data pengukuran akan terletak dalam 3 deviasi standar
atau terletak dalam interval ( - 3s, + 3s).
2.6. Ukuran Relatif
Ukuran relative menggambarkan lokasi kuantitatif relative dasri suatu
ukuran tertentu dalam kumpulan data. Ada 2 jenis ukuran relative yaitu:
1. Persentil ke-p
Untuk sembarang n data pengukuran (yang diurutkan naik), persentil ke-p
adalah sebuah bilangan sehingga p% dari data pengukuran akan jatuh dibawah
persentil ke-p dan (100-p) % akan jatuh di atasnya.
2. Nilai z
Nilai z sampel didefinisikan sebagai
Nilai z populasi dari x didefinisikan sebagai:
Dalam skala nilai z, interpretasi deviasi standar adalah sebagai berikut:
1. Kurang lebih 68% data akan mempunyai nilai z terletak antara -1 dan 1.
2. Kurang lebih 95% data akan mempunyai nilai z terletak antara -2 dan 2.
3. Kurang lebih 99,7% data akan mempunyai nilai z terletak antara -3 dan 3.
2.7. Outliers
Outliers adalah hasil observasi (data pengukuran) dalam suatu kumpulan
data yang nilainya sangat berbeda jika dibandingkan dengan sekumpulan data dari
pengukuran lain. Penyebab outlier ada 3 macam, yaitu:
1. Data pengukuran tidak dicatat dan dimasukkan dalam computer dengan benar
2. Data pengukuran berasal dari populasi lain
3. Data pengukuran benar, tapi mewakili peristiwa (keadaan) yang jarang terjadi.
Beberapa istilah yang digunakan:
Kuartil Bawah (QL), yaitu persentil ke-25
Kuartil Tengah, yean mean
Kuartil Atas (QU), yaitu persentil ke-75
Jangkauan interkuartil (interquartil range) yang sering disingkat dengan
JIQ, yaitujarak antara Kuartil Atas dan Kuartil Bawah dan mempunyai rumus:
JIQ = QU – QL
Range atau jangkauan, yang sering pula disebut rentang.
Aturan untuk mendeteksi adanya outliers:
1. Melalui boxplot
Observasi yang berada antara pagar dalam dan pagar luar “diduga outliers”,
sedangkan observasi yang berada di luar pagar luar diduga keras “outliers”.
Observasi yang berada pada garis whiskers disebut “ekstrim”
Pagar luar bawah = QL – 3 (JIQ)
Pagar luar bawah = QL – 1,5 (JIQ)
Pagar luar bawah = QU + 3 (JIQ)
Pagar luar bawah = QU – 1,5 (JIQ)
Kedua pagar di atas adalah garis imajiner yang tidak ditahan. Nilai observasi
yang terletak di luar pagar dalam bawah (PDB) dan pagar dalam atas (PDA)
adalah “outliers potensial”. Nilai observasi yang terletak di luar (pagar luar
bawah) PLB dan PLA (pagar luar atas) adalah “outliers”.
45
40
35
30
Gambar 2.8: Gambar boxplot
Pada gambar di atas terdapat 2 buah outliers yang diberi tanda bintang (*).
Contoh 2.4.
Untuk data dengan QL = 35,5 dan QU = 38,5 serta mean = 37, nilai JIQ adalah
38,5 – 35,5 = 3. Berdasarkan gambar boxpot dapat diperoleh:
Pagar dalam abawah (PDB) = QL – 1,5 (JIQ) = 35,5 – 1,5 (3,0) = 31,0
Pagar dalam atas (PDA) = QU + 1,5 (JIQ) = 38,5 + 1,5 (3,0) = 43,0
2. Melalui nilai z
Gambar boxplot:
Box
QU
Median
QL
Pagar dalam atas
Pagar dalam
bawah
Pagar luar bawah
Pagar luar atas *
Observasi yang nilai mutlaknya lebih dari 3 disebut outliers. Untuk data yang
sangat menceng, nilai mutlak lebih dari 1 dapat disebut outliers.
2.8 Penggambaran Relasi 2 Variabel
Cara untuk menggambarkan relasi antara 2 variabel kuantitatif yang ada
disebut relasi n bivariate adalah dengan menggambar data dalam “scattergram
(scatterplot)”
Relasi positif Relasi negative Tidak ada relasi
Gambar 2.9. Tigas jenis relasi bivariate
2.9 Ukuran Data Berkelompok
Apabila n data observasi terkelompok menjadi k kelas interval maka dapat
digunakan rumus-rumus berikut ini:
1. Mean
dengan
adalah frekuensi kelas ke-i
adalah titik tengah kelas ke-I dan k adalah banyak kelas
Var 2
Var 1
Var 2
Var 1
Var 2
Var 1
2. Median
Modus =
Lmod = batas bawah interval kelas Modus
a = selisih antara frekuensi interval Modus dengan frekuensi interval
kelas sebelumnya.
b = selisih antara frekuensi interval Modus dengan frekuensi interval
kelas sesudahnya
c = lebar interval kelas
4. Variansi
atau
fi = frekuensi interval kelas ke-i
xi = adalah titik tengah interval kelas ke-i
= adalah mean
k = adalah banyak interval kelas
n = adalah banyak data observasi
4. Koefisien Variasi (KV)
Rumusnya adalah:
Koefisien variasi sering digunakan untuk menunjukkan ketidak pastian
relative dari distribusi dengan mean yang berbeda.
5. Ukuran Kemencengan (Km)
Mean – Modus 3(Mean –Modus) Km = atau Km =
deviasi standar deviasi standar
Jika:
Km > 0 maka distribusi data menceng ke kanan
Km > 0 maka distribusi data simetris
Km > 0 maka distribusi data menceng ke kiri
Soal-soal Bab 2
1. Diberikan data golongan darah 50 orang mahasiswa sebagai berikut:
1 A 11 A 21 A 31 O 41 A
2 B 12 A 22 O 32 A 42 A
3 O 13 A 23 B 33 B 43 A
4 AB 14 B 24 A 34 O 44 B
5 O 15 B 25 O 35 AB 45 B
6 AB 16 A 26 B 36 O 46 O
7 O 17 B 27 AB 37 A 47 O
8 AB 18 O 28 A 38 B 48 O
9 A 19 O 29 B 39 B 49 B
10 B 20 O 30 O 40 B 50 AGambarkan bar-graph dan pie-chart dari data di atas !
2. Dipunyai 2 sampel data sebagai berikut:
Sampel 1 Sampel 2121173157165170161142
171184185172159187166
158163145196172100171
171168190140172199167
152169183173174151170
170171185206169180188
a. Gambarkan diagram boxplot dari data di atas !
b. Dengan menggunakan informasi yang ada pada gambar boxplot, jelaskan
kesamaan dan perbedaan pada dua himpunan data tersebut !
c. Carilah outlier dari dua kumpulan data tersebut jika ada !
3. Data di bawah ini menunjukkan jarak dari tempat kediaman pekerja menuju
tempat pekerjaan mereka (diukur dalam mil):
3,5 2,0 4,0 2,5 0,3 1,0 12,0 17,5 3,0 3,5 6,5 7,0 9,0
3,0 2,4 2,7 4,0 9,0 16,0 3,5 0,5 2,5 1,0 0,7 1,5 1,4
12,0 9,2 8,3 4,0 2,0 1,0 3,0 7,5 3,2 2,0 1,0 3,5 3,6
1,9 2,0 3,0 1,5 0,4 2,0 3,0 6,4 11,0 2,5
a. Gambarkan diagram batang-daun (stem-leaf) dari sekumpulan data
tersebut !
b. Tentukan histogram dan distribusi frekuensi dari data di atas !
c. Dari histogram yang telah anda buat, hitunglah mean, median, modus dan
kemencengan kumpulan data tersebut (gunakan rumus untuk data
terkelompok) !
d. Apabila suatu data mempunyai nilai x = 3,6 mil, berapakah nilai z-nya ?
e. Berapa persen data yang terletak pada selang ( - s, + s), ( - 2s, +
2s) dan ( - 3s, + 3s) !
4. Polisi jalan raya mencatat kecepatan 40 mobil di suatu tempat pada jalan raya
dan mendapatkan data sebagai berikut (dalam mil/jam):
68 72 62 75 81 64 81 66
65 68 70 70 69 73 72 75
71 70 80 74 62 59 81 69
66 88 66 65 65 77 70 65
64 77 68 70 72 66 73 68
a. Tentukan gambar diagram Boxplotnya !
b. Gambarkan histogram dari data di atas melalui distribusi frekuensinya
c. Dari data terkelompok tersebut (distribusi frekuensi) maka, hitunglah
mean, median, modus dan kemencengan data.