Download doc - staff.ui.ac.idstaff.ui.ac.id/system/files/users/anon.mirmani/... · Web viewGambarkan diagram batang-daun (stem-leaf) dari sekumpulan data tersebut ! Tentukan histogram dan distribusi

BAB II

PENGGAMBARAN DATA

2.1 Penggambaran Data Kualitatif

Metode penggambaran data merupakan hal yang esensial dalam statistik

deskriptif. Sebelum kita menarik kesimpulan dari sekumpulan data, kita harus

terlebih dahulu melakukan proses statistik deskriptif. Berikut ini adalah beberapa

definisi dalam statistik deskriptif yang penting.

Kelas adalah salah satu dari katergori dimana data, baik kualitatif maupun

kuantitatif, dapat dikelompokkan.

Frekuensi Kelas adalah banyaknya observasi dalam kumpulan data yang

masuk pada kelas tertentu.

Frekuensi Relatif Kelas adalah frekuensi kelas dibagi dengan banyaknya

observasi; yang dirumuskan:

Frekuensi Relatif =

Dengan n adalah banyaknya observasi.

Penggambaran data kualitatif dapat dilakukan dengan 2 cara, yaitu pie

chart dan bar graph. Di bawah ini adalah contoh penggambaran data kualitatif

dengan pie chart dan bar graph untuk hasil studi aphasia yang dimuat dalam

Journal of Communication Disorder (Mar. 1995).

Tabel 2.1. 22 orang dewasa yang menderita aphasia dan jenisnya

Subyek Jenis Aphasia

1 Broca

2 Anomic

3 Anomic

4 Conduction

5 Broca

6 Conduction

7 Conduction

8 Anomic

9 Conduction

10 Anomic

11 Conduction

12 Broca

13 Anomic

14 Broca

15 Anomic

16 Anomic

17 Anomic

18 Anomic

19 Broca

20 Anomic

21 Conduction

22 Anomic

Tabel 2.2. Rangkuman data 22 orang penderita aphasia

KelasTipe Aphasia

Frekuensi Banyak Subject

Frekuensi Relatif Proporsi

Broca 5 0.227Conduction 7 0.318

Anomic 10 0.455Total 22 1.000

Penggambaran dengan pie chart:

Gambar 2.1. Penggambaran data dengan pie chart

Penggambaran dengan bar graph:

Anomic Broca Conduction

Gambar 2.2. Penggambaran data dengan bar graph

Conduction(0.318)

Anomic(0.455)

Broca(0.227)

10

5

2.2 Penggambaran Data Kuantitatif

Data kuantitatif dapat digambarkan dengan 3 metode, yaitu:

1. Metode dot-plot

2. Metode stem-leaf (batang daun)

3. Histogram atau distribusi frekuensi

Contoh 1.1

Penggambaran data peringkat 100 mobil dalam hal pemakaian bahan baker

(dalam mpg = mile per gallon) menurut EPA (Environmental Protection Agency)

yang tabelnya tercantum di bawah ini adalah:

36.3 41.0 36.9 37.1 44.9 36.8 30.0 37.2 42.1 36.9

32.7 37.3 41.2 36.6 32.9 36.5 33.2 37.4 37.4 39.5

40.5 36.5 37.6 33.9 40.2 36.4 37.7 37.7 37.7 34.5

36.2 37.9 36.6 37.9 35.9 38.2 38.3 35.7 35.7 35.8

38.5 39.0 35.5 34.8 38.6 39.4 35.3 34.4 34.4 39.3

35.3 36.8 32.5 36.4 40.5 36.6 36.1 38.2 38.2 39.7

41.0 31.8 37.3 33.1 37.0 37.6 37.0 38.7 38.7 35.1

37.0 37.2 40.7 37.4 37.1 37.8 35.9 35.6 35.6 34.2

37.1 40.3 36.7 37.0 40.1 40.1 38.0 35.2 35.2 33.6

39.9 36.9 32.9 33.8 34.0 34.0 36.8 35.0 35.0 36.7

1. Metode dot-plot . . . . . . . .. .. …… . . .. . . . . ……… ………. .. . ……………………................ . . .

30 35 40 45

2. Metode stem-leaf (diagram batang-daun)

Frekuensi Stem Leaf

1 30 0

1 31 8

4 34 5799

6 33 126899

6 34 024588

11 35 01235667899

20 36 01233445566777888999

21 37 000011122334456677899

10 38 0122345678

8 39 00345789

7 40 0123557

3 41 002

1 42 1

0 43

1 44 9Dengan n = 100 dan unit leaf = 0.10

3. Histogram atau distribusi frekuensi

Ukuran Kelas Frekuensi Frekuensi Relatif

30.0 – 31.5 1 0.01

31.5 – 33.0 5 0.05

33.0 – 34.5 9 0.09

34.5 – 36.0 14 0.14

36.0 – 37.5 33 0.33

37.5 – 39.0 18 0.18

39.0 – 40.5 12 0.12

40.5 – 42.0 6 0.06

42.0 – 43.5 1 0.01

43.5 – 45.0 1 0.01

Total 100 1.00

Apabila banyaknya ukuran data dalam kumpulan data bertambah,

penggambaran data yang baik dapat diperoleh dengan menurunkan lebar interval

kelas. Jika interval kelas menjadi cukup kecil, maka histogram akan menjadi

kurva yang “mulus” (smooth).

Kumpulan data kecil kumpulan data lebih besar kumpulan data besar

Gambar 2.3. Gambar berbagai histogram apabila n meningkat semakin besar

2.3. Notasi Jumlahan (Sigma)

Kumpulan data kuantitatif dilambangkan dengan symbol:

X1, X2, X3, X4 ….. Xn.

Untuk menyingkat/meringkas jumlahan dengan bentuk X1 + X2 + X3 + X4 + … + =

Xn

sehingga

X1 + X2 + X3 + X4 + … + = Xn =

Berapa aturan pada notasi sigma yang mendasar adalah sebagai berikut:

FR

0 20

FR

0

FR

0 2020

Aturan 1

Jika Xi = k (suatu konstanta) maka

= X1 + X2 + X3 + X4 + … + Xn

= k + k + k + … + k = nk

Aturan 2

Jika k suatu konstanta maka,

= kX1 + kX2 + kX3 + … + kXn

= k(X1 + X2 + X3 + … Xn)

=

Aturan 3

(Xi + Yi) = (X1 + Y1) + (X2 + Y2) + ….+ (Xn + Yn)

= (X1 + X2 + + X3 + ….+ Xn) + (Y1 + Y2 + …. + Yn)

=

Contoh 2.2

1-1/3 + 1/5 + 1/7 + 1/9 + 1/11 + 1/13 + 1/15 + =

2.4. Ukuran Pusat (Sentral) dan Ukuran Penyebaran (Variabilitas)

Ukuran pusat dari kumpulan pengukuran adalah kecenderungan data

untuk mengelompok atau memusat pada nilai numeric tertentu, sedangkan ukuran

variabilitas data adalah nilai penyebaran data. Berbagai ukuran pusat yang sering

digunakan adalah:

pusat penyebaran

Gambar 2.4. Gambar ukuran pemusatan dan penyebaran data

1. Mean, yaitu jumlah pengukuran dibagi dengan banyaknya pengukuran. Mean

dirumuskan sebagai:

Dengan = mean sample dan = mean populasi

2. Median, yaitu bilangan tengah apabila data pengukuran tersebut diatur (urut

naik/turun). Median dihitung dengan cara mengurutkan data dari yang terkecil

sampai yang terbesar. Jika n ganjil, meannya adalah data yang ditengah. Jika n

genap, meannya adalah rata-rata dari dua data yang ditengah.

3. Modus, yaitu data yang paling sering muncul.

Contoh 2.3

Modus kumpulan data 8, 7, 9, 6, 8, 10, 9, 9, 5, 7 adalah 9.

Perbandingan antara letak mean dan median pada kemencengan data

dapat digambarkan sebagai berikut:

Jika data menceng ke kanan, mean lebih besar dari pada median

Med

Gambar 2.5 Gambar sekumpulan data yang menceng ke kanan

Jika data simetris, mean sama dengan median

Med

Gambar 2.6. Gambar sekumpulan data yang simetris bentuknya

Jika data menceng ke kiri, mean lebih kecil dari pada median

Med

Gambar 2.7. Gambar sekumpulan data yang menceng ke kiri

Ukuran-ukuran penyebaran (variabilitas) adalah sebagai berikut:

1. Range/jangkauan, yaitu data terbesar dikurangi data terkecil.

2. Variansi sample

atau

3. Deviasi standar sample

dimana

: variansi sample

s : deviasi standar sampel

2 : variansi populasi

: deviasi standar populasi

2.5. Interpretasi Deviasi Standar

Deviasi standar menyajikan ukuran penyebaran data dan menjawab

pertanyaan seperti “Berapa banyak ukuran data yang terletak di dalam 1 deviasi

standar terhadap mean atau data-data yang terletak antara - 2s hingga + 2s?”.

Suatu kumpulan data disebut berdistribusi bentuk “mound” apabila mean, media

dan modusnya sama.

Interpretasi deviasi standar dengan aturan Chebyshev

1. Tak ada informasi untuk data pengukuran yang terletak dalam 1 standar

deviasi terhadap mean.

2. Paling sedikit ¾ data pengukuran akan terletak dalam 2 standar deviasi

terhadap mean atau terletak dalam interval ( - 2s, + 2s).

3. Paling sedikit 8/9 data pengukuran akan terletak dalam 3 standar deviasi

terhadap mean atau terletak dalam interval ( - 3s, + s).

4. Kira-kira 99,7 % data pengukuran akan terletak dalam 3 deviasi standar

atau terletak dalam interval ( - 3s, + 3s).

2.6. Ukuran Relatif

Ukuran relative menggambarkan lokasi kuantitatif relative dasri suatu

ukuran tertentu dalam kumpulan data. Ada 2 jenis ukuran relative yaitu:

1. Persentil ke-p

Untuk sembarang n data pengukuran (yang diurutkan naik), persentil ke-p

adalah sebuah bilangan sehingga p% dari data pengukuran akan jatuh dibawah

persentil ke-p dan (100-p) % akan jatuh di atasnya.

2. Nilai z

Nilai z sampel didefinisikan sebagai

Nilai z populasi dari x didefinisikan sebagai:

Dalam skala nilai z, interpretasi deviasi standar adalah sebagai berikut:

1. Kurang lebih 68% data akan mempunyai nilai z terletak antara -1 dan 1.

2. Kurang lebih 95% data akan mempunyai nilai z terletak antara -2 dan 2.

3. Kurang lebih 99,7% data akan mempunyai nilai z terletak antara -3 dan 3.

2.7. Outliers

Outliers adalah hasil observasi (data pengukuran) dalam suatu kumpulan

data yang nilainya sangat berbeda jika dibandingkan dengan sekumpulan data dari

pengukuran lain. Penyebab outlier ada 3 macam, yaitu:

1. Data pengukuran tidak dicatat dan dimasukkan dalam computer dengan benar

2. Data pengukuran berasal dari populasi lain

3. Data pengukuran benar, tapi mewakili peristiwa (keadaan) yang jarang terjadi.

Beberapa istilah yang digunakan:

Kuartil Bawah (QL), yaitu persentil ke-25

Kuartil Tengah, yean mean

Kuartil Atas (QU), yaitu persentil ke-75

Jangkauan interkuartil (interquartil range) yang sering disingkat dengan

JIQ, yaitujarak antara Kuartil Atas dan Kuartil Bawah dan mempunyai rumus:

JIQ = QU – QL

Range atau jangkauan, yang sering pula disebut rentang.

Aturan untuk mendeteksi adanya outliers:

1. Melalui boxplot

Observasi yang berada antara pagar dalam dan pagar luar “diduga outliers”,

sedangkan observasi yang berada di luar pagar luar diduga keras “outliers”.

Observasi yang berada pada garis whiskers disebut “ekstrim”

Pagar luar bawah = QL – 3 (JIQ)

Pagar luar bawah = QL – 1,5 (JIQ)

Pagar luar bawah = QU + 3 (JIQ)

Pagar luar bawah = QU – 1,5 (JIQ)

Kedua pagar di atas adalah garis imajiner yang tidak ditahan. Nilai observasi

yang terletak di luar pagar dalam bawah (PDB) dan pagar dalam atas (PDA)

adalah “outliers potensial”. Nilai observasi yang terletak di luar (pagar luar

bawah) PLB dan PLA (pagar luar atas) adalah “outliers”.

45

40

35

30

Gambar 2.8: Gambar boxplot

Pada gambar di atas terdapat 2 buah outliers yang diberi tanda bintang (*).

Contoh 2.4.

Untuk data dengan QL = 35,5 dan QU = 38,5 serta mean = 37, nilai JIQ adalah

38,5 – 35,5 = 3. Berdasarkan gambar boxpot dapat diperoleh:

Pagar dalam abawah (PDB) = QL – 1,5 (JIQ) = 35,5 – 1,5 (3,0) = 31,0

Pagar dalam atas (PDA) = QU + 1,5 (JIQ) = 38,5 + 1,5 (3,0) = 43,0

2. Melalui nilai z

Gambar boxplot:

Box

QU

Median

QL

Pagar dalam atas

Pagar dalam

bawah

Pagar luar bawah

Pagar luar atas *

Observasi yang nilai mutlaknya lebih dari 3 disebut outliers. Untuk data yang

sangat menceng, nilai mutlak lebih dari 1 dapat disebut outliers.

2.8 Penggambaran Relasi 2 Variabel

Cara untuk menggambarkan relasi antara 2 variabel kuantitatif yang ada

disebut relasi n bivariate adalah dengan menggambar data dalam “scattergram

(scatterplot)”

Relasi positif Relasi negative Tidak ada relasi

Gambar 2.9. Tigas jenis relasi bivariate

2.9 Ukuran Data Berkelompok

Apabila n data observasi terkelompok menjadi k kelas interval maka dapat

digunakan rumus-rumus berikut ini:

1. Mean

dengan

adalah frekuensi kelas ke-i

adalah titik tengah kelas ke-I dan k adalah banyak kelas

Var 2

Var 1

Var 2

Var 1

Var 2

Var 1

2. Median

Modus =

Lmod = batas bawah interval kelas Modus

a = selisih antara frekuensi interval Modus dengan frekuensi interval

kelas sebelumnya.

b = selisih antara frekuensi interval Modus dengan frekuensi interval

kelas sesudahnya

c = lebar interval kelas

4. Variansi

atau

fi = frekuensi interval kelas ke-i

xi = adalah titik tengah interval kelas ke-i

= adalah mean

k = adalah banyak interval kelas

n = adalah banyak data observasi

4. Koefisien Variasi (KV)

Rumusnya adalah:

Koefisien variasi sering digunakan untuk menunjukkan ketidak pastian

relative dari distribusi dengan mean yang berbeda.

5. Ukuran Kemencengan (Km)

Mean – Modus 3(Mean –Modus) Km = atau Km =

deviasi standar deviasi standar

Jika:

Km > 0 maka distribusi data menceng ke kanan

Km > 0 maka distribusi data simetris

Km > 0 maka distribusi data menceng ke kiri

Soal-soal Bab 2

1. Diberikan data golongan darah 50 orang mahasiswa sebagai berikut:

1 A 11 A 21 A 31 O 41 A

2 B 12 A 22 O 32 A 42 A

3 O 13 A 23 B 33 B 43 A

4 AB 14 B 24 A 34 O 44 B

5 O 15 B 25 O 35 AB 45 B

6 AB 16 A 26 B 36 O 46 O

7 O 17 B 27 AB 37 A 47 O

8 AB 18 O 28 A 38 B 48 O

9 A 19 O 29 B 39 B 49 B

10 B 20 O 30 O 40 B 50 AGambarkan bar-graph dan pie-chart dari data di atas !

2. Dipunyai 2 sampel data sebagai berikut:

Sampel 1 Sampel 2121173157165170161142

171184185172159187166

158163145196172100171

171168190140172199167

152169183173174151170

170171185206169180188

a. Gambarkan diagram boxplot dari data di atas !

b. Dengan menggunakan informasi yang ada pada gambar boxplot, jelaskan

kesamaan dan perbedaan pada dua himpunan data tersebut !

c. Carilah outlier dari dua kumpulan data tersebut jika ada !

3. Data di bawah ini menunjukkan jarak dari tempat kediaman pekerja menuju

tempat pekerjaan mereka (diukur dalam mil):

3,5 2,0 4,0 2,5 0,3 1,0 12,0 17,5 3,0 3,5 6,5 7,0 9,0

3,0 2,4 2,7 4,0 9,0 16,0 3,5 0,5 2,5 1,0 0,7 1,5 1,4

12,0 9,2 8,3 4,0 2,0 1,0 3,0 7,5 3,2 2,0 1,0 3,5 3,6

1,9 2,0 3,0 1,5 0,4 2,0 3,0 6,4 11,0 2,5

a. Gambarkan diagram batang-daun (stem-leaf) dari sekumpulan data

tersebut !

b. Tentukan histogram dan distribusi frekuensi dari data di atas !

c. Dari histogram yang telah anda buat, hitunglah mean, median, modus dan

kemencengan kumpulan data tersebut (gunakan rumus untuk data

terkelompok) !

d. Apabila suatu data mempunyai nilai x = 3,6 mil, berapakah nilai z-nya ?

e. Berapa persen data yang terletak pada selang ( - s, + s), ( - 2s, +

2s) dan ( - 3s, + 3s) !

4. Polisi jalan raya mencatat kecepatan 40 mobil di suatu tempat pada jalan raya

dan mendapatkan data sebagai berikut (dalam mil/jam):

68 72 62 75 81 64 81 66

65 68 70 70 69 73 72 75

71 70 80 74 62 59 81 69

66 88 66 65 65 77 70 65

64 77 68 70 72 66 73 68

a. Tentukan gambar diagram Boxplotnya !

b. Gambarkan histogram dari data di atas melalui distribusi frekuensinya

c. Dari data terkelompok tersebut (distribusi frekuensi) maka, hitunglah

mean, median, modus dan kemencengan data.