36
Nama: Analisis Statistika (STK511) SKS : 3 (2-2) Referensi: 1. Mattjik, A.A dan I M Sumertajaya. 2002. Perancangan Percobaan dengan Aplikasi SAS dan Minitab, Jilid I. IPB Press. Bogor. 2. Montgomery, D.C. 1991. Design and Analysis of Experiments, 3rd ed. John Wiley & Sons, Inc. Singapore. 3. Steel, R.G.D., J.H. Torrie and D.A Dickey. 1997. Principles and Procedures of Statistics a Biometrical Approach, 3nd ed. McGraw-Hill, Inc. Singapore. 4. Aunuddin. 2005. STATISTIKA: Perancangan dan Analisis Data. IPB Press. Bogor Penilaian : UTS, UAS, Tugas, Praktikum

SKS : 3 (2-2) Referensi - · PDF file- Diagram Dahan Daun (Stem-and-Leaf Display) - Diagram Kotak Garis (Box-Plot) Analisis Eksplorasi Data. Contoh data: Analisis Eksplorasi Data Stem-and-leaf

  • Upload
    lethuy

  • View
    216

  • Download
    1

Embed Size (px)

Citation preview

Nama: Analisis Statistika (STK511)

SKS : 3 (2-2)

Referensi:1. Mattjik, A.A dan I M Sumertajaya. 2002. Perancangan Percobaan

dengan Aplikasi SAS dan Minitab, Jilid I. IPB Press. Bogor.

2. Montgomery, D.C. 1991. Design and Analysis of Experiments, 3rd ed. John Wiley & Sons, Inc. Singapore.

3. Steel, R.G.D., J.H. Torrie and D.A Dickey. 1997. Principles and Procedures of Statistics a Biometrical Approach, 3nd ed. McGraw-Hill, Inc. Singapore.

4. Aunuddin. 2005. STATISTIKA: Perancangan dan Analisis Data. IPB Press. Bogor

Penilaian : UTS, UAS, Tugas, Praktikum

PENDAHULUAN

• Apa itu statistika? • Statistika berasal dari kata statistik

penduga parameter• Ilmu yang mempelajari dan

mengusahakan agar data menjadi informasi yang bermakna

StatistikaPopulasi

Contoh

Sampling Pendugaan

Tingkat Keyakinan

Ilmu PeluangStatistika Deskriptif

vs Statistika Inferensia

Deskriptif

StatistikaPopulasi : Keseluruhan pengamatan yang menjadi pusat perhatian

kita

Contoh : Himpunan bagian dari populasi (mewakili)

Parameter : Karakteristik numerik dari populasi

Statistik : Karakteristik numerik dari contoh

Peubah / Variabel : Ciri dari objek yang diamati

Data : ?

Skala pengukuran : Nominal, Ordinal, Interval, Rasio

Peubah: Kualitatif vs Kuantitatif, Diskret vs Kontinu

Pengumpulan Data: Harus dibangkitkan dulu Percobaan Langsung dikumpulkan Survei/Observasi

Analisis Eksplorasi DataEksplorasi Upaya untuk melihat ke dalam data guna mengungkap

informasi yang terkandung dalam data tersebut

manipulasi, penyarian/perangkuman, peragaan

Peragaan : tabel & grafik (histogram, diagram batang, diagram lingkaran/pie chart, plot, dll.)

Penyarian: ukuran pemusatan (mean, median, modus, quartil), ukuran penyebaran (ragam, standard deviasi, range, jarak antar kuartil)

0102030405060708090

Tw-1 Tw-2 Tw-3 Tw-4

JabarJatimLampung

79%

21%

Laki-Laki Perempuan

400500600700800900

1000

20 40 60 80 100 120Jarak (1000 Km)

Em

isi H

c (p

pm)

Analisis Eksplorasi Data

Contoh: a. 3 9 7 4 10 3 b. 4 9 3 8 6

Mean rataan atau rata-rata Populasi Contoh

Median nilai yang membagi pengamatan menjadi dua bagian yang sama besar (50% < median, 50% > median)

Quartil nilai yang membagi pengamatan menjadi empat bagian yang sama besar (Q1 : 25% < Q1 & 75% > Q1, Q2=median, Q3 : 75% < Q3 & 25% > Q3)

Modus nilai yang paling sering muncul

⎥⎦⎤

⎢⎣⎡ +=

21nx ~x

⎥⎦⎤

⎢⎣⎡ +

=)1(

411 x

nQ

⎥⎦⎤

⎢⎣⎡ +

=)1(

433 x

nQ

∑=

=N

1i

i

Nx μ ∑

=

=n

1i

i

nx x

Ragam : Populasi Contoh

Standard Deviasi akar kuadrat dari ragam: Pop=σ , Contoh=s

Range atau Wilayah Selisih nilai terbesar dengan terkecilR = X[n] – X[1]

Jarak Antar Kuartil Selisih antara Q3 dengan Q1 (JAK=Q3-Q1)

Analisis Eksplorasi Data

∑=

−=

N

i N1

2i2 )(x μσ ∑

= −−

=n

i nxs

1

2i2

1)(x

2σσ = 2ss=

Contoh Data KaryawanNo Sex Tinggi Berat Agama

1 1 167 63 Islam

2 1 172 74 Islam

3 0 161 53 Kristen

4 0 157 47 Hindu

5 1 165 58 Islam

6 0 167 60 Islam

7 1 162 52 Budha

8 0 151 45 Katholik

9 0 158 54 Kristen

10 1 162 63 Islam

11 1 176 82 Islam

12 1 167 69 Islam

13 0 163 57 Kristen

14 0 158 60 Islam

15 1 164 58 Katholik

16 0 161 50 Islam

17 1 159 61 Kristen

18 1 163 65 Islam

19 1 165 62 Islam

20 0 169 59 Islam

21 1 173 70 Islam

Rekapitulasi menurut Sex

Sex Frek. Persen

Laki-laki 12 57.14

Perempuan 9 42.86

Rata-rata Tinggi & Berat

Tinggi Berat

Laki-laki 166.25 64.75

Perempuan 160.56 53.89

Gabungan 163.81 60.10

57%

43%

Laki-laki

Perempuan

61%19%

10%5% 5%

Islam Kristen Katholik Hindu Budha0.00

50.00

100.00

150.00

200.00

Tinggi Berat

Laki-laki

Perempuan

Penyajian Tabel

Penyajian Grafik

Rekapitulasi menurut Agama

Agama Frekuensi Persen

Islam 13 61.90

Kristen 4 19.05

Katholik 2 9.52

Hindu 1 4.76

Budha 1 4.76

Penyajian dengan: - Diagram Dahan Daun (Stem-and-Leaf Display) - Diagram Kotak Garis (Box-Plot)

Analisis Eksplorasi Data

Contoh data:

Analisis Eksplorasi Data

Stem-and-leaf of Contoh3 N = 23

Leaf Unit = 1.0

1 0 3

3 0 45

5 0 77

8 0 899

(4) 1 0011

11 1 223

8 1 4455

4 1 67

2 1 8

1 2

1 2

1 2

1 2 7

Stem-and-Leaf Display

Stem-and-leaf of Contoh1 N = 20

Leaf Unit = 1.0

1 2 5

4 3 579

7 4 138

(4) 5 0445

9 6 5569

5 7 36

3 8 12

1 9 3

Stem-and-leaf of Contoh2 N = 24

Leaf Unit = 1.0

3 0 899

7 1 0223

(6) 1 566779

11 2 01344

6 2 689

3 3 1

2 3 8

1 4

1 4

1 5 3

Analisis Eksplorasi DataBoxplot

Langkah Pembuatan Boxp-Plot:

1. Tentukan: nilai terkecil, nilai terbesar, Q1, Median, Q3

2. Lakukan identifikasi pencilan:

dekat: x < Q1 – 3/2 d atau x > Q3 + 3/2 d & jauh: x < Q1 – 3d atau x > Q3 + 3d

3. Gambar !

Peluang• Bagaimana membuktikan bahwa sebuah dadu setimbang?

• Empiris Peluang = frekuensi relatif

• Contoh:

• Satu mata uang setimbang dilempar sekaliRC = {M, B}P({M})=1/2 dan P({B})=1/2

• Satu mata uang setimbang dilempar 3 kaliRC = {BBB,BBM,BMB,MBB,BMM,MBM,MMB,MMM}P({MMM})=1/8 ; P({BBB})=1/8 ; P({BMB})=1/8X = Jumlah sisi muka yang muncul (X disebut peubah acak)

Peluang

P(X=0) = P({BBB}) = 1/8P(X=1) = P({BBM,BMB,MBB}) = 3/8P(X=2) = P({BMM,MBM,MMB}) = 3/8P(X=3) = P({MMM}) = 1/8

Sebaran Binom(n,p) sebaran Binom dengan parameter n dan p(sebaran peluang diskret)

n0,1,2,..., ; )1()( =−⎟⎟⎠

⎞⎜⎜⎝

⎛== − xpp

xn

xXP xnx

Peubah Acak fungsi yang memetakan anggota gugus RC ke gugus bilangan nyata

Nilai Harapan & Ragam Peubah Acak XNilai Harapan & Ragam : Sebaran Binom(n,p)

,...,nixPxXE i

n

iix 0 ; )()(

0=== ∑

=

μ

222 )()( XEXEx −=σ

,...,nixPxXE i

n

ii 0 ; )()(

0

22 ==∑=

X 0 1 2 3P(X) 0.125 0.375 0.375 0.125

E(X) = 1.5

σ2 = 0.75

Khusus pada sebaran Binom(n,p) :

E(X) = μ = np dan σ2 = np(1-p)

Contoh: n=3 & p=0.5

Peluang Kontinu

4 0 ; 41)( ≤≤= xxf

Sebaran Seragam kontinu

P(X=3) = 0 pada sebaran kontinu, peluang pada satu titik =0

43

40

43|

441)()3(

3

0

3

0

3

=−====< ∫∫∞−

xdxdxxfXP

41

42

43|

441)()32(

3

2

3

2

3

2

=−====≤< ∫∫xdxdxxfXP

dxxxfXE x ∫∞

∞−

== )()( μNilai harapan

Peluang Normal

- ; 21),;(

2

21

2 ∞<<∞=⎟⎠⎞

⎜⎝⎛ −

−xexf

xσμ

σπσμ

Sebaran Normal

(fungsi peluang kontinu)

) ,N( ~ X 2σμ

Contoh: Berat ikan di suatu danau mengikuti pola sebaran normal dengan rataan 400g dan standard deviasi 100g. Jika diambil satu ikan secara acak, berapa peluang mendapatkan ikan yang beratnya lebih dari 500g?

)1 ,0N( ~ Z -Xσμ

=ZTabel-Z

1587.0)1(100

400500)500( =>=⎟⎠⎞

⎜⎝⎛ −

>=> ZPZPXP

Peluang Normal, Z, t, χ2, F Jika X~N(μ, σ2) ~N(μ, σ2/n)

Bagaimana jika sebaran pop tdk normal Dalil Limit Pusat

Apapun sebaran populasinya, ~N(μ, σ2/n) dengan n ∞

Jika σ2 tidak diketahui, maka sebaran Normal (Z) sebaran t

Peubah acak Z2 sebaran χ2 (Khi-kuadrat)

Rasio dari p.a. sebaran χ2 sebaran F

Penggunaan:Sebaran Z menguji μ jika σ2 diketahuiSebaran t menguji μ jika σ2 tidak diketahuiSebaran χ2 menguji ragam (σ2)Sebaran F Rasio dua ragam

x

x

Metode SamplingTujuan Utama:Mendapatkan sampel yang mencerminkan populasi

dapat digunakan untuk menduga populasi

Metode Sampling Probability vs Non Probability Sampling

Masalah utama dalam sampling:1. Menentukan metode sampling yang sesuai

2. Menentukan ukuran sampel yang mewakili populasi(dengan tingkat ketelitian yang diinginkan dan segala kendala yang ada)

Metode SamplingProbability SamplingMetode Sampling yang berbasis pada pemilihan secara acak

Acak setiap unit memiliki peluang yang sama untuk terpilih

Butuh kerangka contoh (daftar seluruh unit atau anggota populasi)

Beberapa definisi:

N = banyaknya objek dalam kerangka contoh (sampling frame)

n = banyaknya objek dalam contoh

f = n/N = fraksi contoh

Metode SamplingBeberapa Metode (Probability Sampling)• Penarikan Contoh Acak Sederhana (Simple Random Sampling)

• Penarikan Contoh Acak Berlapis (Stratified Random Sampling)

• Penarikan Contoh Sistematis (Systematic Random Sampling)

• Penarikan Contoh Gerombol (Cluster Random Sampling)

• Penarikan Contoh Bertahap (Multi-Stage Sampling)

Error Sampling Error vs Non Sampling Error

Metode SamplingUkuran contoh optimum (n)

n = f(ragam, ukuran populasi, ketelitian yang diinginkan, biaya, waktu, resiko)

Ukuran contoh yang diperlukan untuk menduga μ dengan batas error pendugaan sebesar B adalah:

Ukuran contoh yang diperlukan untuk menduga P dengan batas error pendugaan sebesar B adalah:

4B Ddengan ,

)1(

2

2

2

=+−

σDN

Nn

)1()1()1(

ppDNpNpn

−+−−

=

222

22

)1( ε−+=

NVzNVzn

222

2

)1()1()1(

pNppzpNpzn

ε−+−−

=

Z=1.96 dengan SK 95%, V=Std relatif thd mean, ε=batas kesalahan yang diinginkan (% thd mean)

Metode SamplingContoh Penentuan ukuran contoh optimum (n)

Tentukan ukuran contoh optimum untuk menduga rata-rata produksi petambak jika diketahui N=10000 dan range produksi petambak antara 10-20 ton, dan batas error yang diinginkan B=1 ton.

2594.245.2

41*)110000(

5.2*100002

2

2

≅=+−

=n

Tentukan ukuran contoh optimum untuk menduga proporsi (p) indukan udang yang baik jika diketahui N=2000 dan diinginkan batas error B=0.05. Asumsikan proporsi awal tidak diketahui.

33447.3335.*5.

405.*)12000(

5.*5.*2000)1()1(

)1(2 ≅=+−

=−+−

−=

ppDNpNpn

5.24

104

==≈rangeσ

Metode SamplingNon Probability Sampling• Pemilihan tidak dilakukan secara acak

• Generalisasi terhadap populasi agak sulit dilakukan

• Sering digunakan dalam penelitian sosial, marketing research, dll., krn Probability Sampling tidak praktis atau bahkan tidak dapat diterapkan

• Accidental/Haphazard/Convenience vs Purposive

• Purposive Model Instance Sampling, Expert Sampling, Quota Sampling, Heterogenety Sampling, Snowball Sampling

Pendugaan ParameterDugaan Titik

untuk menduga μ

s2 untuk menduga σ2

x

Dugaan SelangSelang kepercayaan (1-α)100% bagi μ

Jika σ2 diketahui:

Jika σ2 tdk diketahui:

nzx

nzx σμσ

αα22

+<<−

nstx

nstx nn )1()1( 22 −− +<<− αα μ

Dugaan SelangSelang kepercayaan (1-α)100% bagi μ1-μ2 dua contoh bebas

Jika σ1 dan σ2 tdk diketahui dan diasumsikan sama:

Pendugaan Parameter (lanjutan)

2

22

1

21

21212

22

1

21

21 22)()(

nnzxx

nnzxx σσμμσσ

αα ++−<−<+−−

⎟⎟⎠

⎞⎜⎜⎝

⎛++−<−<⎟⎟

⎞⎜⎜⎝

⎛+−−

21

2)(2121

21

2)(21

11)(11)(22 nn

stxxnn

stxx gabvgabv αα μμ

2dan 2

)1()1(21

21

222

2112 −+=

−+−+−

= nnvnn

snsnsgab

Dugaan SelangSelang kepercayaan (1-α)100% bagi μ1-μ2 dua contoh bebas

Jika σ1 dan σ2 tdk diketahui dan diasumsikan tidak sama:

Pendugaan Parameter (lanjutan)

⎟⎟⎠

⎞⎜⎜⎝

⎛++−<−<⎟⎟

⎞⎜⎜⎝

⎛+−−

2

22

1

21

)(21212

22

1

21

)(21 22)()(

ns

nstxx

ns

nstxx vv αα μμ

( ) ( )⎥⎥⎦

⎢⎢⎣

⎡−⎟

⎠⎞

⎜⎝⎛+

⎥⎥⎦

⎢⎢⎣

⎡−⎟

⎠⎞

⎜⎝⎛

⎟⎠⎞

⎜⎝⎛ +

=

11

2

2

2

22

1

2

1

21

2

2

22

1

21

nnsnn

s

ns

ns

v

Dugaan SelangBeda nilai tengah bagi contoh berpasangan: μd

Selang kepercayaan (1-α)100% bagi μd

Pendugaan Parameter (lanjutan)

nstd

nstd d

nDd

n )1()1( 22 −− +<<− αα μii

ii

d xxin

dds 21i

2

2 ddan )(

−=−

−=∑

Dugaan selang bagi proporsi: P

Ragam proporsi

Selang kepercayaan (1-α)100% bagi Pn

Ppp

)1(2 −=σ

nppzpP

nppzp )1()1(

22

−+<<

−− αα

Pengujian Hipotesis

Hipotesis Statistik: Pernyataan/dugaan mengenai parameter populasi yang ingin dibuktikan kebenarannya

H0 hipotesis nol

H1 atau Ha hipotesis satu atau hipotesis alternatif

Misalnya:

H0: μ=100 vs H1: μ=120 tunggal

H0: μ=60 vs H1: μ≠60 uji dwi arah

H0: μ=160 vs H1: μ>160 uji eka arah

H0: μ=500 vs H1: μ<500 uji eka arah

Pengujian Hipotesis

Berdasarkan data yang dikumpulkan, H1 atau H0 yang benar ?

majemuk

Pengujian Hipotesis (lanjutan)

H0 benar H1 benar

Hasil Pengujian

H0 benar Benar Salah Jenis 1 (α)

Salah Jenis 2 (β)

H1 benar

Keadaan Sebenarnya

Benar

α = Peluang menolak H0 padahal H0 benar

β = Peluang menerima H0 padahal H1 yang benar

Contoh :Suatu contoh acak berukuran 30 diambil dari populasi A. Nilai rata-rata dari 30 contoh tersebut adalah 123. Manakah yang lebih Anda percayai, ke-30 contoh tersebut berasal dari populasi A yang menyebar N(120,100) ataukah sebenarnya dari populasi B yang menyebar N(127,100)?

Peluang menyatakan H1 benar padahal H0 yang benar =

H0: μ = 120 vs H1: μ = 127

( )

0510

1.6432

3010

1201230

.

zPzP

n

xzP H

=

>=

⎟⎟⎟⎟

⎜⎜⎜⎜

⎛−

>=

⎟⎟⎟⎟

⎜⎜⎜⎜

⎛−

> σμ

Peluang menyatakan H0 benar padahal H1 yang benar =

( )

0140

-2.1909

3010

1271231

.

zPzP

n

xzP H

=

<=

⎟⎟⎟⎟

⎜⎜⎜⎜

⎛−

<=

⎟⎟⎟⎟

⎜⎜⎜⎜

⎛−

< σμ

Pengujian Hipotesis (lanjutan)

Kaidah Keputusan:

Jika p-value < α H1 benar

Jika p-value ≥ α H0 dianggap benar

α taraf nyata pengujian (kesalahan maksimum yang diperbolehkan jika memutuskan H1 benar)

P-value peluang salah jenis 1 berdasarkan data

Teladan 1:

Pada saat ini diduga terjadi kenaikan rata-rata tinggi badan orang Indonesia dibandingkan tahun 70-an. Untuk membuktikan dugaan ini diambil contoh acak berukuran 25 dan diperoleh rataan sebesar 164 cm. Ujilah apakah dugaan tersebut benar. Gunakan α=5%. (Catatan: Tinggi rata-rata tahun 70-an=161 cm, dan σ2=81 cm2).

Pengujian Hipotesis (lanjutan)

Diketahui: n=25, =164 cm ; σ2=81 cm2 ; α =5%=0.05.

H0: μ=161 cm vs H1: μ>161cm

Z tabel = Z0.05 = 1.65

P-value = P(x>x0 / μ =161) = P(Z>1.67) = 0.0475

P-value < α Tolak H0

(Memang benar sekarang ada kenaikan rata-rata tinggi orang Indonesia dibandingkan dengan tahun 70-an)

x

67.125/81

161-164 /-x

===n

μ

Z > Ztab Tolak H0

Pengujian Hipotesis (lanjutan)

Secara Umum:

Satu Nilai Tengah Populasi: H0: μ = μ0 vs H1: μ ≠ μ0

H0: μ ≤ μ0 vs H1: μ > μ0

H0: μ ≥ μ0 vs H1: μ < μ0

Dua Nilai Tengah Populasi:

Saling Bebas Berpasangan

H0: μ1= μ2 vs H1: μ1 ≠ μ2 H0: μD = 0 vs H1: μD ≠ 0

H0: μ1 ≤ μ2 vs H1: μ1> μ2 H0: μD ≤ 0 vs H1: μD > 0

H0: μ1 ≥ μ2 vs H1: μ1< μ2 H0: μD ≥ 0 vs H1: μD < 0

Pengujian Hipotesis (lanjutan)Teladan-2:

Ada dugaan kuat bahwa latar belakang petambak berpengaruh terhadap keberhasilan sebagai petambak di CP Bahari. Untuk membuktikan pendapat ini, dipilih 22 petambak contoh secara acak, dimana 11 orang berlatar belakang petambak dan 11 orang sisanya berlatar belakang bukan petambak. Jika produksi merupakan ukuran tingkat keberhasilan petambak, dan produksi terakhir dari ke-22 petambak tersebut seperti tabel di bawah ini, ujilah apakah dugaan tersebut di atas benar? (Gunakan α=5% dan asumsikan ragam produksi kedua populasi sama).

11.7 9.6 12.2 8.6 9.3 10.1 8.9 9.5 10.4 8.3 9.4Produksi dari 11 Petambak yang Berlatar Belakang Petambak

7.4 8.5 9.2 8.7 7.8 6.9 10.2 9.4 8.1 8.3 9.0Produksi dari 11 Petambak yang Berlatar Belakang Bukan Petambak

Bentuk Hipotesis ? Statistik Uji ?

⎟⎟⎠

⎞⎜⎜⎝

⎛+

−=

−=

21

2

2121

11

)()(

21

nns

xxs

xxt

gabxx

hit

H0: μ1 ≤ μ2 vs H1: μ1> μ2

Data• Data adalah bentuk jamak dari datum, berasal dari bahasa Latin yang berarti

"sesuatu yang diberikan". Dalam penggunaan sehari-hari data berarti suatu pernyataan yang diterima secara apa adanya. Pernyataan ini adalah hasil pengukuran atau pengamatan suatu variabel yang bentuknya dapat berupa angka, kata-kata, atau citra.

• Data in everyday language is a synonym for information.[1] In the exact sciences there is a clear distinction between data and information, where data is a measurement that can be disorganized and when the data becomes organized it becomes information. Data may relate to reality, or to fiction as in a fictional movie. Data about reality consists of propositions. A large class of practically important propositions are measurements or observations of a variable. Such propositions may comprise numbers, words or images.