Author
vutruc
View
252
Download
6
Embed Size (px)
1
GE3143
Statistik Deskriptif
2
Pengenalan
Statistik adalah teknik dan kaedah untuk
penyelidik mengumpul, mengelas, meringkas, menyusun, menganalisis dan menginterpretasi data kuantitatif.
3
Jenis statistik
Statistik deskriptif Memerihalkan ciri sesuatu sampel Merumuskan dan menyusun bilangan data
yang banyak.
Statistik inferensi Satu kaedah untuk membuat keputusan atau
penganggaran mengenai populasi berdasarkan keputusan yg didapati drp sampel.
4
Istilah dan Simbol Statistik
Populasi- Semua ahli dalam sesuatu kumpulan yang mempunyai ciri yang mendefinasikan populasi kajian
Sampel- satu subset atau pewakilan daripada populasi yang dipilih untuk kajian
Subjek- individu dalam sesuatu sampel
Parameter (nilai yang digunakan untuk menerangkan populasi) (µ, σ2)
Statistik (nilai yang digunakan untuk menerangkan sampel)
( X , s)
5
Contoh
Populasi Sampel Statistik deskriptif
Statistik inferensi
100,000 pelajar ting. 3 menduduki ujian matematk PMR
Pengkaji memilih secara rawak skor/ markah 1000 pelajar
Guna untuk memerihalkan sampel – X (min) dan s (sisihan piawai)
Berdasarkan statstik deskriptif digunakan untuk mengganggar skor untuk populasi 100,000 pelajar µ (min) dan σ2 (sisihan piawai)
6 GB6023 6
Fikir dan buat Nyatakan apakah populasi, sampel dan
pembolehubah bagi pernyataan kajian di bawah:
Satu kajian dijalankan untuk
mengetahui tahap pengetahuan ICT bagi pelajar-pelajar sekolah rendah di Selangor.
7
Pengkelasan data
Tiga cara: Cara data diwakil
Kuantitatif (boleh diukur dan wujud dalam skala nombor) Kualitatif (tidak boleh diukur dalam skala nombor)
Bentuk Diskrit (mempunyai sukatan data tertentu- cth: bilangan
komputer) Selanjar (mempunyai sukatan yang berterusan cth:
ketinggain sesuatu bangunan)
Tahap ukuran
8
Skala Pengukuran
Nominal: data boleh dikategorikan mempunyai nama atau label tertentu cth., jantina, bangsa, jawapan ya/tidak.
Ordinal: data yang boleh disusun ikut tertib tetapi perbezaan nilai tidak memberi makna cth., pengetahuan komputer pelajar dikelaskan kepada cemerlang, baik
dan sederhana. Interval: data yang boleh disusun ikut tertib dan perbezaan nilai data
adalah bermakna,nilai sifar memberi nilai kuantiti dan bukannya tiada kuantiti. cth., skor ujian, ujian IQ, suhu
Ratio: data yang boleh disusun ikut tertib dan perbezaan nilai data adalah bermakna, dan nilai sifar menunjukkan tiada kuantiti e.g., umur, halaju kereta.
9
Jenis Analisis Deskriptif
Analisis univariate—memerihalkan data mengenai sesuatu pembolehubah selalunya pembolehubah bersandar.
Analisis Bivariate—mencari korelasi antara pembolehubah, membanding kumpulan atau mencari mencari pembezaan antara kumpulan
10
Dua cara pemerihalan
Dengan menyusun data melalui jadual dan graf
Dengan mendapatkan ukuran berbentuk numerik bagi data
11
Taburan frekuensi
Students by Region of the United States
679 44.8415 27.4423 27.9
North EastSouth EastWest
Frequency Percent
12
Plot Stem-and-Leaf
Stem ditunjukkan pada lajur menegak dan ia mewakili digit pertama di sesuatu skor.
Leaf mewakili digit yang terakhir yang terdapat pada stem.
Age of Students 2 335678889 3 01224445555699 4 22445566678 5 1244589
13
Histogram
Mewakili data dalam dua dimensi di mana nilai frekuensi adalah pada paksi y dan maklumat mengenai pembolehubah bersandar (skor) adalah pada paksi x
Highest Year School Completed, Mother
20.017.515.012.510.07.55.02.50.0
600
500
400
300
200
100
0
Std. Dev = 3.46
Mean = 10.8
N = 1233.00
14
Carta Bar
Mewakili data dalam bentuk dimensi dan sesuai untuk data berbentuk nominal, iaitu frekuensi diwakili pada paksi y dan kategori diwakili oleh paksi x.
Is Life Exciting or Dull
DullRoutineExcitingMissing
Cou
nt
600
500
400
300
200
100
0
15
Poligon frekuensi
Menggmbarkan data seperti histogram. Titik tengah di setiap bar pada histogram dikenalpasti dan disambungkan dengan satu garisan. Highest Year of School Completed
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
0
Missing
Cou
nt
500
400
300
200
100
0
16
Carta Pie- mewakili % frekuensi 100%- 360 darjah 1%- 3.6 darjah
Sudut ditentukan melalui: Frekuensi relatif
(frekuensi/jumlah responden x 360 darjah)
1st Qtr 2nd Qtr
3rd Qtr 4th Qtr
17
Ukuran numerik statistik deskriptif
Untuk merumuskan taburan frekuensi atau sekumpulan data dengan satu ukuran (nilai)
Ukuran Kecenderungan Memusat- keadaan purata atau indeks kepusatan sesuatu taburan data
Terdapat tiga jenis ukuran: 1. Min 2. Median 3. Mod
18
Min
Nilai purata bagi suatu kumpulan Dikirakan dengan menjumlahkan semua
data dibahagikan dengan bilangan data Simbol by x atau M
19
GB6023 19
Min
N
N...21
Nμpopulasi, min
χχχ
χ
+++=
∑=
n
n...21
sampel, min
χχχ
χχ
+++=
∑=
n
20
GB6023 20
Min
Contoh: Markah ujian statistik bagi 10 pelajar adalah seperti berikut.
Dapatkan min markah ujian statistik. 75.60 52.40 85.00 43.00 72.00
70.00 60.00 81.50 51.00 49.00
95.6310
00.4900.5150.8100.6000.7000.7200.4300.8540.5260.75
,
=
+++++++++=
∑=
NMin
χµ
21
Median
Bacaan data yang wujud di tengah-tengah apabila data disusun dalam tertib menarik atau menurun.
Simbol Mdn atau X Jika bilangan data ganjil, median- data di
tengah-tengah Jika bilangan data genap, median= purata
dua data di tengah-tengah
22
22
Median
Contoh: Berikut merupakan markah ujian statistik bagi 9
orang pelajar. 69 57 61 53 70 67 59 65 70
23
Median
Contoh: Susun data secara meningkat.
53 57 59 61 65 67 69 70 70
Data di tengah2
∴Median, adalah 65 ~
χ
24
Mod
• Bilangan skor yang mempunyai kekerapan terbanyak didalam satu set data/taburan
• Diperolehi daripada melihat taburan sahaja • Terdapat tiada mod/ lebih daripada satu mod • Jarang digunakan
25
25
Mod
Contoh: Berikut merupakan markah ujian statistik bagi 20 orang
pelajar.
33 25 33 75 8475 65 57 84 7061 53 38 70 8169 70 71 59 67
26
Mod
Contoh: Susun data secara meningkat
25 33 33 38 53 57 59 61 65 67 69 70 70 70 71 75 75 81 84 84
Kekerapan paling tinggi
∴Mod, adalah 70 ∧
χ
27
Perbandingan di antara min, median dan mod
Kesesuaian
Skala pengukuran
Min
Median
Mod
Nominal
tidak
tidak
ya
Ordinal
tidak
ya
ya
Interval
ya
ya
ya
Ratio
ya
ya
ya
28
LATIHAN Kriteria yg diberikan di bawah merujuk
kepada uku. kecenderungan memusat yang mana?
Paling boleh dipercayai Paling kurang dipercayai Mudah dipengaruhi oleh sesuatu
nilai dalam cerapan Boleh dianggarkan secara langsung
drp taburan data Boleh dianggarkan secara langsung
drp histogram
29
29
Hubungan di antara Min, Mod dan Median
Pembolehubah
Min = Median = Mod
Bentuk Simetri
30
30
Bentuk Terpencong Ke Kanan
Pembolehubah
Fre
kuen
si
Median
Mod Min
31
31
Bentuk Terpencong Ke Kiri
Pembolehubah
Fre
kuen
si
Mod
Median
Min
32
33
33
LATIHAN
Jika kebanyakan drp pelajar dlm kelas anda tidak mengulangkaji dengan baik topik yang anda ajarkan, skor ujian yang bakal diberikan nanti akan cenderung untuk bertabur:
- secara NORMAL? - secara TERPENCONG POSITIF? - secara TERPENCONG NEGATIF?
34
Serakan
Ukuran memusat tidak dapat menggambarkan perbezaan antara suatu skor dengan skor yang lain
Perlu lapur juga ukuran serakan untuk menggambarkan keadaaan kepelbagaian atau keseragaman
35
Contoh
Kedua-dua taburan skor set di bawah mempunyai nilai min yang sama ( = 50), tetapi taburan skor set 2 adalah lebih terserak. Taburan skor untuk set 1: 48 49 49 50 50 50 51
51 52 (serakan rendah) Taburan skor untuk set 2: 10 30 30 50 50 50 70
70 90 (serakan tinggi)
36
Jenis ukuran serakan
Julat Varians Sisihan Piawai
37
Julat
Julat= Skor mak- skor min Kurang sesuai untuk mengukur serakan
data kerana ia hanya mengambil kira niala minima dan nilai maksima saja
38
GB6023 38
Julat
Contoh: 44 49 50 58 58 60 61 68 70 72
Julat = data maksimum – data minimum = 72 – 44 =28
39
SISIHAN PIAWAI & VARIANS
Sisihan piawai adalah pengukuran yang paling sesuai digunakan untuk mengukur serakan data
Sisihan piawai yang diperolehi memberikan nilai bagi kedudukan data yang bertabur sekitar min
Nilai sisihan piawai yang tinggi memberikan gambaran bahawa data itu tertabur jauh daripada min (kurang padat)
xx
x
40
Sisihan piawai
Simbol adalah SD, Ã , or s Sisihan piawai sering digunakan dengan
mengaitkannya Antara sisihan piawai dan taburan normal
41
Taburan normal Satu poligon frekuensi yang garisannya telah
dilatarkan
42
Ciri Taburan Normal
Unimodal Simetrikal(samaukur) Min=Median=mod Lengkuk akan menghampiri paksi x
apabila skor menjauhi min tetapi tidak akan mencecah paksi x
43
Kaitan antara Luas di bawah taburan normal dan sisihan piawai
Jumlah luas di bawah taburan normal mewakili semua skor dalam taburan tersebut
68% skor adalah antara MIN + 1s 95% skor adalah antara MIN + 2s 99.7% skor adalah antara MIN + 3s
44
45
Peratus berkaitan dengan luas di bawah taburan juga boleh ditulis dalam bentuk perpuluhan 84.13%= 0.8413
Jika dalam bentuk perpuluhan, merujuk kepada konsep Kebarangkalian atau bahagian (pecahan) luas kawasan (proportion of area) 84.13% skor adalah dibawah nilai 115 Kebarangkalian untuk memilih skor dibawah nilai
115 ialah 0.8413 Bahagian (pecahan) luas kawasan dibawah nilai
115 ialah 0.8413
46
STATISTIK KORELASI
xx
x
Mengambarkan kekuatan hubungan di antara dua pembolehubah:
Contohnya: hubungan antara sikap pelajar terhadap matapelajaran dengan pencapaian pelajar dalam matapelajaran tersebut
Kekuatan hubungan diringkaskan dengan nilai r (pekali korelasi).
Nilai r adalah dalam julat +1 dan –1.00
Tanda + @ - menunjukkan arah hubungan
Nilai menggambarkan kekuatan hubungan
47
STATISTIK KORELASI
xx
x
Seandainya pembolehubah yang ingin dihubungkan adalah bersifat interval, maka korelasi Pearson digunakan.
Sebaliknya, jika data adalah bersifat nominal/ordinal maka, korelasi Spearman digunakan
48
Terima Kasih
Sila hantar jawapan anda