328
8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 1/328 Bài ging môn hc PHÂN TÍCH SLIU THNG KÊ Gingviên: Ths.Dƣơng ThMai Thƣơng Bmôn: Khoa hcmáy tính – CNTT Email: [email protected] Mobile: 0945373858 1

Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

Embed Size (px)

Citation preview

Page 1: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 1/328

Bài giảng môn học

PHÂN TÍCHSỐ LIỆU THỐNG KÊGiảng viên: Ths.Dƣơng Thị Mai Thƣơng Bộ môn: Khoahọc máy tính – CNTTEmail: [email protected] Mobile: 0945373858

1

Page 2: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 2/328

MÔN HỌC TIỀN ĐỀ

• Toán caocấp • Xácsuất thống kê• Lập trìnhcăn bản

2

Page 3: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 3/328

MỤC TIÊU MÔN HỌC

• Cungcấp kiến thức cơ bản về phân tíchthống kê dữ liệu – Ước lượng

– Kiểm định – Phân tíchhồi quy vàtương quan – Phân tíchchuỗi thời gian

• Cungcấp kỹ năng sử dụng phần mềm SPSS

3

Page 4: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 4/328

YÊU CẦU & ĐÁNH GIÁ

• 100% sinh viên lênlớp và thực hành• Thực hiện chia nhómđể thảo luận, làm bàitập

lớn, tiểu luận mônhọc.

• Kết thúc môn sinh viên cóthể phân tíchthống kê số liệu dựa trên phần mềm SPSS 19.• Đánh giá:

– Chuyêncần: 10% – Giữa kỳ: 10% – Báo cáo bàitập lớn: 20% – Thi hết học phần: 60%

4

Page 5: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 5/328

TÀI LIỆU THAM KHẢO

• [1] Dang Quang A and Bui The Hong, Statistical data analysis,• www.netnam.vn/unescocourse/statistics.htm, 1999 ( Giáo trình điện tử

theo đặthàngcủa UNESCO). • [2] Bùi Thế Hồng, Giáo trình phân tích thống kê dữ liệu và SPSS for

Windows, Hà Nội, 1999. • [3] Trần Bá Nhẫn, Đinh Thái Hoàng, Lý thuyết thống kê, NXB Thố

1998.• [4] Đào Hữu Hồ, Nguyễn Văn Hữu, Hoàng Hữu Như, Thống kê toán họ

NXB ĐHQG Hà Nội, 2004. • [5] Nguyễn Văn Liệu, Nguyễn Đình Cừ, Nguyễn Quốc Anh, SPSS- ứng

dụng phân tích dữ liệu trong quản trị kinh doanh và khoa học tự nhi xã hội, NXB Giao thông vận tải, 2000.

• [6]Hoàng Trọng, Chu Nguyễn Mộng Ngọc, Phân tích dữ liệu nghiên

cứu với SPSS, NXB Hồng Đức, 2008. 5

Page 6: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 6/328

Thời gian

NỘI DUNG Nội dung

Tuần 1 Giới thiệu mônhọc, ôn tập cáckiến thức cơ bản Chƣơng 1. Phân loại dữ liệu, mã hóa,nhập liệu và một số xử lý trên biến

Lý thuyết

Tuần 2,3 Chƣơng 2. Làm sạch dữ liệu Chƣơng 3. Tómtắt và trình bàydữ liệu Lý thuyết thực hànhTuần 4 Chƣơng 4. Kiểm định mối liên hệ giữa

hai biến định tính. Lý thuyết thực hành

Tuần 5 Chƣơng 5. Phân tích liên hệ giữa biếnnguyên nhân định tính và biến kết quảđịnh lượng:Kiểm định trung bình quần thể

Lý thuyết thực hành

6

Page 7: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 7/328

7

Thời gian

NỘI DUNG Nội dung

Tuần 6 Chương 6. Phân tích liênhệ giữa biến nguyên nhânđịnh tính và biến kết quả định lượng: Phân tích phƣơng sai

Lý thuyết thực hành

Tuần 7 Kiểm tra bài 1Tuần 8 Chƣơng 7: Kiểm định phi thamsố Lý thuyết

thực hànhTuần 9 Chƣơng 8. Kiểm định tỷ lệ

Chƣơng 9. Tương quan vàhồi quytuyến tính

Lý thuyết

thực hành

Tuần 10,11, 12

Báo cáo bàitập lớn Kiểm tra bài 2Ôn Tập

Báo cáo

Page 8: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 8/328

NỘI DUNG MÔN HỌC( đọc thêm)

• Chương 10: Hồi quiBianry Logistic• Chương 11: Đánh giá độ tin cậy của thang đo • Chương 12: Phân tích nhân tố

• Chương 13: Phân tích biệt số • Chương 14: Phân tích cụm • Chương 15: Lập bản đồ nhận thức với đo lường đ

hướng và phân tích tương hợp • Chương 16: Các tiện ích

8

Page 9: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 9/328

GIỚI THIỆU PHÂN TÍCH DỮ LIỆU

• Nghiên cứu và phân tích dữ liệu 1. Xác định vấn đề cần nghiên cứu2. Thu thập dữ liệu 3. Xử lý dữ liệu 4. Phân tích dữ liệu 5. Báo cáo kết quả

9

Page 10: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 10/328

GIỚI THIỆU PHÂN TÍCH DỮ LIỆU

• Bản chất của phân tíchdữ liệu

10

Dữ liệu

Thông tin

Sự kiện

Hiểu biết, tri thức

Mức độ chính xác củamô hình thống kê

Mức độ cải thiệncủa các quyết định

Page 11: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 11/328

BẢN CHẤT CỦA PT DỮ LIỆU (cont.)

• Dữ liệutrở thànhthông tin khi nó liên quanđến vấn đề nhận thức, kết luận và quyết địncủa người nghiên cứu

• Thông tin trở thànhsự kiệnkhi thông tin hỗtrợ cho việc ra quyết định

• Sự kiệntrở thànhtri thứckhi nó được sử dụngđể hoàn tất quá trình ra quyết định một cáchthành công.

11

Page 12: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 12/328

THỐNG KÊ VÀ PHÂN TÍCH DỮ LIỆU

• Thống kê: tập hợp các phương pháp dùng đểthu thập, phân tích, trình bày và diễn giải dữliệu

• Phân tích dữ liệu: cung cấp kinh nghiệm thựchành được đúc kết để đẩy mạnh việc ứng d

tư duy thống kê và kỹ thuật thống kê nhằmhiểu rõ các hiện tượng nghiên cứu, từ đó hỗ cho việc ra quyết định

12

Page 13: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 13/328

Chƣơng 1

PHÂN LOẠI DỮ LIỆU, MÃ HÓANHẬP LIỆU VÀ MỘT SỐ XỬ LÝTRÊN BIẾN

13

Page 14: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 14/328

PHÂN LOẠI DỮ LIỆU

Dữ liệu

Dữ liệu định tính

Thang đo danh nghĩa

Thang đo thứ bậc

Dữ liệu định lượng

Thang đo khoảng cách

Thang đo tỉ lệ

14

Page 15: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 15/328

PHÂN LOẠI DỮ LIỆU (cont.)

• Dữ liệu định tính: – Phản ánh tính chất, sự hơn kém, không tính đc giá

trị trung bình của dữ liệu dạng định tính.

– Ví dụ: Nam/ Nữ, Giỏi/ Khá/ TBK/ TB/ Yếu/ Kém • Dữ liệu định lƣợng – Phản ánh mức độ, mức độ hơn kém, tính được tr

trung bình. – Ví dụ: Tuổi, Thu nhập trong tháng…

15

Page 16: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 16/328

CÁC LOẠI THANG ĐO • Thang đo danh nghĩa (phân loại) – nominal scale

– Các con số mang ý nghĩa phân loại đối tượng – Ví dụ: Vui lòng cho biết tình trạng hôn nhân của bạn?

– Chứng minh các thang đo trên là biến phân loại – Thứ tự thang đo phân loại có quan trọngko?

16

1 Độc thân2 Đang có giađình 3 Ở góa4 Ly thânhoặc ly dị

Page 17: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 17/328

CÁC LOẠI THANG ĐO

• Thang đo thứ bậc – ordinal scale – Các con số được sắp xếp theo một quy ước nào đthứ bậc hay sự hơn kém, nhưng không biết đượckhoảng cách giữa chúng?

– Ví dụ: Mức độ hài lòng của bạn về GV giảng dậy • 1. Rất hài lòng • 2. Hài lòng• 3. Bình thường • 4. Không hài lòng

– Chứng minh đây là thang đo thứ bậc? – Thang đo thứ bậc có phải là thang đo phân loại?

17

Page 18: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 18/328

CÁC LOẠI THANG ĐO

• Thang đo khoảng cách – interval scale – Là một dạng đặc biệt của thang đo thứ bậc, cho b

khoảng cách giữa các thứ bậc.

– Ví dụ: Theo bạn tầm quan trọng của việc chăm chđối với kết quả học tập? (1 = không quan trọng, 1rất quan trọng)

• Thang đo khoảng cách không có điểm 0 tuyệt đối.

– Thang đo khoảng cách hay thứ bậc cho nhiều thôntin hơn?

18

Page 19: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 19/328

CÁC LOẠI THANG ĐO

• Thang đo tỉ lệ- ration scale – Thang đo tỉ lệ = thứ tự + khoảng cách + điểm

“0” là giá trị thật

– Ví dụ:• Bạn đang có bao nhiêu tiền? • Điểm trung bình học tập của bạn đạt bao nhiêu?

19

Page 20: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 20/328

VÍ DỤ THANG ĐO

• Giá trị 0 của biến có mangnghĩa tự nhiên. – Tôihết sạch tiền – Lương tôichỉ bằng ½ sếp tôi – Dânsố Việt Namgấp 10 lần dânsố NewDilan

• Giá trị 0 không mangnghĩa tự nhiên. – 00 F làmột điểm 0 nhântạo. – 320 F = 00 C

– Nếu nói 320

F nónggấp đôi 160

F thì ko có ýnghĩa vìchúngđều đóng băng. – So sánh haivật ở 500 C ( (0+100)/2 và1220 F ((32+212)/2)đều ở điểm giữa nhiệt độ sôi vàđóng

băng. 20

Page 21: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 21/328

NGUYÊN TẮC MÃ HÓA& NHẬP LIỆU

• Xét 2 ví dụ

21

Họ tên Giới tính Tuổi Nghề nghiệp

1 Đỗ Văn An Nam 21 Sinh viên2 Lý Thu Hoa Nữ 34 Giáo viên3 Đào Thị Lê Na Nữ 56 Nghỉ hưu … n Ngô Hà Nam Nam 17 Học sinh

Các biến

N h ữ n g n g ư ờ i t r ẳ l ờ i c

â u

h ỏ i

Page 22: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 22/328

NGUYÊN TẮC MÃ HÓA &NHẬP LIỆU

• Sau khi mã hóa

22

Họ tên Giới tính Tuổi Nghề nghiệp

1 Đỗ Văn An 1 21 12 Lý Thu Hà 0 34 23 Đào Thị Lê Na 0 56 3… n Ngô Hà Nam 1 17 19

Các biến

Page 23: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 23/328

NGUYÊN TẮC MÃ HÓA & NHẬPLIỆU

• Chú ý: – Chỉ mã hóa được thang đo định tính – Mỗi cột là một biến cần khảo sát

– Mỗi hàng là thông tin của một đối tượng cần thu – Câu hỏi có nhiều khả năng trả lời? • Ví dụ: Trong vòng 5 năm vừa qua, bạn đã đi

những địa danh nào? Thái Nguyên, Hà Nội, Huế, Đà Nẵng, Sài Gòn, Khác. Biểu diễn dữ liệu trên?

23

Page 24: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 24/328

QUẦN THỂ VÀ MẪU

• Quần thể: Tập hợp các cáthể hoặc cácđối tượng màngười nghiêncứu cần quan tâm. – Quần thể loàingười

– Quần thể sinh viên – Quần thể kháchsạn 3 sao• Mẫu: Tập hợp các cáthể mà tập này cóthể coi

là đại diện của quần thể được quan sát

Page 25: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 25/328

QUẦN THỂ HỮU HẠN

• Quần thể hữu hạn: Làquần thể mà cáthể cóthể liệt kêđược – Sinh viênlớp KHMT:Quần thể hữu hạn

– DS sinh viênlớp KHMT: DSliệt kê – Dânsố Việt Nam ?

Page 26: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 26/328

QUẦN THỂ GIẢ ĐỊNH

• Ví dụ: Từ lô 1000 bóngđèn do 1 nhà máysản xuất, tiến hànhthử 1 số bóng và ghilại tuổi thọ.

– 1000 bóng làquần thể hữu hạn – Bóngđèn mangthử là mẫu – Kết quả thuđược là tuổi thọ của mẫu được thử

Page 27: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 27/328

QUẦN THỂ GIẢ ĐỊNH

– Với cùng côngnghệ như vậy tiếp tục sản xuất bóngđèn , các bóng đèn sẽ được sản xuất tạo thành quần thể giả định ( chưa sản xuất )

– Tuổi thọ của các bóng trongquần thể giả định đóng

vai trò quantrọng vàđược dự đoán trước thông qua

kết quả thử nghiệm đã có.

Page 28: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 28/328

TỔ CHỨC CÁC DỮ LIỆU PHÂN LOẠI

• Số lần xuất hiện – Dữ liệu chia thành 2 cột, 1 cột định dang của cá

được quan sát, 1 cột ghi dữ liệu quan sát được.

– Cách làm này gọi là tính số lần xuất hiệnhay tần xuất

Page 29: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 29/328

Page 30: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 30/328

SỐ LẦN XUẤT HIỆN(Tần xuất)

– Tần xuất đối với một lớp nàođó của một biến là số các quan sátrơi vào lớp này – Bảng phân bố tần xuất

Page 31: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 31/328

TẦN XUẤT (cont.)

• Các phân bố tần xuất: – Chỉ ra các cáthể phân bố như thế nào theo các

nhóm, dùng khinhấn mạnh đến biến đang được quan sát

• Các phần trăm: – Tần xuất tương đối của biến hay tỉ lệ của biến trên

tổng số các quan sát.

Page 32: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 32/328

TẦN XUẤT (cont.)

• Tần xuất tƣơng đối đối với một lớp nàođó của một biến bằng tần xuất của lớp này chiacho tổng quan sát

Page 33: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 33/328

Page 34: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 34/328

CÁC DẠNG ĐỒ THỊ TẦN XUẤT

• Đồ thị dạng thanh

Ồ Ầ Ấ

Page 35: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 35/328

CÁC DẠNG ĐỒ THỊ TẦN XUẤT(cont.)

• Đồ thị dạng cột chồng nhau

Ồ Ầ Ấ

Page 36: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 36/328

CÁC DẠNG ĐỒ THỊ TẦN XUẤT(cont.)

• Đồ thị đạng đƣờng

Page 37: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 37/328

DỮ LIỆU RỜI RẠC

• Tần xuất tích lũy ở một giá trị đã cho bằng tổng tần xuất của tất các giátrị nhỏ hơn và bằng giá trị này.

• Các tần xuất trong bảng 2.7 cóthể biểu diễn trênđồ thị

Ổ Ữ Ệ

Page 38: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 38/328

TỔNG HỢP DỮ LIỆU

Page 39: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 39/328

ĐỒ THỊ DẠNG CỘT

Page 40: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 40/328

40

Tin Ui Tần xuất Tần xuất tƣơng đối Tần xuất tích lũy Tần suất tƣơng đối tích lũy U1 3 0,13 3 0,13

U2 7 0,29 10 0,42

U3 9 0,38 19 0,80

U4 5 0,20 24 1,00

Tin Ui U1 U2 U3 U4 U5 U6 U7 U8 U9

Tần xuất 1 3 1 4 4 4 2 3 5

Page 41: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 41/328

ĐỒ THỊ DẠNG ĐIỂM

Page 42: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 42/328

DỮ LIỆU LIÊN TỤC

• Độ chính xác: Trên lýthuyết độ chính xác làtùy ý,thực tế lại phụ thuộc vàdụng cụ đo.• Làm tròn: Làmgiảm độ chính xác.

Page 43: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 43/328

PHÂN BỐ TẦN XUẤT CỦA DL LIÊN TỤC

• Dữ liệu số liên tục được liệt kê trong bảng 2cột như dữ liệu rời rạc. • Nhận xét

– Min = 41, max = 64 – Miền giá trị biến cân nặng 64-41=23 – Ta chia miền giá trị thành 5 khoảng nhỏ (43, 48,

53, 58, 63) tương ứng với các lớp: 40.5-45.5, 45.5-50.5, 50.5-60.5, 60.5-65.5• Nếu bằng cận thì lấy nhóm trên

Page 44: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 44/328

Page 45: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 45/328

ƢỢ Ồ Â Ặ Ạ

Page 46: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 46/328

LƢỢC ĐỒ CÂN NẶNG DẠNGCỘT

Page 47: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 47/328

DẠNG CHẤM

Page 48: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 48/328

DẠNG ĐƢỜNG

Page 49: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 49/328

CÁC SỐ ĐO VỊ TRÍ

• Mode :giá trị xuất hiện nhiều nhất trong tập dữliệu • Median: điểm giữa của dữ liệu. • Mean: giá trị trung bình • Sum: tổng số • Miền giá trị • Mean Deviation: Độ lệch trung bình • Độ lệch chuẩn • populationvariance: phương sai của quần thể

Page 50: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 50/328

MODE CỦA DỮ LIỆU PHÂN NHÓM

• Mode của các dữ liệu định lượng rời rạc – Mode của một tập dữ liệu là giá trị xuất hiện nhilần nhất trong tập dữ liệu

– Ví dụ: bảng 2.6 • Mode của biến số con là 2 (chiếm 35%)

– Dữ liệu là biến liên tục, các giá trị có thể hoàntoàn khác nhau thì có tồn tại Modeko?

• Biến liên tục thì xác suất xuất hiện của dữ liệu là baonhiêu?

– Nếu dữ liệu được phân nhóm có thế tính được Mode của nhómko?

Page 51: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 51/328

51

Ủ Ê Ụ

Page 52: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 52/328

MEDIAN CỦA DL LIÊN TỤC

• Median là giá trị chia tập hợp thành 2 nửa saocho các quan sát của nửa này nhỏ hơn bằng gtrị giữa, quan sát nửa kia lớn hơn bằng giá tr

giữa. – Để tìm giá trị giữa nên sắp xếp dữ liệu. – Một tập quan sát được sắp thứ tự gọi là mẫu đư

sắp thứ tự.

Page 53: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 53/328

MEDIAN

– Nếu số mẫu là lẻ thìMedian ởchínhgiữa

– Nếu số mẫu là chẵn thì nênlấy giá trị trung bìnhcủa 2 mẫu trung tâm.

Page 54: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 54/328

MEAN

• Mean: là giá trị trung bình số học của một biến, được tính bằng tổng các giá trị quan sáchia cho số quan sát.

– Đây là dạng công cụ thường được dùng cho dạnđo khoảng cách và tỷ lệ. – Giá trị trung bình có đặc điểm là chịu sự tác động

của các giá trị ở mỗi quan sát. – Công thức:

n

X

n

ii x

1

Page 55: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 55/328

MEAN (cont.)

• Ví dụ – Tính cânnặng trung bìnhcủa 5 người có số cân(56, 39, 70, 101, 45)

– (56, 39, 70, 101, 45)/5 = 62.2 kg• Thayđổi đơn vị – Nếu tất cả các tập quan sátđược cộng (trừ) với 1

số dương thì bằng Meancộng (trừ) số đó. – (59, 42, 73, 104, 48)/5 = 63.2 kg

Ổ Ố

Page 56: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 56/328

TRUNG BÌNH VÀ TỔNG SỐ

• Ví dụ: Giả sử số con của 10gia đình được đánh số 1 – 10

• Số con trung bình: 3.5

• Số conko thể lẻ nhưng giátrị trung bình có nghĩa. • Giá trị trung bình của giới

tính có ý nghĩako?

Page 57: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 57/328

Page 58: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 58/328

MIỀN GIÁ TRÍ

• Định nghĩa: – Hiệu số giữa quan sát lớn nhất và nhỏ nhất của dữ liệu được gọi làmiền giá trị của tập này.

Page 59: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 59/328

ĐÁNH GIÁ MIỀN GIÁ TRỊ

Tên Số tiền A 2000

B 100

C 170

D 220

E 250

F 190

G 16

H 200

I 150

• Miền giá trị lớnnhưngkhông phản ánh đúng bản chất của dữ liệu

• Miền giá trị tăng khi cỡcủa tập quan sát tăngchứko bao giờ giảm (độ dàn trải của số liệu)

Page 60: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 60/328

MEAN DEVIATION

– Độ lệch trung bình làsố đo về sự biến đôỉ

Page 61: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 61/328

MEAN DEVIATION

• Giá trị tuyệt đối của độ lệch là khoảng chênhlệch giữa giá trị quan sát và giá trị trung bìnhmẫu.

• Độ lệch tuyệt đối trung bình(độ lệch trung bình)

Ủ Ầ Ể

Page 62: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 62/328

TRỊ TRUNG BÌNH CỦA QUẦN THỂ

• Định nghĩa: – Giá trị trung bình của quần thểlà

– Các độ lệch làyi – μ (i=1,2,..)

– Độ lệch tuyệt đối là |yi – μ | (i=1,2,..)

– Độ lệch trung bình của quần thể(tuyệt đối) là khoảng

cách trung bình từ các điểm y1 y2 …,yn đến giá trịtrung bình của chúng

Ộ Ệ Ẫ

Page 63: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 63/328

ĐỘ LỆCH TRUNG BÌNH MẪU

• Định nghĩa – Độ lệch trung bình của mẫu là tổng của các độ ltuyệt đối chia cho cỡ của mẫu trừ đi một.

– Trong đó x1 ,x2 …,xn là n quan sát vàlà trung bình mẫu

Page 64: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 64/328

VÍ DỤ • Trò chơi tung đồng xu:Một cậu bé vạch một

đường nằm ngang sau đó lùi lại 2m và tung đồxu ba lần sao cho chúng rơi càng gần đường nngang càng tốt. Giả sử đồng xu rơi xuống cáchcậu bé khoảng x1 x2 x3

Page 65: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 65/328

VÍ DỤ (cont.)

• Tổng khoảng cách của đồng xu so với đườnnằm ngang(đường này coi là trung bình củamột tổng thể vô hạn lần tung đồng xu)

• Khoảng cách trung bình (chia 3) là số đo sự

phân tán các lần tung đồng xu xung quanhđích.

Í

Page 66: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 66/328

VÍ DỤ (cont.)

– Tuy nhiên tổng khoảng cách của các đồng xu so vớiđường vạch ngang (biểu diễn ):

– Thường nhỏ hơn tổng thứ nhất vì là tâm của mẫ1 x2 x3 , 2m có thểko phải là tâm của mẫu.

– Để điều chỉnh lại cho nhỏ đi ta chia cho 2.

Ộ Ệ Ẩ

Page 67: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 67/328

ĐỘ LỆCH CHUẨN

• Định nghĩa – Độ lệch chuẩn của một quần thể các quan sát y1 y2 …,yn được ký hiệu là σ và tính theo công thức

Í

Page 68: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 68/328

VÍ DỤ

• Độ lệch chuẩn của ví dụ bảng 4.1

Ầ Ể

Page 69: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 69/328

PHƢƠNG SAI QUẦN THỂ

• Định nghĩa – Phương saicủa một quần thể các quan sát y1 y2 …,yn là bình phương của độ lệch chuẩn của quần thể và kýhiệu là σ2

Ộ Ệ Ẩ Ủ Ẫ

Page 70: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 70/328

ĐỘ LỆCH CHUẨN CỦA MẪU

• Định nghĩa 7 – Độ lệch chuẩn của mẫu gồm n quan sát x1 ,x2 …,xn được ký hiệu là s và được tính theo công thức

ĐỘ LỆCH CHUẨN CỦA MẪU

Page 71: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 71/328

ĐỘ LỆCH CHUẨN CỦA MẪU(cont.)

• Định nghĩa 8 – Phương sai của một mẫu gồm n quan sát x1 ,x2 …,xn là bình phương của độ lệch chuẩn của một mẫký hiệu là s2 và được tính theo công thức

Ữ Ĩ Ủ ƢƠ

Page 72: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 72/328

NGỮ NGHĨA CỦA PHƢƠNG SAI

• Khoảng cách từng cặp: Phương sai cóngữ nghĩa tự nhiênvề khoảng cáchtừng cặp điểm.

NGỮ NGHĨA CỦA PHƢƠNGSAI

Page 73: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 73/328

NGỮ NGHĨA CỦA PHƢƠNGSAI(cont.)

• Nhận xét – Khoảng cách giữa các cặp càng lớn thì sự biếnthiên càng lớn.

• Độlêchtrung bình của khoảng cách là: 20/10=2 • Độ lệch trung bình tuyệt đối và độ lệch trung bình

khoảng cáchko có mối liên hệ – Trung bình khoảng cách các cặp bình phương

(xi – x j )2

và trung bình các độ lệch chuẩn mẫu bình phương (xi - )2 có mối liên hệ trực tiếp.

ế

Page 74: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 74/328

(tiếp) – Trung bìnhkhoảng cáchcủa từng cặp bình phương:

50/10 = 5 – Phương saimột mẫu gồm n quan sát: 2.5 (một nửa

trung bình của các khoảng cách bình phương )

( ế )

Page 75: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 75/328

(tiếp)

• Định nghĩa – Phương saicủa một mẫu gồm n quan sát x1 ,x2 …,xn bằng một nửa giá trị trung bìnhkhoảng cáchcủa cáccặp bình phương

– là số cáccặp trong n quan sát

SỬ DỤNG CÁC ĐỘ ĐO BIẾN

Page 76: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 76/328

SỬ DỤNG CÁC ĐỘ ĐO BIẾNTHIÊN

• Đánh giá thực chất của thông tinđược chứa trongmột độ đo vị trí. – Một độ đo về sự biến đổi thường được sử dụng

cùngvới một độ đo về vị trí để tạo ra một chỉ báovề đặc điểm của quần thể.

CÁC ĐỘ ĐO BIẾN THIÊN

Page 77: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 77/328

CÁC ĐỘ ĐO BIẾN THIÊN

• Ví dụ:

– Haimẫu có giátrị trung bình là: 4 – Độ lệch trung bình là; 6/4=1.5

CÁC ĐỘ ĐO BIẾN THIÊN ( iế)

Page 78: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 78/328

CÁC ĐỘ ĐO BIẾN THIÊN (tiếp)

– Độ lệch chuẩn của mẫu 1:

– Độ lệch chuẩn của mẫu 2: – Giải thích:

• Độ lệch chuẩn là các bình phương của cácđộ lệch xungquanh giátrị trung bình, trongmẫu 2 cáccực trị ởxa giátrị

trung bình,mẫu 1 thìgần hơn. Dovậy, trongmột số trường hợp nênsử dụng độ đo khác (miền giá trị của các góc phần tư để môtả sự biến thiên).

SO SÁNH CÁC PHÂN BỐ

Page 79: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 79/328

SO SÁNH CÁC PHÂN BỐ

• Khi so sánh các phân bố tập trung vàovị trí vàsự biến thiên. – Ví dụ 1:

• Haiquốc gia có cùng thunhập bình quânđầu người nhưng khác nhauvề độ lệch chuẩn.

• Hai hãnglốp A,B có giá bánlốp như nhau.Cả 2 hãngđều cókhuyến mại mua 5lốp giảm 20% giá.Tuổi thọ của lốp B cóđộ lệch chuẩn là 1000km,lốp A là 5000km.

– Người mua hàng nên mualốp của hãng nào?

Page 80: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 80/328

– Tổng số tiền có thể ít hơn nếu mualốp hãng B, chodù tuổi thọ trung bình cóthể ngắn hơn vì chúng mònnhư nhauhoặc gần như nhau.

• Ví dụ 2: Nhầu đầu tư nôngnghiệp sẽ đầu tư vàovùngđất A hay Bnếu lượng mưa của chúngtương ứng như sau: – A: 40, 36, 25, 60, 54 ( sA = 14,7) – B: 38, 40, 35, 50, 52 ( sB = 7,55)

• Đầu tư vào vùngđất B sẽ có lợi hơn!

Kế l ậ

Page 81: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 81/328

Kết luận

• Một số đo vị trí sẽ mô tả một tập các quan sátchính xácnếu độ biến thiêncủa tập nàynhỏ vàngc lại.

• Độ lệch trung bình vàđộ lệch chuẩn là khoảng cách trung bình sovới giá trị trung bình. – Độ lệch trung bình làsố học của cácđộ lệch tuyệt

đối. – Độ lệch chuẩn là căn bậc haicủa trung bìnhcủa

bình phương cácđộ lệch.

Kếtl ậ

Page 82: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 82/328

Kết luận

– Đối với cả quần thể, trung bìnhđược chia chocỡ của quần thể – Đối với mẫu trung bìnhđược chia chocỡ của mẫu

trừ 1 – Phương saimẫu bằng ½ trung bình bình phương

khoảng cách cáccặp quan sát. – Cácsố đo vị trí đều có thể tínhđược bằng SPSS

PHẦN MỀM PHÂN TÍCH VÀ XỬ

Page 83: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 83/328

C VLÝ DỮ LIỆU

• Các phần mềm phục vụ phân tích vàxử lý dữ liệu hiện nay: SAS, SPSS và STATA – SAS:lớn nhất, đầy đủ nhất vàđắt nhất => ítđược

sử dụng tại VN – STATA có phạm vi ứng dụng hẹp hơn thường

được sử dụng chủ yếu trong ngành Y tế – SPSS có nhiều chức năng và linh hoạt hơn được

dụng rộng rãi trong nhiều ngành khoa học khácnhau như: Xã hội học, Y học, Nhân học, Tâm lýhọc, Kinh tế học, Marketing.... cả phiên bản chocác hệ điều hành Microsoft Windows, Mac, vàLinux/ UNIX.

83

CÁCH SỬ DỤNG SPSS

Page 84: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 84/328

CÁCH SỬ DỤNG SPSS

• SPSSlà phần mềm chuyên dụng xử lý thôngtin sơ cấp.• SPSSlà một bộ chương trình rất dễ sử dụng

nên thu hút được nhiều người sử dụng.• SPSScung cấp một giao diện giữa người vàmáy cho phép sử dụng các Menu thả xuống đ

chọn các lệnh thực hiện.

84

QUẢN LÝ DỮ LIỆU

Page 85: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 85/328

QUẢN LÝ DỮ LIỆU • SPSScó một bộ soạn thảo dữ liệu tương tự

như Excel, bộ soạn thảo cho phép vào các dữliệu và mô tả các thuộc tính của chúng. – SPSSkhông có những công cụ quản lý dữ liệu thậ

mạnh, chỉ có các lệnh chuyển cấu trúc dữ liệu thechiều ngang thành cấu trúc dữ liệu theo chiều dọcvà ngược lại.

– SPSSchỉ xử lý mỗi file dữ liệu ở một thời điểm vkhó có thể phải thực hiện các nhiệm vụ phân tíchvới nhiều file dữ liệu cùng một lúc. Các file dữ licó thể có tới 4096 biến và số lượng bản ghi chỉ bgiới hạn trong dung lượng của đĩa cứng. 85

ỨNG DỤNG TRONG PHÂN TÍCHỐ

Page 86: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 86/328

THỐNG KÊ

• SPSSthực hiện những thống kê mô tả và phâtích thống kê chung nhất như: – Hồi quy, hồi quyLogistic

– Kiểm định – Phântích tồn tại, phân tích phươngsai – Phântích nhân tố và phân tích nhiều chiều.

86

ỨNG DỤNG TRONG PHÂN TÍCHỐ

Page 87: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 87/328

THỐNGKÊ (tiếp)

• Sức mạnh lớn nhất của SPSS là lĩnh vực: – Phân tích phương sai – K hả năng lập các biểu bảng số liệu tổng hợp: đa

dạng và linh hoạt, các bảng biểu,báo cáo đượctrình bày đẹp,có thể hiệu chỉnh, in ra hoặcconvert

• Yếu điểm của SPSS – K hả năng xử lý đối với những vấn đề ước lượng

phức tạp và do đó khó đưa ra được các ước lượnsai số đối với các ước lượng này.

– SPSS cũng không hỗ trợ các công cụ phân tích dữ

liệu theo lược đồ mẫu87

VẼ ĐỒ THỊ

Page 88: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 88/328

VẼ ĐỒ THỊ

• Thao tácđơn giản • Đồ thị đó chất lượng cao, và có thể cắt/dán vcác tài liệu khác như vào Word hoặc

Powerpoint. – SPSScó ngôn ngữ cú pháp để tạo ra các đồ thị,nhưng nguôn ngữ cú pháp đó tương đối phức tạpvà nhiều điểm trong giao diện tạo đồ thị lại khônsẵn sàng trong ngôn ngữ cú pháp vì thế nên ít đưsử dụng tới.

88

Màn hình quản lýdữ liệu

Page 89: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 89/328

q ý ệ

(data view)

Là nơi lƣu trữ dữ liệu nghiêncứu với một cấu trúc cơ sở dữ

liệu bao gồm cột, hàng và cácô giao nhaugiữa cột vàhàng

Cột (Column): Đại diện chobiến quan sát.

Màn hình quản lý dữ liệu

Page 90: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 90/328

q ý ệ

(data view)

Là nơi lƣu trữ dữ liệu nghiêncứu với một cấu trúc cơ sở dữ

liệu bao gồm cột, hàng và cácô giao nhaugiữa cột vàhàng

Hàng (Row): Đại diện cho một trường hợp quan sát (người trả lời),

Màn hình quản lý dữ liệu

Page 91: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 91/328

q ý ệ

(data view)

Là nơi lƣu trữ dữ liệu nghiêncứu với một cấu trúc cơ sở dữ

liệu bao gồm cột, hàng và cácô giao nhaugiữa cột vàhàng

Ô giao nhau giữa cột và hàng (cell): Chứa đựng một kết quả trả lời tương ứng với câu hỏi cần khảo sát (biến) và một đối tượng trả lời cụ thể (trường hợp quan sát). Ô làsự kết hợp của đối tượng và biến. Các ô chỉ chứa các trị số biến.

Màn hình quản lý dữ liệu

Page 92: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 92/328

q ý(data view)

Là nơi lưu trữ dữ liệu nghiêncứu với một cấu trúc cơ sở dữ

liệu bao gồm cột, hàng và cácô giao nhaugiữa cột và hàng

File dữ liệu có hình chữ nhật. Hai hướng của file dữ liệu được xác định bởi số lượng các đối tượng và số lượng cácbiến. Không có các ô “trống rỗng” trong các đường biêncủa file dữ liệu. Đối với các biến dạng số, các ô rỗng được chuyển thành trị số khuyết thiếu hệ thống. Đối với cácbiến dạng chuỗi, một dấu cách vẫn được coi là một trị số.

Màn hình quản lýbiến

Page 93: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 93/328

(variables view) Là nơi quản lý cácbiến cùng với cácthông số liên quanđến biến. Trongmàn hình này mỗi

hàng trên mànhình quản lý một biến, và mỗi cột thể hiện các thôngsố liên quan đến biến đó

Tên biến (name): Là tênđại diện cho biến, tên biến này sẽ được hiễn thị trênđầu mỗi cột trong màn hìnhdữ liệu

Màn hình quảnlýbiến(variables view)

Page 94: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 94/328

Màn hình quản lýbiến (variables view) • Các quitắc được ápdụng cho tên biến:

• Tên phải bắt đầu bằng một chữ. Các kýtự còn lại có thể là bất kỳ chữ nào, bất kỳ số nào,hoặc các biểu tượng như @, #, _,hoặc $.

• Tên biến khôngđược kết thúc bằng một dấu chấm.

• Tránh dùng các tên biến màkết thúcvới một dấu gạch dưới cần (để tránh xungđột với các biến được tự động lập bởi một vàithủ tục)

• Độ dàicủa tên biến khôngvượt quá 8 kýtự.• Dấu cách và các kýtự đặc biệt (vídụ như !, ?, „,và *) không

được sử dụng • Từng tên biến phải đơn chiếc/duynhất; khôngđược phép trùng

lặp. Khôngđược dùngchữ hoađể đặt tên biến. Các tênNEWVAR, NewVar, và newvarđượcxem làgiốngnhau.

Màn hình quản lýbiến

Page 95: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 95/328

(variables view) Là nơi quản lý cácbiến cùng với cácthông số liên quanđến biến. Trong mànhình này mỗi hàngtrên màn hình quản lý một biến, và mỗi

cột thể hiện cácthông số liên quanđến biến đó

Loại biến (type): Thể hiện dạng dữ liệu thể hiện trong biến. Dạng số, và dạng chuỗi

Màn hình quản lýbiến

Page 96: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 96/328

(variables view) Là nơi quản lý cácbiến cùng với cácthông số liên quanđến biến. Trong mànhình này mỗi hàngtrên màn hình quản lý một biến, và mỗi cột thể hiện cácthông số liên quanđến biến đó

Số lượng con số hiễn thị cho giá trị (Width): Giá trị dạng số được phéphiễn thị bao nhiêu con số

Màn hình quản lýbiến

Page 97: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 97/328

(variables view) Là nơi quản lý cácbiến cùng với cácthông số liên quanđến biến. Trong mànhình này mỗi hàngtrên màn hình quản lýmột biến, và mỗi cột thể hiện các thông số liên quan đến biến đó

Số lượng con số sau dấu phẩy được hiễn thị (Decimals

Màn hình quản lý biến

Page 98: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 98/328

(variables view)

Là nơi quản lý cácbiến cùng với cácthông số liên quanđến biến. Trong mànhình này mỗi hàngtrên màn hình quản lýmột biến, và mỗi cột thể hiện các thông số liên quan đến biến đó

Nhãn của biến (label): Tên biến chỉ

được thể hiện tóm tắc bằng ký hiệu,nhãn của biến cho phép nêu rõ hơn về ý nghĩa của biến

Màn hình quản lý biến( i bl i )

Giá trị trong biến (Values): Cho

Page 99: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 99/328

(variables view)

Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trongmàn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các thông số liên quan đến biến đó

ị g ( )phép khai báo các giá trị trong biến với ý nghĩa cụ thể (nhãn giá trị)

Màn hình quản lý biến

Page 100: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 100/328

(variables view) Là nơi quản lý cácbiến cùng với các

thông số liên quanđến biến. Trong mànhình này mỗi hàngtrên màn hình quản lýmột biến, và mỗi cột thể hiện các thông số liên quan đến biến đó Giá trị khuyết (Missing): Do thiết kế bảng

câu hỏi có một số giá trị chỉ mang tính chất quản lý, không có ý nghĩa phân tích, để loại bỏ các biến này ta cần khai báo nó như là giátrị khuyết (user missing). SPSS mặc định giá

trị khuyết (system missing) là một dấu chấm và tự động loại bỏ các giá trị này ra khỏi cácphân tích thống kê.

Màn hình quản lý biến

Page 101: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 101/328

(variables view)

Là nơi quản lý cácbiến cùng với cácthông số liên quanđến biến. Trong mànhình này mỗi hàngtrên màn hình quản lýmột biến, và mỗi cột thể hiện các thông số liên quan đến biến đó

Kích thướt cột (columns): Cho phépkhai báo độ rộng của cột

Màn hình quản lý biến

Page 102: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 102/328

(variables view)

Là nơi quản lý cácbiến cùng với cácthông số liên quanđến biến. Trong mànhình này mỗi hàngtrên màn hình quản lýmột biến, và mỗi cột thể hiện các thông số liên quan đến biến đó

Ví trí (align): Vị tríhiễn thị các giá trị trong cột (phải, trái,giữa)

Màn hình quản lý biến

Page 103: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 103/328

(variables view)

Là nơi quản lý các biến cùng với các thông số liên quan đến biến.Trong màn hình này mỗi hàng trên màn hìnhquản lý một biến, và

mỗi cột thể hiện cácthông số liên quan đến biến đó

Ordinary: thứ bậc Norminal: danh nghĩa Scale = Interval + ration(khoảng cách + tỉ lệ)

Dạng thang đo (measures): Hiễn thị dạng thang đo của giá trị trong biến

Màn hình hiện thị kết quả( )

Page 104: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 104/328

(output) Các phép phân tíchthống kê sẽ cho ra cáckết quả như bảng biểu, đồ thị và các kết quả kiểm định…., cáckết quả này sẽ được

truy xuất ra một mànhình, và được lưu giữ dưới một tập tin khác(có đuôi là .SPO). Mànhình này cho phép taxem và lưu giữ các kết

quả phân tích

Nhắp để mởrộng hoặc thuhẹp các cấpđộ xem

Nhắp đúp mộtbiểu tượngkiểu sách đểhiện hoặc làmẩn một chi tiết

Panô phân cấpxem

Nhắp một chi tiếtđể chọn và đithẳng đến nó

Panô nội dung Nhắp đúp một bảng để xoay hoặc

hiệu đính nó

MỘT SỐ XỬ LÝ TRÊN BIẾN

Page 105: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 105/328

MỘT SỐ XỬ LÝ TRÊN BIẾN

• Mã hóa lại biến: – Mục đích làmgiảm biểu hiện của biến định tính – Chuyển biến định lượng thànhđịnh tính –

Vídụ

:(Dữ liệu Data thuc hanh)

• Mã hóalại biến thunhập (tngd) 4khoảng: (0-5, 6-10,11-15, >16t)

• Mã hóalại biến tuổi: (0-18, 19-25, 26-35, 36-45, 46-60,>61t)

• (Transform/recode/)

105

MỘT SỐ XỬ LÝ TRÊN BIẾN

Page 106: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 106/328

MỘT SỐ XỬ LÝ TRÊN BIẾN

• Chuyển biến dạng Category thànhdạng Dichotomy – Category: biến phânloại cónhiều giá trị mã hóa (

ví dụ như đạo : Phật, Thiên chúa giáo, Tin lành,Caođài…)

– Dichotomy: biến phânloại chỉ có 2 giátrị cóhoặc không (cóđạo hoặc không cóđạo)

– (Transform/count)

106

Page 107: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 107/328

Chương 2

LÀM SẠCH DỮ LI 107

SỰ CẦN THIẾT

Page 108: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 108/328

SỰ CẦN THIẾT

• Xét vídụ

108

CÁC PHƢƠNG PHÁP LÀM SẠCHDỮ LIỆU

Page 109: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 109/328

DỮ LIỆU

• Dùng bảng tần số (Edit/Find) – Ưu điểm: dễ thực hiện – Nhược điểm: thủ công,chỉ phùhợp với bảng câuhỏi

ngắn.• Dùng bảng phối hợp 2 hoặc 3 biến (Data/ Select

Cases) – Ưu: pháthiện được nhiều lỗi, phùhợp với bảng dài – Nhược điểm: phức tạp cần cókiến thức và kinh

nghiệm.• Dùnglệnh Sort Case

109

Page 110: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 110/328

Chương 3TÓM TẮT VÀ TRÌNH B

DỮ LIỆU

110

PHƢƠNG PHÁP VÀ CÔNG CỤ

Page 111: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 111/328

ƢƠ G V CÔ G CỤ

• Bảng tần số • Cácđại lượng thống kê môtả, biểu đồ tần số • Bảng kết hợp nhiều biến

• Đồ thị

111

BẢNG TẦN SỐ ĐƠN GIẢN

Page 112: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 112/328

• Tệp dữ liệu datathuchanh.sav• Ví dụ lập bảng tần số của biến gtinh (1-nam, 2- nữ),

kết quả thuđược bảng 3.1 và 3.2• Analyze/Descriptive statistics/Frequencies

– Bảng 3.1

– Valid:Số quan sáthợp lệ (số người có trả lời) – Missing:Số quan sát khônghợp lệ (Kotrả lời)

112

Bảng tấn số (tiếp)

Page 113: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 113/328

g ( p)

• Bảng 3.2

113

Bảng tấn số (tiếp)

Page 114: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 114/328

g ( p)

• Giải thích – Cột 1: biểu hiện của các giátrị nhập vào (1-Nam,2- Nữ, 11, 22….)

– Frequencies:tần số của từng biểu hiện – Percent: tínhtần suất theotỉ lệ phần trăm – Valid percent: phần trăm hợp lệ, tính trênsố quan

sát có thông tintrả lời

– Cumulative percent:Phần trăm tíchlũy

114

???

Page 115: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 115/328

• Bảng tần số có thể thực hiện được với biến định lượng được ko?• Nếu biến định lượng liêntục thì cóvấn đề gì

xảy ra?• Test thử với biến tuoi.

115

CÁC ĐẠI LƢỢNG THỐNG KÊ MÔ TẢ

Page 116: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 116/328

Ạ Ợ

• Các đại lƣợng thống kê mô tả chỉ áp dụngvới biến định lƣợng • Analyze/Descriptive statistics/ Descriptives…

• Các đại lượng thường dùng: – Mean: trung bình cộng – Sum: tổng cộng

– Std.Deviation: độ lệch chuẩn – Minimum/ Maximum: giá trị nhỏ/ lớn nhất – SE mean: sai số chuẩn khi ước lượng trị trung bì

116

Ghi chú

Page 117: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 117/328

• Distribution: Cho biết phân phối đang xét cógần với phân phối chuẩn không? – Kurtosis:thước đo độ rộng hình chópcủa một phân

phối (phân phối chuẩn có Kurtosis = 3) – Skewness:thước đo mức độ khôngđối xứng của một

phân phối (phân phối chuẩn có Skewness = 0)• Display Order: Cácsắp xếp thứ tự kết quả

– Variable list: theothứ tự các biến – Alphabetic: theo bảng chữ cái – Ascending/ descending means:tăng/ giảm dần

117

Ví dụ

Page 118: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 118/328

• Test thử với biến tuoi, thanhpho và tncn (thunhập cá / tháng) , file Data thuc hanh.sav• Giải thích ý nghĩa kết quả nhận được

118

LẬP BẢNG TẦN SỐ ĐỒNG THỜITÍNH CÁC ĐẠI LƢỢNG THỐNG

Ê Ô Ả

Page 119: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 119/328

KÊ MÔ TẢ

• Analyze/Descriptive statistics/Frequencies

119

THỐNG KÊ MÔ TẢ VỚI THỦTỤC EXPLORE

Page 120: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 120/328

TỤC EXPLORE

• Nhận xét: – Thủ tục thống kê môtả trênchỉ hữu dụng với biến định lượng đơn.

– Muốn thống kê môtả giữa các biến dùng Explore• Explore tính cácđại lượng thống kê môtả chotất

cả các trường hợp trongdữ liệu hoặc nhóm concủa dữ liệu

• Nhận diện các giátrị khác biệt • Tính các giátrị thập phânvị của phân phối biến • Tạo biểu đồ.

120

Ví dụ

Page 121: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 121/328

• Analyze/Descriptive statistics/Explore• So sánh cácđại lượng thống kê môtả của biến tuoi với gtinh, tp

121

Chú ý

Page 122: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 122/328

• Trong hộp thoại Statistics – Descriptive: Mặc định chọn sẵn của SPSS (các đạlượng thống kê mô tả) – M – estimators: Các số thống kê tương đồng với số

trung bình nhưng tạo ra các trọng số để cân bằngnhững quan sát phụ thuộc vào khoảng cách từ chútới trung tâm (khi số liệu có điểm cực trị hoặc phântán thì M – estimators cho ước lượng tốt hơn trungbình và trung vị)

– Outliers: thể hiện 5 giá trị min, max được đưa vàokhung Dependent List – Percentile: Thể hiện các thập phân vị thứ 5,10, 25

50, 75, 90, 95. 122

Chú ý

Page 123: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 123/328

• Trong hộp thoại Plots – Boxplots: Sắp xếp lại lại cách thể hiện các biểutrong hộp Boxplots

– Descriptive: Biểu đồ thân lá hoặc dạng histogram – Normality plots with tests: Vẽ biểu đồ xác xuất

chuẩn Q – Q giúp kiểm tra phân phối chuẩnkhông?

123

Chú ý

Page 124: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 124/328

• Giải thích biểu đồ thân lá: – Trong biểu đồ thân lá, độ rộng của thân là 10 – Các con số ở thân biểu diễn hàng chục và lá biểu

diễn hàng đơn vị – Mỗi lá đại diện cho một trường hợp

124

LẬP BẢNG TỔNG HỢP NHIỀUBIẾN

Page 125: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 125/328

BIẾN

• Bảng kết hợp các biến định tính – Bảng kết hợp 2 biến định tính – Bảng kết hợp 3 biến định tính

• Bảng kết hợp biến định tính và định lượng – Bảng kết hợp 1biến định tính và 1 biến định lượ – Bảng kết hợp 2 biến định tính và 1 biến định lư – ( Analyze / Tables / Custom Tables)

125

TRÌNH BÀY KẾT QUẢ BẰNGĐỒ THỊ

Page 126: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 126/328

ĐỒ THỊ

• Các loại biểu đồ

126

Page 127: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 127/328

Chương 4: KIỂM ĐỊNH MỐI LIÊN HỆ GIỮ

BIẾN ĐỊNH TÍN

127

GIỚI THIỆU CƠ BẢN VỀ LÝTHUYẾT KIỂM ĐỊNH

Page 128: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 128/328

THUYẾT KIỂM ĐỊNH

• Kiểm định giả thuyết – Là một phương pháp suy luận – Đưa ra kết luận từ giá trị của một tham số

• Ví dụ – Kiểm tra xem độ bền trung bình của sản phẩm củcty A có lớn hơn độ bền trung bình của sản phẩmcùng loại do cty B sản xuất hay ko?

128

HÌNH THÀNH CÁC GIẢ THUYẾT h ố đ hé hử h ộ lý h ế

Page 129: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 129/328

• Khi muốn đưa ra phép thử cho một lý thuyết m

cần phải hình thành một giả thiết – Giả sử số tiền của người thành thị sẽ nhiều hơn nsống ở nông thôn.

• Định nghĩa 9.1 – Một giả thuyết thống kê là một kết luận về giá trị củ

một tham số quần thể • Định nghĩa 9.2

– Giả thuyết đối lập với giả thuyết chúng ta hi vọngthể đúng gọi là giả thuyết gốc hay giả thuyết không – không có sự khác nhau giữa các trung bình quần th(H0)

129

HÌNH THÀNH CÁC GIẢ THUYẾT (Cont.)

Page 130: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 130/328

• Định nghĩa 9.3 – Giả thuyết mà chúng ta hi vọng có thể chứng minh

được là đúng được gọi là giả thuyết thay thế(Ha)• Chú ý

– Giả thuyết không thường được các nhà nghiên cứura với hi vọng có thể loại bỏ được nó. – Ví dụ: Người A thiết kế một phương pháp giảng

mới và muốn thử xem phương pháp này có cải tiếhơn so với các phương pháp cũ ko?

– Người A tiến hành thí nghiệm so sánh. – Giả thuyết không là ko có sự khác biệt

130

Ví dụ 1

ế ậ ả ế ả

Page 131: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 131/328

• Hãy thiết lập các giả thuyết không và giải

thuyết thay thế để kiểm định kết luận củacác nhà nhân khẩu học cho rằng số con đãtừng sinh của phụ nữ thành thị ít hơn nôngthôn.

• Nhận xét: – Các giả thuyết này phải được hình thành dưới

dạng một hay một số các tham số của quần thể

131

Ví dụ 1 (cont.)

ờ ả

Page 132: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 132/328

• Lời giải

– μ1 : Số con đã từng sinh TB của phụ nữ thànhthị – μ2 : Số con đã từng sinh TB của phụ nữ nông

thôn – Nhà nhân khẩu học cho rằng μ1 < μ2 vậy: – H0 (μ1 – μ2 = 0): Ko có sự khác nhau giữa số

con đã được sinh ra ở thành thị và nông thôn

– Ha (μ1 – μ2 < 0): Số con đã được sinh ra ở thànhthị ít hơn số con được sinh ra ở nông thôn

132

Ví dụ 2

Page 133: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 133/328

• Trên các bao thuốc lá thường ghi dòng chữ“HÚT THUỐC LÁ CÓ HẠI CHO SỨCKHỎE” nhưng thông báo này được ghi ở cạn bao và khá nhỏ. Vì vậy một nhà nghiên cứu crằng có trên 80% người hút thuốc ko đọc đưdòng chữ này. Hình thànhgiả thuyết không vàgiả thuyết thay thế điểm kiểm tra lại kết luận

này.133

(tiếp vd2)

ờ ả

Page 134: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 134/328

• Lời giải:

– Nhà nghiên cứu muốn có kết luậnp về sốngười không đọc được dòng cảnh báo. Tức làngười này muốn thu thập chứng cứ để kết luận p > 0.8

– H 0 : p = 0.8 – H a : p > 0.8

134

Ví dụ 3

Page 135: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 135/328

• Một máy tiện được dùng để tiện các vòng bi có đường kính 10cm. Người ta kiểm trađịnh kỳ đường kính các vòng bi được sảnxuất ra. Nếu đường kính trung bình của cácvòng bi lớn hay nhỏ hơn 10cm thì coi nhưmáy đã bị lỗi cần sửa chữa. Hãy hình thànhcác giả thuyết không và giả thuyết thay thếđể kiểm tra xem qui trình sản xuất có bị lỗihay ko?

135

Ví dụ 3 (Cont.) Lời iải

Page 136: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 136/328

• Lời giải:

– μ: đường kính trung bình đúng của tất cả cácvòng bi do máy tiện sản xuất ra. – Nếu μ < 10 hoặc μ > 10 thì máy bị lỗi. – H

0 : μ = 10 (qui trình sản suất ko bị lỗi)

– H1 : μ ≠ 10 ( qui trình sản suất bị lỗi)

136

HÌNH THÀNH CÁC GIẢ THUYẾT (Cont.)

Đị h hĩ 9 4

Page 137: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 137/328

• Định nghĩa 9.4

– Mộtkiểm định giả thuyết một phía là một kiểm địnhtrong đó giả thuyết thay thếlà có hướng và được xácđịnh bằng một bất đẳng thức với dấu“<“ hoặc “>”

• Định nghĩa 9.5 – Mộtkiểm định giả thuyết hai phía là một kiểm định

trong đó giả thuyết thay thế không được xác định đitheo hướng nào tính từ H0 và được thể hiện bằng mộ

mệnh đề với dấu “≠” 137

Ví dụ 4

Page 138: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 138/328

• Tỷ lệ mắc bệnh lao trong các cư dân TP là kolớn 0.0002. Sau khi khám sức khỏe cho nhữngngười ngoại tỉnh mới nhập cư vào TP người thấy rằng những người này có tỷ lệ mắc lao

hơn. Để kiểm định kết luận này người ta thửgiả thuyết là: – H0 : p = 0.0002 , trong đó p là tỷ lệ đúng của những

người ngoại tỉnh mới nhập cư mắc bệnh lao. Hãyra giả thuyết thay thế thích hợp cho nghiên cứu nà 138

Page 139: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 139/328

CÁC KẾT LUẬN VÀ KẾT QUẢ

Page 140: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 140/328

• Mục đích của kiểm định giả thuyết là đưa ramột quyết định liệu có thể loại được giả thuykhông H0 và nghiêng về giả thuyết thay thế Ha được hay không?

• Mặc dù luôn mong có thể đưa ra được kết luậđúng tuy nhiên kết luận này cần dựa trên thôntin mẫu vì vậy dễ mắc phải một số sai lầm.

140

CÁC LOẠI SAI LẦM

Page 141: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 141/328

• Định nghĩa 9.6 – Mộtsai lầm loại Ixảy ra nếu chúng ta loại bỏ m

giả thuyết không khi nó đúng. Xác suất mắc salầm loại một ký hiệu là α.

• Định nghĩa 9.7 – Mộtsai lầm loại IIxảy ra nếu chúng ta không lo

bỏ một giả thuyết không khi nó sai. Xác suất m

sai lầm loại một ký hiệu là β.141

CÁC LOẠI SAI LẦM (Cont.) • Nhận xét

Page 142: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 142/328

• Nhận xét

– Giả thuyết không có thể đúng hoặc sai vì vậy tacần đưa ra quyết định chấp nhận hay bác bỏnó. Có 4 tình huống xảy ra.

– Không xảy ra trường hợp mắc cả 2 loại sai lầm – α và β có quan hệ tỷ lệ nghịch. – Để làm cho α, β cùng giảm thì cần tăng lượng

thông tin – cỡ của mẫu 142

Ví dụ 5 Xét tiế í dụ 3 á đị h i lầ l ại I II

Page 143: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 143/328

• Xét tiếp ví dụ 3, xác định sai lầm loại I, II c

thể xảy ra với bài toán. • Lời giải – Sai lầm loại I là bác bỏ ko đúng giả thuyết khôn

Kết luận đường kính khác 10cm trong khi thực tếđướng kính đúng là 10cm. – Sai lầm loại II là không bác bỏ giả thuyết không

Kết luận đường kính không thay đổi (đúng bằng10cm) trong khi thực tế đường kính khác 10cm.

143

CÁC LOẠI SAI LẦM (Cont.) Đị h ghĩ 9 8

Page 144: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 144/328

• Định nghĩa 9.8

– Xác suất α của việc mắc một sai lầm loại Iđược gọi là mức ý nghĩa của việc kiểm định giảthuyết

– Sai lầm loại I có thể kiểm soát được nên đượclấy làm độ về mức độ tin cậy của kiểm định

144

Qui trình xác định giả thuyết vàhình thành các kết luận

Page 145: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 145/328

hình thành các kết luận

• 1. Xác định giả thuyết mà ta muốn chứng mingiả thuyết thay thế Ha • 2. Giả thuyết H0 là đối thuyết của Ha và chứa dấu

“=“. • 3. Nếu thông tin mẫu nghiêng về Ha thì bỏ H0 ,xác

suất để mắc sai lầm loại I là α và ta có thể cho nhỏtùy ý.

• 4. Nếu mẫu không đủ căn cứ để chấp nhận Ha thìkết luận H0 ko bị bác bỏ dựa trên mẫu đang xét.Cần thu thập thêm thông tin về mẫu. 145

Ví dụ 6

Page 146: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 146/328

• Hãy xét xem một bị cáo có phạm tội nào đó hko? – A. Hình thành giả thuyết không và giả thuyết tha

thế khi phán xử một bị cáo có tội hoặc ko có tội.

– B. Gải thích ý nghĩa của sai lầm loại I và II trongtrường hợp này. – C. Nếu bạn là bị cáo, bạn muốn α lớn hay nhỏ? Giải

thích tại sao? – D. Sai lầm loại I hay II nghiêm trọng hơn?

146

(tiếp vd6)

Page 147: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 147/328

• Lời giải – Theo luật bị cáo là vô tội cho đến khi tòa án chứnminh được bị cáo là có tội, vậy bị cáo ko buộc phchứng minh được mình vô tội mà tòa án phải thuthập chứng cứ để kết luận bị cáo có tội hay ko?

– A. H0 bị cáo vô tội – Ha bị cáo có tội

147

(tiếp vd6) B Bố kết ả ó thể ó là

Page 148: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 148/328

– B. Bốn kết quả có thể có là:

– C. Sai lầm loại I là rất nghiêm trọng. α càngnhỏ càng tốt.

– D. Sai lầm loại I nghiêm trọng hơn loại II. 148

9.4 các thống kê kiểm định và cácmiền bác bỏ

Page 149: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 149/328

• Mô tả cách thức đi đến kết luận trong mộttình huống kiểm định giả thuyết. • Giả thuyết rằng qui trình lấy mẫu thích hợp

và đã được thực hiện • Ví dụ 7 – Giả sử cần kiểm định giả thuyết:

– H0 : μ = 72 – Ha : μ > 72 – Hãy nêu rõ cách thức chung để tiến hành kiểm

định một giả thuyết thống kê. 149

(tiếp ví dụ 7) Lời iải

Page 150: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 150/328

• Lời giải – Bước 1: Thu được mẫu đảm bảo tínhngẫu

nhiên từ quần thể mà ta quan tâm. Thống kêthu được(thống kê kiểm định) sẽ giúp ta đưa raquyết định bác bỏ hay chấp nhận.

– Bước 2: Xác định xem thống kê kiểm định thuđược có phù hợp với phép kiểm định giả thuyếtđã cho hay ko?

– Bước 3: Chỉ ra được miền các giá trị có thểtính được của thống kê kiểm định mà đối vớicác giái trị này, giả thuyết không sẽ bị bác bỏ. 150

(tiếp 9.4) Đị h hĩ 9 9

Page 151: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 151/328

• Định nghĩa 9.9 – Thống kê kiểm định là một thống kê mẫu đượctính từ các thông tin rút ra từ một mẫu, mà mẫu

này là cơ sở để tiến hành kết luận liên quan tớigiả thuyết không và giả thuyết thay thế.

• Định nghĩa 9.10 – Miền bác bỏ là tập hợp các giá trị có thể có của

thống kê kiểm định, mà đối với các giá trị nàygiả thuyết không sẽ bị bác bỏ.

151

Page 152: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 152/328

Ví dụ 8 Tiế í dụ 2 Nhà ghiê ứ ố khẳ g

Page 153: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 153/328

• Tiếp ví dụ 2. Nhà nghiên cứu muốn khẳng

đinh rằng: H0 : p = 0.80 và Ha : p > 0.80• Hãy đưa ra một thống kê kiểm định giúp

quyết định có nên loại bỏ H0 hay ko?

• Lời giải: – Vì tham số đích là một tỷ lệ quần thể p nên ta

dùng tỷ lệ mẫu (ước lượng điểm của p đượcsử dụng trong thủ tục ước lượng khoảng)nhưmột công cụ trong qui trình ra quyết định.

– (Kiểm định giả thuyết về trị trung bình củaquần thể)

153

Ví dụ 9 • Xét tiếp ví dụ 1, trong đó ta kiểm định:

Page 154: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 154/328

p ụ , g ị

– H0 (μ

1 – μ

2 = 0)

– Ha (μ1 – μ2 < 0)• Hãy đề xuất một thống kê kiểm định thích hợ

cho bài toán này.• Lời giải:

– Tham số cần quan tâm là sự khác nhau giữa hai tru bình của quần thể μ1 – μ2 .

– Kiểm định giả thuyết về sự bằng nhau giữa hai tru bình tổng thể 154

Chú ý• Khi kiểm định giả thuyết liên quan tới một

Page 155: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 155/328

• Khi kiểm định giả thuyết liên quan tới một

tham số quần thể nhất định thì thống kêkiểm định chính là ước lượng điểm tươngứng của tham số này.

– Chia tất cả các giá trị có thể có thành hai tập:miền bác bỏ và phần bù của miền. – Nếu giá trị tính được rơi vào miền bác bỏ thì

loại bỏ giả thuyết không. – Ngược lại không loại giả thuyết không.

155

Ví dụ 10 • Xét ví dụ 7 Phép kiểm định giả thuyết:

Page 156: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 156/328

• Xét ví dụ 7. Phép kiểm định giả thuyết:

– H0 : μ = 72 – Ha : μ > 72 – Hãy chỉ ra quyết định đúng nếu thống kê kiểm

định có giá trị sau đây:

• Lời giải:

– a, bác bỏ H0 – b, không bác bỏ H0 để nghiêng về Ha – c, kết luận ko chắc chắn, cần thêm giả thuyết. 156

Ví dụ 11 • Xét tiếp ví dụ 10 hãy xác định miền bác

Page 157: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 157/328

• Xét tiếp ví dụ 10, hãy xác định miền bác

bỏ cho kiểm định với mức ý nghĩa α = 0.5• Lời giải:

– Trong ví dụ 10, trường hợp c ko đủ căn cứ để

kết luận vậy giá trị bằng bao nhiêu để kếtluận (73 đã đủ lớn hơn 72 để loại bỏ H0 chưa?) – Sử dụngtiêu chuẩn z -(z-score) để đo khoảng

cách giữa 72 và , số đo này chuẩn hóa giá trịcủa thống kê kiểm định

157

Page 158: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 158/328

(tiếp vd11) Xét hình 9 1a nếu μ=72 thì cơ hội nhận được

Page 159: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 159/328

– Xét hình 9.1a, nếu μ=72 thì cơ hội nhận được

một giá trị vượt quá 72 một khoảng là 1.645lần độ lệch chuẩn chỉ là 0.5 – Xét hình 9.1b thì miền bác bỏ z > 1.645

159

Tiếp 9.4 • Định nghĩa 9 11

Page 160: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 160/328

• Định nghĩa 9.11

– Giá trị biên của một miền bác bỏ đối với một kiđịnh giả thuyết được gọi là giá trị tới hạn.

• Ví dụ 13:Xác định miền bác bỏ cho phép kiể

định giả thuyết sau: – H0 : μ = 72 – Ha : μ < 72

– Với mức ý nghĩa α=0.01160

(tiếp vd 13) • Lời giải:

Page 161: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 161/328

• Lời giải:

– VD này tìm những giá trị đủ nhỏ để bác bỏ H0 – Chuẩn hóa giá trị thống kê kiểm định về z-score

– Giả sử n>130 (để phân bố lấy mẫu xấp xỉ dạngchuẩn)

161

(tiếp) • Nếu thực tế μ=72 thì cơ hội lấy được một g

Page 162: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 162/328

• Nếu thực tế μ=72 thì cơ hội lấy được một g

vượt quá 72 bằng 2.33 lần độ lệch chuẩn ch0.01.

162

(tiếp) • Tại mức ý nghĩa (xác suất sai lầm loại I) bằ

Page 163: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 163/328

• Tại mức ý nghĩa (xác suất sai lầm loại I) bằ

0.01 ta sẽ bác bỏ H0 đối với z < 2.33

163

Ví dụ 14 Xác định miền bác bỏ cho phép kiểm định giả thuyế

Page 164: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 164/328

Xác định miền bác bỏ cho phép kiểm định giả thuyế

sau. Với mức ý nghĩa α=0.05 – H0 : μ = 72 – Ha : μ ≠ 72

164

Ví dụ 15 • Xét tiếp VD 12 Giả sử thống kê sau được

Page 165: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 165/328

• Xét tiếp VD 12. Giả sử thống kê sau được

tính từ một mẫu ngẫu nhiên gồm n=30,

• Hãy thực hiện phép kiểm định cho – H0 : μ = 72 – Ha : μ > 72 – Với mức ý nghĩa α = 0.05

• Lời giải: – Trong ví dụ 12 ta đã tính được miền bác bỏ

z>1.645165

(tiếp vd 15) – Z-score được tính như sau:

Page 166: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 166/328

Z score được tính như sau:

• Giá trị z ko nằm trong miền bác bỏ nên ta ko bác bỏ H0ko đủ cơ sở

ủng hộ cho Ha 166

Ví dụ 16 • Tiếp VD 3 giả sử lấy một mẫu ngẫu nhiên

Page 167: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 167/328

• Tiếp VD 3, giả sử lấy một mẫu ngẫu nhiên

cỡ n=50, = 9.68, s= 0.6, hãy thực hiệnkiểm định ở mức ý nghĩa 0.05 với giảthuyết H0: μ = 10cm và Ha: μ ≠ 10cm

• Lời giải

167

(tiếp vd 16) • Nhận xét giá trị tính được nằm trong miền

Page 168: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 168/328

Nhận xét giá trị tính được nằm trong miền

bác bỏ, kết luận bác bỏ H0.

168

Bài tập • 1 Một bác sỹ muốn nghiên cứu để xác

Page 169: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 169/328

1. Một bác sỹ muốn nghiên cứu để xác

định xem liệu tỷ lệ những người đàn ông phải vào viện vì bệnh tim có khác với tỷlệ tương ứng của phụ nữ hay ko? Hãyhình thành giả thuyết không va giả thuyếtthay thế và xác định xem đây là kiểm địnhmột hay hai chiều?

• 2. Tại sao chúng ta nên tránh việc đưa ramột két luận có dạng “chấp nhận giảthuyết H0 “? 169

Bài tập • 3. Giả sử chúng ta muốn kiểm định giả

Page 170: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 170/328

. ả ử g ố ể ị g ả

thuyết H0 : μ = 65 và Ha : μ ≠ 65 với mức ýnghĩa α = 0.5. Hãy xác định miền bác bỏ. • 4. Đối với mỗi miền bác bỏ sau đây, hãy

xác định giá trị của α (xác suất sai lầm loạiI) – a. z < -1,96 – b. z > 1.645 – c. z < -2,58 – c. z > -2,58 170

ĐẶT VẤN ĐỀ • Có phảitrìnhđộhọcvấncó tácđộngtớicách

Page 171: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 171/328

• Có phải trìnhđộ học vấn có tácđộng tới cách

đọc báo? Hay cómối liênhệ giữa trìnhđộ học vấn và cáchđọc báo?

171

NHẬN XÉT

ể ị ể ị ề

Page 172: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 172/328

• Trong các phép kiểm định thì kiểm định vềmối liên hệ giữa các biến là kiểm định tính đlập.

• Kiểm định: – Biến định danh – định danh – Biến định danh – thứ bậc – Biến thứ bậc – thứ bậc

172

KIỂM ĐỊNH MỐI LIÊN HỆ GỮAHAI BIẾN ĐỊNH DANH – ĐỊNHDANH (THỨ BẬC) ử ể ị

Page 173: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 173/328

( Ậ )• Sử dụng kiểm định Chi – bình phương (X2 )

– Cho biết có tồn tại mối liênhệ giữa hai biến tổng thể hay ko?

– Nhưng không cho biết độ mạnh yêucủa mối liênhệ.

• Lý thuyết cơ bản về kiểm định giả thuyết – Sinh viên đọc trong tài liệu kèm theo ( chương

9,10)

173

TÓM TẮT LÝ THUYẾT KIỂMĐỊNH CHI – BÌNH PHƢƠNG (X2)ặ ả ế ố

Page 174: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 174/328

• 1. Đặt giả thuyết thống kê – Giả thuyết không H0 : Hai biến độc lập nhau – Giả thuyết đối H1 : hai biến cómối liênhệ với

nhau

• 2. Tính

174

2ij ij2

1 ij

( )c

j

O E X E

iji j R C E

n

(tiếp) 2 đ il hi bì h h dù đểkiể đị h

Page 175: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 175/328

– X2 : đại lượng chi bình phương dùngđể kiểm định – Oij : đại diện chosố trường hợp được quan sát

trongmột ô cụ thể của bảng chéo (tần số quan sát) – Eij: đại diện chosố trường hợp mà bạn mongđợi

gặp trongnhững ô của bảng chéonếu không cómối liênhệ giữa 2 biến trong bảng (tần số mongđợi)

– C: số cột của bảng – R: số hàngcủa bảng – R i : tổng số quan sátcủa hàngthứ i – C j : tổng số quan sátcủa cột thứ j 175

Nhận xét

X2 0 khi ấ á ábằ ầ ố đ i

Page 176: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 176/328

– X2 = 0 khitất các quan sát bằng tần số mongđợi (không cómối liênhệ giữa các biến)

– X2 >= 0, O khác biệt E cànglớn thì X2 cànglớn • 3. Tính giátrị giới hạn

– Đại lượng kiểm định này có phân phối chi bình phương nên phải tra bảng phân phối X2 để tìm giátrị giới hạn với mức ý nghĩa a, số bậc tự do:df = (r-1)(c-1)

– Mức ý nghĩa a là khả năng tối đa cho phépmắc sailầm loại I.

176

2( 1)( 1),r c X a

(tiếp)

4 iê h ẩ ếđị h là á h iá ị iới

Page 177: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 177/328

• 4. Tiêuchuẩn quyết định là so sánh giátrị giới hạn vàđại lượng X2

• Bác bỏ giả thuyết H0 nếu:

• Chấp nhận giả thuyết H0 nếu:

– ( Bảng phân phối X 2

được cho tại phụ lục T246 – Phân tích thống kê số liệu – Bùi Thế Hồng )

177

2 2( 1)( 1),r c X X a

2 2( 1)( 1),r c X X a

SỬ DỤNG SPSS KIỂM ĐỊNH X2 • Analyze/Descriptive Statistics/Crosstabs/

Page 178: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 178/328

• Analyze/Descriptive Statistics/Crosstabs/…

– Tra bảng X2 tìm giátrị giới hạn với bậc tự do là 15và mức ý nghĩa 0.05 và so sánhvới X2 tính toán.

– =24.995 < X2 = 29.884 – Vậy bác bỏ giả thuyết H0 (cóảnh hưởng) 178

2( 1)( 1),r c

X a

Chú ý

Có ột g ê tắ khá ửdụ gt gkiể đị h

Page 179: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 179/328

• Cómột nguyêntắc khácsử dụng trongkiểm định giả thuyết là dùng P – value

• P – value là xácsuất sẽ mắc phải sai lầm loại I(xácsuất loại bỏ H0 với những thông tin tính toánđc, vậy P – value có cùng ýnghĩa với mức ýnghĩa a ) – Xácsuất p – value càng cao thì chothấy hậu quả của

mắc sai lầm loại I cànglớn.

– Vậy quytắc chung là không bác bỏ H0 nếu p – valuequá lớn.

179

(tiếp)

Với ê ắ à ó hể é l

Page 180: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 180/328

• Với nguyêntắc này cóthể xem xét p – valueđể ra quyết định. – Nếu p – value < 0.1 thìkiểm định có ýnghĩa với

độ tincậy 90%(Khái niệm “có ý nghĩa” được hiểu là giả thuyết H 0 có thể bị bác bỏ với độ tin cậy 90%)

– Nếu p – value < 0.05 thìkiểm định có ýnghĩa với độ tincậy 95%

– Nếu p – value < 0.01 thìkiểm định có ýnghĩa với độ tincậy 99%

180

P-valuevới SPSS

SPSS i l là Si ứ ý hĩ

Page 181: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 181/328

• SPSSgọi p – value là Sig. – mức ý nghĩa quansát. – Ví dụ: X2 = 29.884 có Sig. = 0.012 (1.2%)

• Quyết định theo nguyêntắc: – Chấp nhận H0 nếu sig. >a , vìnếu bác bỏ H0 thì

khả năng mắc sai lầm sẽ lớn hơn mức ý nghĩa cho phép.

– Bác bỏ H0 nếu sig. < a , vì lúc này xácsuất phạm sai lầm nếu bác bỏ H0 nhỏ hơn mức cho phép, cóthể an toàn khi bác bỏ.

– Ví dụ: p-value = 0.012 <a 0.05, bác bỏ H0 181

Chú ý

• KiểmđịnhX2 chỉcó ýnghĩakhisốquan sátđủlớn

Page 182: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 182/328

• Kiểm định X2 chỉ có ýnghĩa khisố quan sátđủ lớn . – Nếu có quá 20% số ô trong bảng chéo có tần số lý thuyết

nhỏ hơn 5 thì X 2 không đáng tin. Cần gom các biến lại để tăng số quan sát (dùng recode).

– Continuity Correction: dạng biến thể của X2 , sử dụng chonhững bảng dạng 2x2 ( bảng kết hợp 2 biến, mỗi biến có 2 biểu hiện)

– Likelihood ratio: làmột số thống kê tương tự X2 với những cỡ mẫu lớn kết quả của 2 thống kê nàyrất gần

nhau. – Linear – by – Linear Association: đo lường mối liênhệ tuyết tínhgiữa 2 biến. Số thống kê nàychỉ hữu dụng khi biến hàng,cột được sắp thứ tự từ nhỏ tới lớn

182

MỘT SỐ ĐẠI LƢỢNG THỐNG KÊKHÁC VỀ MỐI LIÊN HỆ GIỮA 2BIẾN ĐỊNH DANH

Page 183: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 183/328

• Kiểm định X2 không cho biết độ mạnh của mốliên hệ, để khắc phục ta có thể dùng: – Lambda – Cramer V – Hệ số liên hợp (coefficient of contigency)

183

Cramer V

• Cramer V được tính dựa trên X2 và là một kiểm

Page 184: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 184/328

• Cramer V được tính dựa trên X và là một kiểmđịnh trực tiếp mối liên hệ giữa 2 biến.• Cramer V cho biết độ mạnh của mối liên hệ gicác biến định danh.

– k, số hàng hoặc số cột trong bảng, chọn k nào nhỏhơn.

– N: số quan sát trong mẫu.

184

2

( 1) X V

N k

Hệ số liên hợp (Coeficient ofcontigency)Là ột hỉ ố đá h giá ứ độ tươ g

Page 185: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 185/328

• Là một chỉ số đánh giá mức độ tương quangiữa 2 biến.

– N: qui mô mẫu – C=0 khi giữa hai biến không có liên quan gì

185

2

2 (0 1) X

C C X N

Lambda (L/λ )

Phé đ lườ g liê hệ ủ á biế đị h d

Page 186: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 186/328

• Phép đo lường liên hệ của các biến định dancung cấp cho người tiến hành những cảm nhdễ dàng và khả năng giải thích trực tiếp. – Lambda cho biết liệu các trị số của một biến có

hướng tập trung quanh một số trị số nào đó của biến kia hay ko? – Nếu có thì khi biết được trị số của biến độc lập

có thể dự đoán được trị số của biến phụ thuộc.

186

Page 187: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 187/328

KIỂM ĐỊNH MỐI LIÊN HỆ GIỮA 2BIẾN THỨ BẬC

• Ví dụ:

Page 188: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 188/328

Ví dụ: – Nghiên cứu mối liên hệ giữa tuổi tác và mức độ

quan tâm đối với chủ đề gia đình trên báoSGTT?

– Nhận xét về 2 biến trên – Đặt giả thuyết không và giả thuyết thay thế

188

KIỂM ĐỊNH MỐI LIÊN HỆ GIỮA 2BIẾN THỨ BẬC

• Nhận xét

Page 189: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 189/328

• Nhận xét – Cả hai yếu tố này đều là dữ liệu thứ bậc vì nó đ

phân hạng. – Giả thiếtH0: tuổi tác không có mối liên hệ với mứ

độ quan tâm đến chủ đề gia đình trên báo SGTT. – Giả thuyết Ha?

• Giải pháp giúp phát hiện mối liên hệ tốt hơn chi

bình phƣơng – Tau-bcủaKendall – d củaSomer – Gammacủa Goodman và Kruskal. 189

Gamma của Goodman và Kruskal

• Gamma là một thước đo phổ biến và dễ cảm

Page 190: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 190/328

• Gamma là một thước đo phổ biến và dễ cảmnhận, vì trị số của nó nằm trong khoảng từ-1tới +1, giá trị 0 đại diện cho sự độc lập hoàntoàn.

• Giả thuyết H0 (gamma): tổng thể chung = 0(không có mối liên hệ giữa các biến thứ bậc – Nếu kết quả kiểm định cho phép bác bỏ H0 thì k

luận 2 biến thứ bậc có mối liên hệ và giá trịgamma của mẫu tính được xấp xỉ giá trị gammacủa tổng thể chung.

190

Gamma của Goodman và Kruskal • Ví dụ: kiểm định mối liên hệ giữa tuổi tác và

độ quan tâm tới chủ đề gia đình trên báo SGTT

Page 191: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 191/328

độ quan tâm tới chủ đề gia đình trên báo SGTT

191

Tab- b của Kendall

• Gammavì nó có xu hướng thổi phồng mối liên

Page 192: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 192/328

g p g

hệ giữa các biến bởi những dữ liệu nó bỏ khôxét đến trong quá trình tính toán (do quy tắc tícủa gamma)

• Tau-bsử dụng hầu hết dữ liệu nên sẽ gần nhưluôn luôn nhỏ hơn của gamma vì vậy nó đángcậu hơn khi đo lường mối liên hệ.

• Tuy nhiên rất khó kiểm tra mức ý nghĩa của ta-btrong lĩnh vực nghiên cứu, công thức tính nó lạkhó và không sẵn bảng để tra cứu.

192

Tab- b của Kendall • Ví dụ: kiểm định mối liên hệ giữa tuổi tác và

độ quan tâm tới chủ đề gia đình trên báoSGTT

Page 193: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 193/328

độ quan tâm tới chủ đề gia đình trên báoSGTTvới giả thuyết H0 là: tổng thể chung = 0

193

BÀI TẬP THỰC HÀNH

• Xem xét tất cả các vấn đề cần kiểm định sa

Page 194: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 194/328

• Xem xét tất cả các vấn đề cần kiểm định sacho biết sử dụng kỹ thuật nào để kiểm địnhGiải thích tại sao và tiến hành kiểm định, đưra kết luận cho phép kiểm định: 1. Có ý kiến cho rằng có mối liên hệ thu nhập bìn

quântháng và giới tính hay thành phố sinh sống,hãy kiểm định ý kiến trên.

2. Có hay không mối liên hệ giữa trình độ học vấvà cách đọc báo?

194

Chƣơng5

PHÂNTÍCH LIÊN HỆ GIỮA BIẾN

Page 195: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 195/328

PHÂNTÍCH LIÊN HỆ GIỮA BIẾNNGUYÊN NHÂN ĐỊNH TÍNHVÀ BIẾN

KẾT QUẢ ĐỊNH LƢỢNG (KIỂM ĐỊNH TRUNG BÌNH TỔNG THỂ)

195

KIỂM ĐỊNH GIẢ THUYẾT VỀ TRỊ TRUNGBÌNH CỦA MỘT TỔNG THỂ

• Ví dụ: Có người cho rằng tuổi trung bình củ

Page 196: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 196/328

• Ví dụ: Có người cho rằng tuổi trung bình củđộc giả báo SGTT là 30 tuổi, với dữ liệu cóđược bạn làm thế nào để kiểm định được ýkiến trên?

• Thực hiện: – Lọc ra các đối tượng đọc giả báo SGTT – Đặt giả thuyết không

– Kiểm định theo yêu cầu

196

KIỂM ĐỊNH GIẢ THUYẾT VỀ TRỊ TRUNGBÌNH CỦA MỘT TỔNG THỂ

1. Đặt giả thuyết H0: Tuổi trung bình của độc giả báoSGTT=30

Page 197: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 197/328

2. Dùnglệnh Count để chuyển các biến Category từ câu c2tới c2a.9 thành biến Dichotomy với biển hiện 1 là ngườđọc báo SGTT và 0 là người không đọc báo SGTT.

3. Dùng lệnh Select case lọc ra các trường hợp đọc báo SG

(chỉ thực hiện kiểm định trên các trường hợp này). 4. Thực hiện kiểm định: Analyze/ Compare Means/ One –

Sample T-Test5. Đưa biến tuổi vào khung Test Varialbe, khai báo Test Val

30.6. Chọn mức độ tin cậy của phép kiểm định 7. Đọc kết quả . 197

KẾT QUẢ KIỂM ĐỊNH

Page 198: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 198/328

• Nhận xét kết quả? 198

KẾT QUẢ KIỂM ĐỊNH • Giải thích ý nghĩa các giá trị:

Mean: giá trị trung bình

Page 199: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 199/328

– Mean: giá trị trung bình – Std.Deviaton -SD: độ lệch chuẩn – Std.Error Mean -SE: sai số chuẩn(SD/sqrtN) – t: giá trị tới hạn – giá trị kiểm định t(t hai đuôi) – df : số bậc tự do (là đại lượng hiệu chỉnh độ chệch

cho phương) – Mean differrent: sai biệt giữa TB mẫu và giá trị lý

thuyết(m- μ ) – 95% Confident interval of the difference: Khoảngước lượng mẫu với độ tin cậy 95% (upper – lower:giới hạn trên – dưới) 199

KẾT QUẢ KIỂM ĐỊNH

• Sig = 0 001 < α = 0 05: sự khác biệt có ý

Page 200: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 200/328

Sig = 0.001 < α 0.05: sự khác biệt có ýnghĩa thống kê-> chấp nhận H a

200

KIỂM ĐỊNH GIẢ THUYẾT VỀ TRỊ TRUNGBÌNH CỦA HAI TỔNG THỂ(MẪU ĐỘC LẬP)

• Ví dụ: So sánh giữa 2 thành phố Hà Nội và T

Page 201: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 201/328

Ví dụ: So sánh giữa 2 thành phố Hà Nội và THCM về số nhân khẩu trung bình của các hộgiađình. – Nhận xét hai biến kiểm đinh?

– Nhận xét về yêu cầu kiểm định trên? – Phương án thực hiện?

201

KIỂM ĐỊNH GIẢ THUYẾT VỀ TRỊ TRUNGBÌNH CỦA HAI TỔNG THỂ(MẪU ĐỘC LẬP) • Nhận xét

Page 202: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 202/328

Nhận xét – Biến định lượng số nhân khẩu, định tính là thành

phố – Cần so sánh trị trung bình về một chỉ tiêu nghiên

cứu(số nhân khẩu)giữa hai đối tượng (TP Hà Nộivà HCM) – Sử dụng phép kiểm định trị trung bình 2 mẫu độ

lập (Independent – samples T-Test)

202

KIỂM ĐỊNH GIẢ THUYẾT VỀ TRỊ TRUNGBÌNH CỦA HAI TỔNG THỂ(MẪU ĐỘC LẬP) • Chú ý:

Page 203: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 203/328

Chú ý: – Đối với phép kiểm định trị trung bình của 2 mẫu

độc lập thì sự khác biệt từ chính nội tại của mẫuchứ không phải do các nguyên nhânkhác

– Khi có nhiều yếu tố gây ra sự khác biệt giữa 2 trtrung bìnhthì chọn 2 nhóm mẫu kiểm định như thnào đó để cho có sự tương đồng hoàn toàn trongtừng cặp quan sát về các yếu tố có khả năng tácđộng đến vấn đề ta muốn kiểm tra có sự khác bihay không (Paired – samples design).

203

CHÚ Ý (Cont.) – Tất cả các quan sátxemnhư là được chọn ngẫu nhiên

độc lập từ 2 tổng thể cho phân phối chuẩn và phư

Page 204: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 204/328

độc lập từ 2 tổng thể cho phân phối chuẩn và phưsai bằngnhau (Independent – samples design).

– Nếu kiểm định giả thuyết về trị trung bình của 2 mđộc lập vi phạm giả thuyết là 2 mẫu ngẫu nhiên từ

tổng thể có phân phối chuẩn thì chúng ta sử dụng định Mann – Whitney. – Trước khi thực hiện kiểm định Independent –

samples T-Test,thực hiện phép kiểm định Levene teđể kiểm định sự bằng nhau về phương sai.

• Giả thuyết H0 rằng phương sai của 2 tổng thể bằng nhaukết quả kiểm định cho bạn mức ý nghĩa quan sát nhỏ nh0,05 bạn có thể bác bỏ giả thuyết H0. 204

THỰC HIỆN KIỂM ĐỊNH(Independent – samples design)1 Chọn Analyze/Compare Means/ Independen

Page 205: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 205/328

1. Chọn Analyze/Compare Means/ Independen – samples T-Test.

2. Đưa các biến định lượng muốn kiểm định ttrung bình vào Test Variable, biến định tínhvào Grouping Variable.

3. Sau khi chọn biến để phân nhóm, chọn DefiGroups để chỉ định 2 nhóm cần so sánh.

4. Đọc kết quả

205

THỰC HIỆN KIỂM ĐỊNH(Independent – samples design) Cont.

• Đọc kết quả

Page 206: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 206/328

– Nếu sig. trong kiểm định Levene < 0.05 thì phương saigiữa 2 nhóm khác nhau, sử dụng kết quả kiểm định t phần Equal variances not asumed.

– Ngược lại, đọc kết quả ở phần Equal variances assumed.

• Sử dụng kết quả ở phần Equal variances notassumed cho kiểm định t. – Nếu Sig. trong kiểm định t< 0.05 thì kết luận có sự kh

biệt có ý nghĩa về trung bình giữa 2 thành phố. – Ngược lại chưa có sự khác biệt có ý nghĩa về trị trun

bình giữa 2 thành phố. 206

KẾT QUẢ KIỂM ĐỊNH

Page 207: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 207/328

207

KẾT QUẢ KIỂM ĐỊNH

• Sig. của kiểm định Levene = 0.01 < 0.05

Page 208: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 208/328

Sig. của kiểm định Levene 0.01 0.05--> sử dụng kết quả kiểm định t ở phần Equalvariances not asumed.

• Sig. tại Equal variances not asumed = 0.00 Bác bỏ giả thuyết H0 và kết luận số nhân khẩu

trung bình trong hộ gia đình ở TP HCM khác(lớn hơn) một cách có ý nghĩa thống kê so vớiHà Nội.

208

KIỂM ĐỊNH TRỊ TRUNG BÌNH CỦA HAIMẪU PHỤ THUỘC (Paired-samples T-test)

• Đây là loại kiểm định dùng cho 2 nhóm tổng thể

Page 209: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 209/328

liên hệ với nhau.• Dữ liệu của mẫu thu thập ở dạng thang đo định

lượng khoảng cách hoặc tỉ lệ.

• Quá trình kiểm định sẽ bắt đầu với việc tính toáchênh lệch giá trị trên từng cặp quan sát bằng phtrừ, sau đó kiểm nghiệm xem chênh lệch trung bìcủa tổng thể có khác 0 không, nếu khác 0 tức làkhông có khác biệt.

209

KIỂM ĐỊNH TRỊ TRUNG BÌNH CỦA HAIMẪU PHỤ THUỘC (Paired-samples T-test) • Lợi thế của phép kiểm định mẫu phối hợp từng

Page 210: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 210/328

ợ p p ị p ợp gcặp là nó loại trừ được những yếu tố tác động ngoài vào nhóm thử.

• Phương pháp kiểm định này rất thích hợp với

dạng thử nghiệm trước vàsau.• Ví dụ: Kiểm định sự khác biệt về 2 loại đậu phộng chế biến trước và sau khi tiến hành cải t

– Tiến hành đánh giá trên cùng một nhóm người th – So sánh giửa 2 nhóm người khác nhau thì sự đánhgiá bị ảnh hưởng bởi khẩu vị, nhận thức, kinhnghiệm… 210

Page 211: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 211/328

THỰC HIỆN KIỂM ĐỊNH

• Sử dụng bộ dữ liệu Dauphong.sav

Page 212: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 212/328

ụ g ộ ệ p g1. Vào Analyze/Compare Means/ Paired-samples T-

test2. Chọn 2 biến chứa các giá trị của 2 mẫu cần quan s

đưa vào Paired Variables để so sánh. 3. Chọn độ tin cậy tại hộp thoại Confidence Interval 4. Đọc kết quả

212

KẾT QUẢ KIỂM ĐỊNH

Page 213: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 213/328

213

KẾT QUẢ KIỂM ĐỊNH

• Sig. = 0,036 < 0,05, bác bỏ H0(có sự chênh

Page 214: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 214/328

g , , , ( ự

lệch có ý nghĩa thống kê về sự đánh giá củangười tiêu dùng trước và sau khi cải tiến sản phẩm đậu phộng)

214

TỔNG KẾT • So sánh trị trung bình của một tổng thể với mộ

Page 215: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 215/328

giá trị cụ thể nào đó ta sẽ thực hiện phép kiểmđịnh giả thuyết về trung bình tổng thể.(One-Sample T-Test )

• So sánh hai trị trung bình của hai nhóm tổng thểriêng biệt ta thực hiện phép kiểm định giả thuvề sự bằng nhau của 2 trung bình tổng thể dựtrên hai mẫu độc lập rút ra từ hai tổng thể này(Independent-Sample T-Test)

215

TỔNG KẾT • So sánh hai trị trung bình của hai nhóm tổng thể

Page 216: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 216/328

riêng biệt có đặc điểm là mỗi phần tử quan sátrong tổng thể này có sự tương đồng theo cặpmột phần tử ở tổng thể bên kia ta sử dụng kiểđịnh giả thuyết về sự bằng nhau của hai trungbình tổng thể dựa trên dữ liệu mẫu rút từ hai tthể theo cách phối hợp từng cặp (Paired -SampleT-Test)

216

BÀI TẬP THỰC HÀNH • Xem xét tất cả các vấn đề cần kiểm định sau,

biết sử dụng kỹ thuật nào để kiểm định? Giả

Page 217: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 217/328

biết sử dụng kỹ thuật nào để kiểm định? Giảthích tại sao và tiến hành kiểm định, đưa ra kếluận cho phép kiểm định: 1. Có người cho rằng mỗi gia đình có trung bình 3

người đọc báo SGTT và 2 người xem trang quảncáo. Hãy kiểm định ý kiến trên

2. Kiểm định mối liên hệ giữa số lượng người đọc

và thu nhập bình quân tháng của hộ gia đình

217

Chƣơng 6

Page 218: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 218/328

ƣ gPHÂN TÍCH MỐI LIÊN HỆ GIỮA BIẾNNGUYÊN NHÂN ĐỊNH TÍNH VÀ BIẾN

KẾT QUẢ ĐỊNH LƢỢNG (PHÂN TÍCH PHƢƠNG SAI)

218

PHÂN TÍCH PHƢƠNG SAI MỘT YẾU TỐ(ANOVA)

• Ví dụ: So sánh có sự khác biệt hay không về y

Page 219: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 219/328

ụ ự ệ y g ytố “có tự do cá nhân” đối với cuộc sống của n6 nhóm học vấn khác nhau

219

VÍ DỤ (tiếp) • Nhận xét:

Page 220: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 220/328

– Biến trình độ học vấn: biến định tính – Biến có tự do cá nhân: biến định lượng – Có 6 nhóm phân loại khác nhau

• Phương pháp giải quyết – Sử dụng kiểm định trị trung bình của các tổng thểthành 13 nhóm khác nhau -> không hiệu quả, sai sốlớn.

– Sử dụng phân tích phương sai (ANOVA), tiến hànkiểm định tất cả các nhóm cùng 1 lúc với sai số chlà 5%. 220

PHÂN TÍCH PHƢƠNG SAI MỘT YẾU TỐ(ANOVA)

• Phân tích phương sai là sự mở rộng của kiểm

Page 221: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 221/328

p g gđịnh t, phương pháp này giúp ta so sánh trị trun bình của 3 nhóm trở lên.

• Kỹ thuật phân tích phương sai được dùng đểkiểm định giả thuyết các tổng thể nhóm có trtrung bình bằng nhau.

• SPSScó 2 thủ tục phân tích phương sai: – ANOVAmột yếu tố (sử dụng một yếu tố để phân

và các quan sát thành các nhóm khác nhau. – ANOVAnhiều yếu tố ( khi có từ 2 yếu tố phân loạ

221

LÝ THUYẾT PHÂN TÍCH PHƢƠNG SAIMỘT YẾU TỐ (One – Way ANOVA)

• Một số giả định đối với One – Way ANOVA:

Page 222: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 222/328

– Cácnhóm so sánh phải độc lập và được chọn mộtcách ngẫu nhiên

– Các nhóm so sánh phải có phân phối chuẩn hoặc c

mẫu phải đủ lớn để được xem như là tiệm cận ph phối chuẩn – Phương sai của các nhóm so sánh phải đồng nhất – Nếu giả định tổng thể có phân phối chuẩn với ph

sai bằng nhau không đáp ứng được thì sử dụng kiđịnh phi tham số Kruskal – Wallis thay thế.

222

LÝ THUYẾT PHÂN TÍCH PHƢƠNG SAIMỘT YẾU TỐ (One – Way ANOVA)

• Giả thuyết H0 cần kiểm định là trung bình tổng

Page 223: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 223/328

thể của k nhóm là bằng nhau: – H0: μ1 = μ2 = μ3 =… = μk (không có sự khác biệt giữa

các trung bình nhóm được phân loại theo biến định

tính)

223

LÝ THUYẾT PHÂN TÍCH PHƢƠNG SAIMỘT YẾU TỐ (One – Way ANOVA)

• Trình tự tính toán:

Page 224: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 224/328

1. Tổng các chênh lệch bình phương trong nội bộnhóm: phản ánh biến thiên ngẫu nhiên do ảnhhưởng của các yếu tố khác không xem xét ở đây

2. Tổng các chênh lệch bình phương giữa các nhóm phản ánh biến thiên của biến định lượng đangnghiên cứu do tác động của biến phân loại xem xtới.

3. Tổng các chênh lệch bình phương toàn bộ: phản ánhtoàn bộ biến thiên của biến định lượng đang nghcứu.

224

THỰC HIỆN PHÂN TÍCH ONE-WAYANOVA

1. ChọnAnalyze/Compare mean/One way

Page 225: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 225/328

ANOVA2. Đưa biến định lượng vào khung Dependent L

và biến phân loại và khungFactor3. Chọn thực hiện thống kê các đại lượng thốn

mô tả Descriptive và kiểm định sự bằng nhaugiữa các phương sai nhóm Homogeneity – of – variance.

225

THỰC HIỆN PHÂN TÍCH ONE-WAYANOVA

• Nhận xét:

Page 226: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 226/328

– Nếu H0 được chấp nhận thì công việc đã xong. – Nếu H0 bị bác bỏ thì cần thực hiện tiếp thủ tục k

định nhằm xác định cụ thể trung bình nhóm nào kh

nhóm nào, tức là tìm xem sự khác biệt giữa các nhxảy ra ở đâu.

226

ĐỌC KẾT QUẢ PHÂN TÍCH ONE-WAYANOVA

Page 227: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 227/328

227

Từ bảng kết quả kiểm định phương sai: α=.226 < 0,05Vậy phương sai cho biết khôngkhác nhau một cách có ý nghĩa giữa các nhóm học vấn khácnhau => Kết quả phân tích ANOVA có thể sử dụng được

ĐỌC KẾT QUẢ PHÂN TÍCH ONE-WAYANOVA

Page 228: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 228/328

228

ĐỌC KẾT QUẢ PHÂN TÍCH ONE-WAYANOVA

• Với mức ý nghĩa quan sát α = .137 > 0.05

Page 229: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 229/328

– Vậy không có sự khác biệt có ý nghĩa thống kê vsự đánh giá tầm quan trọng của yếu tố “có tự donhân” giữa các nhóm người có trình độ học vấnkhác nhau.

• Nếu chấp nhận độ tin cậy là 85% thì sao???

229

XÁC ĐỊNH CHỖ KHÁC BIỆTPhân tích ANOVA chuyên sâu

• Có 2 phương pháp xác định sự khác biệt trong

Page 230: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 230/328

trị trung bình nhóm xảy ra ở đâu, đó là kiểm đ“trước” và kiểm định “sau”. – Kiểm định “trƣớc” có thể định nghĩa như là kiểm địn

các giả thuyết về sự khác nhau của các trung bìnhnhóm trước khi thực hiện phân tích ANOVA. – Thực hiện việc xác định những chênh lệch cụ thể

các trung bình nhóm theo phán đoán chủ định củangười kiểm định.

– Kiểu kiểm định này được thực hiện trong hộp thoContrasts với tên gọi là kierm định Priori Contrasts 230

XÁC ĐỊNH CHỖ KHÁC BIỆTKiểm định sau

• Là kiểm định các giả định về sự khác nhau củ

Page 231: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 231/328

các trung bình nhóm sau khi đã thực nhiện phâtích ANOVA. – Trong phạm vi giáo trình này ta chọn phương pháp

kiểm định “sau” để tiếp cận. – Kiểu kiểm định này được thực hiện trong hộp thoPost Hoc.

– Kiểm định trong hộp thoại Post Hoc có các phươn pháp kiểm định thống kê sau để so sánh cac trị trun bình của các nhóm.

231

XÁC ĐỊNH CHỖ KHÁC BIỆTKiểm định sau (tiếp)

• Kiểm định trong hộp thoại Post Hoc cócác

Page 232: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 232/328

phương pháp kiểm định thống kê sau để so sácac trị trung bình của các nhóm. – LSD. Phép kiểm định này chính là việc dùng kiểm

định t lần lượt cho từng cặp trung bình nhóm. Nhưđiểm là độ tin cậy không cao. – Bonferroni. Tiến hành giống quy tắc của LSD như

điều chỉnh được mức ý nghĩa khi so sánh bội dựa tsố lần tiến hành so sánh. Đây là thủ thục đơn giảnđược sử dụng.

232

XÁC ĐỊNH CHỖ KHÁC BIỆTKiểm định sau (tiếp) – Tukey: Sử dụng khá phổ biến cho việc tìm kiếm cá

Page 233: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 233/328

trung bình nhóm khác biệt. Nó sử dụng bảng phân Studentize range distribution. Tukey hiệu quả hơnBonferroni khi số lượng các cặp trung bình cần so là lớn.

– Scheffe: Phương pháp này kém nhạu hơn trong việcsánh cá trị trung bình của các cặp, nó đòi hỏi phải ckhác biệt lớn giữa các trị trung bình so với các thủ

so sánh bội khác để đảm bảo rằng có sự khắc biệtsự, nhưng vì thế nó đưa ra kết quả kiểm định thậnhơn.

233

XÁC ĐỊNH CHỖ KHÁC BIỆTKiểm định sau (tiếp) – R-E-G-W:Thực hiện 2 bước kiểm định, đầu tiên nó

Page 234: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 234/328

tiến hành kiểm định lại toàn bộ các trị trung bình nhxem có bằng nhau không, nếu không bằng thì bước tiếp nó sẽ kiểm định để tìm các nhóm nào khác biệsự với nhau về trị trung bình. Nhưng kiểm định nàykhông phù hợp với kích cỡ các mẫu không bằng nha

– Dunnett: Thủ tục cho phép chọn so sánh các trị trung bình của các nhóm mẫu còn lại với trị trung bình củ

một nhóm mẫu cụ thể nào đó được chọn ra so sánh(SPSS mặc định là nhóm cuối). – Trong trường hợp phương sai giữa các đối tượng cầ

sánh khác nhau, người ta hay chọnTamhane’s T2. 234

VÍ DỤ

• Chọn kiểm định Dunnett, lựa chọn mặc định

Page 235: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 235/328

nhóm cuối cùng.• Kết quả ???

235

PHÂN TÍCH ANOVA HAI YẾU TỐ • Ví dụ: Kiểm định sựảnh hưởng của mức độ

Page 236: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 236/328

yêu thích ngành học vàthời gian tự học tới kếtquả học tập của sinhviên.

236

PHÂN TÍCH ANOVA HAI YẾU TỐ

• Giả thuyết cho kiểm định ANOVA hai yếu tố

Page 237: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 237/328

sau: – Tổng thể có phân phối chuẩn:tổng thể mà từ đó mẫu

nghiên cứu phải có phân phối chuẩn

– Phương sai đồng đều: Phương sai nhóm nghiên cứu phải đều nhau

237

PHÂN TÍCH ANOVA HAI YẾU TỐ

• Đặt giả thuyết H0 như sau:

Page 238: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 238/328

– Điểm trung bình học tập (ĐTB) của sinh viên có thgian tự học khác nhau đều bằng nhau

– ĐTB của sinh viên có mức độ yêu thích ngành học

khác nhau đều bằng nhau – Không có ảnh hưởng tương tác giữa thời gian tự hvà mức độ yêu thích ngành học của sinh viên.

238

Page 239: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 239/328

ĐỌC KẾT QUẢ PHÂN TÍCH

Page 240: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 240/328

• Kết quả kiểm định Levene‟s α=.389>.05

giả định về sự bằng nhau về phương sai ko b phạm. 240

ĐỌC KẾT QUẢ PHÂN TÍCH

Page 241: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 241/328

• Mức ý nghĩa α = .000 < 0.005 => bác bỏ giảthuyết H

0=> Phân tích ANOVA chuyên sâu(kiểm

định Tukey)

241

ĐỌC KẾT QUẢ PHÂN TÍCHTUKEY• Xác định các cặp trung bình tổng thể khác nhau th

yếu tố “Thời gian tự học”

Page 242: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 242/328

y g ự ọ

• Tất cả các giá trị sig < 0.05 =>bác bỏ giả thuyết H 0 (SVcó thời gian tự học khác nhau có ĐTB khác nhau) 242

ĐỌC KẾT QUẢ PHÂN TÍCH TUKEY • Xác định các cặp trung bình tổng thể khác nha

theo yếu tố “Yêu thích ngành học”

Page 243: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 243/328

y g

• Sig=.815 > .05 =>Sv có mức độ yêu thích ngành học“thích” hoặc “ko thích lắm” ko có sự khác biệt về ĐT 243

ĐỌC KẾT QUẢ PHÂN TÍCH TUKEY

• Biểu đồ

Page 244: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 244/328

244

Chƣơng 7 Ể Ố

Page 245: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 245/328

KIỂM ĐỊNH PHI THAM SỐ

245

NHẬN XÉT

• Hầu hết các kiểm định thống kê đã học đều đề ố ẩ

Page 246: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 246/328

hỏi những giả định chặt chẽ về phân phối chuẩncủa tổng thể mà từ đó mẫu được chọn ra.

• Tuy nhiên trong phân tích số liệu thống kê, khô phải lúc nào cũng gặp được các tình huống thỏmãn hoàn toàn các giả định cần thiết này, đặc khi bộ mẫu có số lượng nhỏ. Khi đó phải sử d

các thủ tục kiểm định ít nghiêm ngặt hơn về p phối dữ liệu – thủ tục kiểm định phi tham số . 246

NHẬN XÉT (Tiếp)

• Nhược điểm của kiểm định phi tham sốlà: khảệ ậ ủ

Page 247: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 247/328

năng tìm ra được những khác biệt thật sự củachúng kém hơn kiểm định tham số. – Kiểm định phi tham số chỉ hữu dụng cho những tr

hợp không thể sử dụng kiểm định tham số thôngthường hoặc mẫu có những giá trị quan sát bấtthường.

– Kiểm định phi tham số cũng phù hợp trong các trưhợp dữ liệu thứ bậc, hoặc khoảng cách không có p phối chuẩn rõ ràng.

247

Các kiểm định phi tham sốthay thế cho kiểmđịnh tham số

Page 248: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 248/328

248

VÍ DỤ • Ví dụ: Xem xét lại minh họa về cải tiến của s

ẩ ậ ộ ớ ả ế

Page 249: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 249/328

phẩm đậu phộng trước và sau khi cải tiến vì cta có thể nghi ngờ rằng mẫu không thỏa mãn gđịnh về phân phối chuẩn của tổng thể các chêlệch, do đó kết quả kiểm định của chúng ta ở Paired – samples t-test chưa chính xác. – Giả thuyết H0: không có khuynh hướng thích sản

phẩm loại này hơn so với sản phẩm loại kia trong

bộ người tiêu dùng.

249

KIỂM ĐỊNH DẤU (SIGN TEST) • Kiểm định dấu là một thủ tục phi tham số đơn

giản nhất được sử dụng cho hai mẫu liên hệ tố ủ ị

Page 250: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 250/328

tình huống so sánh sự khác nhau của trị trung bcủa 2 tổng thể mà không cần giả thuyết nào vhình dạng của hai phân phối này.

250

TRÌNH TỰ KIỂM ĐỊNH DẤU • So sánh từng cặp điểm đánh giá của từng ngư

đối với 2 tình huống cụ thể, lấy điểm người đả ẩ ừ ể

Page 251: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 251/328

đánh giá sản phẩm sau trừ đi điểm đánh giá chsản phẩm trước. – Ghidấu “+” nếu sản phẩm sau cải tiến hơn sản ph

trước và ngược lại cho dấu “-“ nếu không cải tiến,trong trường hợp giá trị = 0 thì không xét tới. – Nếu đi theo giả thuyết H0 của bài toán rằng trong

thể người tiêu dùng không có khuynh hướng thích phẩm loại này hơn so với loại kia thì xét về dấu knăng gặp 1 dấu “+” hay một dấu “-“ là như nhau(50%). 251

TRÌNH TỰ KIỂM ĐỊNH DẤU

• Giả thuyết H0 của bài toán chuyển thành:ấ ể ộ ờ

Page 252: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 252/328

– H0: Xác suất để một người tiêu dùng nào đó đánh gsản phẩm sau cải tiến hơn sản phẩm trước (hoặcngược lại) là 0,5.

• Giá trị kiểm định T bằng số lượng các dấu “+đếm được so với các giá trị tới hạn tính ra từ p phối nhị thức.

252

BẢNH MẪU

Page 253: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 253/328

253

NHẬN XÉT • Có: 12 dấu “+” và 4 dấu “–”=> T = 12 (n = 16)• H0 : p = 0,5

Page 254: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 254/328

• H1 : p ≠ 0,5 • Giá trị kiểm địnhT =12(tổng số dấu cộng)

• Giátrị giới hạn đầu tiên C1 được tính ra từ bảng phân phối nhị thức (với n là số đơn vị chênh lkhác 0 và p=0,5) sao cho gần nhất với mức ýnghĩa α/2. Giá trị giới hạn C2 = n – C1

254

NHẬN XÉT (Tiếp) • Nếu C1 ≤ T ≤ C2 : chấp nhận giả thuyết H0 ,

ngược lại bác bỏ giả thuyết H0 ớ

Page 255: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 255/328

• Ví dụ trên với n = 16, p = 0,5 và α/2 = 0,025 tathấy trong bảng chỉ có 0,0278 là gần với 0,025nhất, tương ứng với giá trị giới hạn C1 = 4 (thật ranếu gần bằng đúng với 0,025 thì C1 ≈ 3,9). Vì thếC2 = 16 – 3,9 = 12,1. – Ta có : 4 ≤ T=12 ≤ 12,1 => chấp nhận giả thuyế

H0 nếu chọn mức ý nghĩa 0,05

255

NHẬN XÉT (Tiếp)

• Cách tính P-value :(a>b, n=16, p=0,5)là ố dấ ộ à b là ố dấ ừ

Page 256: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 256/328

– a là số dấu cộng và b là số dấu trừ α/2 = P(a ≥ 12) = P(b ≤ 4) =0,0278+0,0085+0,0018+0,0002 = 0,0383

α = 2 x 0,0383 = 0,0766 ≈ 0,077

256

THỰC HIỆN KIỂM ĐỊNH DẤU BẰNG SPSS 1. Analyze/ Nonparametric Test/ 2 Related Sampl2. Chọn biến đưa vào khung Test Pair

ể ấ

Page 257: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 257/328

– Wilcoxon: Kiểm định dấu và hạng Wilcoxon – Sign: Kiểm định dấu – McMemar: Kiểm định McMemar là dạng kiểm địn

dấu áp dụng cho biến Dichotomous.3. Tùychọn các tính toán và đọc kết quả.

257

ĐỌC KẾT QUẢ KIỂM ĐỊNH

Page 258: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 258/328

258

ĐỌC KẾT QUẢ KIỂM ĐỊNH

Page 259: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 259/328

• Mức ý nghĩa sig = .077 > .025 => người tiêu dthích các sp trước và sau cải tiến là khác nhau Nhưng chưa đủ để chấp nhận đánh giá sp trưhơn sp sau (Pari T Test kết luận chính xác hơn

259

VÍ DỤ 2 • Cho bảng mẫu

Page 260: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 260/328

260

NHẬN XÉT • Có 2 dấu “+” và 5 dấu “–”=> T = 2 (n = 7)• H0 : p = 0,5

0

Page 261: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 261/328

• H1 : p ≠0,5• =>Giátrị kiểm định T = 2

– Giá trị giới hạn C1 được tính ra từ bảng phân phối nh

thức (với n=7 và p=0,5) sao cho gần nhất với mứcnghĩa α/2. Giá trị giới hạn C2 = n – C1

– Nếu C1 ≤ T ≤ C2 : chấp nhận giả thuyết H0 , ngược

lại bác bỏ giả thuyết H0

261

NHẬN XẾT (Tiếp) • Ví dụ trên với n = 7, p = 0,5 và α/2 = 0,025 ta t

trong bảng chỉ có 0,0547 là gần với 0,025 nhấươ ứ ới iá ị iới h C1 1 ( hậ ế

Page 262: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 262/328

tương ứng với giá trị giới hạn C1 = 1 (thật ra nếugần bằng đúng với 0,025 thì C1 ≈ 0,5). Vì thế C2 =7 – 1 = 6

– Ta có :1≤ T=2 ≤ 6 => chấp nhận giả thuyết H0 nếuchọn mức ý nghĩa 0,05 • Cách tính P-value: (a<b, n=7, p=0,5)

– a là số dấu cộng và b là số dấu trừ, α/2 = P(a ≤ 2) P(b ≥ 5) = 0,1641+0,0547+0,0078 =0,2266 – α= 2 x 0,2266 = 0,4532

262

KIỂM ĐỊNH DẤU VÀ HẠNG WILCOXON • Kiểm định dấu chỉ xét chiều hướng nên đơn g

nhưng không mạnh Kiể đị h dấ à h Wil khắ h

Page 263: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 263/328

• Kiểm định dấu và hạng Wilcoxon khắc phục nhược điểmnày: – Sử dụng luôn cả thông tin về độ lớn của chênh lệ – Giả thuyết rằng phân phối của 2 tổng thể là giống

nhau.• Giả thuyết H0: hai trị trung bình của 2 tổng thể l

như nhau

263

KIỂM ĐỊNH DẤU VÀ HẠNG WILCOXON • Kiểm định dấu và hạngWilcoxon:

– Cácchênh lệch được xếp hạng theo độ lớn không đế dấ ủ hú g Điể â bằ g thì hạ g ủ

Page 264: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 264/328

đến dấu của chúng. Điểm cân bằng thì hạng của cđược tính bình quân.

– Sauđó tính tổng các hạng đối với các chênh lệch

dương và đối với các chênh lệch âm. Giá trị tổng hnào nhỏ nhất sẽ là giá trị T của kiểm định này. – Qui tắc quyết định là ở mức ý nghĩaa , bác bỏ giả

thuyết H0 nếuT<Ta vớiT a là giá trị tra bảng phân phối của kiểm định Wilcoxon (trong trường hợp mlớn có thể dùng bảng phân phối chuẩn thay cho ph phối của kiểm định Wilcoxon).

264

BẢNG MẪU QS Trƣớc Sau ∆ Dấu Thứ hạng

Hạng

(+)

Hạng

(-)

(1) (2) (3) (4) (5) (6) (7) (8) (9) 7 7 7 0 0 0

15 7 7 0 0 0

19 6 6 0 0 0

Page 265: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 265/328

20 8 8 0 0 0

1 7 8 +1 1 + 1 5,5

2 8 9 +1 1 + 2 5,5

3 6 5 -1 1 - 3 5,5

4 8 9 +1 1 + 4 5,5

5 7 8 +1 1 + 5 5,5

8 6 7 +1 1 + 6 5,5

9 8 7 -1 1 - 7 5,5

13 8 9 +1 1 + 8 5,5

14 9 10 +1 1 + 9 5,5

17 8 7 -1 1 - 10 5,5

6 7 9 +2 2 + 11 13,5

10 6 8 +2 2 + 12 13,5 11 7 9 +2 2 + 13 13,5

12 7 5 -2 2 - 14 13,5

16 7 9 +2 2 + 15 13,5

18 7 9 +2 2 + 16 13,5

Tổng hạng 106 30

Hạng trung bình 8,83 7,50

265

NHẬN XÉT • Thứ tự quan sát của bộ mẫu? • Giải thích các ý nghĩa và cách tính của các cộ

Page 266: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 266/328

266

NHẬN XÉT – Giả thuyết H0 : phân phối của hai tổng thể giống nh

hay Ho: = )

Giá trị kiểm định T là giá trị tổng hạng nào nhỏ nh

Page 267: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 267/328

– Giá trị kiểm định T là giá trị tổng hạng nào nhỏ nh(T = 30)

– Tra bảng phân phối Wilcoxon với n=16 (không xét

cặp có chênh lệch = 0) với mức ý nghĩa α đã chọn(T0,025 = 30) – Nếu T ≤ Tα/2 : bác bỏ giả thuyết H0 , ngược lại chấp

nhận giả thuyết H0

• Ví dụ trên với T = Tα/2= 30 => bác bỏ giả thuyếH0 với mức ý nghĩa α = 0,05

267

THỰC HIỆN KIỂM ĐỊNH TRÊN SPSS

1. Analyze/ Nonparametric Test/ 2 Related Sampl2 Chọ biế đư à kh g T t P i

Page 268: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 268/328

2. Chọn biến đưa vào khung Test Pair – Wilcoxon: Kiểm định dấu và hạng Wilcoxon – Sign: Kiểm định dấu

– McMemar: Kiểm định McMemar là dạng kiểm địndấu áp dụng cho biến Dichotomous.

3. Tùy chọn các tính toán và đọc kết quả.

268

ĐỌC KẾT QUẢ KIỂM ĐỊNH

Page 269: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 269/328

269

• Hạng trung bình chênh lệch âm l7.5 , dương là 8.83.

• Có 4 quan sát có giá trị bằng nhau • Sig = 0.042 > 0.025 => bác bỏ H0

KIỂM ĐỊNH MANN- WHITNEY2 MẪUĐỌC LẬP

• Là phép kiểm định phổ biến nhất để kiểm địnthuyết vềsự bằng nhau của hai trung bình mẫuđộc lập khi các giả định không thỏa mãn

Page 270: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 270/328

độc lập khi các giả định không thỏa mãn.• Giả thuyết H0: 2 trung bình của 2 nhóm tổng thể

bằngnhau. – Kiểm định không quan tâm tới hình dáng của phân

phối 2 nhóm nhưng chúng phải có cùng hình dáng nhau.

– Kiểm định có thể sử dụng với biến thứ bậc.

270

VÍ DỤ • K hảo sát tuổi thọ của các bóng đèn tròn hiệu A

B. Có 7 bóng hiệu A và 5 bóng hiệu B được kh

sát và ghi nhận tuổi thọ

Page 271: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 271/328

sát và ghi nhận tuổi thọ.

271

Quan sát Hiệu A Hạng Quan sát Hiệu B Hạng 1

2

3

4

5

6

7

2400

3800

2300

2600

2400

2800

2100

3,5

11

2

5

3,5

7

1

8

9

10

11

12

3900

3200

2900

3400

2700

12

9

8

10

6

Tổng hạng 33 45

Hạng TB 4,71 9

NHẬN XÉT • Giả thuyết H0 : phân phối của hai tổng thể giống

nhau ( hay Ho : = )• Để thực hiện kiểm định thì các quan sát của 2

Page 272: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 272/328

• Để thực hiện kiểm định thì các quan sát của 2được kết hợp và xếp hạng từ giá trị min – max. – Cách tính hạng?

272

TRÌNH TỰ KIỂM ĐỊNH 1. Analyze / Nonparametric Test/ 2 Independent

Sample2 Đưa biến vào khung Test Variable List và

Page 273: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 273/328

2. Đưa biến vào khung Test Variable List vàGrouping Variables.

3. Chọn kiểm định Mann – Whitney và đọc kết quả

273

ĐỌC KẾT QUẢ

Page 274: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 274/328

274

• Exact Sig. :Nếu toàn bộ cỡ

mẫu < 30• Asymp. Sig. : mức ý nghĩaquan sát

• => vì cỡ mẫu = 12 nên mức ý

nghĩa quan sát sig. = 0.048 >0.025 => bác bỏ H0

KIỂM ĐỊNH KRUSKAL- WALLIS• Kiểm định Kruskal – Wallis là phương pháp kiểm

định giả thuyết trị trung bình của nhiều nhóm thể bằng nhau hay chính là phương pháp phân

Page 275: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 275/328

thể bằng nhau hay chính là phương pháp phân phương sai một yếu tố mà không đòi hỏi bất kgiả định nào về phân phối chuẩn của tổng thể – Khichỉ có 2 nhóm tổng thể muốn so sánh trị trung bình, kiểm định KrusKal – Wallis tương tự kiểm định

Mann – Whitney.

275

THỦ TỤC KIỂM ĐỊNH KRUSKAL-WALLIS

• Tất cả các quan sát của ba nhóm được gộp lạnhau để xếp hạng.

• Sauđó hạng của các quan sát trong từng nhóm

Page 276: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 276/328

• Sauđó hạng của các quan sát trong từng nhómđược cộng lại và đại lượng thống kê KrusKal Wallis H được tính từ các tổng hạng này.

• Đại lượng H này xấp xỉ một phân phối Chi bì phương với giả thuyết H0 là cả ba nhóm này có phân phối giống nhau.

276

VÍ DỤ • Xemxét phân phối của tuổi thọ bóng đèn của 3

nhãn hiệu A, B, C có giống nhau hay không. Giả thuyết H0 là không có sự khác biệt về tuổi th

Page 277: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 277/328

– Giả thuyết H0 là không có sự khác biệt về tuổi thtrung bình của 3 loại bóng đèn.

277

Quan

sát

Hiệu

A

Hạng Quan

sát

Hiệu

B

Hạng Quan

sát

Hiệu

C

Hạng

1

2

3

4

5

6

7

2400

3800

2300

2600

2400

2800

2100

6,5

16

5

8,5

6,5

11

2,5

8

9

10

11

12

3900

3200

2900

3400

2700

17

14

12

15

10

13

14

15

16

17

3000

2100

1800

2200

2600

13

2,5

1

4

8,5

TC 56 68 29

THỰC HIỆN KIỂM ĐỊNH 1. Analyze/ Nonparametric Test/ K Independent

Sample2 Đưa biến vào khung Test Variable List và

Page 278: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 278/328

2. Đưa biến vào khung Test Variable List vàGrouping Variables.

3. Chọn khoảng nhóm cần sosánh.4. Xácđịnh các giá trị của biến nhóm, chọn kiểm

định Kruskal – Wallis H và đọc kết quả.

278

ĐỌC KẾT QUẢ

Page 279: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 279/328

279

• Mức ý nghĩa quan sát sig = 0.04 > 0.02=> bác bỏ giả thuyết H0• => cần xác định các cặp trung bình

nào khác nhau. Phương pháp xác địnhtương tự như phương pháp Tukeytrong phân tích ANOVA chuyên sâu

CHÚ Ý• So sánh kết quả kiểm định Kruskal – Wallis và

One way ANOVA với ví dụ trên. • Kết luận???

Page 280: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 280/328

• Kết luận??? – Nếu cả 2 phương pháp cho cùng kết quả-> ok – Nếu 2 phương pháp cho kết quả khác nhau thì cần

hiểu tại sao và kiểm tra lại số liệu hoặc sử dụng phương pháp kiểm định khác mạnh hơn.

280

KIỂM ĐỊNH CHI- BÌNH PHƢƠNG MỘTMẪU

• Kiểm định Chi – bình phương thường được sửdụng để kiểm định mối liên hệ giữa 2 biến địtính

Page 281: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 281/328

tính.• Ngoài ra còn xem xét độ phù hợp của dữ liệu

giả thuyết về phân phối của tổng thể

281

VÍ DỤ • Một công ty muốn nghiên cứu các vụ tai nạn

động có xảy ra như nhau vào các ngày làm việ

trong tuần hay là có xu hướng tăng vào các ngứ ố ầ

Page 282: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 282/328

trong tuần hay là có xu hướng tăng vào các ngthứ Hai và các ngày cuối tuần? –

282

Tần số thực tế

(Oi)

Tần suất thực tế(%)

Tần số kỳ vọng

(Ei=n.p

i)

Tần suất kỳ vọng

(pi)

Thứ hai 7 21,0 5,3 1/6 Thứ ba 3 9,4 5,3 1/6 Thứ tƣ 3 9,4 5,3 1/6 Thứ năm 2 6,3 5,3 1/6

Thứ sáu 5 15,6 5,3 1/6 Thứ bảy 12 37,5 5,3 1/6 Total n=32 100,0

NHẬN XÉT – Ta lập luận rằng nếu giả thuyết cho rằng “các vụ

nạn xảy ra với xác suất nhu nhau trong 6 ngày làm

việc của tuần” là đúng thì xác suất xảy ra tai nạn cỗi à hải là hư h ứ là bằ 1/6

Page 283: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 283/328

việc của tuần là đúng thì xác suất xảy ra tai nạn cmỗi ngày phải là như nhau tức là bằng 1/6. – Với tổng số 32 vụ tai nạn lao động công ty đó thu

được trong vòng 5 năm qua tạ nhà mày, số lượng cvụ tai nạn trong từng ngày phải bằng nhau tức là 3= 5.3 vụ

• Giả thuyết H0: khả năng xảy ra các vụ tai nạn la

động vào các ngày làm việc trong tuần là nhưnhau,ta sử dụng kiểm định Chi bình phương mmẫu. 283

NHẬN XÉT (tiếp) • H0: tổng thể có phân phối xác suất bằng nhau

1/6– Ei được tính trên cơ sở giả thuyết H0

Page 284: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 284/328

Ei được tính trên cơ sở giả thuyết H0

• Giá trị kiểm định :

– Giá trị giới hạn tra bảng phân phối Chi-square với bậc tự do k -1 và mức ý nghĩa α đã chọn.

• Bác bỏ giả thuyết H0 nếu :284

2k 2 i i

i 1 i

(O E )

E

2k 1, a

2 2k 1, a

THỰC HIỆN KIỂM ĐỊNH 1. Analyze/ Nonparametric Test/ Chisquare… 2. Đưa biến vào khung Test VariableList.3 Xácđịnh các lựa chọn hoặc sử dụng mặc địn

Page 285: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 285/328

3. Xácđịnh các lựa chọn hoặc sử dụng mặc địncủa SPSS và đọc kết quả

285

ĐỌC KẾT QUẢ KIỂM ĐỊNH • Sig = 0,023 < 0,025 vậy có

thể chấp nhận giả thuyếtHa, tức là các vụ tai nạn cóhướ ă à

Page 286: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 286/328

286

Ha, tức là các vụ tai nạn cóxu hướng tăng cao vàongày cuối tuần và thứ 2.

VÍ DỤ • Kiểm định lại kết quả có phải khả năng xảy nạn ngày thứ 2 nhiều hơn ngày thứ 3,4,5 khôn

Page 287: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 287/328

287

KIỂM ĐỊNH KOLMOGOROV – SMIRNOVMỘT MẪU • Kolmogorov – smirnov test được sử dụng để ki

định giả thuyết phân phối của dữ liệu có phù hớ hâ hố lý h ế

Page 288: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 288/328

định giả thuyết phân phối của dữ liệu có phù hvới phân phối lý thuyết. – Nó tiến hành xét các sai lệch tuyệt đối lớn nhất giữ

đường phân phối tích lũy thực nghiệm và lý thuyếlệch tuyệt đối càng lớn, giả thuyết H0 càng dễ bị b bỏ.

– Một số phương pháp thường được sử dụng để kh

tổng thể có phân phối chuẩn hay không như dựng thị Q-Q plot, hay tiến hành kiểm định Jaccque-Berra… • 288

VÍ DỤ • Trong phần kiểm định dấu, chúng ta có đặt mộ

câu hỏi: “Có thật là giả định về phân phối chucủa tổng thể các chênh lệch ở thử nghiệm về

Page 289: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 289/328

của tổng thể các chênh lệch ở thử nghiệm về phộng cải tiến được thỏa mãn hay không?” Tadụng kiểm định Kolmogorov – smirnov để trả lời

câu hỏi. – Tiến hành kiểm định giả thuyết về phân phối chucủa tổng thể chính là ∆, nó là đại diện cho sự chênlệch.

• Giả thuyết H0: tổng thể của biến Delta có phân phối chuẩn

289

CÁCH TÍNH ∆ • Sử dụng file dauphong.sav

1. Transform/Compute… nhập tên biến mới (Delta) 2. Chọn spthu đưa vào khung Numeric Expression

Page 290: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 290/328

2. Chọn spthu đưa vào khung Numeric Expression Chọn nút „-‟ ở khung toán học Chọn spban đưa vào khung Numeric Expression

3. Đặt lại nhãn có biến 4. Nhấn OK và đọc kết quả

290

TRÌNH TỰ KIỂM ĐỊNH1. Analyze/ Nonparametric Test/ 1-Sample K - S2. Đưa biến cần kiểm định (Delta) vàokhung Test

Variable List

Page 291: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 291/328

Variable List.3. Cọn tên phân phối mà giả thuyết muốn kiểm

(Normal) trong khung Test Distribution.4. Tùy chọn các lựa chọn tính toán khác và đọc

quả.

291

ĐỌC KẾT QUẢ KIỂM ĐỊNH

• Sig = 0 232 > 0 1

Page 292: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 292/328

292

• Sig = 0.232 > 0.1do đó chấp nhậngiả thuyết H0

• Kết luận chênhlệch tổng thể có phân phối chuẩn=> áp dụng kiểmđịnh Paired T testlà phù hợp.

CHƢƠNG 8 KIỂM ĐỊNH TỶ LỆ

Page 293: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 293/328

KIỂM ĐỊNH TỶ LỆ

293

KIỂM ĐỊNH TỶ LỆ

• Thủ tục kiểm định tỉ lệ tổng thể là một thủ tụ

giản tuy nhiên việc tiến hành kiểm định này trSPSS ầ hú ý

Page 294: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 294/328

giản tuy nhiên việc tiến hành kiểm định này trSPSS cần chú ý: – Biến đưa vào kiểm định cần phải là một biến nhị

nếu là biến trên 2 lựa chọn thì cần khai báo điểm cđối với biến đó để chia dữ liệu thành hai nhóm.

– Kiểm định này không đòi hỏi giả định về dạng ph phối của biến đang xét xong số liệu phải đảm bảo

ngẫu nhiên.

294

VÍ DỤ • Nghiêncứu “giá trị cảm nhận về dịch vụ đào t

của sinh viên Khoa Kinh tế- ĐH TN “.

Page 295: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 295/328

– Dùng lệnh Seclect Case với lựa chọn Random Samof case để chọn một mẫu (xem là ngẫu nhiên) 100 viên từ tổng thể này thành fileKiemdinhmoi.

• Giả thuyết:H0: Tỷ lệ sinh viên nam trong tổng t>= 40%

295

THỰC HIỆN KIỂM ĐỊNH TỶ LỆ

1. Analyze/ Noparametric Test/ Binomial

2. Đưa biến gioitinh sang khung Test Variable Li

Page 296: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 296/328

2. Đưa biến gioitinh sang khung Test Variable Li 3. Giá trị về tỷ lệ tổng thể muốn kiểm định tron

khung Test Proportion thành 0,4.4. Nếu biến của chúng ta là nhị phân thì mặc đị

để lựa chọn Get from Data với giới tính namđược chọn là nhóm 1 ở dữ liệu này.

296

ĐỌC KẾT QUẢ KIỂM ĐỊNH

Page 297: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 297/328

– Giá trị sig. = 0.462 > 0.05(mức ý nghĩa mặc định) =không bác bỏ được giả thuyết H0

• Thực hiện lại kiểm định trên với việc lấy ngẫnhiên 20% mẫu từ tổng thể quan sát ?

297

VÍ DỤ (Tiếp) • Giả sử ta muốn kiểm định với giả thuyết

– H0: Tỷ lệ sinh viên học ngành KTTS trong tổng th

27% (15%)H1 Tỷ lệ i h iê họ gà h KTTS t g tổ g th

Page 298: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 298/328

( ) – H1: Tỷ lệ sinh viên học ngành KTTS trong tổng th>27% (15%)

• Kết quả ?

298

CHƢƠNG 9

TƢƠNG QUAN VÀ HỒI QUIẾ Í

Page 299: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 299/328

TƢƠNG QUAN VÀ HỒI QUITUYẾN TÍNH

299

VÍ DỤ • Một công ty có 24 khu vực bán hàng trong toànquốc, công ty mở chiến dịch chào hàng cho sả

phẩm mới. Hãy cho biết mối liên hệ giữa doabán hàng và chi phí chào hàng?

Page 300: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 300/328

phẩm mới. Hãy cho biết mối liên hệ giữa doa bán hàng và chi phí chào hàng?

300

Page 301: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 301/328

MỘT SỐ DẠNG LIÊN HỆ THƢỜNG GẶPGIỮA HAI BIẾN ĐỊNH LƢỢNG

• Không có mối liên hệ

Page 302: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 302/328

302

Liên hệ tuyến tính thuận

Page 303: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 303/328

303

Liên hệ tuyến tính nghịch

Page 304: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 304/328

304

Liên hệ phi tuyến

Page 305: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 305/328

305

SỬ DỤNG ĐỒ THỊ PHÂN TÁN • Thực hiện lệnh: Graphs/Scatter/Simple/Define • Dùng đồ thị Scatter biểu diễn mối lên hệ giữa

doanh số bán hàng và chi phí chào hàng.

Page 306: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 306/328

g p g

306

NHẬN XÉT • Mối liên hệ giữa 2 biến?• Độ mạnh/ yếu của mối liên hệ đó? • Mức độ chặt chex của liên hệ?

Page 307: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 307/328

ộ ặ ệ

307

HỆ SỐ TƢƠNG QUAN ĐƠN r • Sử dụng hệ số tương quan đơn r để lượng hó

mức độ chặt chẽ của mối liên hệ tuyến tính g biến định lượng

Page 308: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 308/328

ị ợ g• Công thức:

– Trong đó:-1 ≤ r ≤ +1 – r = 0 : không có mối quan hệ giữa 2 biến – r ≤ 0 : tương quan nghịch – r ≥ 0 : tương quan thuận – r = 1 : ??? 308

n

i ii 1

x y

X Y n(X)(Y)r

(n 1)S S

ĐẶC ĐIỂM HỆ SỐr• Giá trịr =0 chưa hẳn có nghĩa là 2 biến không c

mối liên hệ (có thể là liên hệ phi tuyến). Vì thr chỉ dùng để đo độ chặt chẽ của mối liên hệ tư

t ế tí h

Page 309: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 309/328

g ộ ặ ệquan tuyến tính.

• Nên kết hợp với đồ thị để đưa ra kết luận chíxác

• Không phải lúc nào có mối liên hệ tương quantuyến tính thì đó là mối quan hệ nhân quả.

– VD: Doanh số bán hàng tăng cao có thể do chi phíchào hàng tăng nhưng hoàn toàn có thể do ngẫu nh(do thời tiết, sự kiện lớn đang diễn ra, mùa vụ…) 309

ĐẶC ĐIỂM HỆ SỐr (tiếp) • Có thể xảy trường hợp tương quan tuyến tính

(giá trị r rất cao nhưng lại không phù hợp về mtổng thể)

ữ ố l h ê à ố l

Page 310: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 310/328

g ) – VD: tương quan giữa số lượng sinh viên và số lượ

quán bia trong thành phố. Có thể số lượng quán bia

tăng cao do dân số tăng, mùa hè nắng nóng, thị hiếtiêu dùng của địa phương… • Hệ số tương quanr có tính chất đối xứng, không

có đơn vị đo, không bị ảnh hưởng bởi phép biếđổi tuyến tinh. – Thực nghiệm với SPSS

310

KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐTƢƠNG QUAN TUYẾN TÍNHr

• Hệ số r phản ánh một hiệp biến thiên thật sựtổng thể hay chỉ do tình cờ. – Giả thuyết H0 : ρ = 0 (không có liên hệ tương quan)

ả ị ẫ ẫ ộ ậ ấ ừ

Page 311: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 311/328

– Giả định các mẫu ngẫu nhiên độc lập lấy ra từ mtổng thể nào đó và thỏa mãn phân phối chuẩn

– Giá trị kiểm định :

– Giá trị giới hạn :-tn-2,α/2 và +tn-2,α/2

– Bác bỏ nếu – Đây là phép kiểm định 1 hay 2 phía? Khi nào thực

hiện kiểm định 1 phía? 2 phía? 311

22r n 2t r

1 r1 rn 2

t tn-2, /2a

THỰC HIỆN KIỂM ĐỊNH TRÊN SPSS 1. Analyze / Correlate / Bivariate2. Chọn biến yêu cầu phân tích đưa vào Variable

– Nếu tất cả các trường hợp quan sát đều có giá trị thiếu đối với 1 hoặc 2 biến được chọn hoặc tất c

Page 312: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 312/328

thiếu đối với 1 hoặc 2 biến được chọn, hoặc tất ctrường hợp cùng có 1 giá trị thì không tính được hệr ( .)

3. Lựa chọn hệ số tương quan cần tính toán tron phần Correlation Coefficients.

– Pearson (mặc định): hệ số tương quan – Kendall‟s tau- b: hệ số tương quan hạng – Spearman: hệ số tương quan hạng trong trường hợ

không tuân theo phân phối chuẩn 312

THỰC HIỆN KIỂM ĐỊNH TRÊN SPSS 4. Chọn loại kiểm định: – Two tail ( mặc định): Khi không xác định được chi

hướng kiểm định – One tail: Khi đã xác định được chiều hướng của p

Page 313: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 313/328

ị ợ g pkiểm định

5. Lựa chọn các tùy chọn – Statistics: các thông số thống kê

• Means and standard: trung bình và độ lệch chuẩn • Cross- product deviations and covariances: tổng tích các

modem chéo và hiệp phương sai.

313

THỰC HIỆN KIỂM ĐỊNH TRÊN SPSS – Missing value: các số liệu bị thiếu, sót

• Exclude cases pairwise: Các trường hợp quan sát bị thiế

một hay hai biến sẽ bị loại khỏi quá trình phân tích • Exclude cases listwise: Giá trị quan sát bị thiếu sẽ bị loạ

Page 314: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 314/328

qkhỏi phân tích

6. Continue và đọc kết quả kiểm định

314

ĐỌC KẾT QUẢ KIỂM ĐỊNH

Page 315: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 315/328

– Hệ số tương quan giữa doanh số bán hàng và chínlà: 1, với chi phí bán hàng là 0,905

– Giá trị sig. = 0.000 vậy bác bỏ giả thuyết H0

• Kiểm định trên sử dụng mức ý nghĩa α ?315

HỆ SỐ TƢƠNG QUAN HẠNG • Hệ số tương quan đơnr chỉ phù hợp với dữ liệu

định lượng và thỏa mãn phân phối chuẩn • Dữ liệu không thỏa mãn điều kiện phân phối

h ẩ ử d hệ ố ươ h

Page 316: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 316/328

chuẩn sử dụng hệ số tương quan hạng:Spearman – Hệ số tương quan hạng tính dựa vào hạng của dữ

chứ không dùng giá trị thực của quan sát – Giá trị tương quan hạng:- 1 đến +1

316

HỆ SỐ TƢƠNG QUAN HẠNG (Tiếp)• Xi và Yi được xếp hạng theo thứ tự tăng dần,

trường hợp giá trị bằng nhau thì được xếp đồnhạng và hạng sẽ là hạng trung bình.

í h ù ô hứ ới hư í h h ị

Page 317: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 317/328

• r s tính cùng công thức với r nhưng tính theo trị xếp hạng của Xi và Yi

• Phương pháp kiểm định : – H0 : ρs = 0 (không có liên hệ tương quan) – Giá trị kiểm định r s tính như giá trị kiểm định t

– Giá trị giới hạn tra bảng phân phối Spearman ứng n và mức ý nghĩa α/2 (2 bên)

– Bác bỏ nếu (2 bên) 317s nr r , /2a

ĐỌC KẾT QUẢ KIỂM ĐỊNH

Page 318: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 318/328

318

HỒI QUI TUYẾN TÍNH • Giả sử đã xác định được 2 biến có mối liên hệ

tuyến tính, xác định đúng hướng của mối quannhân quả là có thật => Mô hình hóa mối quan bằng mô hình hồi qui tuyến tính

Page 319: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 319/328

bằng mô hình hồi qui tuyến tính – Mô hình gồm 1 biến phụ thuộc (biến được giải th-

Y) và biến độc lập ( biến giải thích- X). – Mô hình sẽ mô tả hình thức của mối liên hệ và qugiúp dự đoán được mức độ của biến phụ thuộc khtrước giá trị của biến độc lập.

– Phân tích hồi qui các biến không có tính chất đối x phân biệt biến nguyên nhân và kết quả

319

Page 320: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 320/328

VÍ DỤ • Xây dựng mô hình hôi qui tuyến tính đơn biến

tả mối quan hệ giữa doanh số bán hàng và chichào hàng.D h ố dự đ á b+ b *Chi hí hà hà

Page 321: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 321/328

• Doanh số dự đoán = b0 + b1*Chi phí chào hàng – B1 là lượng tăng giảm (triệu đồng) của doanh số đ

chỉnh (doanh số dự đoán) do lượng tăng giảm của phí chào hàng. – B0 là giá trị doanh số lý thuyết khi chi phí chào hàn

bằng 0.

321

CÁCH THỨC XÂY DỰNG MÔHÌNH BẰNG SPSS

1. Analyze / Regression / Linear… – Đưa biến phụ thuộc (doanhso) vào khung Depend

– Đưa biến độc lập (chaohang) vào Independent Ok à lự họ

Page 322: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 322/328

– Ok và lựa chọn

322

ĐỌC KẾT QUẢ

Page 323: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 323/328

– Từ kết quả, ta có phương trình hồi qui tuyến tính Doanh số dự đoán =651.523 + 6,261*Chi phí chào hàng

–Hệ số hồi qui chuẩn hóa (beta) là độ dốc của đườnthẳng ta xác định.

323

CÁC GIẢ ĐỊNH ĐỐI VỚI PHÂNTÍCH HỒI QUI TUYẾN TÍNH

• Phân tích hồi qui nhằm mục đích suy rộng kếtluận cho mối liên hệ giữa các biến trong tổng – Trong ví dụ có 12 khu vực bán hàng? Vậy 24 khu v

kết quả ntn?

Page 324: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 324/328

kết quả ntn? – Để có thể suy luận được thì cần thỏa mãn các giả

và cần xác định mức độ vị phạm các giả định đó. • Ví dụ: xác định độ chính xác của kết luận rút hàm hồi qui là: “Khi chi phí chào hàng tăng lênđơn vị thì doanh số tăng lên 6,261 đơn vị tiền”

324

CÁC GIẢ ĐỊNH ĐỐI VỚI PHÂN TÍCHHỒI QUI TUYẾN TÍNH

• Phân phối chuẩn và phương sai bằng nhau • Các mẫu đảm bảo tính ngẫu nhiên và độc lập • Tuyến tính

Page 325: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 325/328

• Khi chỉ có một biến độc lập thì mô hình hôi qutuyến tính tổng thể có dạng:Y

i = β

1+ β

0 * X + e

i

325

DỰ ĐOÁN BẰNG MÔ HÌNH HỒI QUI • Ứng dụng cụ thể của mô hình hồi qui tuyến tí

– Dự báo giá trị trung bình Y trong trường hợp biết

giá trị cụ thể X (X0)– Tiên đoán giá trị của Y trong một trường hợp cụ th

Page 326: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 326/328

Tiên đoán giá trị của Y trong một trường hợp cụ thgiá trị X0

• Ví dụ: có thể tiên đoán doanh số trung bình củcả các khu vực có chi phí chào hàng là 120 triệđồng, hay tiên đoán doanh số của một khu vựcthể có chi phí chào hàng là 120 triệu (sai số khnhau)

Doanh so ban = 651,523+(6,261x120)=1,402,9 tr 326

DỰ ĐOÁN GIÁ TRỊ RIÊNG LẺ • Dự đoán giá trị riêng lẻ gặp 2 nguồn sai số:

– Giá trị dự đoán riêng lẻ này có thể khác với giá trị

trung bình của Y tại X0– Ước lượng trung bình tổng thể tại X0 có thể khác

Page 327: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 327/328

Ước lượng trung bình tổng thể tại X0 có thể kháctrung bình thực sự của tổng thể tại X0.

327

BÀI TẬP • Dự đoán cân nặng của trẻ với file CanNang.sa

– Vẽ biểu đồ Scatter – Xác định mối liên giữa hai biến định lượng

Viế hươ ì h hồi i ế í h

Page 328: Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

8/20/2019 Bài Giảng Môn Học Phân Tích Số Liệu Thống Kê

http://slidepdf.com/reader/full/bai-giang-mon-hoc-phan-tich-so-lieu-thong-ke 328/328

– Viết phương trình hồi qui tuyến tính – Theo kết quả nghiên cứu trên thì trẻ khi 7t, 8t nặn

hiề kg?