48
Bs Trần Quý Phi-Trường CĐYT Quảng Nam I. Các khái niệm và thao tác cơ bản ........................................................................... 2 A. Chạy SPSS và đóng SPSS 2 B. File dữ liệu 2 C. Các loại file chính 3 D. Mở file, lưu file, đóng file 3 E. Cửa sổ biến và cửa sổ dữ liệu 4 F. Cách tạo một biến mới 5 G. Quy định kiểu. Type 5 H. Quy định độ rộng (dài). Width 6 I. Số chữ số thập phân. Decimal 7 J. Nhãn của biến. Label 7 K. Nhãn của giá trị. Values 7 L. Dữ liệu bị thiếu. Missing 7 M. Độ rộng của cột. Column 8 N. Canh dòng. Alignment 8 O. Thang độ đo. Measure. 8 II. Nhập, sửa dữ liệu ..................................................................................................... 9 A. Nhập 9 B. Sửa 9 C. Hủy việc nhập hoặc sửa 9 D. Chọn các ô 10 E. Chọn cả cột 10 F. Chọn cả hàng 10 G. Xóa dữ liệu 10 H. Xóa một hàng (1 trường hợp) 10 I. Xóa một cột (1 biến) 10 J. Copy dữ liệu 10 K. Cắt dữ liệu 11 L. Di chuyển vị trí các biến 11 III. Các thao tác chung ............................................................................................. 12 A. Hủy lệnh mới làm 12 B. Lấy lệnh đã hủy 12 C. Lưu các sửa đổi 13 D. Câu hỏi 13 E. Bài tập: 13

Nhap Mon SPSS

Embed Size (px)

Citation preview

Page 1: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

I. Các khái niệm và thao tác cơ bản ........................................................................... 2 A. Chạy SPSS và đóng SPSS 2 B. File dữ liệu 2 C. Các loại file chính 3 D. Mở file, lưu file, đóng file 3 E. Cửa sổ biến và cửa sổ dữ liệu 4 F. Cách tạo một biến mới 5 G. Quy định kiểu. Type 5 H. Quy định độ rộng (dài). Width 6 I. Số chữ số thập phân. Decimal 7 J. Nhãn của biến. Label 7 K. Nhãn của giá trị. Values 7 L. Dữ liệu bị thiếu. Missing 7 M. Độ rộng của cột. Column 8 N. Canh dòng. Alignment 8 O. Thang độ đo. Measure. 8

II. Nhập, sửa dữ liệu ..................................................................................................... 9 A. Nhập 9 B. Sửa 9 C. Hủy việc nhập hoặc sửa 9 D. Chọn các ô 10 E. Chọn cả cột 10 F. Chọn cả hàng 10 G. Xóa dữ liệu 10 H. Xóa một hàng (1 trường hợp) 10 I. Xóa một cột (1 biến) 10 J. Copy dữ liệu 10 K. Cắt dữ liệu 11 L. Di chuyển vị trí các biến 11

III. Các thao tác chung ............................................................................................. 12 A. Hủy lệnh mới làm 12 B. Lấy lệnh đã hủy 12 C. Lưu các sửa đổi 13 D. Câu hỏi 13 E. Bài tập: 13

Page 2: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

IV. Mã hóa lại (recode).............................................................................................. 15 A. Recode lại chính X 15 B. Recode qua một biến khác 18 C. Giải thích thêm về Old Value và New Value 22

V. Tính toán dữ liệu (compute) .................................................................................. 25 A. Ghi chú về cách gõ công thức 28

VI. Sắp xếp ................................................................................................................ 29

VII. Chọn các trường hợp ......................................................................................... 30 A. Chọn các trường hợp thỏa mãn điều kiện nào đó 30 B. Hủy chọn 33

VIII. Tần suất (frequency) ........................................................................................... 33 A. Riêng biệt Error! Bookmark not defined. B. Tính tần suất của biến này trong biến kia 36

IX. Lặp lại lệnh đã thực hiện .................................................................................... 36 A. Gọi lại lệnh bằng Recall 36 B. Lưu lệnh bằng file syntax 37

X. Chương III: Thống kê mô tả ..........................................Error! Bookmark not defined.

I. Các khái niệm và thao tác cơ bản

A. Chạy SPSS và đóng SPSS

B. File dữ liệu

Dữ liệu được lưu vào file có đuôi là sav.

Hình 1. Các file dữ liệu của SPSS

Cách lưu file dữ liệu:

File

Page 3: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Save

Đặt tên file

Bấm nút Save

File sẽ có đuôi là sav

C. Các loại file chính

1. File dữ liệu (data)

Như đã nói ở trên.

2. File kết quả (output)

Là file chứa kết quả sau khi phân tích.

3. File cú pháp (syntax)

Là file chứa các dòng lệnh.

D. Mở file, lưu file, đóng file

Mở:

File

Open

Lưu

File

Save

Page 4: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Đóng

File

Close

E. Cửa sổ biến và cửa sổ dữ liệu

1. Các khái niệm

Variable: Biến. một tính chất của các trường hợp cần nghiên cứu: mã, tuổi, giới, tình trạng hôn nhân…

Case: một trường hợp trong nghiên cứu, ví dụ : mỗi người bệnh là một trường hợp…

Case còn được gọi là một quan sát (Observation).

Hình 2. Case Hàng ; Variable Cột

2. Cửa sổ biến

Dùng để định nghĩa các biến (tên biến, kiểu là số hay chữ…).

Bấm chuột vào Variable View ở dưới

Cửa sổ biến như sau:

Name: Tên biến

Type: Kiểu là số (numeric) hay chuỗi chữ (string)

Width: Độ rộng của chuỗi chữ hay độ lớn của số.

Page 5: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Decimals : Số chữ số thập phân.

Label : Nhãn của biến (để dễ hiểu hơn) và nó sẽ xuất hiện trong các phân tích Phân biệt với tên biến.

Values : Định nghĩa nhãn cho từng giá trị (để dễ hiểu hơn), ví dụ 0 là DB, 1 là MN. Phân biệt với giá trị thực của các biến.

Missing : Xử lý các trường hợp không có dữ liệu.

F. Cách tạo một biến mới

1. Đặt tên. Name

Vào cửa sổ biến

Gõ tên vào cột Name.

Quy tắc:

Không quá 8 ký tự. Không có dấu cách. Không bắt đầu bằng con số.

Thông báo khi đặt tên sai:

Hình 3. “Biến chứa ký tự đầu tiên không hợp lệ”

Hình 4. “Biến chứa ký tự không hợp lệ”

Ghi chú: Nên cân nhắc khi đặt tên biến. Tên biến có thể dựa vào mã của bảng điều tra, chẳng cau1, cau2… để việc nhập dữ liệu được thuận lợi. Nhất thiết phải dùng Label để tránh nhầm lẫn.

Tên biến là Cau1, Label là Gioi tinh Tên biến là Cau2, Label là Tuoi

G. Quy định kiểu. Type

Ban đầu biến mặc nhiên có kiểu là Numeric.

Page 6: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Để đổi kiểu, bấm vào nút chấm chấm bên cạnh:

Xuất hiện cửa sổ để chọn kiểu

Chọn kiểu và bấm OK.

Ghi chú:

1) Kiểu số nhập nhanh hơn và không gây nhầm lẫn bằng kiểu chuỗi chữ.

Nghĩa là trong khi thu thập số liệu nên mã hóa trước bằng số

Ví dụ nghề nghiệp có thể mã hóa thành

1- Nông 2-Buôn bán 3- Công chức

Còn để diễn giải các giá trị để dễ hiểu ta dùng tính chất Values để gán nhãn cho các giá trị.

2) Trong khi phân tích SPSS sẽ kèm theo một hình để ta biết đó là biến số hay biến ký tự

Trong hình trên ta biết Ma bn [id] là kiểu số. Dia chi [diachi] là kiểu chuỗi.

H. Quy định độ rộng (dài). Width

Gõ con số vào cột Width.

Page 7: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Ví dụ chuỗi có giá trị là 8 thì người nhập không gõ tiếp được chữ số thứ 9 nếu số chữ đã gõ đã đến 8.

I. Số chữ số thập phân. Decimal

Gõ con số vào Decimal

Ví dụ biến tuổi, biến huyết áp tối đa nên có Decimal là 0. Cân nặng (kg) có decimal là 1

Chiều cao (m) có decimal là 2, nhưng tính bằng cm thì có decimal là 0 (?).

J. Nhãn của biến. Label

Gõ tên nhãn vào cột Label. Ghi chú: Nhãn sẽ xuất hiện kèm theo, hoặc thay thế tên biến trong các thao tác, đặc

biệt là kết quả phân tích.

K. Nhãn của giá trị. Values

Giả sử muốn quy ước giá trị 0 là Nam, 1 là Nữ cho biến c2

Bấm vào nút ở cột Values.

Gõ Value là 0 (sẽ là giá trị nhập vào).

Gõ Value Label (sẽ là nhãn của giá trị 0).

Bấm vào nút Add.

Gỡ bỏ nhãn đã có : Chọn nhãn, bấm Remove.

Sửa nhãn đã có : Chọn nhãn, bấm Change. Ghi chú : Phân biệt giá trị và nhãn của giá trị. Người dùng phải nhập 0, 1 mà không

nhập Nam, Nu nhưng khi phân tích thì xuất hiện là Nam, Nu.

L. Dữ liệu bị thiếu. Missing

1. System missing

Nếu không nhập thì ô bị trống (có dấu chấm nếu là số).

Page 8: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Hình 5. Hàng thứ nhất và thứ ba ở cau4 là system missing.

2. User missing

Biến nhận giá trị nhưng ta cho là missing.

Ví dụ:

Câu 10: Theo Anh, Chị chương trình học là:

1- Quá nặng 2-Vừa phải 3- Rất nhẹ 4-Không trả lời.

Có hai kiểu missing xảy ra:

Câu này không được ghi nhận (không nhập liệu, vì không đánh dấu vào lựa chọn nào cả); tức là xem như bỏ sót câu này. Đây là system missing

Người được phỏng vấn từ chối trả lời và lựa chọn 4 được ghi nhận.

Khi phân tích ta có thể xem 4 là giá trị missing. Đây là user missing.

M. Độ rộng của cột. Column

Là độ rộng để hiển thị của cột trong cửa sổ Data View. Không liên quan đến độ rộng (width) của biến.

N. Canh dòng. Alignment

O. Thang độ đo. Measure.

Hình 6. Các loại thang độ đo

Scale: Nhận các con số liên tục (có thể xếp thứ tự, có thể đánh giá lớn hơn, nhỏ hơn, ví dụ huyết áp, chiều cao…)

Nominal: Định danh (không có thứ bậc, ví dụ giới tính)

Ordinal: Định danh nhưng có thứ bậc, ví dụ: Thu nhập thấp, thu nhập trung bình, thu nhập cao. Học lực giỏi, học lực trung bình, học lực kém

Chú ý:

Cần xác định rõ thang độ đo của biến vì các phân tích bao giờ cũng kèm theo điều kiện biến đưa vào là theo kiểu gì.

Page 9: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Biến có kiểu số chưa chắc là Scale, đó là các trường hợp dùng cách mã hóa. Chẳng hạn nếu quy ước 1 là nam 2 là nữ, thì biến sẽ nhận giá trị 1, 2. Nhưng biến này là kiểu Nominal (định danh không thứ bậc), nói cách khác ở đây ta không thể cho là 2 lớn hơn 1 và ngược lại không thể cho là 1 nhỏ hơn 2.

Có một loại gọi là Dischotomous (nhị nguyên) chỉ nhận hai giá trị, là 0 và 1. Loại biến này hay gặp để diễn tả một tính chất chỉ có hai giá trị (có bệnh hay không có bệnh, nam hay nữ, có gia đình hay không có gia đình)…

II. Nhập, sửa dữ liệu Chuyển qua cửa sổ dữ liệu

Bấm nút Data View.

A. Nhập

Nhập vào ô,

Bấm enter hoặc bấm nút mũi tên.

B. Sửa

Chọn ô muốn sửa.

Bấm F2 và sửa.

Phân biệt giữa việc sửa và nhập:

Khi nhập thì giá trị cũ của ô sẽ biến mất.

Khi sửa thì giá trị cũ của ô còn đó, ta chỉ sửa mà thôi.

C. Hủy việc nhập hoặc sửa

Bấm phím Esc

Dữ liệu trở về như cũ (hoặc trống, nếu trước đó chưa có).

Page 10: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

D. Chọn các ô

Nhấn phím Shift.

Bấm phím mũi tên theo chiều thích hợp.

E. Chọn cả cột

Đưa chuột lên đầu cột

Bấm chuột

F. Chọn cả hàng

Đưa chuột ra đầu hàng.

Bấm chuột.

G. Xóa dữ liệu

Chọn ô (hoặc nhiều ô) muốn xóa.

Bấm phím Delete.

H. Xóa một hàng (1 trường hợp)

Chọn hàng muốn xóa.

Bấm phím Delete.

Ghi chú: Xóa một hàng là xóa cả một trường hợp (case). Xóa các ô (đã có dữ liệu) của một hàng chỉ có nghĩa là xóa dữ liệu của trường hợp đó, nhưng trường hợp này vẫn còn (vẫn còn được tính trong các phân tích).

I. Xóa một cột (1 biến)

Chọn cột muốn xóa.

Bấm phím Delete.

Ghi chú:

Xóa một cột là xóa cả một biến, đương nhiên dữ liệu kèm theo biến đó cũng bị mất luôn. Xóa các ô (đã có dữ liệu) của một cột chỉ có nghĩa là xóa dữ liệu của biến đó, nhưng biến này vẫn còn.

J. Copy dữ liệu

Chọn ô (hoặc nhiều ô) muốn copy.

Bấm Ctrl + C

Bấm chuột vào ô muốn chép.

Bấm Ctrl + V

Page 11: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

K. Cắt dữ liệu

Chọn ô (hoặc nhiều ô) muốn cắt.

Bấm Ctrl + X (dữ liệu sẽ biến mất).

Bấm chuột vào ô muốn chép.

Bấm Ctrl + V

Ghi chú:

Động tác này được xem như chuyển chỗ.

L. Di chuyển vị trí các biến

Vào cửa sổ Variable View

Bấm chọn một hàng

Nhấn giữ chuột

Kéo chuột lên trên hoặc xuống.

Ví dụ sau chuyển biến “tuoi” lên trên biến “gioi”

Ghi chú:

Có thể thực hiện việc này ở cửa sổ Data View nhưng lúc này lại chọn cả cột và kéo qua trái hoặc phải.

Page 12: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

III. Các thao tác chung

A. Hủy lệnh mới làm

Bấm chuột vào nút Undo.

B. Lấy lệnh đã hủy

Bấm chuột vào nút Redo

Ví dụ:

1. Nhập 9

2. Nhập 10

Undo lần đầu (hủy thao tác nhập 10)

Undo lần nữa: (hủy thao tác nhập 9)

Page 13: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Redo một lần: lấy lại thao tác mới hủy, tức thao tác nhập 9, kết quả là:

Redo lần nữa: lấy lại thao tác đã hủy tiếp đó tức là thao tác nhập 10, kết quả là

Ghi chú: Không phải lệnh nào cũng undo được.

C. Lưu các sửa đổi

Nếu dữ liệu thay đổi thì phải lưu (nếu muốn) bằng cách bấm Ctrl + S

Ghi chú về bài tập: Nghiên cứu 200 bệnh nhân được chẩn đoán là cao huyết áp vô căn. Mục tiêu nghiên cứu là đánh giá tỉ lệ mắc bệnh và các yếu tố liên quan, số liệu được lấy từ phiếu khám (xem bảng số liệu).

D. Câu hỏi

E. Bài tập:

1) Chạy SPSS

Page 14: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

2) Lưu file với tên là HA 3) Chọn Variables View và

Tạo các biến sau Tên biến Kiểu Độ rộng Số số lẻ Nhãn biến Nhãn giá trị ID Số 8 0 Ma bn Cau1 Số 8 0 Gioi tinh 0: Nam

1: Nu Cau2 Số 8 0 Tuoi Cau3 Chữ 10 0 Dia chi Cau4 Số 8 0 Nghe nghiep 0: Nong

1: Cong nhan 2: Buon ban 3: CNVC

Cau5 Số 8 1 Chieu cao Cau6 Số 8 1 CanNang Cau7 Số 8 0 HA tam thu Cau8 Số 8 0 HA tam truong

4) Vào Data View và

Nhập 20 dữ liệu sau:

5) Nhận xét về biến Cau3 (Địa chỉ) 6) Đóng file lại 7) Đóng SPSS 8) Chạy lại SPSS

Page 15: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

9) Mở file HA nói trên.

IV. Mã hóa lại (recode) Recode là công đoạn cần làm sau khi nhập dữ liệu, vì các lý do sau:

- Dữ liệu nhập bị nhầm.

- Nhóm các dữ liệu thành các nhóm, ví dụ quy định các nhóm tuổi dựa vào tuổi cụ thể của mỗi người.

Khi recode một biến X thì có thể:

- Recode lại chính X: Thay đổi luôn dữ liệu của biến X. Trường hợp này có thể xem Recode là thao tác thay đổi dữ liệu hàng loạt.

- Recode và đưa dữ liệu mới vào biến mới Y, (X vẫn như cũ).

A. Recode lại chính X

Giả sử, ở biến Cau3 ta cần đổi T Binh thành TB, Duy xuye thành DX…

Transform

Recode

Into Same Variables

Bấm chọn biến Cau3

Page 16: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Bấm nút mũi tên, biến DiaChi[cau3] xuất hiện bên phải.

Bấm chọn Old and New Values.

Gõ giá trị cũ ở khung Old Value và giá trị mới khung New Value.

Bấm nút Add thì ở khung Old New có dòng ‘Duy Xuye’ ‘DX’ cho biết giá trị cũ Duy Xuye sẽ thành giá trị mới DX.

Page 17: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Làm tương tự với các giá trị khác

Nếu không muốn tiến hành đổi một giá trị nào đó thì bấm ở khung Old New và chọn Remove.

Sau khi xác định các giá trị cần đổi. Bấm Continue.

Bấm OK

Page 18: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

B. Recode qua một biến khác

Recode biến X thành biến Y. X vẫn như cũ. Nên sử dụng cách này vì 2 lý do :

- Giữ lại dữ liệu gốc. Nếu Recode nhầm X thì có nguy cơ không truy lại được dữ liệu gốc.

- Recode chỉ có mục đích phân nhóm, chẳng hạn recode tuổi thành các nhóm tuổi, thì tuổi vẫn nên giữ lại, để sử dụng phân tích sau này (chẳng hạn tính tuổi trung bình, lớn nhất, nhỏ nhất v.v…).

Giả sử, ta cần phân nhóm tuổi theo quy định sau :

1- 19 gộp thành nhóm 1

20-29 gộp thành nhóm 2

30-39 gộp thành nhóm 3

40-49 gộp thành nhóm 4

50-59 gộp thành nhóm 5

60-69 gộp thành nhóm 6

70 trở lên gộp thành nhóm 7

Ta sẽ Recode biến Cau2 và phân thành nhóm vào biến mới gọi DoTuoi.

Transform

Recode

Into Different Variables

Chọn Tuoi[cau2]

Bấm nút mũi tên

Page 19: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Trong Output Variable (biến đầu ra) gõ DoTuoi. Bấm nút Change.

Lúc này dòng cau2 ? sẽ trở thành cau2 Dotuoi, nghĩa là dữ liệu (độ tuổi) sẽ được vào biến mới là Dotuoi

Page 20: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Bấm nút Old and New Values…

a) Đổi từ 1 đến 19 vào nhóm 1:

Old Value:

Bấm nút Range (dãy), Gõ 1 (through, đến) 19

New Value:

Bấm nút Value, Gõ 1

Bấm nút Add.

Page 21: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Trong khung Old New ta có dòng 1 thru 20 1 có nghĩa là các giá trị 1 đến 20 ở biến Cau2 sẽ được chuyển thành 1 ở biến Dotuoi.

v.v…

Tiếp tục làm như vậy cho các nhóm khác

Riêng nhóm cuối cùng (từ 70 trở lên) thì:

Old Value:

Bấm chọn Range (ở through highest) và gõ 70,

New Value

Chọn Value gõ 7.

Nghĩa là dãy từ 70 đến các số lớn hơn, được quy thành nhóm 7 trong Dotuoi

Page 22: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Bấm Continue.

Bấm OK.

Lưu ý: Khi recode xong thì hai biến không còn liên hệ gì với nhau. Ví dụ ban đầu tuổi bệnh nhân (biến Tuoi) là 30, ta ra lệnh recode qua biến DoTuoi là nhóm 3. Thì sau này nếu có sửa tuổi thành 50 (DoTuoi là 5) thì phải Recode lại. Kinh nghiệm cho thấy là các lệnh Recode nên lưu lại trong file syntax để sau này chạy lại cho nhanh.

Xem mục Lặp lại lệnh.

C. Giải thích thêm về Old Value và New Value

1. Đổi 1 giá trị Old Value cụ thể thành 1 giá trị New Value

Recode giá trị 1 (old value) ở biến X thành 2 (new value) ở biến Y

Page 23: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

2. Đổi các giá trị Old Value trong một giới hạn thành 1 giá trị New Value.

Recode các giá trị từ 10 đến 20 (old value) ở biến X thành 3 (new value) ở biến Y

3. Đổi các giá trị Old Value nhỏ hơn một giới hạn thành 1 giá trị New Value

Recode các giá trị nhỏ hơn hoặc bằng 30 (old value) ở biến X thành 7 (new value) ở biến Y

4. Đổi các giá trị Old Value từ một giới hạn trở lên thành 1 giá trị New Value

Recode các giá trị từ 70 (old value) trở lên ở biến X thành 9 (new value) ở biến Y

Page 24: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

5. Đổi tất cả các giá trị Old Value còn lại thành 1 giá trị New Value.

Ví dụ: Ta có các huyện (biến DiaChi) sau: TM, TP, TK, DX, DL Ta quan tâm đến 2 vùng miền núi và đồng bằng.

Cách nhanh nhất là Recode vào biến Vung bằng cách:

Đổi TM, TP thành MN.

Các giá trị còn lại là DB

6. Biến mới (new value) là biến chuỗi

Ban đầu, biến mới mặc định là biến số.

Muốn cho ra biến chuỗi, Ví dụ:

Dưới 20 gộp thành nhóm có tên ‘Duoi 20’ thay vì là nhóm 1

20-29 gộp thành nhóm có tên là ‘20 den 29’ thay vì là nhóm 2

v.v…

ta phải chọn Output Variables are string, và gõ độ dài của biến vào ô Width.

Page 25: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Bài tập 2:

1) Chạy SPSS

2) Mở file Cao huyet ap

3) Recode lại dữ liêu của biến cau3 thành các tên tắt của Huyện cho vào biến diachi1

4) Xóa biến diachi1.

5) Đổi tên biến diachi1 thành cau3.

6) Phân các nhóm tuổi thành 2 loại cho vào biến Tuoi1 với quy định dưới 50 là nhóm 0 và từ 50 trở lên là nhóm 1.

7) Chuyển vị trí biến Tuoi1 cho nằm bên cạnh biến cau2.

8) Phân các nhóm tuổi thành các loại cho vào biến Tuoi2 với quy định sau:

Dưới 20 gộp thành nhóm có tên ‘Duoi 20’

20-29 gộp thành nhóm có tên là ‘20 den 29’

30-39 gộp thành nhóm có tên là ‘30 den 39’

40-49 gộp thành nhóm có tên là ‘40 den 49’

50-59 gộp thành nhóm có tên là ‘50 den 59’

60-69 gộp thành nhóm có tên là ‘60 den 69’

70 trở lên gộp thành nhóm có tên là ’70 tro len’

9) Lưu file và thoát SPSS

V. Tính toán dữ liệu (compute) Đôi khi cần phải tạo ra các biến mới, dựa trên dữ liệu của một hay nhiều biến cũ, nhưng giá trị mới là một biểu thức phức tạp thì không dùng Recode mà phải dùng Compute.

Ví dụ: Cần tạo ra biến mới là BMI (chỉ số khối cơ thể) dựa trên Cân nặng và Chiều cao của mỗi đối tượng nghiên cứu.

Page 26: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

BMI = (cân nặng)/(chiều cao)2

Ta làm như sau.

Transform

Compute…

Gõ tên biến mới vào Taget Variable

Trong khung Numeric Expression gõ công thức để đưa vào biến

BMI:

Page 27: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Gõ OK.

Ví dụ 2: Tạo biến mới là CaoHA với quy định

CaoHA là 1 nếu HA tối đa (cau7) >140 hoặc HA tối thiểu (cau8) >90

Numeric Expression cho CaoHA là

Cau7>140 | Cau8>90

Biểu thức trên gọi là biểu thức logic hoặc. Biểu thức này cho giá trị 1 khi nó đúng. 0 khi nó sai.

Biểu thức logic hoặc này đúng khi chỉ cần 1 trong 2 phép so sánh Cau7>140 hoặc Cau8>90 đúng.

Ví dụ 3: Tạo biến mới là CaoTT (chỉ cao HA tâm thu, tâm trương bình thường) với quy định

CaoTT là 1 nếu HA tối đa (cau7) >140 và HA tối thiểu (cau8) <= 90

Numeric Expression cho CaoHA là

Cau7>140 & Cau8>90

Page 28: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Biểu thức trên gọi là biểu thức logic và. Biểu thức này cho giá trị 1 khi nó đúng. 0 khi nó sai.

Phép và này chỉ đúng khi cả 2 phép so sánh Cau7>140 và Cau8>90 là đúng.

A. Ghi chú về cách gõ công thức

Công thức gồm các biến, các phép toán số học, các hàm.

+ Cộng

- Trừ

* Nhân

/ Chia

** Lũy thừa

| Phép hoặc (đúng khi chỉ cần 1 cái đúng)

& Phép và (đúng khi tất cả đều đúng)

Bài tập 3:

1) Chạy SPSS

2) Mở file Cao huyet ap

3) Tạo biến mới BMI để tính chỉ số khối của cơ thể

4) Tạo biến mới CaoHA, với 1 là chẩn đoán có cao HA và 0 là không.

5) Tạo biến mới CaoTT với 1 chỉ cao HA tâm thu (mà không cao tâm trương), 0 là không.

6) Tạo biến mới CaoTTr với 1 chỉ cao HA tâm trương (mà không cao tâm thu), 0 là không có.

7) Tạo biến mới Cao2 với chẩn đoán là cao cả hai HA tâm thu và tâm trương.

Page 29: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

VI. Sắp xếp Sắp xếp theo thứ tự theo một hoặc nhiều biến. Giả sử ta muốn sắp xếp dữ liệu theo thứ tự tuổi (tăng dần: ascending), rồi đến huyết áp tâm thu (giảm dần: descending).

Data

Sort Cases…

Trong cửa sổ Sort Cases bấm chọn tuổi

Bấm nút mũi tên để đưa qua khung Sort by:

Sau đó chọn tiếp HA tam thu (cau7) bấm qua. Chọn Descending.

Page 30: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Bấm OK thì SPSS sẽ xếp theo tuổi từ nhỏ đến lớn, nếu cùng tuổi thì xếp theo HA tâm thu (từ lớn xuống).

VII. Chọn các trường hợp

A. Chọn các trường hợp thỏa mãn điều kiện nào đó

Trường hợp chỉ cần quan tâm tới một số trường hợp (case) thỏa mãn điều kiện nào đó để phân tích thì ta dùng lệnh Select Cases. Sau khi dùng lệnh này, thì các lệnh phân tích sẽ chỉ tính toán trên các trường hợp đã chọn. Ví dụ sau khi chọn các trường hợp có tuổi dưới 40 và tính trung bình của chiều cao, thì chiều cao này là chiều cao của các trường hợp đó, mà bỏ qua các trường hợp khác (có tuổi từ 40 trở lên).

Ví dụ ta chọn các trường hợp có tuổi dưới 40 như sau:

Data

Select Cases…

Ban đầu ta thấy dấu All cases được chọn, nghĩa là tới lúc này tất cả các trường hợp đều được tính đến.

Page 31: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Bấm chọn If condition is satisfied (nếu điều kiện được thỏa mãn)

Bấm nút If…

Xuất hiện khung như trong trường hợp Compute (xem lại cách ghi biểu thức).

Page 32: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Gõ biểu thức.

Bấm Continue.

Lúc này cửa sổ Select Cases bên cạnh nút if có ghi biểu thức trên.

Bấm OK.

Page 33: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Các trường hợp dưới 40 tuổi đã được chọn, số thứ tự không bị gạch chéo, các trường hợp bị gạch chéo sẽ được xem như không có trong dữ liệu.

B. Hủy chọn

Data

Select Cases…

Chọn lại All Cases.

VIII. Tần suất (frequency)

A. Nhắc lại

Là số lần xuất hiện của các giá trị

Mã Giới tính

01 Nam

Page 34: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

02 Nu

03 Nam

04 Nam

05 Nu

06 Nu

07 Nu

Frequency của Giới tính:

Nam: 3

Nu: 4

B. Thực hiện

Analyze

Tables

Tables of frenquency

1. Tính tần suất riêng cho từng biến

Chọn biến muốn tính tần suất. Bấm nút mũi tên qua phải

Page 35: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Chọn nút Layout…

Chọn Count Display (để hiển thị số lượng), chọn Percents Display (để hiển thị %)

Bấm Continue.

Bấm OK.

Kết quả:

Page 36: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Ghi chú: Có thể tính tần suất của nhiều biến cùng một lần.

2. Tính tần suất của biến này trong biến kia

Muốn tính tần suất của biến này trong biến kia, ví dụ, tính tần suất của Nghe nghiep, sau đó trong mỗi nghề nghiệp, ta tính nam bao nhiêu nữ bao nhiêu thì làm như sau:

Khi xuất hiện cửa sổ Table of frequencies sau khi chọn Nghe nghiep để đưa qua Frequency for, sau đó chọn Gioi tinh để đưa qua Subgroup, in each tables: (nhóm phụ trong mỗi bảng)

Kết quả:

IX. Lặp lại lệnh đã thực hiện Thường thì thực hiện một lệnh phải tốn nhiều nhiều thao tác: như bấm chọn menu, chọn các biến, chọn các thông số v.v…

Có hai cách để thực hiện lại một cách nhanh chóng những lệnh đã làm là dùng nút Recall hay lưu lại lệnh trong một file syntax

A. Gọi lại lệnh bằng Recall

Chọn nút Dialog Recall.

Page 37: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Hiện ra danh sách các lệnh đã dùng. Chọn lệnh muốn thực hiện lại.

B. Lưu lệnh bằng file syntax

Để lưu lại một lệnh ta làm như sau:

Sau khi thực hiện việc chọn các biến, tham số… ta bấm nút Paste

Xuất hiện cửa sổ syntax:

Page 38: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Ta bấm nút lưu và đặt tên file.

Sau này muốn chạy lại lệnh ta làm như sau:

File

Open

Syntax…

Bấm chọn file syntax đã lưu

Page 39: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Xuất hiện (các) dòng lệnh trong file này:

Nếu muốn chạy lệnh này thì ta bấm vào nút mũi tên.

X. Kiểm định tỉ lệ Mục đích: Xác định tỉ lệ của các nhóm có bằng nhau hay không hay phù hợp với các tỉ lệ đã định trước hay không.

Giả thiết H0 : các nhóm trong một biến có tỉ lệ bằng nhau

Tiến hành Chi-square test.

Căn cứ vào Asym. Sig (p-value) nếu nhỏ hơn 0.05 : bác bỏ H0- nếu lớn hơn có thể kết luận tỉ lệ các nhóm là bằng nhau

Ví dụ 1 : Khảo sát 100 học sinh ta có 58 nam, 42 nữ. Số nam lớn hơn số nữ (trong mẫu của chúng ta); nhưng kết luận này có ý nghĩa thống kê hay không ?

H0 : tỉ lệ nam bằng tỉ lệ nữ (hoặc tỉ lệ nam :nữ là 50 :50)

Ví dụ 2 : Theo một lý thuyết, bài kiểm tra nên có 25% học sinh đạt điểm kém, 50% đạt điểm trung bình và 25% đạt điểm giỏi. Khảo sát của chúng ta trên một bài kiểm tra cụ thể có 10 học

Page 40: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

sinh đạt điểm kém, 17 học sinh đạt điểm trung bình và 9 học sinh đạt điểm giỏi. Kết quả này có phù hợp với lý thuyết hay không ?

H0 : Tỉ lệ điểm trong khảo sát của ta theo cơ cấu 25 :50 : 25

A. Kiểm định các tỉ lệ có bằng nhau hay không

Ví dụ : Tỉ lệ các nghề nghiệp có bằng nhau không ?

Analyze

Non-parametric test

Chi-Square

Chọn biến để đưa qua

Chọn All categories equal (các nhóm bằng nhau)

OK

Kết quả : Nghe nghiep Observed N Expected N Residual

Page 41: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Nong dan 40 50.0 -10.0 Cong nhan 53 50.0 3.0 Buon ban 57 50.0 7.0 CNVC 50 50.0 .0 Total 200

Test Statistics Nghe nghiep Chi-Square(a) 3.160 Df 3 Asymp. Sig. .368

Diễn giải:

Observed N: số lượng quan sát Expected N: tần suất mong đợi (tần suất theo giả thiết H0) Chi-Square: thống kê Chi-Square. Df: bậc tự do. Asymp. Sig: giá trị p-value: xác suất để giả thiết đúng Giả thiết H0: tỉ lệ các nghề nghiệp là bằng nhau.

Asymp. Sig: xác suất để giả thiết đúng là 0.368 khá lớn (lớn hơn 0.05), nói cách khác:

- có nhiều khả năng tỉ lệ các nghề nghiệp là bằng nhau hoặc:

- các nghề nghiệp khác nhau không có ý nghĩa thống kê.

Nếu Asymp. Sig nhỏ hơn 0.05 ta kết luận là tỉ lệ nghề nghiệp khác nhau có ý nghĩa thống kê.

B. Kiểm định tỉ lệ các nhóm có khác với cơ cấu tỉ lệ cho trước

Ví dụ : Nghiên cứu trên 150 bệnh nhân, ta thấy số mắc bệnh X là 50 người. Tỉ lệ là 50/150 = 30%. Tỉ lệ của một tác giả khác là 20%. Tỉ lệ mắc bệnh của ta có cao hơn có ý nghĩa thống kê hay không ?

Giả thiết H0 : tỉ lệ không mắc bệnh : mắc bệnh là 80 : 20

Giả sử biến MacBenh được mã hóa là : 0 : không có bệnh, 1 : có bệnh.

Tiến hành Chi square test như trên, nhưng thay vì chọn All categories equal (tức là tỉ lệ không có bệnh :có bệnh là 50 :50) ta sẽ chỉ định SPPS tiến hành kiểm định với tỉ lệ không có bệnh : có bệnh là 80 :20)

Page 42: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Chọn Values và gõ giá trị 0.2 ; chọn nút Add.

Lại gõ giá trị 0.8 ; chọn nút Add

Cẩn thận : Không mắc bệnh là 0.

Mắc bệnh là 1.

Thứ tự là 0 rồi mới đến 1. Do đó phải đưa giá trị 0.8 (tỉ lệ không mắc) trước 0.2 (tỉ lệ mắc)

Kết quả : MACBENH Observed N Expected N Residual .00 50 160.0 -110.0 1.00 150 40.0 110.0 Total 200

Page 43: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Test Statistics MACBENH Chi-Square(a) 378.125

Df 1 Asymp. Sig. .000

a 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 40.0.

Giả thiết H0 : tỉ lệ không mắc bệnh : mắc bệnh là 80 : 20

Asymp Sig. là .000 bác bỏ H0; nói cách khác tỉ lệ mắc bệnh của ta khác tác giả kia (trong trường hợp này là lớn hơn) với mức ý nghĩa nhỏ hơn 0.01.

Trở lại ví dụ về cơ cấu điểm bài thi.

Nếu mã hóa : 1 : kém ; 2 : trung bình ; 3 : giỏi

Giả thiết H0 : Cơ cấu tỉ lệ 1 :2 : 3 là 25 :50 :25

Khi tiến hành ta phải chọn các value là lần lượt là 0.25, 0.50, 0.25 Cũng có thể chọn là 25 :50 :25 hoặc 2.5 :5.0 :2.5… vì vấn đề ở đây là cơ cấu tỉ lệ

không phải là số lượng.

XI. Kiểm định mối liên hệ của hai biến định tính Mục đích : Xem hai biến (hai yếu tố) có liên hệ như thế nào: có độc lập hay có ảnh hưởng nhau?

Ví dụ : Nhóm tuổi có ảnh hưởng đến việc mắc bệnh hay không.

Nghề nghiệp có ảnh hưởng đến việc mắc bệnh hay không.

Ta sẽ dùng bảng cross-tab (bảng chéo) và các kiểm định Chi-square.

Giả sử ta muốn xem giới tính có độc lập với việc mắc bệnh cao huyết áp hay không.

Giả thiết H0 : Giới tính độc lập với việc mắc bệnh cao huyết áp

Analyze

Descriptive

Crosstabs

Đưa hai biến vào ô Rows và Columns

Page 44: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Kết quả : Gioi tinh * CAOHA Crosstabulation Count

CAOHA .00 1.00 Total

Nu 19 47 66 Gioi tinh Nam 25 109 134 Total 44 156 200

Chi-Square Tests

Value df Asymp. Sig.

(2-sided) Exact Sig. (2-sided)

Exact Sig. (1-sided)

Pearson Chi-Square 2.645(b) 1 .104 Continuity Correction(a) 2.088 1 .149 Likelihood Ratio 2.568 1 .109 Fisher's Exact Test .146 .076 Linear-by-Linear Association

2.632 1 .105

N of Valid Cases 200 a Computed only for a 2x2 table b 0 cells (.0%) have expected count less than 5. The minimum expected count is 14.52.

Diễn giải: mức ý nghĩa Asymp. Sig. là 0.104 nên ta không bác bỏ được H0, nghĩa là có thể kết luận giới tính và bệnh cao huyết áp độc lập với nhau.

XII. Tương quan giữa hai biến : hệ số Pearson Mục đích : Tính hệ số tương quan tuyến tính (Pearson) giữa hai biến định lượng.

Nếu kết quả gần 0 : hai biến không có tương quan

Page 45: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Nếu kết quả càng gần 1 : hai biến càng có tương quan tỉ lệ thuận, biến này tăng thì biến kia cũng tăng.

Nếu kết quả càng gần -1 : hai biến càng có tương quan tỉ lệ nghịch, biến này tăng thì biến kia giảm.

Với bất kỳ kết quả nào, hệ số tương quan phải được xét với mức ý nghĩa (sig. = significance)

Mức ý nghĩa càng thấp thì hệ số tương quan càng có giá trị (không lớn hơn 0.05)

Hệ số tương quan dù gần -1 hoặc 1 nhưng có mức ý nghĩa thấp cũng không đủ kết luận.

Ví dụ : Chiều cao và cân nặng có hệ số tương quan như thế nào ?

Analyze

Correlate

Bivariate

Chọn 2 biến cần tính

OK

Kết quả: Correlations Chieu cao Can nang Chieu cao Pearson

1 -.179(*)

Page 46: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Correlation Sig. (2-tailed) . .011 N 200 200 Pearson Correlation -.179(*) 1

Sig. (2-tailed) .011 .

Can nang

N 200 200 * Correlation is significant at the 0.05 level (2-tailed).

Diễn giải

Pearson Correlation là 1 với mức ý nghĩa Sig. là 0.011 (nhỏ).

Ta kết luận hai biến này có mối tương quan tuyến tính thuận có ý nghĩa thống kê.

XIII. So sánh trị trung bình của một mẫu với một giá trị- One sample T-test Mục đích: Xem giá trị trung bình của một biến có sai khác với một giá trị nào đó?

Ví dụ: Ta đo chiều cao một mẫu 200 thanh niên từ 20-30 tuổi ở một địa phương và xét xem có thể kết luận chiều cao trung bình của họ có sai khác với chiều cao trung bình của thanh niên ở độ tuổi 20-30 được công bố là 160 (cm) hay không?

Biến được xem xét phải là biến định lượng (scale) vì trị trung bình của biến định danh (phân loại) là vô nghĩa, ví dụ trung bình của giới tính (!?)

H0: Trung bình của mẫu không sai khác với giá trị cho trước.

Analyze

Compare Means

One-Sample T Test

Chọn biến cần kiểm định

Chọn giá trị cần so sánh

Page 47: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Kết quả:

One-Sample Test

Test Value = 160 95% Confidence Interval

of the Difference

t df Sig. (2-tailed) Mean

Difference Lower Upper Chieu cao -1.337 199 .183 -1.11 -2.75 .53

Giả thiết H0: Chiều cao trung bình của mẫu bằng 160. Mức ý nghĩa 0.183 không cho phép ta bác bỏ H0. Bây giờ giả sử ta so sánh với chiều cao l0 là 170. Giả thiết H0: Chiều cao trung của mẫu bằng 170.

Kết quả: One-Sample Test

Test Value = 170 95% Confidence Interval

of the Difference

t Df Sig. (2-tailed) Mean

Difference Lower Upper Chieu cao -13.379 199 .000 -11.11 -12.75 -9.47

Mức ý nghĩa .000 cho phép ta kết luận chiều cao trung bình của các thanh niên mà ta khảo sát không bằng 170.

Page 48: Nhap Mon SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Khoảng sai khác 95% Confidence Interval of the Difference đi từ -12.75 đến -9.47 đều dưới 0, nên ta kết luận là chiều cao trung bình của mẫu đã khảo sát thấp hơn 170 (với mức ý nghĩa <0.01)

XIV. So sánh trung bình của hai mẫu độc lập – Independent Samples T-Test Mục đích: Ta có hai nhóm độc lập. Ta kiểm định trung bình của một tính chất (biến) của hai nhóm đó có khác nhau không,

Ví dụ hai mẫu độc lập nam và nữ, ta kiểm định