Upload
doanh
View
228
Download
0
Embed Size (px)
Citation preview
VIỆN NGHIÊN CỨU Y XÃ HỘI HỌC
QUẢN LÝ SỐ LIỆU
Nguyễn Trương Nam
Nguyễn Thi Linh
2
Các bước quản lý số liệu
Thiết kế bộ câu hỏi thu thập số liệu
Thử nghiệm bộ câu hỏi trước khi nhập số liệu
Tạo form nhập liệu (qes, rec, chk)
Nhập số liệu (nhập hai lần)
Kiểm tra số liệu
Kiểm tra lôgíc và tính nhất quán của bộ số liệu
Làm sạch số liệu
+ Frequency (tần số)
+ Cross-tabs
+ Bảng phân bố (các giá tri bất thường)
Lưu trữ
3
Thiết kế (layout) bộ câu hỏi
Layout bộ câu hỏi
Codebook
Codebook.
Trước khi nhập số liệu cần xây dưng codebook. Mọi quyết đinh vê mã hóa đêu cần đươc ghi lại trên codebook trước khi nhập số liệu; nếu không nguy cơ sai số nhập liệu se tăng lên và có thể xảy ra trường hơp các quyết đinh mã hóa phát sinh trong quá trình nhập số liệu se không đươc ghi lại.
Kiểm tra sư nhất quán của bộ câu hỏi trước khi nhập số liệu. Ví dụ, cách mã hóa số liệu “chữ” phải đươc quyết đinh trước khi nhập số liệu và ghi trên bộ câu hỏi - chứ không phải trong quá trình nhập liệu.
QUẢN LÝ SỐ LIỆU
BẰNG PHẦN MỀM EPIDATA
Phần mêm Epidata: http://www.epidata.dk/
Chương trình nhỏ, dễ cài đặt, đơn giản và miễn phí, thân thiện với người sử dụng.
Có thể nhập số liệu từ file dạng text (.txt), Stata, dBase.
Có thể xuất số liệu sang các dạng text (.txt), dBase, Excel, Stata, SPSS và SAS.
Phổ biến, và đươc cập nhật thường xuyên.
File qes bộ câu hỏi không đươc vươt quá 999 dòng (nhưng vẫn có cách khắc phục )
Biến chữ không đươc vươt quá 80 ký tư.
Tạo form nhập liệu và check file
Xây dưng qes file dưa trên bộ câu hỏi
Tạo form nhập liệu từ qes file (tạo rec file).
Viết Check file.
Tạo .QES file
Trên thanh công cụ: Chọn 1. Define Data
→ New .QES file.
Trên thanh menu/ chọn File/New.
Sự dụng File có sẵn
◦ Chắc chắn răng file có săn ơ đinh dạng plain text
(.txt)
◦ Mơ file trong epidata và lưu ơ dạng đuôi .qes
Qes file.
Các loại trường phổ biến
Thưc hành:Tạo QES file-Khanhhoa.qes
-------------------------------------------------------------------
Nhap lieu Nha Trang Phu Nu Mai Dam
-------------------------------------------------------------------
{MS} Ma so bo cau hoi........................ ###
{Dis} Huyen ....................................... #
{Date} Ngay phong van....................... <dd/mm/2010>
{TS1} Thoi gian bat dau-gio............... ##
{TS2} Thoi gian bat dau-phut............. ##
{TE1} Thoi gian ket thuc-gio.............. ##
{TE2} Thoi gian ket thuc-phut............ ##
{In} Ten phong van vien...................... <A >
Khanhhoa.qes
------------------------------------------------------------------
PHAN 1: DAC DIEM CHUNG
------------------------------------------------------------------
{C1} Tuoi......................................... ##
{C2} Hoc van................................... #
{C3} Noi sinh................................... <A >
(C4) Thoi gian song tai KH.............. ##
{C5} Dan toc..................................... #
{C5A} Khac.................................. <A >
{C6} Ton giao.................................... #
{C6A} Khac................................... <A >
{C7} Tinh trang hon nhan.................. #
{C7A} Khac.................................... <A >
Khanhhoa.qes ---------------------------------------------------------------------
PHAN 2: DOI SONG TINH DUC
---------------------------------------------------------------------
{C11} Xu huong tinh duc.............................................#
{C11A} Khac............................................................ #
{C12} QHTD lan dau.................................................... ##
{C13} QHTD lan dau voi ai.......................................... #
{C13A} Khac........................................................... <A >
{C14} Co QHTD trong 3 thang................................... ##
{C15} So nguoi QHTD trong 3 thang............................ ###
{C16} Khach hang khong thuong xuyen trong 3 thang. ###
{C17} Su dung BCS voi khach hang k thuong xuyen. . ##
{C18} So khach hang thuong xuyen trong 6 thang……. ###
{C19} Su dung BCS voi khach hang thuong xuyen…..... ##
{C20} Nhan gi khi QHTD voi khach hang....................... #
{C201} Khac................................................................ <A >
Khanhhoa.qes
{C21} Phai tra tien cho ban tinh nam khi QHTD.... #
{C22} O Trung tam 06............................. #
{C23} Noi bat khach.............................. ## Next 00
{C231} Ngoai duong.......................... #
{C232} Nha nghi, khach san.............. #
{C233} Quan Karaoke, cafe............... #
{C234} Hieu massage........................ #
{C235} Bar, vu truong....................... #
{C236} Bia hoi, quan nhau................ #
{C237} Nha chua............................... #
{C238} Tai nha minh.......................... #
{C239} Qua internet........................... #
{C2310} Qua dien thoai..................... ##
{C2311} Khac..................................... <A >
Qes file trên epidata
Tạo file nhập số liệu (rec file)
Trên thanh công cụ, chọn Data in/out- New Data File.
Một hộp thoại se xuất hiện. Trên dòng đầu tiên, bên cạnh “Enter name of .QES file”, nhập tên của file bộ câu hỏi.
Dòng thứ hai trên hộp thoại, bên cạnh “Enter name of data file”, se tư động chứa tên của file nhâp số liệu (với đuôi .rec) mà tương ứng với file bộ câu hỏi .
Ví dụ:Tạo rec file từ ques file (khanhhoa.qes)
Check file giúp hạn chế lỗi khi nhập
liệu Check file chứa các lệnh để kiểm tra hiệu lưc dữ
liệu đươc nhập.
Check file giúp hạn chế các lỗi trong quá trình nhập
liệu.
Check file đươc lưu với đuôi .chk, và phần đầu tên
giống với ques và rec file tương ứng.
Các lệnh kiểm tra thường dùng
Tạo check file – khanhhoa.chk
Sử dụng chế độ interactive
◦ Menu bar – Check – Add/Revised, open
khanhhoa.rec
◦ Sử dụng hộp thoại interactive- khanhhoa.chk
Viết trưc tiếp
◦ File – new – editor – save – khanhhoa.chk
23
Check file.
Check file.
Viết file check
Sử dụng cả 2 cách interactive (sử dụng hộp
thoại) và viết check file trưc tiếp.
Thưc hành: Viết check file– khanhhoa.chk
Thưc hành: Viết check file– khanhhoa.chk
Nhập số liệu– so sánh số liệu giữa 2 lần nhập
Nhập số liệu hai lần – nên đươc thưc hiện bơi hai
hay hai nhóm các nhập liệu viên
So sánh hai file nhập để tìm ra sư không nhất quán
Kiểm tra bộ câu hỏi gốc và xác đinh file nhập nào
sai
Sửa lỗi ơ cả hai file
So sánh một lần nữa để thấy không còn lỗi.
So sánh giữa 2 lần nhập liệu
Documents –/validate duplicate files
Epidata đưa ra báo cáo gồm các lỗi
So sánh giữa 2 lần nhập liệu
So sánh giữa 2 lần nhập liệu
So sánh giữa 2 lần nhập liệu
So sánh giữa 2 lần nhập liệu
So sánh giữa 2 lần nhập liệu
Báo cáo lỗi
Thưc hành
So sánh 2 lần nhập liệu
Khanhhoa files 1 và 2
Kiểm tra tính nhất quán
Kiểm tra tính nhất quán tương tác (interactive) se
đươc thưc hiện trong quá trình nhập liệu băng
check file trong EpiData.
Viết lệnh consistency check
CONSISTENCYBLOCK
REPORT ID
……………….
Kiểm tra tính nhất quán
(Consistency check) CONSISTENCYBLOCK
REPORT ID
MODULE 1
NO MISSING DATA
CODE
Check "Missing HH code" (a101 <>.)
Check "Missing Commune code" (a1061 <>.)
Check "Missing province code" (a1081 <>.)
CHECK "missing ID MEMBER" (M1 <> .)
CHECK "missing ID MEMBER" (M2 <> .) MODULE 2
Check "Main job and kind of job logical" (M203=12) AND (M204=.) OR (M203=1) OR (M203=2) OR (M203=3) OR (M203=4) OR
(M203=5) OR (M203=6) OR (M203=7) OR (M203=8) OR (M203=9)OR (M203=10) OR (M203=11)
Check "Remunerated for main job and decision maker logical" (m207=4) and (m208=.) and (m210=.) or (m207=1) or
(m207=2) or (m207=3)
Consistency check
Chạy consistency check
Menu bar - Documents – consistency check
Xác đinh file số liệu và consistency check
file
Epidata đưa ra lỗi không nhất quán
Consistency check
Consistency report
Consistency checks for D:\Research document\QUAN LY NHAP LIEU A&T\SO LIEU
4 TINH SAU VALIDATE_14 SEP\FINAL_4 TINH_4036\P1_4036_FINAL.rec
Based on D:\Research document\QUAN LY NHAP LIEU A&T\SO LIEU 4 TINH SAU
VALIDATE_14 SEP\CHECK FILE_Update_Sep 19\Part 1_OK_Linh_Sep 19.chk
18 Sep 2010 13:50
Records identified by field id
Records where id = missing indicated as (## record number)
Missing HH code
(a101 <>.)
No failures.
missing ID MEMBER
(M5 <> .)
Consistency checks failed for id = 41077, 42057
Main job and kind of job logical
(M203=12) AND (M204=.) OR (m203=.) or (M203=1) OR (M203=2) OR (M203=3) OR
(M203=4) OR (M203=5) OR (M203=6) OR (M203=7) OR (M203=8) OR (M203=9)OR
(M203=10) OR (M203=11)
Consistency checks failed for id = 31046, 33115, 28020,
13077
Gộp/nối các file số liệu
Menu bar
Data in/out – append/merge
Gộp/nối các files số liệu
Xuất số liệu từ epidata
Menu bar
Export – SPSS or Stata or SAS
Xuất số liệu
Kiểm tra và làm sạch số liệu
Chạy tần số và kiểm tra các giá tri missing
Kiểm tra tính nhất quán giữa các biến
Kiểm tra các giá tri bất thường