95
PHM VĂN THÔNG 0905 474 478 [email protected] PHƯƠNG PHÁP NGHIÊN CU KHOA HC TRONG QUN LÝ THY SN Khánh Hòa, 2016 THONG - 0905474478

3. Nội dung bài giảng

Embed Size (px)

Citation preview

Page 1: 3. Nội dung bài giảng

PHẠM VĂN THÔNG

0905 474 478 [email protected]

PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC

TRONG QUẢN LÝ THỦY SẢN

Khánh Hòa, 2016

THONG - 090

5474

478

Page 2: 3. Nội dung bài giảng

MỞ ĐẦU

Ngày nay, việc ứng dụng tiến bộ khoa học kỹ thuật vào cuộc sống luôn được đề cao, đặc biệt là các lĩnh vực kinh doanh, hoạt động sản xuất bởi nó mang lại nhiều lợi ích từ nhân lực đến tài chính. Để có được những tiến bộ khoa học kỹ thuật ấy phải kể đến hoạt động nghiên cứu khoa học đã tạo ra chúng. Vì thế muốn phát triển nhanh, mạnh và bền vững thì công tác nghiên cứu khoa học phải được đề cao và quan tâm đúng mức.

Mỗi ngành nghề, mỗi lĩnh vực luôn đòi hỏi tính mới, tính sáng tạo, tiện ích và đó là sản phẩm từ hoạt động nghiên cứu khoa học. Tuy nhiên ở mỗi ngành nghề, mỗi lĩnh vực có cách nghiên cứu và tiếp cận đặc thù. Do vậy bài giảng ‘Phương pháp nghiên cứu khoa học trong Quản lý Thủy sản’ ra đời nhằm mục tiêu cung cấp cho người học ngành Quản lý Thủy sản phương pháp, công cụ cũng như cách thức để tiếp cận thực tế, áp dụng cho công trình nghiên cứu của mình nhằm mang lại hiệu quả về chuyên môn.

Bài giảng bao gồm 3 chương Chương 1: ‘Nghiên cứu khoa học, nghiên cứu khoa học trong Khai thác và Quản

lý Thủy sản’. Chương này cung cấp cho người học những khái niệm cơ bản về khoa học, nghiên cứu khoa học; phân loại khoa học; các yêu cầu, phương pháp và trình tự nghiên cứu khoa học. Ngoài ra chương 1 còn cung cấp những hướng nghiên cứu trong lĩnh vực Khai thác và Quản lý Thủy sản. Giúp người học có những kiến thức khái quát về nghiên cứu khoa học và nghiên cứu khoa học trong lĩnh vực chuyên môn.

Chương 2: ‘Mẫu, phương pháp thu mẫu và xử lý số liệu’. Chương này cung cấp cho người học những kiến thức liên quan đến chọn mẫu; các phương pháp sử dụng để thu mẫu và cách thức xử lý số liệu phù hợp với yêu cầu và trong nghiên cứu lĩnh vực chuyên ngành.

Chương 3: ‘Lập đề cương và công bố kết quả nghiên cứu’. Chương này cung cấp cho người học những nguyên tắc và cách thức để lập đề cương nghiên cứu. Người học còn được chỉ dẫn để trình bày kết quả nghiên cứu của mình theo nhiều hình thức khác nhau phù hợp với nội dung nghiên cứu và yêu cầu nghiên cứu.

Bài giảng được biên soạn qua kinh nghiệm bản thân, thu thập tài liệu liên quan. Nhưng vì thời gian có hạn và ít kinh nghiệm nên có thể còn tồn tại những thiếu sót. Rất mong quí thầy cô, đồng nghiệp và bạn đọc đóng góp ý kiến để bài giảng ngày càng hoàn thiện hơn.

Sưu tầm và biên soạn

Phạm Văn Thông

THONG - 090

5474

478

Page 3: 3. Nội dung bài giảng

I

MỤC LỤC

CHƯƠNG 1 – NGHIÊN CỨU KHOA HỌC, NGHIÊN CỨU KHOA HỌC TRONG KHAI THÁC VÀ QUẢN LÝ THỦY SẢN .......................................... 1

I. Khái niệm về nghiên cứu khoa học ............................................................. 1

I.1. Khoa học .............................................................................................. 1

I.2. Nghiên cứu khoa học ............................................................................ 2

I.3. Phân loại nghiên cứu khoa học ............................................................. 2

I.3.1. Theo chức năng nghiên cứu ........................................................... 2

I.3.2. Theo tính chất sản phẩm nghiên cứu .............................................. 2

I.3.3. Theo lĩnh vực nghiên cứu (theo mẫu đề tài NCKH cấp bộ của Bộ GD&ĐT) ................................................................................................ 3

I.4. Các khái niệm cơ bản trong nghiên cứu khoa học ................................. 3

I.5. Các yêu cầu của nghiên cứu khoa học .................................................. 4

I.6. Phương pháp nghiên cứu khoa học ....................................................... 6

I.7. Trình tự nghiên cứu khoa học ............................................................... 8

II. Nghiên cứu khoa học trong khai thác và quản lý thủy sản .......................... 9

CHƯƠNG 2 – MẪU, PHƯƠNG PHÁP THU MẪU VÀ XỬ LÝ SỐ LIỆU ..... 11

I. Mẫu ........................................................................................................... 11

I.1. Các khái niệm .................................................................................... 11

I.2. Lý do chọn mẫu .................................................................................. 11

I.3. Nguyên tắc chọn mẫu ......................................................................... 12

I.4. Cách thức chọn mẫu ........................................................................... 12

I.5. Ước lượng cỡ mẫu và phân bố mẫu .................................................... 18

I.5.1. Ước lượng cỡ mẫu ....................................................................... 18

I.5.2. Phân bố mẫu ................................................................................ 26

II. Phương pháp thu thập số liệu ................................................................... 26

II.1. Phương pháp thu thập số liệu từ tài liệu tham khảo ........................... 27

II.2. Phương pháp thu thập số liệu từ thực nghiệm ................................... 27

II.2.1. Khái niệm ................................................................................... 27

II.2.2. Định nghĩa các loại biến trong thực nghiệm ............................... 27

II.2.3. Kỹ thuật thu thập số liệu nghiên cứu .......................................... 28

II.3. Phương pháp phi thực nghiệm ........................................................... 28

THONG - 090

5474

478

Page 4: 3. Nội dung bài giảng

II

II.3.1. Khái niệm .................................................................................. 28

II.3.2. Kỹ thuật thu thập số liệu ............................................................ 29

II.4. Một số phương pháp thu thập số liệu khác ........................................ 37

II.4.1. Phương pháp sử dụng nhật ký ghi chép ...................................... 37

II.4.2. Thu thập mẫu từ cuộc nói chuyện ở những nơi công cộng.......... 38

II.4.3. Thu thập mẫu phỏng vấn qua tường thuật .................................. 38

III. Phương pháp xử lý số liệu ...................................................................... 38

III.1. Chuẩn bị dữ liệu .............................................................................. 38

III.2. Cấu trúc và mã hóa dữ liệu .............................................................. 40

III.3. Tạo ràng buộc khi nhập liệu ............................................................. 43

III.3.1. Lý do tạo ràng buộc khi nhập liệu ............................................. 43

III.3.2. Cài đặt chi tiết ........................................................................... 43

III.3.3. Phát hiện sai sót nếu có ............................................................. 44

III.3.4. Chỉnh sửa dữ liệu bị sai ............................................................ 46

III.3.5. Cảnh báo khi lập liệu trùng trong cùng cột ................................ 46

III.4. Sử dụng một số hàm thống kê trong Microsoft Excel để phân tích số liệu ........................................................................................................... 47

III.4.1. Nhóm hàm về thống kê ............................................................. 47

III.4.2. Nhóm hàm về phân phối xác suất ............................................. 49

III.4.3. Nhóm hàm về tương quan và hồi quy tuyến tính ....................... 51

III.4.4. Sử dụng các công cụ tích hợp trong Add in của Microsoft Excel 2013 ..................................................................................................... 51

IV. Xử lý số liệu và đánh giá trong Microsoft Excel .................................... 53

IV.1. Thống kê mô tả (Descriptive statistics) ............................................ 53

IV.1.1. Bảng phân phối tần số - bảng phân phối tần suất ...................... 53

IV.1.2. Đặc trưng mẫu .......................................................................... 54

IV.2. Ước lượng tham số .......................................................................... 55

IV.3. Kiểm định giả thiết .......................................................................... 56

IV.3.1. So sánh 2 trung bình với phương sai đã biết hay mẫu lớn (n≥30) ............................................................................................................. 56

IV.3.2. So sánh 2 trung bình với dữ liệu từng cặp ................................. 58

IV.3.3. So sánh 2 trung bình với phương sai bằng nhau ........................ 59

IV.3.4. So sánh 2 trung bình với phương sai khác nhau ........................ 61

THONG - 090

5474

478

Page 5: 3. Nội dung bài giảng

III

IV.3.5. So sánh 2 phương sai ................................................................ 62

IV.4. Phân tích phương sai (anova)........................................................... 64

IV.4.1. Phân tích phương sai một nhân tố ............................................. 64

IV.4.2. Phân tích phương sai hai nhân tố không lặp .............................. 66

IV.4.3. Phân tích phương sai hai nhân tố có lặp .................................... 69

IV.5. Tương quan – Hồi quy ..................................................................... 72

IV.5.1. Tương quan (Correlation) ......................................................... 72

IV.5.2. Hồi quy đơn tuyến tính ............................................................. 74

IV.5.3. Hồi quy đa tuyến tính ............................................................... 76

CHƯƠNG 3 – LẬP ĐỀ CƯƠNG VÀ CÔNG BỐ KẾT QUẢ NGHIÊN CỨU . 78

I. Các loại đề cương và yêu cầu nội dung ..................................................... 79

II. Nội dung của báo cáo khoa học ............................................................... 80

II.1. Mở đầu .............................................................................................. 81

II.2. Tổng luận .......................................................................................... 81

II.3. Phương pháp nghiên cứu ................................................................... 81

II.4. Kết quả và Thảo luận ........................................................................ 82

II.5. Kết luận và đề xuất ý kiến ................................................................. 82

II.6. Tài liệu tham khảo ............................................................................ 83

II.7. Phụ lục .............................................................................................. 83

II.8. Tóm tắt ............................................................................................. 84

III. Các nguyên tắc khi viết báo cáo ............................................................. 84

III.1. Tuân thủ các qui định về hình thức trình bày ................................... 85

III.2. Đảm bảo tính rõ ràng ....................................................................... 85

III.3. Nhất quán ........................................................................................ 85

III.4. Đơn giản, súc tích ............................................................................ 86

III.5. Tạo được điểm nhấn cần thiết .......................................................... 86

IV. Phản biện bài báo khoa học .................................................................... 86

PHỤ LỤC: Bảng giá trị rcrit (Ravid, 1994). ....................................................... 88

TÀI LIỆU THAM KHẢO ................................................................................ 89

THONG - 090

5474

478

Page 6: 3. Nội dung bài giảng

THONG - 090

5474

478

Page 7: 3. Nội dung bài giảng

1 CHƯƠNG 1 – NGHIÊN CỨU KHOA HỌC, NGHIÊN CỨU KHOA HỌC TRONG KHAI THÁC VÀ QUẢN LÝ THỦY SẢN

I. Khái niệm về nghiên cứu khoa học I.1. Khoa học Khoa học (science) là hệ thống tri thức chung của nhân loại về thế giới tự nhiên (Phạm Viết Vượng 2001). Hay “Khoa học là hệ thống tri thức về mọi qui luật của vật chất và sự vận động của vật chất, những qui luật của tự nhiên, xã hội và tư duy” (Auger, 1961).

- Tri thức khoa học (Scientific knowledge): bao gồm những hiểu biết được tích luỹ thông qua hoạt động nghiên cứu được tổ chức và triển khai dựa trên các phương pháp khoa học. Ví dụ: Ba định luật của Newton.

- Tri thức kinh nghiệm (Empirical knowledge): bao gồm những hiểu biết được tích luỹ một cách ngẫu nhiên thông qua cuộc sống hàng ngày và là tiền đề cho sự phát triển thành tri thức khoa học. Ví dụ: “Chuồn chuồn bay thấp thì mưa, bay cao thì nắng, bay vừa thì râm”.

Các hiểu biết chung này được tích luỹ dần theo thời gian và là kết quả của hoạt động tìm hiểu thiên nhiên không mệt mỏi của con người. Thiếu những hiểu biết này khả năng khai thác và cải tạo thiên nhiên để phục vụ cuộc sống của con người sẽ vô cùng hạn chế. Chẳng hạn cho đến khi các tiến bộ khoa học cho phép phát hiện các túi dầu mỏ nằm sâu trong lòng đất thì loại vật chất này chưa thể được coi là tài nguyên. Thế nhưng việc phát hiện các túi dầu không thôi cũng chưa đủ để con người có thể sử dụng nó. Người ta phải nghiên cứu, tìm hiểu và thử nghiệm các cách thức khai thác (khoan, hút dầu thô đưa lên mặt đất) và chế biến dầu thô thành các sản phẩm hữu dụng như xăng, dầu, các chất tổng hợp … (Miller 2004).

Các phương pháp nhận thức khoa học và qui trình sản xuất cũng là các thông tin khoa học. Phân loại khoa học mang tính linh động cao. Khoa học càng phát triển, nghiên cứu càng sâu thì nhất thiết phải chia thành nhiều ngành nhỏ, gọi là qui luật phân hoá. Ngược lại, để giải quyết những vấn đề lớn, các chuyên ngành nhỏ được tập hợp lại để hình thành cách khoa học liên ngành, gọi là qui luật tích hợp. Lịch sử khoa học cho thấy trước đây, chỉ có một ngành khoa học duy nhất là triết học. Do có khả năng giải thích các hiện tượng xảy ra trong thiên nhiên và xã hội, Triết học đã được coi là khoa học của mọi khoa học. Nhưng đến nay, khoa học đã phân hoá thành rất nhiều ngành, lĩnh vực khác nhau phục vụ yêu cầu tìm hiểu và phát triển của con người.

Chỉ riêng về sinh học thôi ta cũng có thể kể ra nhiều ngành khoa học như động vật học, thực vật học, vi sinh vật học, sinh lý, sinh hoá, di truyền, thần kinh học, nội tiết tố học ... Sự kết hợp giữa khoa học môi trường và kinh tế học để hình thành lên một ngành khoa học mới là kinh tế môi trường thể hiện qui luật tích hợp. Ngành khoa học mới này có nhiệm vụ cân đối yêu cầu phát triển kinh tế với kh ảnăng có hạn của môi trường và tài nguyên thiên nhiên nhằm hạn chế tối đa những ảnh hưởng xấu có thể của hoạt động kinh tế đến môi trường và tài nguyên thiên nhiên. UNESCO chia khoa học thành 5 lĩnh vực chính là: khoa học tự nhiên và khoa học chính xác, khoa học kỹ thuật, khoa học nông nghiệp, khoa học về sức khoẻ và khoa học xã hội và nhân văn. Theo cách phân loại này, khoa học Quản lý thủy sản được xếp vào lĩnh vực thứ 3 (khoa học nông nghiệp).

THONG - 090

5474

478

Page 8: 3. Nội dung bài giảng

2 Theo tác giả Vũ Cao Đàm (1999), khoa học có thể được phân loại như sau: Khoa học tự nhiên; Khoa học kỹ thuật và công nghệ; Khoa học nông nghiệp; Khoa học sức khoẻ; Khoa học xã hội và nhân văn và Triết học.

I.2. Nghiên cứu khoa học Nghiên cứu khoa học (NCKH - scientific research) là một hoạt động sáng tạo, nhằm tìm hiểu và cải tạo thế giới. Ngoài việc tìm hiểu thế giới xung quanh, nghiên cứu khoa học sẽ giúp con người sử dụng các hiểu biết này để khai thác và cải tạo các điều kiện tự nhiên theo chiều hướng có lợi cho con người. Nói cách khác, thông tin khoa học phải hữu ích đối với đời sống của con người. Sáng tạo là động lực quan trọng của nghiên cứu khoa học. Nó được thể hiện qua việc đổi mới cách thức tiếp cận vấn đề cần nghiên cứu, thiết kế thí nghiệm, cách thức thu mẫu và xử lý số liệu, phương pháp phân tích mẫu … Sự sáng tạo trong nghiên cứu khoa học cho phép người làm nghiên cứu có thể giải quyết vấn đề một cách triệt để trong thời gian ngắn nhất với chi phí tối thiểu. Khi điều kiện nghiên cứu chỉ có hạn, người làm nghiên cứu lại càng phải sáng tạo hơn.

Theo Vũ Cao Đàm (2005), “Nghiên cứu khoa học là sự tìm kiếm những điều mà khoa học chưa biết; hoặc là phát hiện bản chất sự vật, phát triển nhận thức khoa học về thế giới; hoặc là sáng tạo phương pháp mới và phương tiện kỹ thuật mới để làm biến đổi sự vật phục vụ cho mục tiêu hoạt động của con người”.

I.3. Phân loại nghiên cứu khoa học I.3.1. Theo chức năng nghiên cứu • Nghiên cứu mô tả (Descriptive research): nhằm đưa ra một hệ thống tri thức giúp con người phân biệt các sự vật, hiện tượng xung quanh; bao gồm mô tả định tính và mô tả định lượng, mô tả một sự vật, hiện tượng riêng lẽ hoặc so sánh giữa nhiều sựvật, hiện tượng khác nhau.

• Nghiên cứu giải thích (Explanatory research): nhằm làm rõ các qui luật chi phối các hiện tượng, các quá trình vận động của sự vật.

• Nghiên cứu sáng tạo (Creative research): nhằm tạo ra các qui luật, sự vật mới hoàn toàn. (Thường các nghiên cứu có tính tương quan các yếu tố).

I.3.2. Theo tính chất sản phẩm nghiên cứu • NCKH cơ bản (Fundamental research): nhằm khám phá các qui luật, bản chất của hiện tượng nghiên cứu. Sản phẩm của NCKH cơ bản là tri thức, là các qui luật, nguyên lý ... Chính vì thế một khi được ứng dụng vào sản xuất, nó có thể đem lại hiệu quả rất cao. Tuy vậy, hiệu quả của NCKH cơ bản thường không được đánh giá hết do trình độ hữu hạn của khoa học ứng dụng đương thời. Các nghiên cứu cơ bản thường tốn kém, đòi hỏi thời gian dài, thiết bị hiện đại và đội ngũ cán bộ nghiên cứu có trình độ cao. Vì thế thường chỉ phát triển ở các nước giàu. NCKH cơ bản, nếu chỉ để hiểu biết về thiên nhiên, được gọi là NCKH cơ bản thuần tuý. Ngược lại, nếu người nghiên cứu đã có dự kiến về khả năng ứng dụng của thông tin tìm được thì nghiên cứu của họ được gọi là NCKH cơ bản có định hướng.

• NCKH ứng dụng (Applied research): ứng dụng kết quảcủa NCKH cơ bản vào thực tiễn sản xuất hoặc đời sống xã hội. Sản phẩm của NCKH ứng dụng là các giải pháp kỹ

THONG - 090

5474

478

Page 9: 3. Nội dung bài giảng

3 thuật, công nghệ hoặc quản lý. NCKH ứng dụng ít tốn kém và mang lại hiệu quả nhanh nếu thực hiện tốt. Chính vì thế thích hợp với các nước đang phát triển.

• NCKH triển khai (Implementation research): NCKH ứng dụng thường bị hạn chế về qui mô. Thử nghiệm dù rất thành công có thể chỉ được triển khai ở qui mô thí nghiệm hay mới chỉ ở một địa điểm. Khi muốn áp dụng vào sản xuất đại trà hoặc tiến hành ở một địa phương khác, trong điều kiện khác phải thông qua NCKH triển khai. Loại hình nghiên cứu này thường gắn liền với hoạt động chuyển giao, điều chỉnh công nghệ.

• NCKH dự báo (Anticipatory research): thường gặp trong các nghiên cứu về kinh tế, phát triển. Căn cứ trên những hiểu biết và các thông số sản xuất hiện tại, người ta dự báo về xu hướng phát triển của ngành. Độ chính xác của dự báo phụ thuộc vào hiện trạng phát triển của khoa học và độ chính xác của những thông tin mà người nghiên cứu sử dụng.

I.3.3. Theo lĩnh vực nghiên cứu (theo mẫu đề tài NCKH cấp bộ của Bộ GD&ĐT) Gồm có các lĩnh vực sau: Tự nhiên; Xã hội-nhân văn; Giáo dục; Kỹ thuật; Nông lâm ngư; Y dược; Môi trường.

I.4. Các khái niệm cơ bản trong nghiên cứu khoa học a. Đề tài nghiên cứu (research project): Là một hình thức tổ chức NCKH do một người hoặc một nhóm người thực hiện để trả lời những câu hỏi mang tính học thuật hoặc ứng dụng vào thực tế. Mỗi đề tài nghiên cứu có tên đề tài (research title), là phát biểu ngắn gọn và khái quát về các mục tiêu nghiên cứu của đề tài.

b. Nhiệm vụ nghiên cứu (research topic): Là những nội dung được đặt ra để nghiên cứu trên cơ sở tên đề tài nghiên cứu đã được xác định.

c. Đối tượng nghiên cứu (research focus): Là bản chất cốt lõi của sự vật hay hiện tượng cần xem xét và làm rõ trong đề tài nghiên cứu.

d. Mục tiêu nghiên cứu (research objective): Những nội dung cần được xem xét và làm rõ trong khuôn khổ đối tượng nghiên cứu đã xác định nhằm trả lời câu hỏi “Nghiên cứu cái gì?”. Dựa trên mục tiêu, các câu hỏi nghiên cứu được xây dựng.

e. Mục đích nghiên cứu (research purpose): Ý nghĩa thực tiễn của nghiên cứu. Mục đích trả lời câu hỏi “ Nghiên cứu nhằm vào việc gì?” hoặc “ Nghiên cứu để phục vụcho cái gì?”.

f. Khách thể nghiên cứu (research population): Là sự vật chứa đựng đối tượng nghiên cứu. Khách thể nghiên cứu có thể là một không gian vật lý, một quá trình, một hoạt động, hoặc một cộng đồng.

g. Đối tượng khảo sát (research sample): Là mẫu đại diện của khách thể nghiên cứu

h. Phạm vi nghiên cứu (research scope): Sự giới hạn về đối tượng nghiên cứu, đối tượng khảo sát và thời gian nghiên cứu (do những hạn chế mang tính khách quan và chủ quan đối với đề tài và người làm đề tài).

THONG - 090

5474

478

Page 10: 3. Nội dung bài giảng

4

Bảng 1. 1: Các khái niệm một đề tài nghiên cứu khoa học cụ thể

Tên đề tài Nghiên cứu cải tiến ngư cụ khai thác tôm hùm con tại vịnh Ninh Chữ, tỉnh Ninh Thuận

Nhiệm vụ - Điều tra tổng quan tình hình kinh tế, xã hội của các hộ ngư dân làm nghề khai thác tôm hùm con tại vịnh Ninh Chữ, tỉnh Ninh Thuận.

- Điều tra thực trạng nghề khai thác tôm hùm con tại vịnh Ninh Chữ, tỉnh Ninh Thuận.

- Viết báo cáo chuyên đề về ảnh hưởng của ngư cụ, phương thức khai thác tôm hùm con đến hệ sinh thái rạn san hô, cảnh quan môi trường và tâm lý của du khách khi du lịch tại vịnh Ninh Chữ, tỉnh Ninh Thuận.

- Đề xuất ngư cụ mới để khai thác tôm hùm con tại vịnh Ninh Chữ, tỉnh Ninh Thuận được ngư dân chấp nhận áp dụng vào thực tế sản xuất với sự đồng thuận của các ban ngành liên quan.

Đối tượng Các cấu trúc, kết cấu ngư cụ khai thác tôm hùm con

Mục tiêu - Phản ảnh được thực trạng ngư cụ, phương thức tổ chức khai thác tôm hùm con tại vịnh Ninh Chữ, tỉnh Ninh Thuận.

- Chỉ ra được những ảnh hưởng của ngư cụ, phương thức khai thác đến hệ sinh thái rạn san hô, cảnh quan môi trường và du lịch của địa phương.

- Thiết kế cải tiến và chế tạo được ngư cụ mới khai thác tôm hùm con tại vịnh Ninh Chữ, tỉnh Ninh Thuận nhằm đảm bảo lợi ích kinh tế cho ngư dân; bảo vệ hệ sinh thái rạn san hộ; giữ được cảnh quan, môi trường thân thiện góp phần thúc đẩy du lịch địa phương phát triển.

Mục đích Đảm bảo sự tồn tại và phát triển bền vững nghề khai thác tôm hùm con tại vịnh Ninh Chữ, tỉnh Ninh Thuận.

Khách thể Ngư cụ khai thác tôm hùm con

Đối tượng Cấu trúc ngư cụ khai thác tôm hùm con

Phạm vi Vịnh Ninh Chữ, tỉnh Ninh Thuận

I.5. Các yêu cầu của nghiên cứu khoa học NCKH có 8 đặc thù và cũng là yêu cầu, bao gồm: tính mới, tính thông tin, tính kế thừa, tính tin cậy, tính khách quan, tính rủi ro, tính cá nhân và tính phi kinh tế. Người làm nghiên cứu cần phải hiểu rõ các đặc thù/yêu cầu này để đảm bảo chất lượng của nghiên cứu do mình thực hiện và đánh giá khách quan các nghiên cứu khác.

• Tính mới: là động lực phát triển của khoa học. NCKH sau phải mới so với NCKH đã được thực hiện trước đó. Tính mới có thể được thể hiện qua một trong những khía cạnh sau: nội dung nghiên cứu, phương pháp nghiên cứu, cách lập luận, phân tích kết quả. Nội dung nghiên cứu mới sẽ đem lại những hiểu biết mới. Phương pháp mới hoặc

THONG - 090

5474

478

Page 11: 3. Nội dung bài giảng

5 phương pháp được cải tiến phải khắc phục được nhược điểm, hạn chế của các phương pháp đã sử dụng trong các nghiên cứu tương tự.

• Tính kế thừa: nghiên cứu sau phải kế thừa và phát triển kết quả của những nghiên cứu trước (nếu không có nghi vấn gì). Người làm nghiên cứu trước khi xây dựng đề cương nghiên cứu cần tham khảo đầy đủ các thông tin đã có, tránh trường hợp vội vàng bỏ qua những thông tin quan trọng hoặc phủ nhận các thông tin đã có đơn giản vì chúng không ủng hộ ý tưởng hoặc giả thuyết nghiên cứu của mình. Một khi đã tiếp cận một cách tương đối đầy đủ thông tin tham khảo, các phán đoán nhận định của người làm nghiên cứu sẽ khả dĩ hơn.

• Tính tin cậy: kết quả của của nghiên cứu phải có độ tin cậy cao. Tính tin cậy của NCKH được thể hiện qua việc xác định chính xác vấn đề cần nghiên cứu, có phương pháp nghiên cứu phù hợp, thu thập số liệu và phân tích kết quả một cách khác quan. Tính tin cậy thể hiện qua khả năng lặp lại của nghiên cứu. Có nghĩa là, người khác phải có khả năng thực hiện lại được nghiên cứu và thu được kết quả tương tự nếu đảm bảo đúng các điều kiện nghiên cứu đã mô tả trong báo cáo đề tài của bạn.

• Tính khách quan: mọi nhận xét, kết luận phải tuân thủ kết quả nghiên cứu và dựa trên các lập luận khoa học. Kết quả nghiên cứu của mình nếu mẫu thuẫn với các tác giả khác cần phải được giải thích, làm rõ nguyên nhân. Tuyệt đối tránh những nhận định cảm tính hoặc mâu thuẫn với kết quả của kiểm định thống kê đã lựa chọn (trước khi thu số liệu) và thực hiện. Trong quá trình thực hiện nghiên cứu, người nghiên cứu không nên để những nhận định chủ quan của mình ảnh hưởng đến việc thu thập và xử lý số liệu.

• Tính thông tin: thông tin thu được từNCKH có thể chỉ có giá trị nhất thời. Người làm nghiên cứu vì thế phải thường xuyên cập nhật thông tin trong lĩnh vực của mình để tránh lặp lại một cách không cần thiết các nghiên cứu đã được thực hiện và có đầy đủ thông tin hơn về đối tượng nghiên cứu, giúp cho việc xây dựng kế hoạch nghiên cứu và thảo luận kết quả chính xác hơn. Mặt khác, thông tin thu được từ nghiên cứu phải được công bố càng sớm càng tốt. Dung lượng thông tin trong các báo cáo khoa học phải cao và đầy đủ về đề tài đã thực hiện để người đọc có thể hiểu và đánh giá chất lượng của nghiên cứu một cách dễ dàng.

• Tính rủi ro: NCKH có thể thất bại. Trong thực tế NCKH số lượng các đề tài nghiên cứu thất bại lớn hơn rất nhiều so với số lượng các đề tài nghiên cứu thành công. Mọi thất bại trong NCKH đều có giá trị nếu người làm nghiên cứu giải thích hoặc chí ít cũng phán đoán được nguyên nhân dẫn đến thất bại hay lý do dẫn đến phán đoán sai của mình.

• Tính cá nhân: tư duy sáng tạo và vai trò dẫn dắt của một hoặc vài cá nhân trong các đề tài, chương trình nghiên cứu khoa học lớn rất quan trọng. Trong NCKH mọi ý kiến, phương án hay của một cá nhân, bất luận vị trí công tác hay trình độ đều được trân trọng. Đóng góp của từng cá nhân cho đề tài nghiên cứu sẽ được ghi nhận và phân biệt theo thứ tự tên các tác giả trong báo cáo khoa học hoặc báo cáo tổng kết đề tài.

• Tính phi kinh tế: NCKH thường rất tốn kém nhưng không phải lúc nào hiệu quả kinh tế của nó cũng được thể hiện ngay. Thêm vào đó, việc định mức lao động trong NCKH cũng rất khó khăn bởi những phát minh, các ý tưởng nghiên cứu độc đáo có thể chỉ đến trong đầu nhà khoa học qua vài giây suy nghĩ những đòi hỏi một quá trình tích luỹ kinh nghiệm và kiến thức lâu dài. Thời gian và công sức dành cho NCKH không phải bao giờ cũng tỉ lệ thuận với mức độ thành công.

THONG - 090

5474

478

Page 12: 3. Nội dung bài giảng

6 Hiểu được những yêu cầu/ đặc thù này, người làm nghiên cứu khoa học phải đảm bảo nghiên cứu do mình thực hiện đem lại những thông tin khoa học mới, góp phần phát triển các học thuyết/mô hình lý thuyết trong lĩnh vực nghiên cứu, sửdụng phương pháp hợp lý để số liệu thu được có độ tin cậy cao, đưa ra các kết luận khách quan và nhanh chóng công bố kết quả. Các đặc thù xã hội của nghiên cứu khoa học (tính cá nhân, tính phi kinh tế) giúp xác lập mối quan hệ giữa những người nghiên cứu và đánh giá đúng hơn giá trị của lao động khoa học.

I.6. Phương pháp nghiên cứu khoa học

Phương pháp nghiên cứu khoa học (method research) là cách thức, công cụ hay phương tiện để nghiên cứu khoa học. Cụ thể hơn, phương pháp NCKH chính là cách thức mà người nghiên cứu sử dụng để thu thập và xử lý số liệu/thông tin về vấn đề mình quan tâm. Xét về cách thức, người làm nghiên cứu có thể quan sát hoặc tiến hành thực nghiệm để thu thập số liệu/thông tin về đối tượng hoặc hiện tượng cần nghiên cứu. Thực nghiệm được xem là linh hồn của nghiên cứu khoa học hiện đại nhờ khả năng phát hiện các mối quan hệ nhân quả và khả năng lặp lại nhiều lần của nó. Quan sát được coi là bước khởi đầu quan trọng.

Quan sát là phương pháp rất thông dụng khi con người bắt đầu tìm hiểu về thiên nhiên. Cho đến nay giá trị và tầm quan trọng của nó vẫn còn nguyên vẹn. Người có tư chất nghiên cứu khoa học trước hết phải là người có óc quan sát. Kết quả của quan sát là các mô tả về đối tượng, ví dụ vào ban đêm cá hay tập trung nơi có nguồn sáng, cá tầng đáy có da dày và đen hơn cá tầng mặt. Phương pháp này đòi hỏi trực quan nhạy bén của người quan sát, phương pháp ghi chép và các thiết bị đo đạc phụ trợ. Kiến thức chuyên môn của người quan sát rất quan trọng, đặc biệt khi muốn phát hiện mối quan hệ có thể giữa vô vàn sự kiện, hiện tượng với nhau. Tuy nhiên, cũng chính vì vậy mà quan sát dễ mang tính chủ quan của người thực hiện. Quan sát thường được thực hiện trong điều kiện tự nhiên. Vì thế lựa chọn thời điểm và địa điểm quan sát mang tính quyết định. Người nghiên cứu cũng có thể thiết lập sự kiện để tiến hành quan sát. Vấn đề là ở chỗ, điều kiện do người nghiên cứu tự thiết lập có gần với điều kiện tự nhiên hay không? Quan sát là tiền đề rất quan trọng cho các nghiên cứu thực nghiệm tiếp theo. Thực nghiệm hay thí nghiệm nhằm kiểm chứng các giả thuyết, nghi vấn hình thành từ những quan sát ban đầu. Nó đi sâu tìm hiểu về nguyên nhân, cơ chế và mức độ ảnh hưởng của của các hiện tượng tự nhiên. Thực nghiệm cho phép tách vấn đề/hiện tượng nghiên cứu thành các vấn đề nhỏ, thay đổi điều kiện nghiên cứu theo chủ ý của người làm nghiên cứu và lặp lại được nhiều lần. Tuỳ thuộc vào vấn đề nghiên cứu đặt ra mà người nghiên cứu thiết lập điều kiện phục vụ cho nghiên cứu của mình với sự hỗ trợ của thiết bị. Giá trị của thực nghiệm, tuy nhiên, phụ thuộc rất nhiều vào mức độ tương đồng giữa điều kiện thực nghiệm và điều kiện tự nhiên. Đa số các thí nghiệm đều được thực hiện ở qui mô nhỏ và có ít yếu tố động hơn là trong tự nhiên.

Khi tiến hành tìm hiểu bản chất của sự vật, hiện tượng công việc của một người làm nghiên cứu khoa học là “phát hiện sự khác biệt giữa nhiều hiện tượng tương tự nhau và tìm ra những điểm chung của nhiều sự kiện, hiện tượng khác nhau”. Để làm được công việc này, người làm nghiên cứu khoa học phải có khả năng phân tích, lập luận tốt. Diễn dịch và qui nạp là hai phép suy luận khoa học được sử dụng. Suy luận diễn dịch là suy luận từ cái chung, cái đã biết – đã khẳng định đến cái riêng, phân tích cho những trường hợp cụ thể. Qui nạp lại đi từ nhiều cái riêng khác nhau để lập luận, đi đến những kết

THONG - 090

5474

478

Page 13: 3. Nội dung bài giảng

7 luận, nguyên lý chung. Trong nghiên cứu khoa học, hai phép suy luận này được sử dụng nhuần nhuyễn và hỗ trợ cho nhau.

Bacon & Mill là những người đi đầu trong việc phát triển phương pháp nghiên cứu khoa học và dựa hoàn toàn vào phép qui nạp- induction (Gower 2005). Theo phép này, người làm nghiên cứu có thể kết luận giả thuyết hoặc học thuyết của mình đưa ra là đúng khi thu thập đủ các bằng chứng và không bị bất cứ quan sát nào phản bác giả thuyết của mình. Hạn chế rõ ràng nhất của cách tiếp cận này là ở chỗ người ta không thể nào thu thập đủ các quan sát, bằng chứng ủng hộ cho giả thuyết/học thuyết của mình cả. Nghiên cứu khoa học hiện đại sử dụng một phương pháp khác:

Phương pháp diễn dịch (deduction). Tức là xây dựng các dự đoán hoặc giải thích dựa trên cơ sở của các học thuyết, các qui luật đã được xác định. Karl Poper (1968, 1969 dẫn từ Quin & Keough 2004) chuẩn hoá cách tiếp cận này và gọi là hypothetico-deduction approach dựa trên nguyên tắc chứng minh sai (falsificationism). Theo đó, các mô hình lý thuyết và giả thuyết đi kèm với chúng sẽ được chứng minh là không có căn cứ. Muốn chứng mình một giả thuyết là đúng, người ta xây dựng đối thuyết (ngược lại với giả thuyết) và chứng minh đối thuyết này là sai và suy ra giả thuyết đúng. Để chứng minh đối thuyết sai, người nghiên cứu chỉ cần tìm một bằng chứng phản bác lại nó.

Người làm nghiên cứu khoa học vì thế dùng phép qui nạp để xây dựng mô hình/ giả thuyết. Sau đó thông qua cả một quá trình diễn dịch logic để kiểm định mô hình/ giả thuyết đã đưa ra. Cách thức thu thập số liệu sẽ quyết định đến giá trị, độ tin cậy của những số liệu này. Cách xử lý và phân tích số liệu cũng quan trọng không kém. Khi thực hiện nghiên cứu, người làm nghiên cứu tuỳ theo cách thức thu thập số liệu của mình cần thiết phải có được các công cụ và vật liệu thích hợp. Ví dụ muốn đánh bắt cá tối thiểu phải có ngư cụ, phương tiện hỗ trợ (tàu, máy dò cá, định vị…).

Phương pháp xử lý số liệu và đưa ra kết luận quan trọng không kém. Kết quản ghiên cứu khoa học phải được trình bày dưới dạng xác xuất (bắt gặp sự kiện mà người nghiên cứu đã quan sát được). Vì thế cần thiết phải có sự hỗ trợ của lý thuyết xác xuất và các phương pháp thống kê. Lý do là nghiên cứu khoa học do con người thực hiện và có thể bị ảnh hưởng bởi cảm tính của người làm nghiên cứu. Một số người có xu hướng khăng khăng bảo vệ ý tưởng của mình ngay cả khi có bằng chứng phản bác giả thuyết hoặc mô hình mà họ xây dựng. Một số khác ra sức bám chặt lấy các nhận định cảm tính của mình, không dựa vào số liệu mà nghiên cứu thu được.

Sử dụng thống kê trong thiết kế thí nghiệm, thiết kế thu mẫu và xử lý số liệu sẽ giúp đảm bảo tính khách quan của nghiên cứu (Quin & Keough 2004). Ngày nay, các NCKH mang tính thực nghiệm mà kết quả nghiên cứu không được xử lý bằng phương pháp thống kê coi như không có giá trị công bố. Việc tính toán, tiến hành kiểm định thống kê trở nên nhẹ nhàng với sự xuất hiện của máy tính điện tử. Các phần mềm thống kê có cả chức năng đồ họa như Genstat, Stat Graphic, SPSS, Stata, R2,… chính là công cụ đắc lực giúp cho người làm nghiên cứu khoa học thực hiện phương pháp do mình lựa chọn.

Với từng đề tài cụ thể, phương pháp nghiên cứu được qui định bởi mục tiêu và nội dung nghiên cứu. Các phương pháp được lựa chọn phải chuẩn, khách quan, có độ chính xác cao và lặp lại được.

THONG - 090

5474

478

Page 14: 3. Nội dung bài giảng

8 I.7. Trình tự nghiên cứu khoa học

Trình tự của một hoạt động NCKH có thể được khái quát thành 7 bước như sau (Ary et al., 2010):

Bảng 1. 2: Tình tự các bước trong nghiên cứu khoa học

Bước Nội dung 1 Lựa chọn vấn đề nghiên cứu

2 Tổng quan tài liệu

3 Thiết kế nghiên cứu

4 Thu thập dữ liệu

5 Phân tích dữ liệu

6 Tổng hợp kết quả và kết luận

7 Báo cáo kết quả • Bước 1: Lựa chọn vấn đề nghiên cứu (Selecting a problem)

Xác định đề tài, nhiệm vụ và đối tượng nghiên cứu, mục tiêu và mục đích nghiên cứu, các câu hỏi nghiên cứu cần được trả lời và các giả thuyết ban đầu tương ứng (nếu cần thiết), đối tượng khảo sát và phạm vi nghiên cứu.

• Bước 2: Tổng quan tài liệu (Reviewing the literature on the problem)

Tổng quan các công trình nghiên cứu đã có, các nguồn thông tin, tư liệu có liên quan đến vấn đề nghiên cứu. Căn cứ trên kết quả tổng quan này để tiếp tục hoàn thiện vấn đề nghiên cứu, các câu hỏi nghiên cứu và các giả thuyết ban đầu.

• Bước 3: Thiết kế nghiên cứu (Designing the research)

Bao gồm các nội dung: lựa chọn phương pháp nghiên cứu, phương pháp và công cụ thu thập dữ liệu, mẫu khảo sát, dự kiến tiến độ.

• Bước 4: Thu thập dữ liệu (Collecting the data)

Tổ chức thu thập các thông tin định tính hoặc định lượng theo các phương pháp và công cụ đã chọn ở bước 3.

• Bước 5: Phân tích dữ liệu (Analyzing the data)

Từ các thông tin thu thập được, sử dụng các công cụ thống kê hoặc các phương pháp đặc thù để xử lý và phân tích dữ liệu.

• Bước 6: Tổng hợp kết quả và kết luận (Interpreting the findings and stating

conclusions)

Khái quát hoá các kết quả xử lý và phân tích dữ liệu nhằm trả lời các câu hỏi nghiên cứu, cung cấp các kết luận và các đề xuất, kiến nghị (nếu cần thiết).

THONG - 090

5474

478

Page 15: 3. Nội dung bài giảng

9 • Bước 7: Báo cáo kết quả(Reporting results)

Người nghiên cứu lập báo cáo kết quả nghiên cứu để gửi đến cá nhân, tổ chức quan tâm hoặc chịu trách nhiệm quản lý.

II. Nghiên cứu khoa học trong khai thác và quản lý thủy sản Trong lĩnh vực quản lý thủy sản, những vấn đề chúng ta có thể tập trung nghiên cứu như: Tàu thuyền, ngư cụ, môi trường-ngư trường-nguồn lợi, mô hình quản lý, đa dạng sinh học và bảo tồn, chính sách – quy hoạch.

Tàu cá:

- Nghiên cứu cải tiến và tiêu chuẩn hóa cơ khí tàu thuyền, giải pháp hiện đại hóa tàu cá.

- Nghiên cứu giải pháp công nghệ quản lý tàu cá hoạt động trên biển, về cảng và neo đậu tại các khu neo đậu tránh trú bão.

- Nghiên cứu giải pháp quản lý thông tin tàu cá nhanh chóng, thuận lợi, có sự gắn kết giữa địa phương với trung ương.

Ngư cụ:

- Nghiên cứu cải tiến và tiêu chuẩn hóa các loại ngư cụ, vật liệu dùng trong nghề cá biển nhằm khai thác bền vững nguồn lợi.

- Nghiên cứu tính chọn lọc ngư cụ nhằm khai thác hợp lý và bảo vệ nguồn lợi thủy sản.

Môi trường, ngư trường, nguồn lợi:

- Nghiên cứu mối quan hệ giữa môi trường, nguồn lợi hải sản và nghề cá biển; ảnh hưởng của biến đổi khí hậu đến nghề cá biển; đề xuất các phương án, giải pháp xử lý ô nhiễm môi trường và quản lý môi trường biển; vi sinh vật trong xử lý môi trường; các biện pháp khôi phục, tái tạo và phát triển nguồn lợi hải sản.

- Điều tra, đánh giá trữ lượng và khả năng khai thác bền vững nguồn lợi hải sản; các hệ sinh thái làm cơ sở khoa học cho việc sử dụng hợp lý tài nguyên sinh vật biển.

- Nghiên cứu nguồn lợi hải sản, quy luật biến động nguồn lợi hải sản và sinh học nghề cá phục vụ dự báo ngư trường khai thác và quản lý nghề cá.

Mô hình quản lý:

- Nghiên cứu xây dựng mô hình quản lý, mô hình đồng quản lý dựa vào cộng đồng, mô hình dịch vụ hậu cần nghề cá hoặc mô hình chuỗi giá trị cho nghề khai thác thủy sản.

Đa dạng sinh học và bảo tồn

- Nghiên cứu các vấn đề kinh tế - xã hội nghề cá, đa dạng sinh học và bảo tồn biển.

- Nghiên cứu thành lập các khu bảo tồn biển, tái tạo và phát triển các hệ sinh thái.

Chính sách, qui hoạch:

- Nghiên cứu xây dựng các chính sách giúp phát triển nghề cá bền vững.

THONG - 090

5474

478

Page 16: 3. Nội dung bài giảng

10 - Nghiên cứu ứng dụng công nghệ thông tin, hệ thống thông tin địa lý… nhằm quy hoạch vùng khai thác, qui hoạch đội tàu khai thác, quy hoạch khu neo đậu tránh trú bão cho tàu cá, quy hoạch hệ thống cảng cá, bến cá…

THONG - 090

5474

478

Page 17: 3. Nội dung bài giảng

11 CHƯƠNG 2 – MẪU, PHƯƠNG PHÁP THU MẪU VÀ XỬ LÝ SỐ LIỆU I. Mẫu I.1. Các khái niệm Toàn thể: Là tập hợp lý thuyết của tất cả các cá thể, không xác định không gian và thời gian.

Quần thể: Là tập hợp lý thuyết của tất cả cá thể theo một đặc tính, trong một khoảng không gian và thời gian xác định.

Mẫu/ quần thể quan sát được (quần thể mục tiêu): Là tập hợp một số lượng cá thể, lựa chọn từ một quần thể trên một đặc tính mẫu quan tâm.

Đặc tính mẫu: Là cơ sở để xác định, lựa chọn cá thể của quần thể vào một mẫu, có số lượng cá thể ít hơn, ví dụ cá thể một quần thể người có thể là cá thể người, hộ gia đình, làng/ xóm.

Mẫu không xác suất (non-probability sample): Phương pháp trong đó việc chọn mẫu không có xác suất đồng đều hay các cá thể trong quần thể không có cơ hội được chọn như nhau.

Mẫu xác suất (probability sample): Phương pháp chọn mẫu trong đó mỗi cá thể có một xác suất đặc trưng của mẫu và thường bằng nhau. Hầu hết việc lấy mẫu xác suất sử dụng cách lấy mẫu ngẫu nhiên để tạo ra mỗi cá thể trong quần thể có cơ hội được chọn như nhau.

Danh sách/ khung mẫu: Là danh sách các cá thể của một quần thể, giúp hỗ trợ kỹ thuật cho quá trình chọn mẫu.

Cỡ mẫu: Là số lượng cá thể được lựa chọn từ một số lượng xác định/ không xác định cá thể của quần thể vào một tập hợp mẫu.

Sức mạnh mẫu: Là mức độ suy diễn kết quả thống kê trên mẫu thành kết quả của quần thể.

I.2. Lý do chọn mẫu Nếu tất cả các cá thể của một quần thể đều giống nhau, chúng ta có một quần thể thuần nhất (homogenous). Khi đó, đặc tính của mỗi cá thể cũng chính là của quần thể. Không có sự khác nhau/ giao động tính chất giữa các cá thể. Tuy nhiên thực tế hiếm xảy ra điều này mà các cá thể trong một quần thể khác nhau, chúng là một quần thể hỗn tạp/ không thuần nhất (heterogeneous). Khi đó đặc tính của một cá thể bất kỳ không mang tính đại diện cho cả quần thể. Có sự khác nhau/ giao động giữa các cá thể.

Nếu muốn mô tả đặc tính quần thể, khi không thể quan sát được tất cả các cá thể, người ta phải chọn một số lượng cá thể ít hơn trong khả năng, đại diện “tốt” cho tất cả các cá thể của quần thể để quan sát.

Khách thể nghiên cứu cũng như đối tượng khảo sát của một đề tài khoa học thường có qui mô lớn, vượt xa khả năng tiến hành nghiên cứu trên từng cá thể. Vì vậy, cần có những phương pháp khoa học giúp người nghiên cứu có thể tiến hành khảo sát trên một mẫu nhỏ hơn nhiều so với qui mô của khách thể nghiên cứu hoặc đối tượng khảo sát nhưng vẫn có thể đưa ra những kết luận có tính khái quát cao và giá trị. Tóm lại lý do chính cho vấn đề này là thời gian và kinh phí thực hiện nghiên cứu có hạn nên cần chọn mẫu nghiên cứu.

THONG - 090

5474

478

Page 18: 3. Nội dung bài giảng

12

Hình 2. 1: Mô tả mục đích của việc chọn mẫu

I.3. Nguyên tắc chọn mẫu Quần thể có các cá thể giống nhau được gọi là quần thể thuần nhất (homogenous). Khi đó, đặc tính của mỗi cá thể cũng chính là của quần thể. Không có sự khác nhau/ giao động tính chất giữa các cá thể.

Khi các cá thể trong một quần thể khác nhau, chúng ta có một quần thể hỗn tạp/ không thuần nhất (heterogeneous). Khi đó đặc tính của một cá thể bất kỳ không mang tính đại diện cho cả quần thể. Có sự khác nhau/ giao động giữa các cá thể.

Nếu muốn mô tả đặc tính quần thể, khi không thể quan sát được tất cả các cá thể, người ta phải chọn một số lượng cá thể ít hơn trong khả năng, đại diện “tốt” cho tất cả các cá thể của quần thể để quan sát.

Mẫu của một quần thể phải suy ra được những thông tin hữu ích về quần thể đó. Do vậy, mẫu phải đảm bảo có được những biến thiên cơ bản giữa các cá thể như ở quần thể.

Một quần thể càng không đồng nhất thì sác xuất một mẫu khó có thể mô tả quần thể và sẽ là một sai lầm nếu suy đặc tính của mẫu thành đặc tính của quần thể. Do vậy số lượng cá thể của mẫu phải càng lớn để có thể mô tả quần thể tốt. Một mẫu phải có số lượng cá thể đủ lớn để có thể suy đặc tính của mẫu thành của quần thể.

Chọn mẫu là một quy trình lựa chọn cá thể từ quần thể cho quan sát, để có thể coi kết quả quan sát mẫu thành kết quả quan sát quần thể, ở một mức độ chấp nhận mà xác định được.

Mẫu là đại diện của một quần thể, mức độ đại diện phải được xác định/ đo lường được.

Có hai cách chọn mẫu:

· Chọn mẫu không ngẫu nhiên

· Chọn mẫu ngẫu nhiên

I.4. Cách thức chọn mẫu Có hai cách chọn mẫu đó là chọn mẫu không ngẫu nhiên (chọn mẫu không xác suất) và phương pháp chọn mẫu ngẫu nhiên (chọn mẫu có xác xuất).

THONG - 090

5474

478

Page 19: 3. Nội dung bài giảng

13 Phương pháp chọn mẫu không ngẫu nhiên (không xác suất) là cách lấy mẫu trong đó các cá thể của mẫu được chọn không ngẫu nhiên hay không có xác suất lựa chọn giống nhau. Điều này thể hiện trong cách chọn mẫu như sau: - Các đơn vị mẫu được tự lựa chọn mà không có phương pháp. - Các đơn vị mẫu rất dễ dàng đạt được hoặc dễ dàng tiếp cận. Ví dụ chọn những tàu bắt gặp tại cảng cá Hòn Rớ, Nha Trang. - Các đơn vị mẫu được chọn theo lý do kinh tế, thí dụ trả tiền cho sự tham dự. - Các đơn vị mẫu được quan tâm bởi người nghiên cứu trong cách “điển hình” của quần thể mục tiêu. Ví dụ người nghiên cứu chỉ quan tâm đến các nhân vật điển hình trong quần thể nghiên cứu, để so sánh với các nhân vật khác. - Các đơn vị mẫu được chọn mà không có sự thiết kế rõ ràng (Ví dụ: chọn 50 tàu cập cảng Hòn Rớ đầu tiên vào buổi sáng). Phương pháp chọn mẫu không ngẫu nhiên (không xác suất) thường có độ tin cậy thấp. Mức độ chính xác của cách chọn mẫu không ngẫu nhiên (không xác suất) tùy thuộc vào sự phán đoán, cách nhìn, kinh nghiệm của người nghiên cứu, sự may mắn hoặc dễ dàng và không có cơ sở thống kê trong việc chọn mẫu. Các phương pháp chọn mẫu không ngẫu nhiên (không xác suất) bao gồm: Thuận tiện, chủ đích, ném bóng tuyết, chỉ tiêu. Phương pháp chọn mẫu ngẫu nhiên (chọn mẫu xác suất) là cách lấy mẫu trong đó việc chọn các cá thể của mẫu sao cho mỗi cá thể có cơ hội lựa chọn như nhau, nếu như có một số cá thể có cơ hội xuất hiện nhiều hơn thì sự lựa chọn không phải là ngẫu nhiên. Để tối ưu hóa mức độ chính xác, người nghiên cứu thường sử dụng phương pháp lấy mẫu ngẫu nhiên. Các phương pháp chọn mẫu ngẫu nhiên (mẫu xác suất) bao gồm: Ngẫu nhiên đơn, phân tầng, hệ thống, theo cụm.

Hình 2. 2: Mô tả các cách chọn mẫu trong NCKH

THONG - 090

5474

478

Page 20: 3. Nội dung bài giảng

14 I.4.1. Phương pháp chọn mẫu ngẫu nhiên (probability sampling methods) I.4.1.1. Chọn mẫu ngẫu nhiên đơn giản (simple random sampling) Cách đơn giản nhất của việc chọn các cá thể của mẫu trong cách chọn mẫu ngẫu nhiên là sử dụng xác suất. Việc lựa chọn n các cá thể từ một quần thể sao cho các cá thể có cơ hội bằng nhau hay một xác suất bằng nhau trong phương pháp này. Ví dụ trong 500 tàu hoạt động nghề lưới rê xa bờ tỉnh Khánh Hòa, người nghiên cứu muốn chọn 50 tàu để nghiên cứu về hiệu quả khai thác. Cách làm đơn giản ghi số đăng ký của 500 tàu và 500 mẫu giấy nhỏ rồi cho tất cả vào thùng, người nghiên cứu rút bốc ngẫu nhiên 50 mẫu (tương ứng 50 tàu). Vậy xác suất bắt gặp mỗi mẫu là 10%. Ta có thể sử dụng Microsoft Excel để hỗ trợ việc này được nhanh hơn. Ví dụ ta có 1000 tàu, muốn chọn 100 tàu để phỏng vấn thì đánh tên chủ tàu hoặc số đăng ký của 1000 tàu, sau đó dùng hàm rand () cho cột bên cạnh với 5 số thập phân trở lên, sau đó dùng chức năng sort (có thể từ lớn đến nhỏ hoặc ngược lại). Sort xong chọn 100 tàu từ trên xuống. Để đảm bảo độ chính xác ta dùng chức năng Conditional Formatting để kiểm tra xem 100 tàu đó có trùng lặp hay không. Ta có thể viết Code từ Visual Basic cho Microsoft Excel để thực hiện công việc. Để thực hiện được việt này, người đọc tham khảo tại …..

Hình 2. 3: Mô tả chọn mẫu ngẫu nhiên đơn giản

Ưu điểm Hạn chế

· Không cần nhiều thông tin về quần thể

· Tính gía trị cao, xác định được sai số thống kê

· Dễ dàng phân tích dữ liệu

· Tốn kém

· Yêu cầu danh sách cá thể trong quần thể

· Không cần chuyên môn của nghiên cứu viên

· Nguy cơ sai số ngẫu nhiên I.4.1.2. Chọn mẫu hệ thống (systematic random sampling) Đôi khi cách chọn đơn vị mẫu ngẫu nhiên không tốt hơn cách chọn mẫu hệ thống. Trong chọn mẫu hệ thống, cỡ mẫu n được chọn (có phương pháp tính xác suất tương tự) từ một quần thể N. Cách lấy mẫu hệ thống là khung mẫu giống như là 1 “hàng” của các đơn vị mẫu, và mẫu như là một chuổi liên tiếp của các điểm số có khoảng cách bằng nhau theo hàng dọc.

THONG - 090

5474

478

Page 21: 3. Nội dung bài giảng

15 Ví dụ chọn mẫu hệ thống như sau: muốn nghiên cứu 1 thành viên trong mỗi nhóm có 10 cá thể, quần thể có 10 nhóm (tổng cá thể của quần thể là 100), đánh số cá thể từ 1-100. Lúc này nhóm 1 được đánh số từ 1-10; nhóm 2 từ 11-20; nhóm 3 từ 21-30; …nhóm 10 từ 91-100. Trước tiên cần sắp xếp thứ tự các đơn vị mẫu (Ví dụ theo thứ tự gia tăng trong trường hợp này). Sau đó chọn điểm đầu tiên bất kỳ có giá trị < 10 (Ví dụ chọn ngẫu nhiên một số trong khoảng từ 1-10 là 5. Số cá thể tiếp theo sẽ cộng thêm là 10. Như vậy các thành viên được chọn sẽ có số thứ tự là 5, 15, 25, 35, 45,… 95.

Hình 2. 4: Mô tả chọn mẫu hệ thống

Ưu điểm Hạn chế

· Chi phí hợp lý, hay được sử dụng

· Tính giá trị cao, xác định được sai số thống kế

· Các cá thể dễ tiếp cận

· Sai số chu kỳ do bản thân danh sách cá thể cũng có thể có tính chu kỳ

· Yêu cầu danh sách cá thể của quần thể

I.4.1.3. Chọn mẫu phân tầng (stratified random sampling) Chọn mẫu phân tầng: Chia quần thể theo một đặc tính cụ thể thành các nhóm/ tầng (strata) (Ví dụ: Chia quần thể sinh viên trường ĐHY Hà Nội thành 3 nhóm/ tầng: học viên tiến sĩ, học viên thạc sĩ và học viên đại học).

Các cá thể trong mỗi tầng đồng nhất, nhưng không đồng nhất giữa các tầng.

Có thể áp dụng chọn mẫu ngẫu nhiên đơn hay chọn mẫu hệ thống ở mỗi tầng (strata). Số mẫu mỗi tầng tham gia vào tổng mẫu có thể bằng nhau (chọn mẫu phân tầng không cân xứng) hay tỷ lệ với số cá thể của mỗi tầng (chọn mẫu phân tầng cân xứng).

Hình 2. 5: Mô tả chọn mẫu phân tầng

THONG - 090

5474

478

Page 22: 3. Nội dung bài giảng

16 Ưu điểm Hạn chế

· Đảm bảo mỗi nhóm đều có tính ñại diện trong tổng mẫu

· Mỗi nhóm đều được thống kê và so sánh

· Giảm sai số hệ thống

· Yêu cầu thông tin chính xác về tỷ lệ giữa các tầng

· Chi phí để có được danh sách mỗi tầng

I.4.1.4. Chọn mẫu theo cụm/ chùm (cluster sampling)

Cụm đây là cụm địa lý nơi các các thể sinh sống. Đầu tiên là chọn cụm, sau đó mới chọn cá thể trong cụm. Phương pháp hay được sử dụng khi không có danh sách cá thể của quần thể. Các loại chọn mẫu theo cụm/ chùm.

Chọn mẫu theo cụm 2 bước: Chọn cụm, sau đó chọn cá thể trong cụm.

Chọn mẫu theo cụm nhiều bước.

Hình 2. 6: Mô tả chọn mẫu theo cụm / chùm

Ưu điểm Hạn chế

· Chí phí thấp / hãy sử dụng

· Không yêu cầu danh sách cá thể của cả quần thể, chỉ yêu cầu danh sách cụm, tiểu cụm, tiểu tiểu… cụm và danh sách cá thể của đơn vị cụm cuối cùng

· Xác định được đặc điểm của cả cụm và quần thể

· Ưu tiên dùng khi quần thể quá lớn, ví dụ như cả một quốc gia

· Sai số lớn hơn so với các phương pháp ngẫu nhiên khác

I.4.2. Phương pháp chọn mẫu không ngẫu nhiên (non-probability sampling methods) I.4.2.1. Chọn mẫu thuận tiện (Convenience Sampling)

Cá thể được lựa chọn vào mẫu một cách “thuận tiện”, sẵn có và dễ tiếp cận.

Tại sao dùng: Nhanh và chi phí thấp

THONG - 090

5474

478

Page 23: 3. Nội dung bài giảng

17 Phải giải trình và đánh giá giá trị nếu chọn mẫu thuận tiện.

Ưu điểm Hạn chế

· Chi phí rất thấp

· Hay được sử dụng

· Không cần danh sách cá thể trong quần thể

· Độ biến thiên và sai số không đo lường và kiểm soát được

· Khó giải trình việc suy luận kết quả thống kê trên mẫu ra của quần thể

I.4.2.2. Chọn mẫu có chủ đích (Purposive Sampling)

Chọn cá thể có một số đặc tính mong muốn vào mẫu với chủ đích của nghiên cứu viên.

Ưu điểm Hạn chế

· Chi phí vừa phải

· Hay được sử dụng

· Mẫu lựa chọn đảm bảo được mục tiêu

· Sai số

· Khó giải trình việc suy luận kết quả thống kê trên mẫu ra của quần thể

I.4.2.3. Chọn mẫu theo chỉ tiêu (Quota samling)

Mẫu đảm bảo đặc tính của quần thể, đại diện ở một mức độ mà nghiên cứu viên mong muốn.

Ưu điểm Hạn chế

· Chi phí vừa phải

· Rất hay sử dụng

· Không yêu cầu danh sách cá thể trong quần thể

· Có phần nào tính chất của chọn mẫu phân tầng

· Không đo lường và giải trình được biến thiên và sai số

I.4.2.4. Chọn mẫu “Ném bóng tuyết“ (Snowball sampling)

Chọn mẫu bắt đầu từ một cá thể, được chọn một cách ngẫu nhiên hay không ngẫu nhiên. Các cá thể tiếp theo được chọn từ cá thể ban đầu hay trước đó, giống như trò chơi ném bóng tuyết, ai trúng thì được lựa chọn.

Ưu điểm Hạn chế

· Chi phí thấp

· Hữu ích trong một số trường hợp cụ thể

· Dùng để xác định những quần thể hiếm

· Sai số do cá thể lựa chọn không hoàn toàn độc lập

· Khó giải trình việc suy diễn kết quả thống kê trên mẫu ra của quần thể.

THONG - 090

5474

478

Page 24: 3. Nội dung bài giảng

18 I.5. Ước lượng cỡ mẫu và phân bố mẫu I.5.1. Ước lượng cỡ mẫu I.5.1.1. Những vấn đề quan tâm khi ước lượng cỡ mẫu

Khi tính toán cỡ mẫu cần quan tâm một số yếu tố như: Loại nghiên cứu, các thuật toán thống kê sử dụng, đặc tính của cá thể, thể hiện qua biến số (khác biệt cơ bản giữa biến liên tục – biến phân hạng). Kết quả các nghiên cứu trước được đưa vào làm cơ sở tính toán. Bên cạnh đó cũng cần quan tâm đến độ tin cậy (99%, 95%, 90%), giá trị p chấp nhận kết quả kiểm định (0,05/ 0,001). Một vài yếu tố cũng cần quan tâm khi tính đến cỡ mẫu đó là mức độ biến thiên của kết quả mẫu so với kết quả thực của quần thể (độ chính xác tương đối), sức mạnh của mẫu nói lên mức độ kết quả mẫu đại diện cho kết quả của quần thể.

I.5.1.2. Xác định cỡ mẫu

a) Xác định cỡ mẫu cho ước lượng trung bình của quần thể

Giả sử ta muốn ước lượng trung bình của quần thể (X) với một khoảng tin cậy nào đó. Một trong những câu hỏi đầu tiên là mẫu nên lớn cỡ nào? Câu hỏi này phải được xem xét nghiêm túc, vì sẽ là một sự lãng phí thời gian và nguồn lực để lấy một mẫu lớn hơn mức cần có để đạt được kết quả mong muốn. Tương tự, một mẫu quá nhỏ có thể dẫn đến kết quả không có giá trị thực tế. Các câu hỏi then chốt là:

Thứ nhất, chúng ta muốn ước lượng của chúng ta gần với giá trị thật sự ở mức nào? Nói cách khác, chúng ta muốn làm cho khoảng tin cậy mà chúng ta muốn xây dựng rộng cỡ nào?

Thứ hai, chúng ta muốn đặt sự tin cậy bao nhiêu cho khoảng tin cậy của chúng ta? Nghĩa là, hệ số tin cậy chúng ta muốn sử dụng là bao nhiêu?

Ta có công thức ước lượng cỡ mẫu cho trường hợp này như sau:

� = �∝��∗ ���� (2. 1)

s: độ lệch chuẩn (Standard Deviation)

d: độ chính xác tuyệt đối mong muốn (confident limit around the point estimate).

Ví dụ: Công suất tàu lưới rê xa bờ Khánh Hòa là 245 CV, độ chính xác mong muốn ±10 CV. Nên khoảng dao động 235 – 255 CV.

Zα/2: Z tương ứng với mức ý nghĩa thống kê mong muốn, thường lấy 95%, ta được Zα/2 = 1,96. Giá trị Zα/2 được tra theo bảng sau:

Bảng 2. 1: Bảng tra giá trị Zα và Zα/2 theo a

α Zα Zα/2 0,20 0,84 1,26

0,10 1,28 1,64

0,05 1,64 1,96

0,01 2,33 2,81

THONG - 090

5474

478

Page 25: 3. Nội dung bài giảng

19 Ví dụ: Giả sử chúng ta muốn ước lượng chiều dài trung bình tàu lưới vây xa bờ tỉnh Khánh Hòa (ký hiệu là Lv) trong một quần thể, chúng ta muốn sai số của ước lượng nhỏ hơn 2 cm với xác suất 0,95 (a=0,05). Vậy số lượng mẫu cần điều tra đáp ứng yêu cầu trên là bao nhiêu?

Giải: Ta có a = 0,05, tra Bảng 2. 1, áp dụng công thức (2.1) nên � = ��,��∗ �� ��. Giá trị s chưa xác định được ta dựa vào các nghiên cứu trước đó. Chẳng hạn những nghiên cứu

trước đó chỉ ra độ lệch chuẩn s = 10 cm thì � = ��,��∗ ��� �� ≈ 96 mẫu.

b) Xác định cỡ mẫu cho ước lượng các tỷ lệ

F Chưa xác định được kích cỡ quần thể

Khi phải ước lượng một tỷ lệ p của quần thể, cỡ mẫu được xác định về cơ bản giống như xác định cho ước lượng trung bình quần thể. Lúc này cỡ mẫu được xác định theo công thức:

� = �∝��∗�∗(���)�� (2. 2)

p: Tỷ lệ ước tính (đơn giản ta lấy p=50%)

F Nếu kích cỡ quần thể dưới 10.000, cỡ mẫu cho xác định một tỷ lệ lúc này như sau:

nh = n / (1 + (n/N)) (2. 3)

Trong đó N kích cỡ quần thể đã xác định.

Ví dụ: Nghiên cứu tỷ lệ chủ tàu hài lòng với dịch vụ hậu cần nghề cá tại cảng A nào đó, độ chính xác mong muốn 5%, độ tin cậy 95%. Kết quả mong đợi chưa biết, coi như 50% chủ tàu hài lòng với dịch vụ hậu cần nghề cá tại cảng A nào đó. � = 1,96� ∗ 0,5 ∗ 0,50,05� = 384 c) Xác định cỡ mẫu để ước lượng hệ số tương quan

Trong các nghiên cứu quan sát có liên quan đến ước lượng một tương quan (ρ) giữa hai biến quan tâm, kí hiệu là X và Y, một giả thuyết tiêu biểu có dạng:

H0: ρ = 0

So với H1: ρ ≠ 0

Tức là, chúng ta đang quan tâm kiểm nghiệm một giả thuyết cho rằng không có quan hệ giữa hai biến chống lại có một quan hệ chưa định rõ, nhưng có ý nghĩa. Cỡ mẫu xác định theo công thức � = � (�∝�� ��)���� (������)�� + � (2. 4)

Mỗi trường hợp gắn liền với một hằng số za/2 và zb. Hai hằng số này có thể tóm gọn bằng công thức C = (za/2 + zb)2.

THONG - 090

5474

478

Page 26: 3. Nội dung bài giảng

20

Vậy công thức (2.4) trở thành � = � ���� (������)�� + � (2. 5)

Bảng 2. 2: Tra hệ số C theo α và b

α b = 0,2 b = 0,10 b = 0,05 0,10 6,15 8,53 10,79

0,05 7,85 10,51 13,00

0,01 13,33 16,74 19,84 Bảng 2. 3: Bảng tra hệ số b và zb theo hiệu năng (độ mạnh)

Độ mạnh (%) Hệ số b Hệ số zb 80% = 0,80 0,20 0,842

89% = 0,85 0,15 1,036

90% = 0,90 0,10 1,282

95% = 0,95 0,05 1,645

Ví dụ, cỡ mẫu cần để phát hiện một hệ số tương quan bằng 0,5 (ρ = 0,5) ở mức ý nghĩa 5% (α = 0,05) và hiệu năng (độ mạnh) 80% (β = 0,2) là: � = � ∗ ���� (������)�� + 3 = � (�,��)���� (���,����,�)�� + 3 ≈ 29

d) Xác định cỡ mẫu so sánh hai giá trị trung bình

Để xác định cỡ mẫu nhằm so sánh giá trị trung bình của 2 nhóm đối tượng, ta sử dụng công thức sau:

�� = ��������� �∗�∆� (2. 6) �� = ��∗��������∗�∆� (2. 7)

Trong đó:

n1: Cỡ mẫu nhóm 1

n2 : Cỡ mẫu nhóm 2

s1: Độ lệch chuẩn nhóm 1

s2: Độ lệch chuẩn nhóm 2

D: Chênh lệch trị số trung bình nhóm 1 và nhóm 2

k: Tỷ lệ n2/n1

THONG - 090

5474

478

Page 27: 3. Nội dung bài giảng

21 Trường hợp n1=n2 nghĩa là k=1 và s1 = s2 = s, khi đó công thức (2.6) và (2.7) trở thành công thức (2.8). � = �� = �� = ��∗ �∆� (2. 8)

Ví dụ: Một nghiên cứu được thiết kế để đánh giá hiệu quả của nguồn sáng trên tàu lưới vây ánh sáng. Nhóm 1 là các tàu trang bị ánh sáng Led, nhóm 2 các tàu trang bị ánh sáng cao áp và huỳnh quang. Tiêu chí đánh giá là sản lượng khai thác trung bình trên mẻ lưới (kg). Số liệu các nghiên cứu trước cho thấy, sản lượng khai thác trung bình trên mẻ lưới (kg) của tàu nhóm 2 là 800 kg/mẻ, độ lệch chuẩn là 100 kg/mẻ. Vậy chúng ta cần phải nghiên cứu bao nhiêu đối tượng để khẳng định được sản lượng khai thác trung bình nhóm 1 tăng 5% so với nhóm 2.

Giải: Gọi m2 là giá trị trung bình nhóm 2 (m2 =800)

Gọi m1 là giá trị trung bình nhóm 1 (m1 = m2 + 5% * m2 = 840)

Ta có D = m1 - m2 =40

Độ lệch chuẩn s =100

Với a =0,05 ta có Zα/2 = 1,96

Với β = 0,2, ta có Zb = 0,84

Dùng công thức (2.8) ta có � = �� = �� = ��∗ �∆� = ����∗ �,����� ≈ 50

Kết quả trên cho biết chúng ta cần 50 tàu mỗi nhóm (hay 100 tàu cho cả công trình nghiên cứu). Trong trường hợp này, độ mạnh là 0,80 (β = 0,2) và α= 0,05 có nghĩa là nếu chúng ta tiến hành thật nhiều nghiên cứu (ví dụ 1.000) và mỗi nghiên cứu với 100 tàu, sẽ có 80% (hay 800) nghiên cứu sẽ cho ra kết quả trên với trị số p < 0,05.

e) Xác định cỡ mẫu so sánh hai tỷ lệ Mục tiêu nghiên cứu là so sánh hai tỷ lệ. Để so sánh hai tỷ lệ, phương pháp kiểm định thông dụng nhất là kiểm định nhị phân (binomial test) hay Chi bình phương (χ2 test). �� = � ∗ �� ∗ �� (���) � ∗ (�����)� , (2. 9) n2 = k * n1 (2. 10)

Trong đó: n1: Cỡ mẫu nhóm 1; n2: Cỡ mẫu nhóm 2; k: Tỷ lệ n2/n1

p1: Tỷ lệ ước tính nhóm 1, q1 = 1 – p1

p2: Tỷ lệ ước tính nhóm 2, q2 = 1 – p2

�̅ = ���� ����� , �� = 1 − �̅

Trong trường hợp k=1 nghĩa là cỡ mẫu nhóm 1 và nhóm 2 như nhau, đặt Δ = p1 – p2, công thức (2.9) và (2.10) trở thành � = �� = �� = � ∗ � �∗ �� ∗� ∆� (2. 11)

THONG - 090

5474

478

Page 28: 3. Nội dung bài giảng

22 Ví dụ: Một dự án tiến hành nghiên cứu khảo sát ban đầu trên cộng đồng ngư dân ven biển về hiểu biết văn bản pháp luật liên quan đến khai thác và bảo vệ nguồn lợi thủy sản. Ước tính tỷ lệ ngư dân hiểu biết đúng, đủ văn bản pháp luật liên quan đến KT&BV NLTS tại khảo sát ban đầu là 40%. Các tỷ lệ ban đầu của các chỉ số tác động là không được biết trước khi khảo sát và được giả định 0,5. Dự án mong muốn tỷ lệ ngư dân hiểu biết đúng và đủ văn bản pháp luật liên quan đến KT&BV NLTS tại khảo sát cuối kỳ tăng lên 70% (tăng 30%). Vậy cỡ mẫu cần thiết là bao nhiêu? Với a =0,05, β = 0,2; giả thiết k = 1.

Giải: Ta có p1 = 40%; p2 = 70%; �̅ = 55%; �� = 45%; Δ = 30%

Với a =0,05 ta có Zα/2 = 1,96

Với β = 0,20, ta có Zb = 0,84

Thay tất cả các số liệu trên vào công thức (2.11) ta được n=43.

Vậy công trình nguyên cứu này cần điều tra ít nhất 86 mẫu (43 * 2).

f) Xác định cỡ mẫu cho nghiên cứu liên quan đến hồi quy

Trường hợp nghiên cứu có nhiều biến liên tục. Với những nghiên cứu có một biến phụ thuộc (dependent variable) và nhiều biến độc lập (independent variables), mục tiêu thường là xác định các biến độc lập có thể “giải thích” bao nhiêu phần trăm phương sai của biến phụ thuộc. Phương pháp phân tích chính là mô hình hồi qui tuyến tính đa biến (multiple linear regression). Trong mô hình này, chỉ số phản ảnh mối liên hệ đa chiều này là hệ số xác định bội (coefficient of determination), ký hiệu R2.

Phương pháp ước lượng cỡ mẫu cho hệ số R2 tương đối phức tạp, và thường phải sử dụng đến thuật mô phỏng (simulation). Tuy nhiên, một số quy ước khá tin cậy có thể áp dụng như sau:

• Với độ mạnh = 0,80 (hệ số b=0,2) và α= 0,05, nghiên cứu cần tối thiểu 50 đối tượng để ước tính R2 ≥ 0,23; hay tối thiểu 100 để ước tính R2 ≥ 0,12.

• Với m biến độc lập và 1 biến phụ thuộc, số lượng cỡ mẫu cần thiết tối thiểu là n > 104 + m.

• Với m ≤ 5 và 1 biến phụ thuộc, số lượng cỡ mẫu cần thiết tối thiểu là n > 50 + m.

Ví dụ: Trong nghề lưới kéo, muốn nghiên cứu xây dựng mô hình hồi quy tuyến tính đa biến giữa sản lượng khai thác (Y (kg/mẻ)– biến phụ thuộc) với diện tích miệng lưới (S m2 – biến độc lập), tốc độ dắt lưới (V (hải lý/ giờ) – biến độc lập), thời gian kéo lưới (t (giờ) – biến độc lập. Vậy số lượng mẫu tối thiểu cần cho nghiên cứu này là n = 53 mẫu.

g) Xác định cỡ mẫu cho nghiên cứu ‘trước – sau’

Nhiều nghiên cứu can thiệp trên một nhóm đối tượng, rồi tiến hành đo lường hai lần: trước khi can thiệp và sau khi can thiệp. Người ta thường gọi là nghiên cứu trước - sau (before-after study). Chẳng hạn để đánh giá hiệu quả sử dụng máy dò ngang trong khai thác, các nhà nghiên cứu chọn một nhóm tàu thích hợp, sau đó xác định sản lượng khai thác trước và sau khi sử dụng máy dò ngang. Hệ số ảnh hưởng có thể tính từ khác biệt giữa hai thời điểm, nhưng ở đây còn một thông số liên quan khác: đó là hệ số tương quan giữa hai lần đo lường.

THONG - 090

5474

478

Page 29: 3. Nội dung bài giảng

23 Gọi đo lường trước khi sử dụng máy dò ngang của tàu i là Xi và sau khi sử dụng máy dò ngang là Yi. Ảnh hưởng của việc sử dụng máy dò ngang có thể ước tính cho mỗi tàu thứ i là Δi= Yi - Xi. Từ đó, chúng ta có thể tính độ ảnh hưởng trung bình và độ lệch chuẩn của Δi. Trong thực tế, chúng ta không biết Δi, cho nên phải dựa vào một mẫu. Nếu gọi ước số mẫu của Δi là di, chúng ta có thể ước tính độ ảnh hưởng trung bình và độ lệch chuẩn của di. Gọi chỉ số trung bình đó là �̅ và độ lệch chuẩn là s. Hệ số ảnh hưởng có thể ước tính bằng công thức: �� = ��� (2. 12)

Ngoài ra, gọi r là hệ số tương quan giữa hai đo lường. Với các thông số này, số lượng cỡ mẫu cần thiết cho nghiên cứu là: � = �� (���)(��)� (2. 13)

Ví dụ: Sử dụng máy dò ngang có khả năng tăng sản lượng khai thác của nghề lưới vây. Độ lệch chuẩn của sản lượng khai thác nghề lưới vây là 150 kg/mẻ. Một nghiên cứu mới sẽ tiến hành trong một quần thể tàu lưới vây tại Khánh Hòa. Các nhà nghiên cứu muốn biết cần xác định bao nhiêu tàu để chứng minh rằng máy dò ngang giúp tăng từ 800 kg/mẻ lên 850 kg/mẻ (tăng 50 kg/mẻ) sau thời gian sử dụng là 3 tháng, với sai số α = 0,05 và b = 0,2.

Giải: Ta có �� = ��� = ����� = 0,333 Vì là nghiên cứu trước – sau, chúng ta cần một thông tin khác nữa: đó là hệ số tương quan giữa hai lần đo lường sản lượng khai thác. Chúng ta không biết hệ số này, nhưng có thể giả định nó dao động khoảng 0,6 đến 0,8. Với hệ số tương quan 0,6 và sử dụng công thức (2.13), chúng ta có thể ước tính số cỡ mẫu như sau:

� = 2� (1 − �)(��)� = 2 ∗ 7,85 ∗ (1 − 0,6)(0,333)� ≈ 57

Nhưng nếu hệ số tương quan là 0,8 thì số cỡ mẫu trở thành là 28 mẫu. � = 2� (1 − �)(��)� = 2 ∗ 7,85 ∗ (1 − 0,8)(0,333)� ≈ 28

Nói cách khác, khi hệ số tương quan càng cao (tức độ tin cậy của đo lường cao), số lượng cỡ mẫu càng thấp.

h) Xác định cỡ mẫu cho nghiên cứu kiểm định độ ảnh hưởng tương đương (equivalence studies)

Trong nhiều nghiên cứu, chúng ta muốn đánh giá xem hai cách can thiệp hay điều chỉnh có hiệu quả như nhau không? Gọi chỉ số trung bình của nhóm 1 và 2 là μ1 và μ2. Nếu |μ1 – μ2| < d (trong đó d là độ khác biệt nhưng không nhiều, có thể bỏ qua), thì chúng ta tuyên bố rằng hai cách can thiệp hay điểu chỉnh có ảnh hưởng tương đương. Trong trường này, hệ số ảnh hưởng sẽ là được ký hiệu là H.

THONG - 090

5474

478

Page 30: 3. Nội dung bài giảng

24 � = |��� ��|� � � (2. 14)

Và số lượng mẫu cần thiết cho mỗi nhóm là: � = ���� (2. 15)

Ví dụ: Một nghiên cứu được thiết kế để “chứng minh” rằng hiệu quả của việc điều chỉnh độ cao chiếu sáng và điều chỉnh góc chiếu sáng trong nghề lưới vây ánh sáng là như nhau. Các nhà nghiên cứu chọn sản lượng khai thác kg/mẻ làm tiêu chí đánh giá. Nghiên cứu gồm 2 nhóm tàu lưới vây ánh sáng được phân chia ngẫu nhiên: nhóm 1 được điều chỉnh độ cao chiếu sáng (A) và nhóm 2 được điều chỉnh góc chiếu sáng (B). Các nghiên cứu trước cho thấy sau 50 mẻ lưới cho kết quả, A có thể tăng sản lượng khai thác lên khoảng 7%, và B có tác dụng tăng sản lượng khai thác lên khoảng 4%. Theo các nghiên cứu đó, độ lệch chuẩn của tăng sản lượng khai thác là 30%. Các nhà nghiên cứu quyết định rằng nếu độ khác biệt về sản lượng khai thác giữa hai nhóm trong vòng 20 kg/mẻ thì sẽ xem là hai sản lượng như nhau. Vấn đề đặt ra là cần bao nhiêu đối tượng cho nghiên cứu với α= 0,05 và b = 0,2?

Giải: Ta có � = |��� ��|� � � = |�� �|� �� �� = −0,567 Với α= 0,05 và b = 0,2, tra Bảng 2. 2 ta có C = 7,85 � = ���� = �∗�,��(��,���)� = 49

Vậy công trình nghiên cứu cần chọn 98 tàu để nghiên cứu sẽ đạt được yêu cầu và mục tiêu đề ra.

i) Xác định cỡ mẫu chứng minh hai tỷ lệ tương đương nhau

Với các nghiên cứu thể loại này, giả thiết đặt ra là nếu độ khác biệt giữa p1 và p2 thấp hơn d thì có thể chấp nhận rằng π1 và π2 tương đương nhau; nếu |p1 – p2| > d, thì hai tỷ lệ không tương đương nhau. Để kiểm định giả thiết tương đương này, số lượng cỡ mẫu cần thiết cho mỗi nhóm là: � = ��[��(����)���(����) ](|�����|� �)� (2. 16)

Ví dụ: Một nghiên cứu nhằm chứng minh mắt lưới A và B lắp ở đụt lưới kéo có hiệu quả như nhau. Tiêu chí đánh giá hiệu quả mắt lưới A và B là tỷ lệ cá con thoát ra ngoài. Số liệu từ các nghiên cứu trước đây cho thấy tỷ lệ cá con thoát ra với mắt lưới A là khoảng 2% và B là khoảng 3%. Các nhà nghiên cứu cho rằng nếu hai tỷ lệ khác nhau trong vòng 0,5% thì có thể xem là tương đương. Vậy cần bao nhiêu đối tượng cho nghiên cứu để đạt mục tiêu đề ra với α= 0,05 và b = 0,2.

Giải:

Từ giả thiết trên ta có: p1 = 0,02, p2 = 0,03 và d = 0,005 (tức 0,5%)

Áp dụng công thức (2.16) ta có: � = � ∗ �,�� ∗ [�,�� ∗ (���,��)��,�� ∗ (���,��) ](|�,����,��|� �,���)� = 15.291

THONG - 090

5474

478

Page 31: 3. Nội dung bài giảng

25 Do đó, công trình này cần tuyển 30.582 đối tượng để đạt yêu cầu của nghiên cứu. Như có thể thấy được trong công thức trên, yếu tố quan trọng trong cách ước lượng cỡ mẫu cho nghiên cứu loại này là độ khác biệt d để xem là hiệu quả hai loại mắt lưới có tương đương nhau không. Số cỡ mẫu trên dựa vào tiêu chuẩn khác biệt 0,5% để kết luận “tương đương”. Nhưng nếu tiêu chuẩn “dễ dãi” hơn một chút (như 1%) thì số lượng cỡ mẫu giảm xuống cho mỗi nhóm giảm xuống còn 7.646 đối tượng.

j) Xác định cỡ mẫu cho các nghiên cứu ước tính tỷ số nguy cơ (odds ratio)

Trong các nghiên cứu đối chứng (case-control study), nhà nghiên cứu thường muốn tìm hiểu mối liên hệ giữa một yếu tố nguy cơ (risk factor) và hành vi / hiện tượng cụ thể. Mối liên hệ này thường được “đo lường” bằng odds ratio (OR), tạm gọi là “tỷ số nguy cơ”. Chẳng hạn như nếu tỷ số nguy cơ giữa không nắm quy định kích thước mắt lưới ở đụt lưới kéo với việc sử dụng kích thước mắt lưới nhỏ hơn quy định là 2, thì điều này có nghĩa là những người không nắm quy định kích thước mắt lưới ở đụt lưới kéo có nguy cơ sử dụng kích thước mắt lưới nhỏ hơn quy định tăng khoảng 2 lần so với những người có hiểu biết.

Do đó, ước lượng cỡ mẫu để thử nghiệm một giả thiết về mối liên hệ giữa một yếu tố nguy cơ và hành vi / hiện tượng cụ thể thường dựa vào tỷ số nguy cơ. Để ước ước lượng cỡ mẫu cho các nghiên cứu như thế, nhà nghiên cứu cần phải có 3 số liệu:

• Tỷ lệ lưu hành (prevalence) của yếu tố nguy cơ trong một quần thể (gọi tắt là p);

• Tỷ số nguy cơ mà nhà nghiên cứu muốn biết;

• Các sai số thống kê thể hiện qua xác suất a và b.

Với các số liệu trên, công thức sau đây sẽ cung cấp cho nhà nghiên cứu một ước tính

số lượng đối tượng cần thiết cho nghiên cứu: � = (���)�∗��∗ (����)�∗�∗(���) (2. 17)

k là tỷ số cỡ mẫu giữa hai nhóm. Khi k=1 nghĩa là cỡ mẫu hai nhóm là như nhau, lúc đó công thức (2.17) trở thành (2.18). � = ��(����)�∗�∗(���) (2. 18)

Ví dụ: Nhà nghiên cứu muốn tìm hiểu mối liên hệ không biết quy định kích thước mắt lưới của nghề lưới kéo và sử dụng kích thước mắt lưới nhỏ hơn quy định. Hai nhóm đối tượng được chọn: Nhóm 1 là những chủ tàu vi phạm và nhóm 2 là những chủ tàu không vi phạm, hai nhóm đối tượng cùng độ tuổi, giới tính. Sau khi có hai nhóm đối tượng, các nhà nghiên cứu sẽ phỏng vấn xem trong hai nhóm, có bao nhiêu chủ tàu vi phạm. Các nhà nghiên cứu giả thiết rằng tỷ số nguy cơ vi phạm ở những chủ tàu không biêt quy định là 2. Nếu các nhà nghiên cứu muốn thử nghiệm giả thiết này với α= 0,05, b = 0,2, giả sử p=25%. Vậy cần bao nhiêu chủ tàu cho nghiên cứu này.

THONG - 090

5474

478

Page 32: 3. Nội dung bài giảng

26 Giải: � = 4�(ln��)� ∗ � ∗ (1 − �) = 4 ∗ 7,85(ln 2)� ∗ 0,25 ∗ (1 − 0,25) = 349

Vậy công trình nghiên cứu cần phải tuyển ít nhất là 350 chủ tàu (175 vi phạm và 175 đối chứng) để kiểm định giả thiết trên.

I.5.1.3. Công cụ hỗ trợ việc ước lượng cỡ mẫu

Ước lượng cỡ mẫu online 1. http://www.surveysystem.com/sscalc.htm 2. http://www.raosoft.com/samplesize.html 3. http://www.nss.gov.au/nss/home.nsf/pages/Sample+size+calculator 4. http://www.calculator.net/sample-size-calculator.html 5. https://www.surveymonkey.com/mp/sample-size-calculator/ 6. https://fluidsurveys.com/survey-sample-size-calculator/

Phần mềm ước lượng cỡ mẫu tại các web link 1. http://www.ncss.com/software/pass/?gclid=Cj0KEQiAyvqyBRChq_iG38PgvLgBEi

QAJbasd8InJvBLBx5BZyQMMpsjhtA0Kts80z14lVgleoVi70QaAsV68P8HAQ 2. http://www.who.int/chp/steps/resources/sampling/en/

Các phần mềm khác có hỗ trợ tính toán như sau: 1. OpenEpi 2. PS – Power and Sample Size CalculationEpiCalc 2000 3. PASS – Power Analysis and Sample Size 11 (commercial software) 4. Stata (commercial software)

I.5.2. Phân bố mẫu Phân bố mẫu phải tỷ lệ thuận với quy mô tổng thể [8]. Công thức xác định cỡ mẫu của từng địa bàn nghiên cứu (ni) như sau:

fNnNNn i

ii ** == (2. 19)

Trong đó N là tổng thể mẫu, Ni tổng thể mẫu tại địa bàn i, n tổng số mẫu cần nghiên cứu, ni tổng số mẫu cần nghiên cứu ở địa bàn i, i là số địa bàn, f là tỷ lệ mẫu f=n/N, (N=N1 + N2 +…+ Ni; n=n1 + n +…+ ni).

II. Phương pháp thu thập số liệu Thu thập số liệu là một việc rất quan trọng trong nghiên cứu khoa. Mục đích của thu thập số liệu là để làm cơ sơ lý luận khoa học hay luận cứ chứng minh giả thuyết hay các vấn đề mà nghiên cứu đã đặt ra.

Có 3 phương pháp chính thu thập số liệu: - Thu thập số liệu từ tài liệu tham khảo.

THONG - 090

5474

478

Page 33: 3. Nội dung bài giảng

27 - Thu thập số liệu từ những thực nghiệm (thu mẫu, đo đạc thực tế, đánh bắt thử nghiệm…). - Thu thập số liệu phi thực nghiệm (lập bảng câu hỏi điều tra, phỏng vấn, thảo luận nhóm…). Một số phương pháp khác sử dụng thu thập số liệu như: Phương pháp sử dụng nhật ký ghi chép; Thu thập mẫu từ cuộc nói chuyện ở những nơi công cộng; Thu thập mẫu phỏng vấn qua tường thuật.

Yếu tố quyết định phương pháp thu thập số liệu: - Mục tiêu nghiên cứu, các biến số: quyết định các chỉ số cần thu thập. - Đối tượng nghiên cứu. - Loại nghiên cứu (định tính, định lượng, phối hợp, mô tả, phân tích…). - Nguồn thông tin thu thập: Sẵn có hay phải điều tra. II.1. Phương pháp thu thập số liệu từ tài liệu tham khảo

Phương pháp này dựa trên nguồn thông tin thu thập được từ những tài liệu tham khảo có sẵn (đề tài, luận văn, luận án, bài báo khoa học, dự án, báo cáo các cơ quan ban ngành, sổ sách thống kê…) để xây dựng cơ sở luận cứ nhằm chứng minh giả thuyết. II.2. Phương pháp thu thập số liệu từ thực nghiệm II.2.1. Khái niệm

Trong phương pháp này, số liệu được thu thập bằng cách quan sát, theo dõi, đo đạc từ các hoạt động thực tế. Để thu thập số liệu, các nhà nghiên cứu thường đặt ra các biến để quan sát và đo đạc (thu thập số liệu). Phương pháp khoa học trong thực nghiệm gồm các bước như: lập giả thuyết, xác định biến, tiến hành thực nghiệm, thu thập số liệu để kiểm chứng giả thuyết. II.2.2. Định nghĩa các loại biến trong thực nghiệm

Trong nghiên cứu thực nghiệm, có 2 loại biến thường gặp, đó là biến độc lập (independent variable) và biến phụ thuộc (dependent variable). - Biến độc lập: là các yếu tố, điều kiện khi bị thay đổi trên đối tượng nghiên cứu sẽ ảnh hưởng đến kết quả thí nghiệm. Trong biến độc lập, thường có một mức độ đối chứng (chứa các yếu tố, điều kiện ở mức độ thông thường) hoặc các yếu tố đã được xác định mà người nghiên cứu không cần tiên đoán ảnh hưởng của chúng. Các yếu tố còn lại sẽ được so sánh với yếu tố đối chứng hoặc so sánh giữa các cặp yếu tố với nhau. - Biến phụ thuộc: là những yếu tố bị ảnh hưởng trong suốt quá trình nghiên cứu, hay có thể nói kết quả có được của các biến này phụ thuộc vào sự thay đổi của biến độc lập. Ví dụ: Trong nghiên cứu “mối liên quan sản lượng khai thác với các yếu tố như công suất phát sáng, loại ánh sáng, thời gian phát sáng, góc chiếu sáng, độ cao chiếu sáng”. Thì biến độc lập là công suất phát sáng, loại ánh sáng, thời gian phát sáng, góc chiếu sáng, độ cao chiếu sáng. Biến phụ thuộc là sản lượng khai thác.

THONG - 090

5474

478

Page 34: 3. Nội dung bài giảng

28 Kết quả quan sát phụ thuộc vào nguyên nhân gây ảnh hưởng. Dựa vào mối quan hệ trong giả thuyết đặt ra, người nghiên cứu dễ dàng xác định được yếu tố nào ảnh hưởng đến sự kiện quan sát. II.2.3. Kỹ thuật thu thập số liệu nghiên cứu

Cần xác định và thực hiện các bước: a. Đối tượng khảo sát Để chọn đối tượng khảo sát trong thí nghiệm, công việc đầu tiên là phải xác định quần thể (population) mà người nghiên cứu muốn đo đạc để thu thập kết quả. Một quần thể bao gồm nhiều cá thể mang các thành phần và đặc điểm khác nhau mà ta muốn khảo sát. Đối tượng khảo sát thường được chia làm hai nhóm: - Nhóm khảo sát: đối tượng được đặt ra trong giả thuyết. - Nhóm đối chứng: so sánh với nhóm khảo sát.

b. Khung mẫu (sample frame) Để bố trí và thu thập số liệu thí nghiệm nghiên cứu thì công việc trước tiên là thiết lập khung mẫu. Khung mẫu cần xác định các cá thể trong quần thể mục tiêu (target population), cỡ mẫu và phương pháp lấy mẫu.

c. Phương pháp lấy mẫu Mục đích của tất cả các phương pháp lấy mẫu là đạt được mẫu đại diện cho cả quần thể nghiên cứu. Khi chọn phương pháp lấy mẫu thì cần hiểu rõ các đặc tính của quần thể nghiên cứu để xác định cỡ mẫu quan sát đại diện và để đánh giá tương đối chính xác quần thể. Trong nghiên cứu, không thể quan sát hết toàn bộ các cá thể trong quần thể, mà chỉ chọn một số lượng đủ các cá thể đại diện hay còn gọi là mẫu thí nghiệm. Phương pháp chọn mẫu thí nghiệm rất quan trọng, bởi vì có liên quan tới sự biến động hay độ đồng đều của mẫu. Có hai phương pháp chọn mẫu: (1) Chọn mẫu không xác suất (không chú ý tới độ đồng đều) và (2) chọn mẫu xác suất (đề cập tới độ đồng đều).

d. Xác định cỡ mẫu Mục đích của việc xác định cỡ mẫu là để giảm đi công lao động và chi phí làm thí nghiệm và điều quan trọng là chọn cỡ mẫu như thế nào mà không làm mất đi các đặc tính của mẫu và độ tin cậy của số liệu đại diện cho quần thể. Có thể dùng công thức ước lượng cỡ mẫu tùy vào phương pháp nghiên cứu. II.3. Phương pháp phi thực nghiệm II.3.1. Khái niệm

Phương pháp phi thực nghiệm là phương pháp thu thập số liệu dựa trên sự quan sát các sự kiện, sự vật đã hay đang tồn tại, từ đó tìm ra qui luật của chúng. Phương pháp này gồm các loại nghiên cứu kinh tế và xã hội, nghiên cứu nhân chủng học, … Loại số liệu thu thập trong phương pháp phi thực nghiệm gồm số liệu được thu thập từ các câu hỏi mở, các câu hỏi kín (đóng) hoặc các câu hỏi mở cuối theo các phương pháp thu thập số liệu.

THONG - 090

5474

478

Page 35: 3. Nội dung bài giảng

29 + Câu hỏi mở: là dạng câu hỏi có số liệu thu thập không có cấu trúc hay số liệu khó được mã hóa. Câu hỏi cho phép câu trả lời mở và có các diễn tả, suy nghĩ khác nhau hơn là ép hoặc định hướng cho người trả lời. Ví dụ: Theo anh / chị, nguyên nhân làm giảm sản lượng khai thác trong 5 năm trở lại đây? ………………………………………………………………………………………….. + Câu hỏi kín (đóng): là dạng câu hỏi có số liệu thu thập có thể tương đối dễ dàng phân tích, mã hóa nhưng nó giới hạn sự trả lời. Ví dụ: Anh (chị) có biết các qui định của Nhà nước về quản lý và khai thác hải sản nguồn lợi hải sản không?

0. Không quan tâm £ 1. Không biết £ 2. Biết sơ sơ £ 3. Biết rất rõ £

+ Câu hỏi mở cuối: là dạng kết hợp 2 loại trên.

Ví dụ: Kế hoạch tăng hiệu quả khai thác của anh/ chị là gì?

1. Giảm chi phí sản xuất £; 2. Tăng sản lượng khai thác £; 3. Tăng chất lượng sản phẩm £; 4. Khác.....................................

II.3.2. Kỹ thuật thu thập số liệu

Nhiều đề tài, chương trình, dự án nghiên cứu trong các lĩnh vực sản xuất, thương mại, kinh doanh có liên quan tới nhiều nhóm người như chủ kinh doanh, đại lý, nhà khoa học, người sản xuất, người tiêu thụ, hay tiềm năng, thị trường, kinh nghiệm, kiến thức hoặc quan điểm. Việc thu thập các thông tin, số liệu trong mối quan hệ trên cần thiết phải chọn phương pháp thu thập số liệu cho phù hợp. Trong đó, phương pháp phỏng vấn là một cách được sử dụng chủ yếu để tìm hiểu những lý do và động cơ về quan điểm, thái độ, sở thích hoặc hành vi của con người. Người phỏng vấn có thể thực hiện các cuộc phỏng vấn là cá nhân hoặc nhóm người ở nơi làm việc, ở nhà, hay ở một nơi nào đó đã thỏa thuận,… Trong phương pháp phỏng vấn, trước khi bắt đầu đặt câu hỏi cho người trả lời thì người nghiên cứu nên xác định phạm vi câu hỏi. Có hai quyết định cần phải làm: 1. Xác định ranh giới (phạm vi) nghiên cứu: Bằng cách tự hỏi quần thể cộng đồng nào hay quần chúng nào trong cộng đồng để nắm bắt được các kiến thức, ý kiến và thông tin từ họ?

2. Chọn mẫu hay chọn đối tượng phỏng vấn: Theo nguyên tắc, chọn mẫu ngẫu nhiên là tốt nhất. Nhưng thực tế cho thấy khó đạt được và khó thuyết phục được người được chọn ngẫu nhiên để tham dự. Vì vậy, thường có nhiều cách khác nhau trong việc lấy mẫu (xem phần phương pháp chọn mẫu trong phương pháp thực nghiệm).

Một khi đã giải quyết xong hai câu hỏi trên, bước kế là xác định kiểu trả lời của người được phỏng vấn. Có hai phương pháp phỏng vấn: Phương pháp phỏng vấn - trả lời và phương pháp sử dụng bảng câu hỏi - trả lời. Sự khác nhau quan trọng giữa hai phương pháp này có liên quan tới khối lượng kiến thức và cơ sở lý thuyết để bắt đầu làm cuộc điều tra, cũng như khối lượng số liệu cần thu thập. Đôi khi có một số mẫu khuyết các câu khó trả lời và một số lổ hổng lớn trong kiến thức. Đây là những trường hợp hay những phương pháp khác nhau mà người nghiên cứu cần chú ý để chọn phương pháp nào thích hợp trong việc điều tra.

II.3.2.1. Phương pháp phỏng vấn - trả lời

THONG - 090

5474

478

Page 36: 3. Nội dung bài giảng

30 Phỏng vấn là một loạt các câu hỏi mà người nghiên cứu đưa ra để phỏng vấn người trả lời. Phỏng vấn có thể được tổ chức có cấu trúc, nghĩa là người nghiên cứu hỏi các câu hỏi được xác định rõ ràng; và phỏng vấn không theo cấu trúc, nghĩa là người nghiên cứu cho phép một số các câu hỏi của họ được trả lời (hay dẫn dắt) theo ý muốn của người trả lời. Đặc biệt, khi áp dụng cuộc phỏng vấn không cấu trúc, người nghiên cứu thường sử dụng băng ghi chép thì tốt hơn nếu không muốn ảnh hưởng đến người được phỏng vấn.

a. Phương pháp phỏng vấn được áp dụng tốt trong trường hợp: · Mục tiêu nghiên cứu chưa được hiểu rõ hoàn toàn. Vấn đề và mục tiêu nghiên cứu có

thể sửa hoặc xem lại trong quá trình nghiên cứu. · Một loạt các câu trả lời có khả năng chưa được biết trước. Một số người trả lời có thể

trình bày các quan điểm mới mà người nghiên cứu chưa biết tới. · Người nghiên cứu cần có sự lựa chọn đề xuất hay trình bày thêm những câu hỏi dựa

trên thông tin từ người trả lời. · Một số người trả lời có thể có thông tin chất lượng cao và người nghiên cứu mong

muốn tìm hiểu sâu hơn với họ về đề tài nghiên cứu. · Các câu hỏi có liên quan tới kiến thức ẩn, không nói ra hoặc quan điểm cá nhân (thái

độ, giá trị, niềm tin, suy nghĩ, …). · Người nghiên cứu có thể cung cấp thêm thời gian và chi phí cho phỏng vấn và đi lại. · Một số người trả lời có những khó khăn trong cách diễn đạt bằng cách viết. · Chúng ta muốn công bố báo cáo có liên quan đến công bố chung.

Các cuộc phỏng vấn thường mất nhiều thời gian, có thể khoảng một ngày cho mỗi cuộc phỏng vấn và kèm theo nhiều giấy tờ, nhưng người nghiên cứu có thể thu thập nhiều bảng câu hỏi được phỏng vấn trong một ngày. Phương pháp phỏng vấn chủ đề là phỏng vấn nhanh, thích hợp và giống như cuộc thảo luận thông thường. Người trả lời phỏng vấn có quyền đưa ra bất kỳ sự bình luận nào mà họ thấy thích hợp, và nếu người phỏng vấn tìm ra chủ đề mới thích thú thì họ có thể đưa ra thêm các câu hỏi dựa trên quan điểm mới. Nhưng nếu như người phỏng vấn đi lạc đề thì sẽ thất bại và cần phải điều chỉnh lại cuộc nói chuyện liên quan tới chủ đề ban đầu đã đưa ra. Phỏng vấn là phương pháp đặc biệt thích hợp khi người nghiên cứu không có cơ sở lý thuyết, lý luận hay suy nghĩ xác thực về vấn đề, trái lại mong muốn để học và biết về quan điểm mới mà không nhìn thấy trước được. Nếu chọn phương pháp nầy, ngưởi trả lời phỏng vấn thường sẽ đưa ra nhiều quan điểm mới hơn.

b. Các loại phỏng vấn thường gặp F Phỏng vấn cá nhân Đây là phương pháp trao đổi thông tin giữa người trả lời phỏng vấn và người phỏng vấn. Phương pháp này có những thuận lợi và không thuận lợi sau:

Thuận lợi: · Người trả lời cho các thông tin tốt hơn so với các điều tra gởi qua bưu điện · Trao đổi thông tin giữa 2 người nhanh hơn · Dễ khai thác các câu trả lời cho các câu hỏi chuyên sâu hơn

THONG - 090

5474

478

Page 37: 3. Nội dung bài giảng

31 · Người phỏng vấn dễ điều khiển, kiểm soát nếu có vấn đề · Tạo động cơ và cảm hứng · Có thể sử dụng một số cách để ghi chép dễ dàng · Đánh giá được tính cách, hành động … của người trả lời phỏng vấn · Có thể sử dụng các sản phẩm hay đồ vật để minh họa · Thường để làm thử nghiệm trước cho các phương pháp khác

Không thuận lợi: · Mất thời gian hơn so với các điều tra gởi qua bưu điện · Cần thiết để sắp đặt ra cuộc phỏng vấn · Thông thường cần phải đặt ra một bộ câu hỏi trước · Có thể sai số ở người trả lời phỏng vấn khi họ muốn làm hài lòng hoặc gây ấn tượng,

hoặc muốn trả lời nhanh, suông sẽ · Phải phỏng vấn nhiều người ở nhiều nơi khác nhau · Một số câu hỏi cá nhân, riêng tư có thể làm bối rối cho người trả lời · Việc ghi chép và phân tích có thể gây ra vấn đề - nếu chủ quan

F Phỏng vấn nhóm Lúc đầu thì hầu hết những người nghiên cứu nghĩ rằng, một người thứ 3 luôn hướng tới sự trả lời và vì vậy những người không cần đến (người không liên quan) như các thành viên khác trong gia đình hay các đồng nghiệp sẽ không bao giờ được phép tham gia phỏng vấn. Nhiều người cho rằng, các giá trị và thái độ riêng của các thành viên được sinh ra trong nhóm xã hội của họ và họ sẽ không tồn tại khi bị tách ra khỏi nhóm. Vì vậy, phỏng vấn nhómlà việc thảo luận trong nhóm xã hội hiện tại như nhóm xã hội, gia đình. Phỏng vấn đạt hiệu quả khi người nghiên cứu cần thu thập các thông tin về đời sống, công việc và sự vui chơi giải trí, cũng như các thông tin phổ biến về sử dụng, đánh giá và các phương tiện có liên quan tới các kết quả hay sản phẩm. Phỏng vấn không đề cập tới sự khác nhau, chủ đề tranh chấp và các câu hỏi nhạy cảm, dễ bị xúc phạm. Hơn nữa, trong một nhóm lớn thì một số các thành viên nói hết thời gian và những thành viên khác bị hạn chế nói hơn. Nếu mục đích nghiên cứu là để mô tả động cơ thực sự của nhóm thì người nghiên cứu có thể chọn để chấp nhận và ghi nhận tính không cân xứng này trong cuộc nói chuyện. Nếu mục đích để thu thập các quan điểm, thái độ về chủ đề đã nêu ra thì nên hướng theo cuộc thảo luận, ngăn chặn khỏi bị lạc đề, và chú ý tất cả những người tham dự đang lắng nghe.

F Phỏng vấn nhóm trung tâm Đây là cuộc phỏng vấn nhóm bình thường, được sử dụng để đưa ra nền tảng, lý lẽ về sự phát triển kết quả hay sản phẩm mới. Thường có từ 5-10 người tham dự tiên phong được lựa chọn trong số các người hiểu biết về kết quả hay sản phẩm hoặc trong số các khách hàng quan trọng trong tương laiđược mời để thảo luậnsự triển vọng của kết quả hay sản phẩm tương lai hoặc những kinh nghiệm về việc sử dụng kết quả hay sản phẩm hiện tại.

THONG - 090

5474

478

Page 38: 3. Nội dung bài giảng

32 Tiến trình phỏng vấn nhóm trung tâm có định hướng mạnh mẽ về mục đích mà có thể chuẩn bị trước tài liệu, vật liệu cho công việc được thuận lợi qua cuộc nói chuyện về mục đích và các công việc chương trình cần thực hiện trong cuộc họp, mẫu mã của các kiểu sản phẩm, và sự mô tả kết quả hay sản phẩm qua tranh ảnh, đồ vật, hay bắt chước. Nhóm trung tâm, giống như câu lạc bộ họp mặt thường ngày, có chương trình làm việc, thư ký và người hướng dẫn thảo luận để động viên kích thích người tham dự cho ý kiến của họ. Cuộc thảo luận thường được ghi chép bằng ghi băng cassette hoặc video và người nghiên cứu sẽ tóm tắt các ý kiến có giá trị sau đó. Sự tóm tắt sau đó có thể được thảo luận bởi các người tham dự chính được chọn hoặc nhóm trung tâm mới.

c. Sắp xếp, chuẩn bị cho cuộc phỏng vấn ngoài thực tế F Cách bố trí cuộc phỏng vấn Phỏng vấn cũng giống các nghiên cứu khác, tất cả sự chuẩn bị là nhằm mục đích tạo điều kiện thuận lợi cho nghiên cứu và điều kiện nơi phỏng vấn có thể ảnh hưởng đến người trả lời phỏng vấn. Để giảm tối đa ảnh hưởng này thì người nghiên cứu nên chọn một nơi quen thuộc với người trả lời phỏng vấn, thí dụ như phỏng vấn tại nhà, phòng họp, quán cafe hoặc nơi yên tĩnh để có thể trò chuyện một cách thoải mái, không bị quấy rầy và không hấp tấp, vội vã. Cách ăn mặc, cư xử và hành động của người phỏng vấn cũng có ảnh hưởng đến người trả lời phỏng vấn. Sự trả lời của người phỏng vấn có thể được ghi chép bởi người trợ lý, thu băng hoặc video.

F Tài liệu, đồ vật, hình ảnh để minh họa Khi câu hỏi gắn với kết quả hay sản phẩm đã đưa ra trong nghiên cứu, thì việc trả lời có thể dễ dàng và đầy đủ hơn nếu kết quả hay sản phẩm sẵn có và hiện đang được sử dụng ngoài thực tế. Nếu như không có sản phẩm chứng minh thì người nghiên cứu có thể đưa ra sản phẩm khác hoặc bắt chước sản phẩm qua các tài liệu, đồ vật, tranh ảnh,… minh họa. Điều này sẽ giúp cho người trả lời hình dung, xác định rõ, chính xác và dễ dàng trả lời các câu hỏi có liên quan tới sản phẩm nghiên cứu.

F Chương trình làm việc Người phỏng vấn thường bắt đầu cuộc phỏng vấn bằng cách trình bày tổ chức, mục đích nghiên cứu và làm thế nào để sử dụng các kết quả. Các mẫu thông tin nhỏ hầu như có thể ít ảnh hưởng đến quan điểm của người trả lời phỏng vấn. Thường cần thiết phải giải thích mức độ nào mà sự thể hiện của người trả lời có thể được giữ kín đáo. Câu hỏi đầu tiên đưa ra là phải diễn đạt trong thuật ngữ chung. Câu hỏi “kết thúc mỡ” và thường kích thích người trả lời phỏng vấn để giải thích và mở rộng câu trả lời của họ. Để tránh sự trả lời lệch lạc, người phỏng vấn phải không bao giờ tiết lộ ý kiến riêng của mình về các chủ đề đã thảo luận. Thí dụ, người nghiên cứu có thể thể hiện sự đồng ý với ý kiến của người trả lời bằng cách gật đầu, nhưng nên cẩn thận và tránh thể hiện sự đồng ý với chỉ một vài ý kiến. Khi người trả lời phỏng vấn trình bày vấn đề một cách kỹ lưỡng, họ không biết khái niệm mới nào làm cho người nghiên cứu quan tâm. Vì vậy, người phỏng vấn phải dẫn dắt người trả lời tới vấn đề. Nếu ngắt câu trả lời lệch lạc của người trả lời thì bất lịch sự, vì vậy phải đợi cho người trả lời kết thúc. Người nghiên cứu phải tìm cách kích thích và

THONG - 090

5474

478

Page 39: 3. Nội dung bài giảng

33 gợi ý tích cực tới người trả lời phỏng vấn hướng vào mục tiêu câu hỏi và gợi ý, gây cảm hứng cho họ. Thí dụ, một số câu hỏi gợi ý: · Anh có thể kể cho tôi nghe về điều đó không? · Tại sao anh nghĩ điều đó xảy ra? · Người ta có suy nghĩ và cảm nhận như thế nào khi nghe về điều đó không?

Một kiểu gợi ý gây cảm hứng khác là khi người trả lời phỏng vấn nói điều gì cường điệu quá (nói phóng đại) mà người nghiên cứu còn nghi ngờ, thì trong tình huống như vậy nên hỏi một cách đơn giản: Anh muốn nói về điều đó … phải không?, anh thực sự muốn nói về điều đó … phải không? và nói lại điều đó bằng cách khác hơn để làm rõ hơn.

II.3.2.2. Phương pháp sử dụng bảng câu hỏi - trả lời Bảng câu hỏi là một loạt các câu hỏi được viết hay thiết kế bởi người nghiên cứu để gởi cho người trả lời phỏng vấn trả lời và gởi lại bảng trả lời câu hỏi qua thư bưu điện, thư điện tử, phản hồi trực tuyến cho người nghiên cứu. Sử dụng bảng câu hỏi là phương pháp phổ biến để thu thập các thông tin từ người trả lời các câu hỏi đơn giản. Các thông tin trả lời được gởi bằng thư từ giữa người trả lời phỏng vấn ở xa với người nghiên cứu. Để thu thập các thông tin chính xác qua phương pháp này, cần nêu ra các câu hỏi và suy nghĩ chính xác về vấn đề muốn nghiên cứu trước khi hoàn thành thiết kế bảng câu hỏi. Thường thì người nghiên cứu có các giả thuyết định lượng với các biến số. Bảng câu hỏi là phương pháp thu thập thông tin được sử dụng tốt nếu: · Vấn đề được xác định rõ (giả thuyết tốt) và không thay đổi trong suốt quá trình nghiên cứu. · Tất cả các câu hỏi có câu trả lời được đoán biết trước. · Một loạt các câu trả lời có thể được biết trước. · Các câu hỏi có liên quan hầu hết tới các sự kiện, số lượng hoặc đồ vật. · Có nhiều câu hỏi mà một số người trả lời phỏng vấn thích để trả lời một cách ẩn danh hơn. · Người nghiên cứu thích phân tích các con số.

Chú ý: khi sử dụng bảng câu hỏi, người nghiên cứu thu thập được những câu trả lời trong bảng thiết kế mà không có những thông tin thêm vào như phương pháp phỏng vấn. Vì vậy việc thiết kế xây dựng bảng câu hỏi cần phải xác định đầy đủ tất cả các câu hỏi trước khi bắt đầu gởi và thu nhận thông tin. Khi thiết kế bảng câu hỏi, phải tôn trọng quyền của người trả lời phỏng vấn. Vì vậy bắt đầu của bảng câu hỏi, nên đặt lời giới thiệu và giải thích cách làm như thế nào cho người trả lời câu hỏi biết. Cũng nên đưa ra thời gian giới hạn để nhận lại bảng câu hỏi, địa chỉ kèm theo phong bì đã được trả cước hoặc tem. Không nên yêu cầu người trả lời ký tên vào bảng câu hỏi. Tuy nhiên, có thể cho ký hiệu trên bao thư để có thể nhận ra có phải là người trả lời phỏng vấn hay không. a. Cách thiết kế câu hỏi: F Đặt câu hỏi về các sự kiện Sự kiện là điều gì đó không bị ảnh hưởng bởi quan điểm hoặc ý kiến. Người nghiên cứu có thể nói tới các câu hỏi thực sự trong phỏng vấn hoặc bảng câu hỏi.

THONG - 090

5474

478

Page 40: 3. Nội dung bài giảng

34 Bảo đảm không nối kết hai chủ đề trong một câu hỏi, các câu hỏi thường được thiết kế các dạng như sau: Năm sinh: ...................................................Số năm theo nghề: ...................................... Tình trạng hôn nhân: Độc thân o Có gia đình o Ly dị o Khi trình bày các câu hỏi chọn lựa theo thiết kế, phải bảo đảm là tất cả sự lựa chọn có thể được bao gồm. Để bảo đảm an toàn có thể thêm các hộp chọn: Khác o; hoặc những cái gì khác: ................................................................................................................... Các câu hỏi phải hoàn toàn không được mơ hồ, khó hiểu cho người trả lời. Vì vậy, nên sử dụng câu đơn giản, các từ sử dụng thông thường, dễ hiểu. Đôi khi có thể làm rõ nghĩa hơn bằng cách nhấn mạnh các từ quan trọng hoặc đưa ra các hình ảnh hoặc dùng viết để vẽ hình minh họa. Các câu hỏi không rõ có thể làm cho người trả lời lúng túng, cảm thấy bị bó buộc hay gượng ép để trả lời, như vậy sẽ không đạt được các câu trả lời đúng, chính xác (số liệu sẽ không tin cậy). Sau khi thiết kế xong bảng câu hỏi, nên làm cuộc thử nghiệm trước khi có cuộc điều tra chính thức ngoài thực tế. Tốt nhất nên đưa cho một vài người nào đó điền vào bảng câu hỏi và quan sát người trả lời viết ra hay phản ứng của người trả lời nhanh hay chậm, các hành động, cử chỉ trong khi trả lời như thế nào (thể hiện khó khăn, suy nghĩ như thế nào,…).

F Đặt câu hỏi về ý kiến và quan điểm Khi hỏi về quan điểm, câu hỏi nên được trình bày trong các nguyên tắc sau đây: · Câu hỏi, cách trình bày phải thu hút, lý thú và gây cho người trả lời thoải mái, dễ chịu. · Câu hỏi, cách trình bày phải ngắn gọn, đơn giản, rõ ràng, dễ hiểu. Tránh các mệnh đề

phụ thuộc. · Các từ như “tất cả”, “luôn luôn”, “không ai” và “không bao giờ” nên tránh sử dụng

trong câu ở quá khứ.

Khi hình thành sự trình bày và nhìn vào kết quả, nên quan tâm ảnh hưởng sai lệch của câu hỏi. Hầu hết mọi người thích trả lời câu hỏi tích cực hơn tiêu cực (trả lời điều hay, tốt, suông sẻ, … hơn là điều xấu, không tốt). Đặc biệt nếu họ biết hay đọc được suy nghĩ và cách thể hiện chính người nghiên cứu muốn ủng hộ cách trình bày trả lời của họ. Vì vậy, tốt nhất là người phỏng vấn nên chọn lựa cách thể hiện, trình bày câu hỏi theo một cách để vừa phản ánh thể hiện quan điểm tiêu cực và tích cực cho người trả lời câu hỏi (quan điểm trả lời ngang bằng nhau lúc đầu, hay không thiên vị).

b. Các mẫu câu hỏi cho người trả lời phỏng vấn trong phương pháp sử dụng bảng câu hỏi gồm: a. Mẫu câu hỏi mở: (Đã đề cập) b. Mẫu câu hỏi kín (đóng): (Đã đề cập) c. Mẫu câu hỏi mở cuối: (Đã đề cập) d. Các mẫu câu hỏi có cấu trúc khác · Mẫu đánh dấu hộp lựa chọn

THONG - 090

5474

478

Page 41: 3. Nội dung bài giảng

35

Đúng o; Sai o; Không chắc o

· Mẫu đường thẳng chia độ

Đời sống của gia đình anh/ chị ngày càng ổn định hơn Rất đồng ý Hoàn toàn không đồng

ý

· Mẫu bảng hệ thống chia mức độ

Văn bản pháp luật liên quan KT&BV NLTS Biết rõ Biết sơ sơ Không biết

Luật Thủy sản 2005 o o o

Thông tư 02/2006/TT-BTS o o o

Nghị định số 33/2010/NĐ-CP o o o

· Mẫu bảng

Dạng bảng này chứa các hạng mục có cấu trúc được sắp xếp theo hàng và cột trong bảng

Độ tuổi <18 tuổi 18÷30 tuổi 31÷40 tuổi 41÷50 tuổi 51÷60 tuổi >60 tuổi

Học vấn Mù chữ Cấp 1 Cấp 2 Cấp 3 T.Cấp, Nghề CĐ-ĐH

c. Những chú ý khi thiết kế mẫu câu hỏi và phỏng vấn hiệu quả

F Cấu trúc chung của một bộ câu hỏi Thường gồm 2 phần chính: - Phần thông tin chung: Thông tin người được phỏng vấn (tên, tuổi, giới, địa chỉ, trình độ văn hóa, nghề nghiệp, chức danh…). - Phần thông tin đặc thù cho nghiên cứu: Tùy mục tiêu nghiên cứu. F Các yếu tố cần cân nhắc khi thiết kế câu hỏi: - Mục đích nghiên cứu và câu hỏi nghiên cứu. - Các giả thuyết nghiên cứu. - Các chỉ số, biến số, thông tin cần thu thập. - Kế hoạch phân tích số liệu. - Các nguồn lực hiện có. - Đặc điểm quần thể nghiên cứu.

F Các bước cần làm khi thiết kế bộ câu hỏi - Chọn loại câu hỏi sẽ sử dụng: Bộ câu hỏi hay phiếu hỏi.

THONG - 090

5474

478

Page 42: 3. Nội dung bài giảng

36 - Liệt kê danh sách các biến: tùy theo câu hỏi nghiên cứu. - Lựa chon cách thu thập số liệu cho từng biến: câu hỏi, khám, xét nghiệm. - Viết nháp bộ câu hỏi. - Tham khảo ý kiến chuyên gia, sửa lại. - Thu thập thông tin thử từ bộ câu hỏi. - Sửa và viết lại cho phù hợp. - Mã hóa thông tin từ câu hỏi. - In ấn, sử dụng.

F Tiêu chuẩn một bộ câu hỏi tốt - Rõ ràng và có tính đặc thù. - Đơn giản, dễ hiểu, dễ mã hóa. - Dễ trả lời. F Một số biện pháp để kích thích người trả lời phỏng vấn

Động cơ thúc đẩy sự tích cực của người trả lời phỏng vấn là cách hiệu quả nhất để hoàn thành mục đích và rất quan trọng trong nghiên cứu trước khi đưa ra các câu hỏi nghiên cứu chính thức. Người nghiên cứu có lẽ cũng nhấn mạnh sự kiện mà cuộc phỏng vấn đem lại thông tin giá trị mình đạt được mà bất kỳ chỗ khác không có như vậy. Cách khác trong việc thúc đẩy người khác là làm sao gây ra càng ít phiền toái càng tốt cho người trả lời phỏng vấn trong bảng câu hỏi. Vì vậy, bảng câu hỏi và các câu hỏi không nên thiết kế quá dài dòng, làm cho người trả lời sợ và cảm thấy không thỏa mái để trả lời hay các câu hỏi nên cần trình bày ngắn gọn, rõ ý. Một số cách để cải tiến mức độ trả lời câu hỏi qua nghiên cứu sử dụng bảng câu hỏi được tóm tắt như sau:

Cách thực hiện Ảnh hưởng mức độ trả lời

Thông báo trước qua thư Tăng nghiên cứu khách hàng (người tiêu dùng).

Thông báo trước qua điện thoại Tăng mức độ trả lời

Kích thích bằng tiền, quà Tăng mức độ trả lời

Bao thư gởi được dán tem sẵn Tăng mức độ trả lời

Riêng tư cá nhân Ảnh hưởng thay đổi

Bảng câu hỏi dài Ảnh hưởng ít trên mức độ trả lời

THONG - 090

5474

478

Page 43: 3. Nội dung bài giảng

37

Cách thực hiện Ảnh hưởng mức độ trả lời

Bảng câu hỏi màu Không ảnh hưởng mức độ trả lời

Sự gia hạn Không ảnh hưởng mức độ trả lời

Dạng câu hỏi Dạng câu hỏi kết thúc kín (Closed-ended) có mức độ trả lời cao hơn dạng câu hỏi mở (open-ended)

Tiếp diễn tiếp theo Thư từ và điện thoại sau đó làm tăng mức độ trả lời

Chú ý: nếu một số người trả lời phỏng vấn không gởi lại bảng trả lời câu hỏi, người nghiên cứu không nên tự động thay thế các câu hỏi đã đưa ra trong bảng câu hỏi bằng các câu hỏi khác. Nếu làm như vậy sẽ dễ dàng làm lệch kết quả, bởi vì người không gởi lại bảng trả lời có thể có những suy nghĩ khác với người gởi bảng trả lời câu hỏi. Để chỉnh lại sự sai lệch do những người vắng mặt trả lời câu hỏi. Thực hiện các bước sau đây: 1. Đầu tiên, người nghiên cứu tách riêng các câu trả lời gởi lại mà không có bất kỳ

yêu cầu trả lời nào (nhóm A, có tỷ lệ 50% trả lời trong thí dụ này), và các câu trả lời gởi lại sau khi có yêu cầu trả lời (nhóm B, trả lời 30%). Nhóm không gởi lại bảng trả lời (nhóm C chiếm 20%).

2. Sau đó, người nghiên cứu xem xét nhóm B có khác với nhóm A hay không tương ứng với các biến, bằng phép thử thống kê t-test.

3. Nếu có sự khác biệt giữa nhóm A và B. Chúng ta thừa nhận nhóm không trả lời, nhóm C sẽ có sự khác biệt với nhóm A và nhóm B. Từ đó các câu trả lời được đưa ra ở nhóm B sẽ được tính bao gồm cho những người không trả lời ở nhóm C hay gia tăng tỷ trọng của nhóm B để bằng với tổng số của nhóm B và C cộng lại là 50% trong thí dụ này.

4. Nếu nhóm A và B được xem là không khác biệt nhau, chúng ta có thể mong muốn rằng sự vắng mặt của nhóm C sẽ không ảnh hưởng lớn đến kết quả, và vì vậy không cần thiết điều chỉnh lại. Nhóm A và B được kết hợp nhau, tổng kết quả được thừa nhận là đúng cho toàn quần thể.

II.4. Một số phương pháp thu thập số liệu khác II.4.1. Phương pháp sử dụng nhật ký ghi chép

Một phương pháp thu thập số liệu khá hấp dẫn, đặc biệt khi thực hiện nghiên cứu theo chiều dọc, là phương pháp sử dụng nhật ký ghi chép. Việc ghi chép được theo dõi trong nhiều ngày, nhiều tuần hoặc có thể hàng năm, nhiều năm. Người nghiên cứu phát sổ ghi nhật ký cho người trả lời và thu lại sổ nhật ký sau một thời gian nghiên cứu nào đó. Người trả lời tự ghi chép các số liệu của các sự kiện về công việc hay hoạt động đang xảy ra, hoặc họ đang xem tivi, hoặc xem quảng cáo, mua bán điều gì đó,… Hiện tại, tất cả việc đánh giá số liệu từ hoạt động tivi và nghe đài được áp dụng qua phương pháp

THONG - 090

5474

478

Page 44: 3. Nội dung bài giảng

38 này và dễ dàng để quản lý. Phương pháp này tương đối ít tốn tiền và rẽ, nhưng có nhược điểm bị giới hạn lớn về việc thu thập các loại thông tin về thái độ, hành vi, … Vấn đề chính của việc sử dụng phương pháp này là rất khó đạt được bất kỳ xác nhận hay bằng chứng độc lập được ghi chép trong nhật ký và chỉ có người trả lời biết chính xác hay là không. Một số người ghi nhật ký cho các câu trả lời mà họ nghĩ muốn làm hài lòng hoặc do họ sợ hoặc tôn trọng người hoặc tổ chức nghiên cứu. Trong khi đó, những người khác cho thông tin không chính xác, đặc biệt khi họ không thích người hoặc tổ chức nghiên cứu. Khi áp dụng phương pháp này, người nghiên cứu nên làm động cơ thúc đẩy người trả lời để họ cung cấp các thông tin chính xác hơn.

II.4.2. Thu thập mẫu từ cuộc nói chuyện ở những nơi công cộng

Đây là một phương pháp đặc biệt nhằm mục đích để loại trừ hoàn toàn ảnh hưởng của sự hiện diện của người nghiên cứu. Nghĩa là nghe lõm cuộc nói chuyện riêng tư ở những nơi công cộng như công viên, cửa hiệu mua sắm,… Một số người nghiên cứu dùng phương pháp này để thu thập các ý kiến chung của cộng đồng liên quan tới việc xây dựng các nơi công cộng mới. Phương pháp nầy cũng được sử dụng để thu thập các quan điểm về đồ đạc, hàng, vật phẩm,… buôn bán trong cửa hiệu. Điểm yếu của phương pháp nầy là thường mất nhiều thời gian khi người nói không đề cặp tới vấn đề người nghiên cứu quan tâm và không giới hạn nghiên cứu ở bất kỳ quần thể xác định nào.

II.4.3. Thu thập mẫu phỏng vấn qua tường thuật

Phỏng vấn tường thuật thường phức tạp, thậm chí khi câu trả lời được ghi băng. Đôi khi cần phải nghe một vài lần và cố gắng hiểu nghĩa trả lời nói gì, sau đó mới ghi chép ra ngoài. Đôi khi một số câu hỏi quan trọng cần được giải thích rõ thì có thể làm lại cuộc phỏng vấn. Làm sao các ý kiến, suy nghĩ của người trả lời phỏng vấn được ghi chép một cách càng trung thực càng tốt, nhưng thực sự đôi khi sự trả lời là một điều khác hơn. Các sự kiện được trình bày từ người trả lời nên nhớ có thể xảy ra như: · Sự sai lệch đích thực của người trả lời phỏng vấn: có thể là họ có lý do để “thêm thắt”

các sự kiện. · Khả năng thực sự của người trả lời phỏng vấn để kể toàn bộ sự thật: họ nằm trong vị

trí để trả lời chỉ một mặt hay toàn bộ?

III. Phương pháp xử lý số liệu III.1. Chuẩn bị dữ liệu Quy trình phân tích và xử lý bắt đầu sau khi dữ liệu đã được thu thập. Nhưng trước khi xử lý phải diễn giải các dữ liệu ra một dạng thích hợp vì những dữ liệu mới được thu thập vẫn còn ở dạng ''thô'' chưa thể xử lý ngay được mà chúng cần được sắp xếp, được mã hóa theo những cách thức nhất định để dễ dàng cho việc sử dụng máy vi tính trợ giúp xử lý dữ liệu sau này.

Làm cho dữ liệu có giá trị: Sau khi thu thập dữ liệu phải kiểm tra các dữ liệu để bảo đảm chúng có ý nghĩa, tức là có giá trị đối với việc xử lý và phân tích. Việc làm cho dữ liệu có giá trị tiến hành theo hai bước:

- Bước thứ nhất: Tiến hành xem xét một cách kỹ lưỡng các phương pháp và các biện pháp đã được sử dụng để thu thập dữ liệu (tức kiểm tra các công cụ dùng để thu thập dữ liệu) .

THONG - 090

5474

478

Page 45: 3. Nội dung bài giảng

39 - Bước thứ hai: Tiến hành nghiên cứu kỹ các bảng câu hỏi đã được phỏng vấn và những chỉ dẫn về thủ tục phỏng vấn để phát hiện ra những nguyên nhân dẫn đến các sai sót.

Hiệu chỉnh dữ liệu: Do những nguyên nhân khách quan và chủ quan, quá trình thu thập dữ liệu dù được chuẩn bị chu đáo vẫn còn có thể tồn tại những sai sót, vì vậy phải hiệu chỉnh để dữ liệu có ý nghĩa đối với quá trình nghiên cứu. Hiệu chỉnh dữ liệu là sửa chữa các sai sót về ghi chép hoặc ngôn từ phát hiện được qua kiểm tra. Trong khi hiệu chỉnh cần sửa chữa những sai sót phổ biến sau:

- Những cuộc phỏng vấn giả tạo do người đi phỏng vấn “phịa” ra

- Như câu trả lời không đầy đủ (là những câu trả lời không rõ ý hoặc trả lời nửa chừng).

- Những câu trả lời thiếu nhất quán.

- Những câu trả lời không thích hợp.

- Những câu trả lời không đọc được.

Có 3 cách tiếp cận được sử dụng để xử lý các dữ liệu ''xấu'' từ các tình huống đó. Quay trở lại người đi phỏng vấn hay người trả lời câu hỏi để làm sáng tỏ vấn đề. Việc liên hệ với các cá nhân để tìm câu trả lời đúng làm nảy sinh hai vấn đề:

- Làm tăng chi phí và sẽ quá đắt nếu cuộc khảo sát có quy mô vì chi phí phỏng vấn này đã được tính trong dự án nghiên cứu. Theo kinh nghiệm, người nghiên cứu có thể không cần tìm cách thu thập thêm dữ liệu nếu tỉ lệ các câu hỏi nghi vấn tương đối nhỏ và / hoặc quy mô của mẫu tương đối lớn (tỉ lệ các câu hỏi nghi vấn nhỏ hơn 20% và mẫu lớn hơn 500).

- Nếu quyết định đi ngược trở lại để thu thập dữ liệu, những dữ liệu mới có thể sẽ khác với dữ liệu đã được thu thập trong cuộc phỏng vấn đầu tiên do các cá nhân có thể không nhớ thông tin cần thiết, cũng như có thể do sử dụng phương pháp khác và điều này ảnh hưởng rất lớn đến kết quả của câu trả lời (liên quan đến độ tin cậy của cuộc điều tra).

Suy luận từ những câu trả lời khác: Theo cách này, người hiệu chỉnh phỏng đoán từ các dữ liệu khác để làm rõ câu trả lời nào đúng. Nhưng đây là cách làm đầy rủi ro. Khó có thể minh định được các quy luật để suy luận các câu trả lời. Do đó để an toàn khi hiệu chỉnh dữ liệu, người nghiên cứu cần hết sức thận trọng với phương pháp này, và không nên suy luận một câu trả lời trừ phi biết tương đối chắc chắn về ý định của người trả lời.

Loại toàn bộ câu trả lời: Đây là việc dễ thực hiện nhất. Theo cách này, người hiệu chỉnh chỉ việc loại đi những câu trả lời có nghi vấn. Trong trường hợp quy mô của mẫu tương đối lớn, người hiệu chỉnh có thể loại bỏ toàn bộ các câu trả lời nếu thông tin thiếu nhất quán và người hiệu chỉnh không thể giải quyết vấn đề thiếu nhất quán đó trong các dữ liệu được thu thập từ các đối tượng phỏng vấn. Tuy nhiên, khuyết điểm trong cách tiếp cận này là sự thiên vị trong kết quả nếu những người trả lời thiếu nhất quán đó bị loại ra khỏi cuộc nghiên cứu, khi đó kết quả đạt được sẽ bị lệch nếu ý kiến những người trả lời bị loại này khác với những người còn được giữ lại trong mẫu điều tra.

Một cách giải quyết khác là tập hợp một báo cáo riêng các loại dữ liệu bị thiếu hoặc không nhất quán, không rầng nếu người nghiên cứu thật sự tin rằng các dữ liệu đó có thể có ích cho việc ra quyết định của các nhà lãnh đạo.

THONG - 090

5474

478

Page 46: 3. Nội dung bài giảng

40 III.2. Cấu trúc và mã hóa dữ liệu Mã hóa dữ liệu là một quá trình liên quan tới việc nhận diện và phân loại mỗi câu trả lời trên một ký hiệu được chỉ định (ký hiệu có thể bằng số hoặc bằng chữ). Dữ liệu này phải được mã hóa thì máy điện toán mới đọc và xử lý được.

Cấu trúc dữ liệu: Cấu trúc của dữ liệu là cách sắp xếp thông tin đã được trả lời vào vị trí ô lưu trữ dữ liệu của máy điện toán. Do đó các nhà nghiên cứu phải tổ chức các dữ liệu được mã hóa thành một cấu trúc thích ứng của các dữ liệu.

Mã hóa dữ liệu: Việc mã hóa có thể được thực hiện vào một trong hai thời điểm, là mã hóa trước và mã hóa sau:

Mã hóa trước: Mã hóa trước là việc quyết định chọn các mã số cho các câu hỏi và các phương án trả lời từ khi thiết kế bản câu hỏi, và do vậy có thể in ngay các mã số lên bảng câu hỏi. Hình thức mã hóa này thích hợp cho các câu hỏi dạng luận lý (chỉ chọn một trong hai cách trả lời: có, không) hay dạng chọn một trong các câu trả lời ghi sẵn. Đối với các câu hỏi này người nghiên cứu đã định rõ được câu trả lời và do đó dễ dàng ký hiệu cho các câu trả lời đó. Việc mã hóa này có tác dụng làm giảm đi rất nhiều khối lượng công việc trong bước chuẩn bị dữ liệu.

Ví dụ cách mã hóa sau:

Mã hóa sau: Khi các câu trả lời thuộc câu hỏi mở, người nghiên cứu phải tốn nhiều công biên tập vì các câu trả lời theo tình huống tự do, không định sẵn. Khi phỏng vấn, người phỏng vấn phải ghi nguyên văn câu trả lời, và vì thế để chuyển các dữ liệu như vậy sang một hình thức mà máy điện toán có thể đọc được cần phải phân các câu trả lời theo những loại giống nhau và gán cho chúng các ký hiệu mã hóa.

Có hai cách:

- Cách thứ nhất: Người nghiên cứu tiến hành mã hóa các câu trả lời trước khi nghiên cứu thực địa. Trường hợp này, người nghiên cứu phải dự kiến về mặt lý thuyết các câu trả lời hoặc sử dụng kinh nghiệm của các cuộc nghiên cứu trước, đồng thời mất thời gian huấn luyện những người đi phỏng vấn cách phân loại các câu trả lời được ghi nguyên văn đúng loại mã hóa đã dự kiến.

- Cách thứ hai: Chờ đến khi thu thập xong dữ liệu mới tiến hành mã hóa. Khi đó, người nghiên cứu phải xem xét ngẫu nhiên 30% các bản câu hỏi đã được trả lời để tính toán các loại tình huống trả lời và mã hóa nó. Trước khi mã hóa, phải rà soát lại toàn bộ các câu hỏi đã phỏng vấn để xem xét có còn tình huống trả lời nào khác không. Để tiện lợi cho việc phân tích, không nên phân loại quá 10 tình huống trả lời cho một vấn đề.

Các nguyên tắc thiết lập kiểu mã hóa

THONG - 090

5474

478

Page 47: 3. Nội dung bài giảng

41 Để làm cho chức năng mã hóa được tốt hơn cần phải tuân thủ các nguyên tắc sau đây trong việc thiết lập các kiểu mã hóa.

- Số “kiểu mã hóa” thích hợp: số kiểu mã cần phải đủ lớn để bao quát hết được các sự khác biệt trong dữ liệu. Nếu số lượng mã quá ít thì có thể một số thông tin quan trọng sẽ không được bao quát.

- Những thông tin trả lời được sắp xếp trong cùng một “loại mã hóa” thì phải tương tự nhau về đặc trưng nghiên cứu.

- Ranh giới rõ ràng giữa các “loại mã hóa”

Với các đặc trưng đang được nghiên cứu, những sự khác biệt về thông tin trả lời giữa các “loại mã” phải không giống nhau đến mức đủ xếp vào cùng một “loại mã”.

Ví dụ: Chúng ta đang nghiên cứu đặc trưng tuổi của thuyền viên trên tàu, giả sử cần tiến hành mã hóa các tình huống trả lời như sau:

- Nhỏ hơn 16 tuổi

- Từ 17 tuổi đến dưới 20 tuổi

- Từ 20 tuổi đến dưới 30 tuổi

- Từ 30 tuổi trở lên

Nếu có một câu trả lời là 16 tuổi 4 tháng thì sẽ không rõ phải được xếp vào loại nào vì ở khoảng thứ 1 nhỏ hơn 16 tuổi và khoảng thứ 2 phải là từ 17 tuổi đến dưới 20 tuổi. Khi đó người nghiên cứu phải làm tròn theo nguyên tắc là 16 tuổi 4 tháng được xếp vào loại thứ 1.

- Nguyên tắc loại trừ giữa các loại mã hóa: các loại mã hóa phải không được chồng chéo lên nhau, cần phải thiết lập chúng như thế nào để bất cứ tình huống trả lời nào cũng chỉ được xếp vào một loại mã hóa thôi (đã được xếp vào loại mã này thì không xếp vào mã khác).

- Nguyên tắc toàn diện: theo nguyên tắc này, cấu trúc của một loại mã phải bao quát được tất cả các tình huống trả lời nhằm đảm bảo tất cả các tình huống đều được mã hóa.

- Nguyên tắc “đóng kín” những khoảng cách lớp: theo nguyên tắc này, không được “để mở” khoảng cách lớp của mã hóa, bởi vì việc không chỉ rõ những giới hạn về khoảng cách lớp sẽ làm lu mờ đi những giá trị phân tán ở hai đầu mút của dãy phân phối và do đó sẽ không cho phép tính toán được giá trị trung bình của những quan sát trong mỗi khoảng cách lớp.

Ví dụ, xem xét việc mã hóa câu hỏi về công suất tàu của những người (chủ tàu) được phỏng vấn:

Mức công suất Mã hóa

Từ 45 CV – 90 CV 1

Trên 90 CV – 250 CV 2

Trên 250 CV – 400 CV 3

THONG - 090

5474

478

Page 48: 3. Nội dung bài giảng

42 Có thể nhận thấy nếu mã hóa như trên thì sẽ chưa đảm bảo “đóng kín” những khoảng cách lớp vì với các tình huống trả lời có thu nhập dưới 45 CV hoặc trên 400 CV chưa được mã hóa mặc dù tần suất xuất hiện các giá trị ở hai đầu mút này rất nhỏ.

- Nguyên tắc về những khoảng cách lớp: Khoảng cách các lớp nên được quy định tương đương nhau thì tốt hơn là để chúng có độ rộng thay đổi. Nếu không tuân thủ các nguyên tắc này có thể đưa đến tình trạng khoảng cách lớp thiếu sự dàn trải phù hợp. Tuy nhiên, có thể chấp nhận các khoảng cách có độ rộng không tương đương nhau khi đã định rõ các “loại mã” chứa đựng các phần tương đối nhỏ của tổng thể mà những đặc trưng trả lời từ những phần nhỏ đó có thể không cung cấp những thông tin hữu ích nào cả.

- Nguyên tắc định điểm giữa các khoảng cách lớp: đối với những câu hỏi mà khi trả lời người ta hay làm tròn số thì những khoảng cách lớp cần được thiết kế sao cho những con số được làm tròn (lớn hơn) đó rơi vào những điểm giữa của khoảng cách lớp.

Lập danh bạ mã hóa

Danh bạ mã hóa gồm nhiều cột, trong từng cột chứa đựng những lời giải thích về những mã hiệu đã được sử dụng trong những trường dữ liệu (data fields) và những mối liên hệ của chúng đối với những câu trả lời của các câu hỏi.

Chức năng của danh bạ mã hóa là giúp người làm mã hóa thực hiện việc làm biến đổi từ câu trả lời ra một ký hiệu thích hợp mà máy điện toán có thể đọc được, giúp các nhà nghiên cứu nhận diện các loại biến số khi in bản phân tích bằng máy điện toán.

Lượng thông tin tối thiểu được chứa đựng trong một danh bạ mã hóa đối với một câu hỏi bao gồm: số của câu hỏi, số cột cần có trong máy điện toán, tên của biến số, vấn đề của câu hỏi và mã hiệu đã được sử dụng.

- Có phải chỉ cần mô tả bề mặt của các tình huống nào đó hay không?

- Có phải chúng ta đang tìm kiếm một ngoại lệ hay một dạng nào đó trong tình huống hay không?

- Cần dự đoán trạng thái tương lai hay giá trị của một biến hay không?

- Nếu có những mối liên hệ quá khứ giữa các biến nào đó thì có cần làm rõ không? Nếu như vậy chúng ta có phải quan tâm đến những mối liên hệ bên trong giữa các biến hay không?

- Chúng ta có muốn thăm dò cấu trúc bên trong của một hiện tượng bền goài về phản ứng của người tiêu dùng, qua đó tìm hiểu được hoặc chứng minh cho các nguyên nhân bên trong hay không ?

- Nếu dùng mô hình thử nghiệm thì (1) có những biến thiên cùng chiều nào giữa các biến thích hợp? (2) các biến đặc biệt nào là nguồn nhập cho từng phương pháp hay cho các bảng tính, (3) việc tính toán được thực hiện theo trình tự nào?

- Những tính toán nào phụ thuộc vào kết quả tính toán của các bước trước?

- Những tính toán nào phải chờ đợi những kết quả của các tính toán khác thì mới đi đến quyết định kết quả của chúng có ý nghĩa hay không?

THONG - 090

5474

478

Page 49: 3. Nội dung bài giảng

43 - Những câu trả lời cho câu hỏi thứ (3) đòi hỏi những phép toán thống kê phải được lập thành một trình tự logic nhất định. Khi thiết lập những trình tự như thế cần nêu rõ những thứ tự ưu tiên tính toán và những gì còn đang nghi vấn đối với kết quả đưa ra.

III.3. Tạo ràng buộc khi nhập liệu III.3.1. Lý do tạo ràng buộc khi nhập liệu Trong quá trình làm NCKH, việc tiếp cận hàng trăm, có khi hàng nghìn mẫu điều tra, mỗi mẫu có từ 50÷100 biến thì số liệu nhập vào dao động từ 50.000 ÷ 100.000 số. Với lượng số liệu đồ sộ như vậy khi nhập liệu dễ dẫn đến sai sót với nhiều nguyên nhân như áp lực quá tải, do sơ xuất, có bấm nhầm số…

Số liệu sai sót ảnh hưởng rất lớn đến quá trình nguyên cứu chẳng hạn tính toán không được, tính ra kết quả không đúng, làm ảnh hưởng đến chất lượng công trình nguyên cứu. Nếu gặp phải trường hợp không tính toán được ta lại tốn nhiều thời gian để tìm kiếm sai sót và sữa chữa, trong khi kết quả tính ra sai ta lại khó nhận biết.

III.3.2. Cài đặt chi tiết Những hướng dẫn bên dưới được thực hiện ở Excel 2013 bởi nó đơn giản, dễ sử dụng. Các phiên bản Excel khác có tính năng và cách thực hiện tương tự.

Sử dụng chức năng Data Vilidation trong Excel, mở menu vào Data / Data Vilidation / Data Vilidation, giao diện mở ra như Hình 2. 7. Tại thẻ Setting có mục Allow cho phép ta chọn các loại dữ liệu nhập vào (ví dụ dữ liệu dạng số, dạng ngày tháng..., Hình 2. 78), mục Data cho phép ta đặt các ràng buộc tương ứng với dạng dữ liệu nhập vào (dạng dữ liệu này đã được chọn ở mục Allow). Thẻ Input Message có 2 mục title và input message, thẻ này cho phép ta ghi tiêu đề và nội dung thông báo khi con trỏ chọn 1 ô (cell) đã cài đặt tính năng Validation Hình 2. 9. Thẻ Error Alert có 3 mục, style cho phép ta chọn biểu tượng cảnh báo, title ghi tiêu đề cảnh báo và error message ghi nội dung cảnh báo, Hình 2. 9.

Hình 2. 7: Giao diện Validation Hình 2. 8: Thuộc tính cho phép cài đặt

Hình 2. 9: Tiêu đề, nội dung gợi ý Hình 2. 10: Tiêu đề, nội dung cảnh báo

THONG - 090

5474

478

Page 50: 3. Nội dung bài giảng

44 Đây là mẫu một số dữ liệu tôi cần nhập vào (hình 2.11) và lần lượt cài đặt các tính năng trong Validation. Cột năm sinh thuộc dạng số, 4 số dao động từ 1900 đến 2014, tuy nhiên để đảm bảo tính thực tế tôi sẽ cài đặt tham số này dao động từ 1900 đến 2004 (hình 2.12).

Hình 2. 11: Dữ liệu cần nhập Hình 2. 12: Cài đặt ràng buộc nhập liệu

Hình 2. 13: Cài tiêu đề Hình 2. 14: Cài cảnh báo

Hình 2. 15: Gợi ý khi nhập liệu Hình 2. 16: Cảnh báo khi nhập sai

Tương tự, tùy thuộc vào dạng dữ liệu ở các cột mà ta chọn các nội dung cài tương ứng ở mục Allow, hình 2.12.

III.3.3. Phát hiện sai sót nếu có a. Lọc để xem

Chức năng lọc tự động rất đơn giản, tại giao diện Excel chọn Data / Filter (chọn dòng tiêu đề, sau đó vào Data / Filter, kết quả như hình...

Chọn cột cần kiểm tra, bấm dấu mũi tên xuống để xem. Ở đây tôi chọn cột năm sinh, phát hiện thấy có năm sinh 1901 có dấu hiệu sai vì tính đến năm 2016 thì người này đã 115 tuổi (hình 2.18), do vậy tôi kiểm tra lại số liệu này để hiệu chỉnh sai sót.

THONG - 090

5474

478

Page 51: 3. Nội dung bài giảng

45

Hình 2. 17: Lọc dữ liệu Hình 2. 18: Phát hiện dữ liệu nhập sai

b. Sử dụng chức năng mô tả

Tôi sử dụng chức năng này trong PASW Statistics 18 bằng cách chuyển dữ liệu từ Excel qua PASW để thực hiện như các hình 2.19 đến 2.24.

Hình 2. 19: Mở PAWS với file Excel Hình 2. 20: Chọn sheet chứa dữ liệu

Hình 2. 21: Thuộc tính dữ liệu Hình 2. 22: Dữ liệu Excel thể hiện ở PAWS

Hình 2. 23: Sử dụng phân tích mô tả ở PAWS Hình 2. 24: Chọn dữ liệu để phân tích mô tả

THONG - 090

5474

478

Page 52: 3. Nội dung bài giảng

46

Bảng 2. 4: Kết quả phân tích mô tả yếu tố năm sinh

NamSinh

Frequency Percent Valid Percent Cumulative Percent

Valid 1901 1 10.0 10.0 10.0

1961 2 20.0 20.0 30.0

1967 1 10.0 10.0 40.0

1968 1 10.0 10.0 50.0

1969 1 10.0 10.0 60.0

1975 1 10.0 10.0 70.0

1983 1 10.0 10.0 80.0

1985 1 10.0 10.0 90.0

1988 1 10.0 10.0 100.0

Total 10 100.0 100.0

Từ Bảng 2. 4 cho thấy có 1 giá trị (có 1 người sinh năm 1901), đây là trường hợp sai sót như nêu trên.

III.3.4. Chỉnh sửa dữ liệu bị sai - Tại hình 2.18 chọn ngay giá trị sai sót, kết quả thể hiện và ta xem lại giá trị số liệu phỏng vấn để nhập lại Cell đó.

- Khi phát hiện bằng phần mềm PASW Statistics 18, ta quay lại file Excel dữ liệu, chọn cột có giá trị sai, sau đó bấm Ctrl+F rồi nhập giá trị sai vào. Kết quả tìm kiếm đến ô sai và ta tiến hành sửa chúng, Hình 2. 25.

Hình 2. 25: Tìm kiếm và sửa lỗi

III.3.5. Cảnh báo khi lập liệu trùng trong cùng cột Chẳng hạn ta nhập số đăng ký tàu của vùng nào đó hay nhập mã nhân viên vào 1 cột. Dữ liệu cần là không có bất kỳ trùng lặp nào. Để hạn chế điều này ta: Bôi đen vào dùng sẽ nhập dữ liệu, chọn mục custom như Hình 2. 26.

THONG - 090

5474

478

Page 53: 3. Nội dung bài giảng

47

Hình 2. 26: Cài đặt cảnh báo khi nhập liệu giống nhau trên cùng cột

Chú ý: $A$1:A10 vùng sẽ được lập liệu, A1 là ô bắt đầu nhập liệu.

Ngoài ra, Microsoft Excel còn hỗ trợ ta một số công cụ phát hiện dữ liệu nhập trùng ở 1 cột hay nhiều cột tương ứng với các dòng khác nhau. Vào thẻ home / Conditional formatting / Highlight cells rules / Duplicate values…

III.4. Sử dụng một số hàm thống kê trong Microsoft Excel để phân tích số liệu Các hàm thống kê trong Microsoft Excel có thể chia thành 3 nhóm nhỏ sau: Nhóm hàm về Thống Kê, nhóm hàm về Phân Phối Xác Suất, và nhóm hàm về Tương Quan và Hồi Quy Tuyến Tính.

III.4.1. Nhóm hàm về thống kê AVEDEV (number1, number2, ...): Tính trung bình độ lệch tuyệt đối các điểm dữ liệu theo trung bình của chúng. Thường dùng làm thước đo về sự biến đổi của tập số liệu.

AVERAGE (number1, number2, ...): Tính trung bình cộng.

AVERAGEA (number1, number2, ...): Tính trung bình cộng của các giá trị, bao gồm cả những giá trị logic.

AVERAGEIF (range, criteria1): Tính trung bình cộng của các giá trị trong một mảng theo một điều kiện.

AVERAGEIFS (range, criteria1, criteria2, ...): Tính trung bình cộng của các giá trị trong một mảng theo nhiều điều kiện.

COUNT (value1, value2, ...): Đếm số ô trong danh sách.

COUNTA (value1, value2, ...): Đếm số ô có chứa giá trị (không rỗng) trong danh sách.

COUNTBLANK (range): Đếm các ô rỗng trong một vùng.

COUNTIF (range, criteria): Đếm số ô thỏa một điều kiện cho trước bên trong một dãy.

COUNTIFS (range1, criteria1, range2, criteria2, …): Đếm số ô thỏa nhiều điều kiện cho trước.

THONG - 090

5474

478

Page 54: 3. Nội dung bài giảng

48 DEVSQ (number1, number2, ...): Tính bình phương độ lệch các điểm dữ liệu từ trung bình mẫu của chúng, rồi cộng các bình phương đó lại.

FREQUENCY (data_array, bins_array): Tính xem có bao nhiêu giá trị thường xuyên xuất hiện bên trong một dãy giá trị, rồi trả về một mảng đứng các số. Luôn sử dụng hàm này ở dạng công thức mảng.

GEOMEAN (number1, number2, ...): Trả về trung bình nhân của một dãy các số dương. Thường dùng để tính mức tăng trưởng trung bình, trong đó lãi kép có các lãi biến đổi được cho trước…

HARMEAN (number1, number2, ...): Trả về trung bình điều hòa (nghịch đảo của trung bình cộng) của các số.

KURT (number1, number2, ...): Tính độ nhọn của tập số liệu, biểu thị mức nhọn hay mức phẳng tương đối của một phân bố so với phân bố chuẩn.

LARGE (array, k): Trả về giá trị lớn nhất thứ k trong một tập số liệu.

MAX (number1, number2, ...): Trả về giá trị lớn nhất của một tập giá trị.

MAXA (number1, number2, ...): Trả về giá trị lớn nhất của một tập giá trị, bao gồm cả các giá trị logic và text.

MEDIAN (number1, number2, ...): Tính trung bình vị của các số.

MIN (number1, number2, ...): Trả về giá trị nhỏ nhất của một tập giá trị.

MINA (number1, number2, ...): Trả về giá trị nhỏ nhất của một tập giá trị, bao gồm cả các giá trị logic và text.

MODE (number1, number2, ...): Trả về giá trị xuất hiện nhiều nhất trong một mảng giá trị.

PERCENTILE (array, k): Tìm phân vị thứ k của các giá trị trong một mảng dữ liệu.

PERCENTRANK (array, x, significance): Trả về thứ hạng (vị trí tương đối) của một trị trong một mảng dữ liệu, là số phần trăm của mảng dữ liệu đó.

PERMUT (number, number_chosen): Trả về hoán vị của các đối tượng.

QUARTILE (array, quart): Tính điểm tứ phân vị của tập dữ liệu. Thường được dùng trong khảo sát dữ liệu để chia các tập hợp thành nhiều nhóm…

RANK (number, ref, order): Tính thứ hạng của một số trong danh sách các số.

SKEW (number1, number2, ...): Trả về độ lệch của phân phối, mô tả độ không đối xứng của phân phối quanh trị trung bình của nó.

SMALL (array, k): Trả về giá trị nhỏ nhất thứ k trong một tập số.

STDEV (number1, number2, ...): Ước lượng độ lệch chuẩn trên cơ sở mẫu.

STDEVA (value1, value2, ...): Ước lượng độ lệch chuẩn trên cơ sở mẫu, bao gồm cả những giá trị logic.

STDEVP (number1, number2, ...): Tính độ lệch chuẩn theo toàn thể tập hợp.

THONG - 090

5474

478

Page 55: 3. Nội dung bài giảng

49 STDEVPA (value1, value2, ...): Tính độ lệch chuẩn theo toàn thể tập hợp, kể cả chữ và các giá trị logic.

VAR (number1, number2, ...): Trả về phương sai dựa trên mẫu.

VARA (value1, value2, …): Trả về phương sai dựa trên mẫu, bao gồm cả các trị logic và text.

VARP (number1, number2, ...): Trả về phương sai dựa trên toàn thể tập hợp.

VARPA (value1, value2, …): Trả về phương sai dựa trên toàn thể tập hợp, bao gồm cả các trị logic và text.

TRIMMEAN (array, percent): Tính trung bình phần trong của một tập dữ liệu, bằng cách loại tỷ lệ phần trăm của các điểm dữ liệu ở đầu và ở cuối tập dữ liệu.

III.4.2. Nhóm hàm về phân phối xác suất BETADIST (x, alpha, beta, A, B): Trả về giá trị của hàm tính mật độ phân phối xác suất tích lũy beta.

BETAINV (probability, alpha, beta, A, B): Trả về nghịch đảo của hàm tính mật độ phân phối xác suất tích lũy beta.

BINOMDIST (number_s, trials, probability_s, cumulative): Trả về xác suất của những lần thử thành công của phân phối nhị phân.

CHIDIST (x, degrees_freedom): Trả về xác xuất một phía của phân phối chi-squared.

CHIINV (probability, degrees_freedom): Trả về nghịch đảo của xác xuất một phía của phân phối chi-squared.

CHITEST (actual_range, expected_range): Trả về giá trị của xác xuất từ phân phối chi-squared và số bậc tự do tương ứng.

CONFIDENCE (alpha, standard_dev, size): Tính khoảng tin cậy cho một kỳ vọng lý thuyết.

CRITBINOM (trials, probability_s, alpha): Trả về giá trị nhỏ nhất sao cho phân phối nhị thức tích lũy lớn hơn hay bằng giá trị tiêu chuẩn. Thường dùng để bảo đảm các ứng dụng đạt chất lượng…

EXPONDIST (x, lambda, cumulative): Tính phân phối mũ. Thường dùng để mô phỏng thời gian giữa các biến cố…

FDIST (x, degrees_freedom1, degrees_freedom2): Tính phân phối xác suất F. Thường dùng để tìm xem hai tập số liệu có nhiều mức độ khác nhau hay không…

FINV (probability, degrees_freedom1, degrees_freedom2): Tính nghịch đảo của phân phối xác suất F. Thường dùng để so sánh độ biến thiên trong hai tập số liệu.

FTEST (array1, array2): Trả về kết quả của một phép thử F. Thường dùng để xác định xem hai mẫu có các phương sai khác nhau hay không…

FISHER (x): Trả về phép biến đổi Fisher tại x. Thường dùng để kiểm tra giả thuyết dựa trên hệ số tương quan…

THONG - 090

5474

478

Page 56: 3. Nội dung bài giảng

50 FISHERINV (y): Tính nghịch đảo phép biến đổi Fisher. Thường dùng để phân tích mối tương quan giữa các mảng số liệu…

GAMMADIST (x, alpha, beta, cumulative): Trả về phân phối tích lũy gamma. Có thể dùng để nghiên cứu có phân bố lệch.

GAMMAINV (probability, alpha, beta): Trả về nghịch đảo của phân phối tích lũy gamma.

GAMMLN (x): Tính logarit tự nhiên của hàm gamma.

HYPGEOMDIST (number1, number2, ...): Trả về phân phối siêu bội (xác suất của một số lần thành công nào đó…).

LOGINV (probability, mean, standard_dev): Tính nghịch đảo của hàm phân phối tích lũy lognormal của x (LOGNORMDIST).

LOGNORMDIST (x, mean, standard_dev): Trả về phân phối tích lũy lognormal của x, trong đó logarit tự nhiên của x thường được phân phối với các tham số mean và standard_dev.

NEGBINOMDIST (number_f, number_s, probability_s): Trả về phân phối nhị thức âm (trả về xác suất mà sẽ có number_f lần thất bại trước khi có number_s lần thành công, khi xác suất không đổi của một lần thành công là probability_s).

NORMDIST (x, mean, standard_dev, cumulative): Trả về phân phối chuẩn (normal distribution). Thường được sử dụng trong việc thống kê, gồm cả việc kiểm tra giả thuyết.

NORMINV (probability, mean, standard_dev): Tính nghịch đảo phân phối tích lũy chuẩn.

NORMSDIST (z): Trả về hàm phân phối tích lũy chuẩn tắc (standard normal cumulative distribution function), là phân phối có trị trung bình cộng là zero (0) và độ lệch chuẩn là 1.

NORMSINV (probability): Tính nghịch đảo của hàm phân phối tích lũy chuẩn tắc.

POISSON (x, mean, cumulative): Trả về phân phối poisson. Thường dùng để ước tính số lượng biến cố sẽ xảy ra trong một khoảng thời gian nhất định.

PROB (x_range, prob_range, lower_limit, upper_limit): Tính xác suất của các trị trong dãy nằm giữa hai giới hạn.

STANDARDIZE (x, mean, standard_dev): Trả về trị chuẩn hóa từ phân phối biểu thị bởi mean và standard_dev.

TDIST (x, degrees_freedom, tails): Trả về xác suất của phân phối Student (phân phối t), trong đó x là giá trị tính từ t và được dùng để tính xác suất.

TINV (probability, degrees_freedom): Trả về giá trị t của phân phối Student.

TTEST (array1, array2, tails, type): Tính xác xuất kết hợp với phép thử Student.

WEIBULL (x, alpha, beta, cumulative): Trả về phân phối Weibull. Thường sử dụng trong phân tích độ tin cậy, như tính tuổi thọ trung bình của một thiết bị.

ZTEST (array, x, sigma): Trả về xác suất một phía của phép thử z.

THONG - 090

5474

478

Page 57: 3. Nội dung bài giảng

51 III.4.3. Nhóm hàm về tương quan và hồi quy tuyến tính CORREL (array1, array2): Tính hệ số tương quan giữa hai mảng để xác định mối quan hệ của hai đặc tính.

COVAR (array1, array2): Tính tích số các độ lệch của mỗi cặp điểm dữ liệu, rồi tính trung bình các tích số đó.

FORECAST (x, known_y's, known_x's): Tính toán hay dự đoán một giá trị tương lai bằng cách sử dụng các giá trị hiện có, bằng phương pháp hồi quy tuyến tính.

GROWTH (known_y's, known_x's, new_x's, const): Tính toán sự tăng trưởng dự kiến theo hàm mũ, bằng cách sử dụng các dữ kiện hiện có.

INTERCEPT (known_y's, known_x's): Tìm điểm giao nhau của một đường thẳng với trục y bằng cách sử dụng các trị x và y cho trước.

LINEST (known_y's, known_x's, const, stats): Tính thống kê cho một đường bằng cách dùng phương pháp bình phương tối thiểu (least squares) để tính đường thẳng thích hợp nhất với dữ liệu, rồi trả về mảng mô tả đường thẳng đó. Luôn dùng hàm này ở dạng công thức mảng.

LOGEST (known_y's, known_x's, const, stats): Dùng trong phân tích hồi quy. hàm sẽ tính đường cong hàmmũ phù hợp với dữ liệu được cung cấp, rồi trả về mảng gía trị mô tả đường cong đó. Luôn dùng hàm này ở dạng công thức mảng.

PEARSON (array1, array2): Tính hệ số tương quan momen tích pearson ®, một chỉ mục không thứ nguyên, trong khoảng từ -1 đến 1, phản ánh sự mở rộng quan hệ tuyến tính giữa hai tập số liệu.

RSQ (known_y's, known_x's): Tính bình phương hệ số tương quan momen tích Pearson ®, thông qua các điểm dữ liệu trong known_y's và known_x's.

SLOPE (known_y's, known_x's): Tính hệ số góc của đường hồi quy tuyến tính thông qua các điềm dữ liệu.

STEYX (known_y's, known_x's): Trả về sai số chuẩn của trị dự đoán y đối với mỗi trị x trong hồi quy.

TREND (known_y's, known_x's, new_x's, const): Trả về các trị theo xu thế tuyến tính

III.4.4. Sử dụng các công cụ tích hợp trong Add in của Microsoft Excel 2013 Ngoài cách dùng các hàm trên ta còn dùng menu Analysis ToolPak cài đặt theo 2 cách sau:

Cách 1: Giao diện Excel 2013 chọn menu File / Options / Add-in / Analysis ToolPak / Go Hình 2. 27 / Analysis ToolPak / Ok Hình 2. 28.

THONG - 090

5474

478

Page 58: 3. Nội dung bài giảng

52

Hình 2. 27: Cài đặt công cụ Analysis ToolPak

Hình 2. 28: Kích hoạt công cụ Analysis ToolPak

Cách 2: Giao diện Excel 2013 chọn menu Developer / Add-in / Analysis ToolPak à OK (Hình 2.28).

Thực hiện xong 2 cách trên, các chức năng của công cụ Analysis ToolPak đã được hiện thị. Ngay giao diện Excel 2013, chọn Data, nhìn góc trên bên phải nhấn Data Analysis, các công cụ hiển thị như Hình 2. 29.

Hình 2. 29: Các chức năng của Analysis Tool

THONG - 090

5474

478

Page 59: 3. Nội dung bài giảng

53 IV. Xử lý số liệu và đánh giá trong Microsoft Excel IV.1. Thống kê mô tả (Descriptive statistics)

IV.1.1. Bảng phân phối tần số - bảng phân phối tần suất Ví dụ: Lập bảng phân phối tần số, tần suất và vẽ biểu đồ dữ liệu sau:

12, 13, 11, 13, 15, 12, 11, 10, 14, 13, 12, 15

Giải:

F Lập bảng phân phối tần số:

- Nhập dữ liệu vào bảng tính Excel từ cột A4:A15.

- Nhập cột giá trị để xác định tần số, tần suất vào cột C4:C9.

- Đánh dấu khối cột tần số từ D4:D9, nhấn F2 rồi nhập công thức = frequency (A4:A15, C4:C9) và ấn ctrl+shift +enter. Hoặc tại ô D4 ta nhập công thức =Countif($A$4:$A$15,C4) rồi nhấn Enter cho kết quả. Tiếp tực kéo xuống các ô còn lại cũng cho kết quả.

F Lập bảng phân phối tần suất: Nhập vào E4 công thức =D4/$D$10, copy các ô còn lại (kéo xuống để có giá trị các ô còn lại).

Hình 2. 30: Tính tần số Hình 2. 31: Tính tần suất

@ Nhập dữ liệu

@ Dùng hàm: frequency (data_array, bins_array)

data_array: Địa chỉ mảng dữ liệu

bins_array: Địa chỉ mảng các giá trị khác nhau của dữ liệu

THONG - 090

5474

478

Page 60: 3. Nội dung bài giảng

54 Vẽ biểu đồ - Dùng chuột chọn vùng dữ liệu cần vẽ biểu đồ, có thể chọn cả vùng tiêu đề (C3:E9) - Chọn menu Insert / chart / Recommended chart (All chart) / Line / Ok. - Chọn vào đường tần suất, vào menu Format / Format selection / Secondary / Axis - Chọn trục trung thứ 2 (trục tần suất), chuột phải / Format axis / thay đổi giá trị Max, Min, Major, Minor, … - Nhấn chuột phải vào các đường tần số, tần suất, chọn add data labels / add data labels (dữ liệu đã xuất hiện tại các điểm mốc trên đường. - Có thể thay đổi màu sắc, loại đường, … cho biểu đồ như ý người dùng.

Hình 2. 32: Biểu đồ tần số và tần suất

IV.1.2. Đặc trưng mẫu Sử dụng công cụ Analysis toolpak, chức năng Descriptive statistics đã được kích hoạt ở hình Hình 2. 28 và hình Hình 2. 29. Ví dụ: Tính đặc trưng mẫu của dữ liệu sau:

12, 13, 11, 13, 15, 12, 11, 10, 14, 13, 12, 15 - Nhập dữ liệu vào bảng tính Excel từ cột A4:A15 - Vào menu Data / Data analysis / Descriptive Statistics / Ok. - Nhập và chọn các thông số như Hình 2. 33.

Hình 2. 33: Cài đặt phân tích thống kê mô tả

1

2

3 3

1

2

0.083

0.167

0.250 0.250

0.083

0.167

0.0000.0500.1000.1500.2000.2500.3000.350

00.5

11.5

22.5

33.5

10 11 12 13 14 15

Biểu đồ tần số, tần suất

Tần số (n) Tần suất (f)

THONG - 090

5474

478

Page 61: 3. Nội dung bài giảng

55 4Kết quả

Bảng 2. 5: Kết quả phân tích thống kê mô tả

Các thống kê mô tả Kết quả Công thức Tên các thông số Dùng hàm trong Excel

Mean 12.58333333 x� Giá trị trung bình Average (A4:A15)

Standard Error 0.451568535 S�√n

Sai số mẫu

Median 12.5 Trung vị Median (A4:A15)

Mode 12 Mode Mode (A4:A15)

Standard Deviation 1.56427929 S� Độ lệch chuẩn Stdev (A4:A15)

Sample Variance 2.446969697 Phương sai mẫu Var (A4:A15)

Kurtosis -0.617684441 Độ nhọn của đỉnh Kurt (A4:A15)

Skewness 0.157146128 Độ nghiêng Skew (A4:A15)

Range 5 Khoảng biến thiên Max (A4:A15) – Min (A4:A15)

Minimum 10 Giá trị lớn nhất Min (A4:A15)

Maximum 15 Giá trị nhỏ nhất Max (A4:A15)

Sum 151 Tổng các giá trị Sum (A4:A15)

Count 12 n Số lượng mẫu Count (A4:A15)

Confidence Level(95.0%) 0.993895643

t∝ S�√n Độ chính xác Confidence (0,05, Sx, n)

Chú ý: Khi mẫu lớn hơn 30 (n≥30) ta thay �∝ ��√� bằng �∝ ��√� trong đó Za=Normsinv(1-a/2).

IV.2. Ước lượng tham số Để ước lượng trung bình đám đông (quần thể) ABC ta thực hiện các bước sau:

- Nhập dữ liệu mẫu và xử lý mẫu bằng thống kê mô tả (Descriptive statistics).

- Tính các khoảng ước lượng ABC theo công thức x� ± z∝ ��√� hoặc x� ± t∝ ��√� .

Ví dụ: Khảo sát sản lượng khai thác (kg) tàu lưới vây xa bờ, người ta thu mẫu 9 mẻ lưới được kết quả lần lượt như sau:

4500; 6500; 5000; 5200; 4800; 4900; 5125; 6200; 5375

Hình 2. 34: Cài đặt phân tích mô tả về sản lượng

THONG - 090

5474

478

Page 62: 3. Nội dung bài giảng

56

Bảng 2. 6: Kết quả ước lượng tham số

IV.3. Kiểm định giả thiết IV.3.1. So sánh 2 trung bình với phương sai đã biết hay mẫu lớn (n≥30)

Ví dụ: Người ta chọn 2 mẫu, mỗi mẫu 10 máy, từ hai lô (I và II được sản xuất với phương sai biết trước tương ứng là 1 và 0,98) để khảo sát thời gian hoàn thành công việc (phút) của chúng:

I: 6, 8, 9, 10, 6, 15, 9, 7, 13, 11

II: 5, 5, 4, 3, 9, 9, 6, 13, 17, 12

Hỏi khả năng hoàn thành công việc của hai máy có khác nhau hay không? a=0,05

Cách làm:

4Nhập liệu, điền thông tin xử lý như hình 2.35.

@ Dùng menu Data / Data analysis / z-test: Two sample for means

@ Tiêu chuẩn kiểm định � = ������������������������� @ Phân vị 2 phía za/2 là: z Critical two-tail

@ Nếu: |�| > �∝/� thì bác bỏ H0, chấp nhận H1 |�| ≤ �∝/� thì bác bỏ H1, chấp nhận H0 THONG - 090

5474

478

Page 63: 3. Nội dung bài giảng

57

Hình 2. 35: Cài đặt phân tích 2 trung bình với phương sai đã biết

4Kết quả:

Bảng 2. 7: Kết quả phân tích 2 trùng bình với phương sai đã biết

4Kiểm định:

+ Giả thiết: H0: aI=aII: “Khả năng hoàn thành công việc của 2 máy như nhau”.

H1: aI¹aII: “Khả năng hoàn thành công việc của 2 máy khác nhau”.

+ Ta có ½z½=2.472066162 > za/2=1.959962787, nên bác bỏ H0, chấp nhận H1.

4Kết luận: Khả năng hoàn thành công việc cua 2 máy là khác nhau.

THONG - 090

5474

478

Page 64: 3. Nội dung bài giảng

58 IV.3.2. So sánh 2 trung bình với dữ liệu từng cặp

Ví dụ: Để nghiên cứu tính chọn lọc của lưới kéo đối với cá mối bằng cách thay đổi kích thước mắt lưới, người ta tiến hành lắp lưới có kích thước mắt lưới a1 > a0 vào đụt lưới (a0 là kích thước mắt lưới cũ), tiến hành đánh bắt 10 mẻ, kích thước trung bình (cm) của cá mối được giữ lại trong đụt như sau:

Bảng 2. 8: Kích thước trung bình cá mối

Số mẻ 1 2 3 4 5 6 7 8 9 10 a1 6,1 7,0 8,2 7,6 6,5 8,4 6,9 6,7 7,4 5,8

a0 5,2 7,9 3,9 4,7 5,3 5,4 4,2 6,1 3,8 6,3

Giả sử kích thước trung bình cá mối đánh bắt được ở mỗi mẻ lưới có qui luật chuẩn. Với mức ý nghĩa a=0,05 hãy kết luận về ảnh hưởng của kích thước mắt lưới a1 trên.

4Nhập liệu, điền thông tin xử lý như Hình 2. 36.

Hình 2. 36: Cài đặt dữ liệu cho phân tích so sánh từng cặp

@ Được dùng khi mẫu bé, phụ thuộc, phương sai hai mẫu không bằng nhau và mỗi phần tử khảo sát có 2 chỉ tiêu X (trước), Y (sau) khi thay đổi điều kiện thí nghiệm.

@ Dùng menu Data / Data analysis / t-test: Pair two sample for means

@ Tiêu chuẩn kiểm định � = ����√� , �� = ∑ (�����)���� � , �� = �∑ (�����)��������

@ Phân vị 2 phía ta/2 là: t Critical two-tail

@ Nếu: |�| > �∝/� thì bác bỏ H0, chấp nhận H1 |�| ≤ �∝/� thì bác bỏ H1, chấp nhận H0

THONG - 090

5474

478

Page 65: 3. Nội dung bài giảng

59 4Kết quả:

Bảng 2. 9: Kết quả so sánh 2 trung bình với dữ liệu từng cặp

4Kiểm định:

+ Giả thiết: H0: a1=a0: “Kích thước mắt lưới trên không có tác dụng chọn lọc”.

H1: a1¹a0: “Kích thước mắt lưới trên không có tác dụng chọn lọc”.

+ Ta có ½t½=3.1835 > ta/2=2.2622, nên bác bỏ H0, chấp nhận H1.

4Kết luận: Kích thước mắt lưới a1 có tác chọn lọc, làm tăng kích thước cá mối bị giữ lại trong đụt lưới kéo.

IV.3.3. So sánh 2 trung bình với phương sai bằng nhau

Ví dụ: So sánh kích thước trung bình (cm) cá mối thoát ra ngoài đụt lưới kéo của dân (kích thước mắt lưới a1) với kích thước trung bình (cm) cá mối trong mẫu đụt thử nghiệm (kích thước mắt lưới a2). Cách tiến hành là dùng bao đụt có kích thước rất nhỏ

@ Được dùng khi mẫu bé, độc lập và phương sai 2 mẫu bằng nhau.

@ Dùng menu Data / Data analysis / t-test: Two-sample assuming equal variances.

@ Tiêu chuẩn kiểm định � = �����������������( ���� ���) , ��� = (����)����(����)����������

@ Phân vị 2 phía ta/2 là: t Critical two-tail

@ Nếu: |�| > �∝/� thì bác bỏ H0, chấp nhận H1 |�| ≤ �∝/� thì bác bỏ H1, chấp nhận H0

THONG - 090

5474

478

Page 66: 3. Nội dung bài giảng

60 bọc ngoài đụt lưới để giữ lại lượng cá thoát ra rồi xác định kích thước trung bình. Tiến hành thực hiện với 10 tàu của dân và 10 tàu thử nghiệm cho kết quả như sau:

Bảng 2. 10: Kích thước cá mối thoát ra qua hai mẫu lưới

Tàu số 1 2 3 4 5 6 7 8 9 10 Thử nghiệm 1,10 0,99 1,05 1,01 1,02 1,07 1,10 0,98 1,03 1,12

Của dân 1,25 1,31 1,28 1,20 1,18 1,22 1,22 1,17 1,19 1,21

Với a=0,05 hãy cho biết kích thước mắt lưới có tác dụng đến tính chọn lọc của cá mối hay không ?

4Nhập liệu, điền thông tin xử lý như Hình 2. 37.

Hình 2. 37: Cài đặt số liệu cho so sánh 2 trung bình với phương sai bằng nhau

4Kết quả:

Bảng 2. 11: Kết quả phân tích 2 trung bình với phương sai bằng nhau

4Kiểm định:

+ Giả thiết: H0: a1=a2 “Hai kích thước mắt lưới có tác dụng như nhau”

H1: a1<a2 “Kích thước mắt lưới mẫu thử nghiệm có tác dụng chọn lọc”

THONG - 090

5474

478

Page 67: 3. Nội dung bài giảng

61 + Ta có: t= - 8.388352782 < - ta/2= - 2.10092204, nên chấp nhận H1.

4Kết luận: Vậy thời gian tắt đèn của hai tàu là như nhau.

IV.3.4. So sánh 2 trung bình với phương sai khác nhau

Ví dụ: Thời gian tắt nguồn sáng chính để tập trung cá tới bè đèn của hai tàu lưới vây ánh sáng xa bời được ghi nhận qua 8 lần quan sát được kết quả sau:

Tàu 1: 61, 71, 68, 73, 71, 70, 69, 74

Tàu 2: 62, 69, 65, 65, 70, 71, 68, 73

Hỏi thời gian tắt nguồn sáng chính để tập trung cá tới bè đèn của 2 tàu có giống nhau không?

4Nhập liệu, điền thông tin xử lý như Hình 2. 38.

Hình 2. 38: Cài đặt số liệu cho so sánh 2 trung bình với phương sai khác nhau

@ Được dùng khi mẫu bé, độc lập và phương sai 2 mẫu khác nhau.

@ Dùng menu Data / Data analysis / t-test: Two-sample assuming unequal variances.

@ Tiêu chuẩn kiểm định � = ������������������������� @ Phân vị 2 phía ta/2 là: t Critical two-tail

@ Nếu: |�| > �∝/� thì bác bỏ H0, chấp nhận H1 |�| ≤ �∝/� thì bác bỏ H1, chấp nhận H0

THONG - 090

5474

478

Page 68: 3. Nội dung bài giảng

62 4Kết quả:

Bảng 2. 12: Kết quả phân tích 2 trung bình với phương sai khác nhau

4Kiểm định:

+ Giả thiết: H0: a1=a0: “Thời gian tắt đèn của 2 tàu là như nhau”.

H1: a1¹a0: “Thời gian tắt đèn của 2 tàu là khác nhau”.

+ Ta có ½t½=0.91521 £ ta/2=2.14479, nên chấp nhận H0.

4Kết luận: Vậy thời gian tắt đèn của hai tàu là như nhau.

IV.3.5. So sánh 2 phương sai

Ví dụ: Yếu tố Y nào đó phân tích bởi hai phương pháp A và B với kết quả sau:

A 6.4 5.2 4.8 5.2 4.3 4.4 5.1 5.8

B 2.6 3.5 3.4 3.2 3.4 2.8 2.9 2.8

@ So sánh 2 phương sai được áp dụng để so sánh độ chính xác của 2 phương pháp định lượng khác nhau.

@ Dùng hàm Data / Data analysis / F-test: Two-sample for variances.

@ Tiêu chuẩn kiểm định � = ������ @ Nếu: F < Fa thì chấp nhận H0, ��� = ���

F ≥ Fa thì chấp nhận H1, ��� ≠ ���

THONG - 090

5474

478

Page 69: 3. Nội dung bài giảng

63 Cho biết phương pháp nào chính xác hơn ?

4Nhập liệu, điền thông tin xử lý như Hình 2. 39.

Hình 2. 39: Cài đặt số liệu phân tích so sánh 2 phương sai

4Kết quả:

Bảng 2. 13: Kết quả phân tích so sánh 2 phương sai

4Kiểm định:

+ Giả thiết: H0: σ��=σ�� : “Hai phương pháp có độ chính xác như nhau”.

H1: σ��>σ�� : “Độ chính xác của phương pháp B cao hơn phương pháp A”.

+ Ta có F=4.17178 > Fa=3.78704, nên chấp nhận H1.

4Kết luận: Vậy phương pháp B chính xác hơn phương pháp A.

THONG - 090

5474

478

Page 70: 3. Nội dung bài giảng

64 IV.4. Phân tích phương sai (anova) IV.4.1. Phân tích phương sai một nhân tố Giả sử nhân tố A có k mức X1, X2, ... , Xk, với Xj, có phân phối chuẩn N (a, σ�) có mẫu điều tra dạng như sau:

X1 X2 ... Xk

x11

x21

:

: x���

x12

x22

:

: x���

...

x1k

x2k

:

: x���

Với mức ý nghĩa α, hãy kiểm định giả thiết:

H0 : a1 = a2 = ... = ak

H1 : Tồn tại j� ≠ j� sao cho a�� ≠ a��

Đặt:

· Tổng số quan sát: � = ∑ ������ · Trung bình mẫu nhóm j (j = 1, .., k): �� = ���∑ �������� = ���� �ớ� �� = ∑ ��������

· Trung bình mẫu chung: �� = ��∑ ∑ ��� = �� �ớ� � = ∑ ∑ �������� =������������� ∑ ������ · Phương sai hiệu chỉnh nhóm j: ��� = ��� �� ∑ (��� − ��� )������

· SST = ∑ ∑ �x�� − x� ����������� Tổng bình phương các độ lệch.

· SSA = ∑ n��x�� − x� ������ Tổng bình phương độ lệch riêng của các nhóm so với x� · SST = ∑ ∑ x��� − ������������ SSA = ∑ ����� − �������

· MSA = ������ SSE = SST – SSA MSE = ������ · Nếu H0 đúng thì F = ������ có phân phối Fisher bậc tự do k – 1; n – k · Miền B�: F > F���;���;�� �:

Bảng 2. 14: Bảng ANOVA

Nguồn sai số Tổng bình phương SS

Bậc tự do df Bình phương trung bình MS

Giá trị thống kê F

Yếu tố

(Between Group)

SSA k - 1 MSA = SSAk − 1 F = MSAMSE

Sai số

(Within Group)

SSE = SST – SSA n - k MSE = SSEn − k

Tổng cộng SST n - 1

THONG - 090

5474

478

Page 71: 3. Nội dung bài giảng

65 Ví dụ: Kích thước loài cá X đánh bắt trên 3 vùng biển Bắc Bộ (BB), Trung Bộ (TB), Tây Nam Bộ (TNB) như sau:

BB: 7,5 6,8 7,1 7,5 6,8 6,6 7,8

TB: 5,8 5,6 6,1 6,0 5,7

TNB: 6,1 6,3 6,5 6,4 6,5 6,3

Hỏi kích thước của loài cá X có khác nhau theo vùng miền không?

4Nhập liệu, điền thông tin xử lý như Hình 2. 40.

Hình 2. 40: Cài đặt số liệu phân tích phương sai một nhân tố

4Kết quả:

Bảng 2. 15: Bảng Anova từng nhân tố

Bảng 2. 16: Bảng Anova tổng hợp các nhân tố

4Kiểm định: F=2656.15 > Fcrit =3.68232, nên bác bỏ H0, chấp nhận H1.

4Kết luận: Kích thước của loài cá X có khác nhau ở những ngư trường khác nhau.

THONG - 090

5474

478

Page 72: 3. Nội dung bài giảng

66 IV.4.2. Phân tích phương sai hai nhân tố không lặp Phân tích nhằm đánh giá sự ảnh hưởng của 2 nhân tố A và B trên các giá trị quan sát xị

Giả sử nhân tố: A có mức n mức a1, a2, ..., an (nhân tố hàng)

B có mức m mức b1, b2, ..., bm (nhân tố cột)

* Mẫu điều tra:

Bảng 2. 17: Dạng phân bố số liệu

B A b1 b2 ... bm

a1 x11

x12 ... x1m

a2 x21

x22 ... x2m

: : : :

an xn1

xn1 ... xnm

*Giả thiết H0:

· Trung bình nhân tố cột bằng nhau · Trung bình nhân tố hàng bằng nhau · Không có sự tương tác giữa nhân tố cột và hàng

*Tiến hành tính toán theo bảng dưới đây:

Bảng 2. 18: Bố trí tính toán số liệu

B A b1 b2 ... bm

��� = � ���� � ���� a1 x11

x12 ... x1m

��∗ � �����

a2 x21

x22 ... x2m

��∗ � �����

: : : :

: : : :

an xn1

xn1 ... xnm

� ����� �∗�= � ���� �∗� �∗� ... �∗� ��� = � ����.�

� ����� � ����� � ����� � ����� � �������

THONG - 090

5474

478

Page 73: 3. Nội dung bài giảng

67 Bảng ANOVA

Bảng 2. 19: Kết quả phân tích ANOVA Nguồn SS df MS F

Yếu tố A SSA = ∑ T∗���m − T�m. n n - 1 MS (A = SSAn − 1)

F� = SSASSE

Yếu tố B SSB = ∑ T∗���n − T�m. n m - 1 MSB = SSBm − 1

F� = SSBSSE

Sai số SSE = SST – SSA - SSB (n-1)(m-1)

MSE = SSE(n − 1)(m − 1)

Tổng SST = � x����,� − T�m. n nm - 1

*Kết luận: · Nếu F� > F���;(���)(���);�� � thì bác bỏ yếu tố A (hàng). · Nếu F� > F���;(���)(���);�� � thì bác bỏ yếu tố B (cột).

Ví dụ: Sản lượng (kg) của tàu lưới kéo kéo lưới trong 1 giờ khi thay đổi các yếu tố về tốc độ dắt lưới v1, v2, v3 và kích thước mắt lưới a1, a2, a3, a4, a5 như bảng sau:

Bảng 2. 20: Bố cục số liệu khảo sát v (hl/h)

a (mm) v1 v2 v3

a1 120 60 60 a2 120 70 50 a3 130 60 50 a4 150 70 60 a5 110 75 54

Hãy xét ảnh hưởng của tốc độ và kích thước mắt lưới đến sản lượng khai thác tàu lưới kéo với mức ý nghĩa a=0,05. 4Nhập liệu, điền thông tin xử lý như hình 2.41.

Hình 2. 41: Cài đặt số liệu phân tích phương sai hai nhân tố không lặp

THONG - 090

5474

478

Page 74: 3. Nội dung bài giảng

68 4Kết quả:

Bảng 2. 21: Kết quả phân tích Anova phương sai hai nhân tố không lặp

Bảng 2. 22: Kết quả phân tích phương sai hai nhân tố không lặp, theo hàng, cột

4Kiểm định:

Giả thiết H0: * Trung bình của 3 tốc độ kéo lưới bằng nhau.

* Trung bình của 5 kích thước mắt lưới bằng nhau.

* Không có sự tương tác giữa tốc độ dắt lưới và kích thước mắt lưới.

Kiểm tra:

Fa =1.12491 < Fcrit = 7.00608, nên chọn H0, bác bỏ H1.

Fv=75.4622 > Fcrit = 8.64911, nên chọn H1, bác bỏ H0

4Kết luận:

- Yếu tố kích thước mắt lưới không ảnh hưởng đến sản lượng khai thác.

- Yếu tố tốc độ dắt lưới có ảnh hưởng đến sản lượng khai thác.

THONG - 090

5474

478

Page 75: 3. Nội dung bài giảng

69 IV.4.3. Phân tích phương sai hai nhân tố có lặp Tương tự như bài toán phân tích phương sai 2 nhân tố không lặp, chỉ khác mỗi mức ((ai, bj) đều có sự lặp lại r lần thí nghiệm và ta cần khảo sát thêm sự tương tác (interaction term) FAB giữa 2 nhân tố A và B. *Mẫu điều tra:

Bảng 2. 23: Phân bố dữ liệu cho phân tích phương sai hai nhân tố có lặp B A b1 b2 ... bm

a1

x111 x112 : x11r

x121 x122 : x12r

...

x1m1 x1m2 : x1mr

a2

x211 x212 : x21r

x221 x222 : x22r

...

x2m1 x2m2 : x2mr

: : : :

an

xn11 xn12 : xn1r

xn21 xn22 : xn2r

...

xnm1 xnm2 : xnmr

*Xử lý mẫu: Tính tổng hàng ��∗∗ = ∑ �����,� , tổng cột �∗�∗ = ∑ �����,�

Bảng 2. 24: Tính toán dữ liệu cho phân tích phương sai hai nhân tố có lặp

B A b1 b2 ... bm ��∗∗ a1

x111 x112 : x11r

x121 x122 : x12r

...

x1m1 x1m2 : x1mr

��∗∗ = � �����,�

a2

x211 x212 : x21r

x221 x222 : x22r

...

x2m1 x2m2 : x2mr

��∗∗ = � �����,�

: : : :

an

xn11 xn12 : xn1r

xn21 xn22 : xn2r

...

xnm1 xnm2 : xnmr

��∗∗ = � �����,�

�∗�∗ �∗�∗ = � �����,� �∗�∗= � �����,�

�∗�∗= � �����,� � = � �����.�,�

THONG - 090

5474

478

Page 76: 3. Nội dung bài giảng

70 Cần tính: ∑ ������,�,� ∑ ��∗∗�� ∑ �∗�∗�� ∑ ���∗��,�

Suy ra: SST = ∑ (x��� − x�)� = ∑ x���� − ������,�,��,�,�

SSA = mr �(x�∗∗����� − x�)� = ∑ T�∗∗��mr − T�nmr�,

SSB = nr �(x��∗���� − x�)� = ∑ T∗�∗��nr − T�nmr�

SSAB = r �(x��∗���� − x�∗∗����� − x∗�∗���� + x�)� = ∑ T��∗��,�r − ∑ T∗�∗��nr − ∑ T�∗∗��mr + T�nmr�,�

SSE = SST − SSA − SSB − SSAB = � ������,�,� − ∑ x��∗��,�r

*BẢNG ANOVA

Bảng 2. 25: Bảng phân bố dữ liệu phân tích ANOVA

Nguồn SS df MS F

Yếu tố A SSA n - 1 MSA = SSAn − 1)

F� = MSAMSE

Yếu tố B SSB m - 1 MSB = SSBm − 1

F� = MSBMSE

Tương tác AB SSAB (n-1)(m-

1)

MSAB= SSAB(n − 1)(m − 1)

F�� = MSABMSE

Sai số SSE nm(r-1) MSE = SSEnm(r − 1)

Tổng SST nmr - 1

* Kết luận:

· Nếu F� > F���; ��(���);�� � thì bác bỏ yếu tố A (hàng). · Nếu F� > F���; ��(���);�� � thì bác bỏ yếu tố B (cột). · Nếu F�� > F(���)(���); ��(���);�� � thì có sự tương tác giữa A và B.

THONG - 090

5474

478

Page 77: 3. Nội dung bài giảng

71 Ví dụ:

Trọng lượng loài cá X được khai thác vào vụ cá Bắc và vụ cá Nam với 3 thời điểm khác nhau (đầu vụ, giữa vụ, cuối vụ) tại 3 ngư trường khác nhau BB, TB, TNB. Kết quả như bảng sau:

Bảng 2. 26: Số liệu điều tra

Vụ Thời điểm Ngư trường

BB TB TNB

Vụ Bắc Đầu vụ 2,4 2,1 3,2

Giữa vụ 2,4 2,2 3,2

Cuối vụ 2,5 2,2 3,4

Vụ Nam Đầu vụ 2,5 2,2 3,4

Giữa vụ 2,5 2,3 3,5

Cuối vụ 2,6 2,3 3,5

Hãy cho biết trọng lượng loài cá X có khác nhau theo Vụ hay Ngư trường không? Nếu có thì 2 yếu tố mùa vụ và ngư trường có sự tương tác với nhau hay không? Với mức ý nghĩa a= 0,05.

4Nhập liệu, điền thông tin xử lý như hình 2.42.

Hình 2. 42: Cài đặt số liệu phân tích ANOVA hai nhân tố có lặp

4Kết quả:

Bảng 2. 27: Kết quả phân tích ANOVA hai nhân tố có lặp

THONG - 090

5474

478

Page 78: 3. Nội dung bài giảng

72 4Kiểm định và kết luận:

- Fvụ=16 > Fcrit =4.74723, trọng lượng loài cá X khác nhau theo vụ.

- Fngư trường = 434.778 > Fcrit = 8.88529, trọng lượng loài cá X khác nhau theo ngư trường.

- Fvụ-ngư trường =1 < Fcrit = 3.88529, ngư trường và mùa vụ không có tương tác với nhau.

IV.5. Tương quan – Hồi quy IV.5.1. Tương quan (Correlation)

Ví dụ: Khảo sát kích thước lưới rê (chiều dài lưới rê (m), chiều cao lưới rê (m)) với sản lượng khai thác được (kg) ta có bảng sau:

Bảng 2. 28: Số liệu điều tra kích thước lưới rê

Chiều dài (m) Chiều cao (m) Sản lượng (kg) 500 30 5.000

700 45 5.600

1.000 50 7.000

1.200 60 8.000

450 30 2.500

600 40 4.000

900 50 6.500

1.000 55 8.000

800 45 8.000

900 50 6.000

@ Hệ số tương quan � = ∑ �����∑��∑�����∑ ����(∑��)����∑����(∑��)�� @ Nếu: R > 0 thì X, Y tương quan thuận

R < 0 thì X, Y tương quan nghịch

@ Nếu: R = 0 thì X, Y không tương quan

½R½=1 thì X, Y có quan hệ hàm số bậc nhất

½R½à 1 thì X, Y thì X, Y có tương quan chặt (tương quan mạnh)

½R½à 0 thì X, Y thì X, Y có tương quan không chặt (tương quan yếu)

THONG - 090

5474

478

Page 79: 3. Nội dung bài giảng

73 4Nhập liệu, điền thông tin xử lý như hình 2.43 (Data / Data analysis / Correlation)

Hình 2. 43: Cài đặt dữ liệu phân tích tương quan

4Kết quả:

Bảng 2. 29: Hệ số tương quan các nhân tố

4Kiểm định:

F Lý thuyết

- Để chặt chẻ hơn cho kết luận, sau khi tính ra r ta cần so sánh nó với giá trị rcrit. (rcrit được tra bảng 1 ở phụ lục).

- Nếu ½r½> rcrit: Kết luận hai biến X, Y có tương quan thuận (hoặc nghịch) đáng kể với mức ý nghĩa α nào đó.

- Nếu ½r½< rcrit: Kết luận hai biến X, Y có tương quan thuận (hoặc nghịch) không đáng kể với mức ý nghĩa α nào đó.

- Để tra bảng 1 ở phục lục ta có các mức ý nghĩa a=0,1; 0,05; 0,02; 0,01. df=n-2 (n số lượng mẫu điều tra).

F Kết quả

+ ½r½chiều dài-sản lượng = 0,853176412 > rcrit=0,632 (df =10 - 2 = 8, a = 0,05).

+ ½r½chiều cao-sản lượng = 0,853176412 < rcrit=0,632 (df =10 - 2 = 8, a = 0,05).

4Kết luận:

- Chiều dài lưới và sản lượng có mối tương quan thuận, mức độ tương quan mạnh (r=0,853176412) với mức ý nghĩa a=0,05.

THONG - 090

5474

478

Page 80: 3. Nội dung bài giảng

74 - Chiều cao lưới và sản lượng có mối tương quan thuận, mức độ tương yếu (r=0,181740612) với mức ý nghĩa a=0,05.

Bảng 2. 30: Mức độ tương quan giữa các biến [10]

Mức độ tương quan (r), không quan tâm dấu

Nhận xét

0,01 đến 0,1 Mối tương quan quá thấp, không đáng kể 0,2 đến 0,3 Mối tương quan thấp 0,4 đến 0,5 Mối tương quan trung bình 0,6 đến 0,7 Mối tương quan cao 0,8 trở lên Mối tương quan rất cao

IV.5.2. Hồi quy đơn tuyến tính

Ví dụ: Tốc độ dắt lưới (hải lý/giờ) của lưới kéo với sản lượng khai thác/ mẻ (kg) được thể hiện như bản sau

Bảng 2. 31: Kết quả điều tra tốc độ dắt lưới và sản lượng khai thác

Tốc độ dắt lưới (hl/h) 2,1 2,3 2,2 2,4 2,6 2,4 2,5

Sản lượng/ mẻ (kg) 500 500 400 450 700 550 600

4Nhập liệu, điền thông tin xử lý như hình 2.44 (Data / Data analysis / Regession)

@ Phương trình có dạng: �� = � + ��, � = � ����������� , � = �� − ��̅

@ Kiểm định hệ số a và b

Giả thiết H0: Hệ số hồi quy không có ý nghĩa (=0)

H1: Hệ số hồi quy có ý nghĩa (¹0)

Trắc nghiệm: t < ta, n-2: Chấp nhận H0, bác bỏ H1.

@ Kiểm định phương trình hồi quy

Giả thiết H0: Phương trình hồi quy không thích hợp

H1: Phương trình hồi quy thích hợp

Trắc nghiệm: F< Fa, 1, n-2: Chấp nhận H0, bác bỏ H1. THONG - 090

5474

478

Page 81: 3. Nội dung bài giảng

75

Hình 2. 44: Cài đặt dữ liệu phân tích hồi quy tuyến tính đơn

4Kết quả:

Bảng 2. 32: Kết quả phân tích hệ số tương quan hồi quy tuyến tính đơn

Bảng 2. 33: Kết quả phân tích Anova hồi quy tuyến tính đơn

Bảng 2. 34: Kết quả phân tích hệ số phương trình tuyến tính đơn

THONG - 090

5474

478

Page 82: 3. Nội dung bài giảng

76 4Kết luận:

- Phương trình hồi quy y� = −516.935 + 443.5484x , y� là sản lượng, x là tốc độ dắt lưới.

- Tốc độ dắt lưới và sản lượng khai thác có mối tương quan thuận, mức tương quan cao (R=0.766704123).

- P-value =0,2449 > a =0,05, nên hệ số tự do có ý nghĩa.

- t=P-value =0,0443 < a =0,05, nên hệ số của x không có ý nghĩa.

- F =0,044326901 < a =0,05, phương trình hồi quy tuyến tính không phù hợp.

IV.5.3. Hồi quy đa tuyến tính Để hồi quy đa tuyến tính, các ước lượng OLS (OLS = Ordinary Least Squares: Phương pháp bình phương nhỏ nhất) là các ước lượng tuyến tính, không chệch và có phương sai bé nhất trong lớp các ước lượng tuyến tính, không chệch, cần có những giả thuyết ràng buộc cho mô hình hồi quy như: Giữa các biến giải thích của mô hình không có đa cộng tuyến, các nhiễu ngẫu nhiên trong hàm hồi quy tổng thể có phương sai không thay đổi, không có tự tương quan hay tương quan chuỗi các nhiễu trong hàm hồi quy tổng thể. Nếu một trong những giả thuyết trên vi phạm thì mô hình hồi quy không chính xác, kết quả dự báo không chuẩn. Để tìm hiểu vấn đề này chi tiết hơn, đọc giả có thể tìm đọc các tài liệu [1], [2], [4], [6].

Ví dụ: Nghiên cứu thực hiện với nghề lưới rê, xác định chiều dài lưới (m), chiều cao lưới (m) và sản lượng khai thác (kg) của 10 lưới và có kết quả sau:

@ Phương trình hồi quy đa tuyến tính có dạng: �� = �� + ���� + ⋯+����

@ Kiểm định hệ số bj

Giả thiết H0: Các hệ số hồi quy không có ý nghĩa (bj=0)

H1: Có ít nhất một vài hệ số hồi quy có ý nghĩa (bj¹0)

Trắc nghiệm: t < ta, n-2: Chấp nhận H0, bác bỏ H1.

@ Kiểm định phương trình hồi quy

Giả thiết H0: Phương trình hồi quy không thích hợp

H1: Phương trình hồi quy thích hợp với ít nhất vài bj.

Trắc nghiệm: F< Fa, 1, n-2: Chấp nhận H0, bác bỏ H1.

THONG - 090

5474

478

Page 83: 3. Nội dung bài giảng

77

Bảng 2. 35: Kích thước lưới rê và sản lượng khai thác

X1 X2 Y 500 30 5000

700 45 5600

1000 50 7000

1200 60 8000

450 30 2500

600 40 4000

900 50 6500

1000 55 8000

800 45 8000

900 50 6000

X1 là chiều dài lưới (m), X2 là chiều cao lưới (m), Y là sản lượng khai thác (kg).

4Nhập liệu, điền thông tin xử lý như hình 2.44 (Data / Data analysis / Regession)

- Ta có thể thực hiện hồi quy đơn biến X1 với Y rồi đánh giá hệ số phương trình và đánh giá phương trình.

- Tiếp theo thực hiện hồi quy đơn biến X2 với Y rồi đánh giá hệ số phương trình và đánh giá phương trình.

- Sau đó thực hiện hồi quy biến X1, X2 với Y rồi đánh giá hệ số phương trình và đánh giá phương trình.

Ở ví dụ này tôi tiến hành hồi quy biến X1, X2 với Y rồi đánh giá hệ số phương trình và đánh giá phương trình như sau:

4Kết quả:

Bảng 2. 36: Kết quả phân tích hệ số tương quan hồi quy đa tuyến tính

THONG - 090

5474

478

Page 84: 3. Nội dung bài giảng

78

Bảng 2. 37: Kết quả phân tích Anova hồi quy đa tuyến tính

Bảng 2. 38: Kết quả phân tích hệ số phương trình hồi quy đa tuyến tính

4Kết luận:

- R2 điều chỉnh =0,65, nghĩa là các yếu tố độc lập X1, X2 giải thích được 65% yếu tố phụ thuộc Y trong phương trình hồi quy đa biến.

- Phương trình hồi quy Y�X1X2=990,8417 + 7,0899X1 – 14,0268X2

- Kiểm định các hệ số phương trình: t=P-value = 0,69693 / 0,29752 / 0,93004 > 0,05, nên chấp nhận H1. Do vậy các hệ số hồi quy phù hợp.

- Kiểm định phương trình hồi quy: F=0,01 < 0,05 nên phương trình hồi quy tuyến tính không phù hợp.

THONG - 090

5474

478

Page 85: 3. Nội dung bài giảng

79 CHƯƠNG 3 – LẬP ĐỀ CƯƠNG VÀ CÔNG BỐ KẾT QUẢ NGHIÊN CỨU I. Các loại đề cương và yêu cầu nội dung Người làm nghiên cứu cần phải viết 3 loại đề cương: sơ bộ, chi tiết và đề cương viết báo cáo. Mục đích của việc xây dựng đề cương nghiên cứu sơ bộ (research outline) là để trình bày ý tưởng nghiên cứu. Trọng tâm của đề cương nghiên cứu sơ bộ là trình bày một cách thuyết phục lý do lựa chọn đề tài nghiên cứu và ý nghĩa của nó. Bên cạnh đó người làm nghiên cứu phải cụ thể được tên đề tài, mục tiêu và các nội dung nghiên cứu chính và hướng tiếp cận. Đề cương nghiên cứu sơ bộ chỉ khoảng 2-3 trang gồm những phần chính như sau:

• Tên đề tài và lý do lựa chọn và ý nghĩa của đề tài

• Mục tiêu và các nội dung nghiên cứu

• Phương pháp nghiên cứu: Hướng giải quyết các nội dung, không đi sâu vào chi tiết

• Dự kiến kết quả thu được và lịch thực hiện

• Các tài liệu tham khảo chính (nếu cần thiết phải nêu)

Một khi ý tưởng nghiên cứu đã được thông qua, người làm nghiên cứu sẽ xây dựng đề cương nghiên cứu chi tiết (research proposal). Trọng tâm của đề cương nghiên cứu chi tiết là ở phần Phương pháp nghiên cứu. Mọi chi tiết của nghiên cứu đều nên được hoạch định một cách cụ thể, từ việc tổ chức nghiên cứu đến phương pháp thu thập và xử lý số liệu; thời gian cụ thể để triển khai từng công việc. Một đề cương nghiên cứu chi tiết được coi như là hoàn hảo khi ta có thể giao cho người khác thực hiện nghiên cứu của mình theo các thông tin có trong đề cương này. Đề cương nghiên cứu chi tiết gồm có các mục sau:

• Mở đầu: Giới thiệu tên đề tài, lý do lựa chọn; các mục tiêu và nội dung nghiên cứu; ý

nghĩa thực tiễn và khoa học của đề tài.

• Tổng luận (hoặc Tổng quan tài liệu): trình bày các vấn đề có liên quan đến đề tài nghiên

cứu với mục đích làm rõ phần mở đầu và làm cơ sở cho phần phương pháp nghiên cứu.

• Phương pháp nghiên cứu

• Định dạng số liệu thu thập: Dưới dạng các bảng biểu thu thập số liệu và cách thức trình bày.

• Tài liệu tham khảo

Khi đề cương nghiên cứu chi tiết đã được thống nhất, người làm nghiên cứu sẽriển khai nghiên cứu của mình theo đúng hoạch định này và chỉên thay đổi các chi tiết nếu có cơ sở và lập luận vững chắc cho chỉnh sửa của mình.

Đề cương viết báo cáo khoa học nhằm phục vụ việc báo cáo kết quả. Đề cương được xây dựng theo cấu trúc của loại báo cáo (bài báo gửi đăng trên tạp chí, báo cáo tổng kết đề tài, luận văn hay luận án). Cho mỗi mục, người viết nên sơ bộ phác thảo bằng cách gạch đầu dòng các nội dung dự định sẽ trình bày, trình tự logic của từng nội dung và những điểm cần phân tích, thảo luận sâu, các điểm nhấn của báo cáo. Thiếu đề cương này công việc viết báo cáo sẽ mất nhiều thời gian hơn mức cần thiết và khó đạt được hiệu quả cao trong việc chuyển tải thông tin đến người đọc.

THONG - 090

5474

478

Page 86: 3. Nội dung bài giảng

80 Có hai cách trình bày tài liệu tham khảo phổ biến đó là theo kiểu Harvard và theo kiểu Vancouver. Tham khảo chi tiết tại website Trường Đại học Nha Trang / Khoa Sau Đại học / Học viên / Hướng dẫn.

II. Nội dung của báo cáo khoa học Người làm nghiên cứu khi kết thúc đề tài của mình phải viết báo cáo khoa học. Báo cáo này có thể là báo cáo tổng kết đề tài hoặc bài báo gửi đăng ở tạp chí khoa học trong ngành. Trong khi báo cáo tổng kết đề tài là một trong những yêu cầu bắt buộc của cơ quan tài trợ và cơ quan quản lý thì việc viết bài báo gửi đăng ở tạp chí khoa học lại phụ thuộc vào chất lượng của nghiên cứu, kỹ năng viết và động lực cá nhân của tác giả. Trình độ của một người làm nghiên cứu khoa học được đánh giá thông qua số lượng và chất lượng của các bài báo họ có trên các tạp chí khoa học quốc tế và quốc gia. Trong thực tế, trình độ chuyên môn của một người làm nghiên cứu sẽ được giới khoa học trên thế giới thừa nhận khi có hơn 10 bài báo về một lĩnh vực cụ thể được đăng trên các tạp chí khoa học quốc tế nổi tiếng trong ngành. Trong lĩnh vực Khai thác Thủy sản và Quản lý Thủy sản có các tạp chí nước ngoài như: Tạp chí SEAFDEC, Journal of Fisheries and Technology, Fish for the people, Elservier… Ở trong nước có các tạp chí như Khoa học Công nghệ Thủy sản – Đại học Nha Trang, tạp chí Khoa học Trường Đại học Cần Thơ, tạp chí Khoa học Công nghệ của Bộ NN & PTNT… Các báo cáo được trình bày ở hội nghị khoa học hay đăng trong tập san của hội nghị (nếu không phải là số đặc biệt của các tạp chí) không được tính là bài báo khoa học. Đối với học viên Cao học và nghiên cứu sinh, hầu hết các cơ sở đào tạo đặt ra yêu cầu bắt buộc phải có một số bài báo nhất định về kết quả nghiên cứu của luận văn Cao học hoặc luận án Tiến sĩ được đăng trên các tạp chí quốc gia và quốc tếmới được bảo vệ luận văn, luận án. Cơ sở đào tạo càng nổi tiếng, yêu cầu này càng cao. Những người làm nghiên cứu trẻ, cần phải rèn luyện cho mình kỹ năng viết báo cáo khoa học. Xét về dung lượng, bài báo khoa học (scientific paper) ngắn hơn rất nhiều so với báo cáo tổng kết đề tài (project report), luận văn Cao học (MSc thesis) hoặc luận án Tiến sĩ (PhD dissertation). Ngoại trừ các bài báo mang tính chất tổng quan (review paper) có thể dài tới 20-30 trang kể cả phần tài liệu tham khảo, các bài báo khoa học thường chỉ được giới hạn từ 3-12 trang. Tuy nhiên, không có tổng biên tập hay người phản biện nào đề nghị cắt giảm số trang của một bài báo khoa học. Chính tác giả là người có nhiệm vụ cắt giảm những thông tin thừa, không cần thiết và hành văn một cách ngắn gọn, xúc tích. Về các đề mục chính, giữa bài báo khoa học và các báo cáo khác có một vài sự khác biệt nhỏ (Bảng 3. 1).

Bảng 3. 1: Nội dung chính của bài báo khoa học và các loại báo cáo khác

THONG - 090

5474

478

Page 87: 3. Nội dung bài giảng

81 II.1. Mở đầu Cho bất kỳ báo cáo khoa học nào, nhiệm vụ của phần Mở đầu là trình bày lý do thực hiện nghiên cứu, mục đích và mục tiêu của nghiên cứu, nêu rõ các câu hỏi nghiên cứu hoặc giả thuyết cần kiểm chứng, giải pháp tiếp cận mà tác giả lựa chọn và ý nghĩa khoa học, thực tiễn của nghiên cứu. Bài báo khoa học không có phần Tổng luận (để bổ sung, giải thích rõ hơn cho phần Mở đầu) như luận văn tốt nghiệp hay luận án nghiên cứu sinh. Chính vì thế người viết cần phải cung cấp đủ các thông tin có liên quan và cơ sở, cũng như các lập luận khoa học để xây dựng giả thuyết nghiên cứu, xác định nội dung nghiên cứu hay lựa chọn cách tiếp cận phù hợp nhất. Nhiều người có xu hướng bỏ qua các dẫn giải quan trọng này vì thế không thuyết phục được người đọc vềtính cần thiết, tính mới và ý nghĩa của nghiên cứu cũng như độ hợp lý của giả thuyết nghiên cứu đưa ra. Các báo cáo với phần Mở đầu viết không đạt yêu cầu sẽ khiến cho người đọc mất phương hướng và bất lợi cho tác giả khi báo cáo được phản biện.

II.2. Tổng luận Tổng luận là phần viết có chức năng trình bày các thông tin có liên quan đến đề tài. Nó làm rõ thêm phần Mở đầu, cung cấp thêm các chi tiết, minh chứng cho các lập luận ngắn gọn đã trình bày trong phần mở đầu. Tổng luận chỉ rõ vị trí của nghiên cứu: nội dung nào là mới, vì sao? Nội dung nào kế thừa, bổ sung, làm sáng tỏ kết quả của các nghiên cứu trước. Thông qua phần Tổng luận, người làm nghiên cứu phân tích cả kết quả lẫn phương pháp nghiên cứu của các nghiên cứu trước để thiết lập cơ sở cho cách tiếp cận và phương pháp mình lựa chọn để đảm bảo trả lời được câu hỏi nghiên cứu hoặc giả thuyết đặt ra. Cấu trúc của phần tổng luận nên được xây dựng theo mô hình lý thuyết bởi vì mô hình lý thuyết chính là cách diễn giải của người nghiên cứu về bản chất của hiện tượng quan sát được. Để làm được điều này, người làm nghiên cứu phải dựa trên các thông tin, cơ sở khoa học đã được công bố; kế thừa được kết quả của các nghiên cứu trước; chỉ ra được các hạn chế cần khắc phục, các thông tin cần tìm hiểu thêm để làm rõ vấn đề nghiên cứu. Trình bày mô hình lý thuyết một cách cặn kẽ chính là trình bày các vấn đề có liên quan đến đề tài.

Các bài báo khoa học không có phần Tổng luận. Trong báo cáo tổng kết đề tài nghiên cứu Tổng luận thường được gọi là Tổng quan tình hình nghiên cứu. Với luận văn tốt nghiệp hay luận án, Tổng luận là phần đòi hỏi rất nhiều đầu tư và thể hiện rõ sự khác biệt về khả năng tổng hợp và phân tích thông tin giữa các cá nhân.

II.3. Phương pháp nghiên cứu Mục đích của phần Phương pháp nghiên cứu là mô tả phương pháp tiếp cận và cách thức cụ thể triển khai các nội dung nghiên cứu của đề tài. Các nội dung mà phần này phải trình bày được đó là: mô tả về đối tượng nghiên cứu, địa điểm nghiên cứu, chỉ rõ thời gian nghiên cứu và những thông tin quan trọng về điều kiện thời tiết có thể tác động đến kết quả nghiên cứu, phương pháp luận, phương pháp thu thập và xử lý số liệu cụ thể. Tương ứng với mỗi nội dung nghiên cứu, người viết mô tả thiết kế thu mẫu hoặc bố trí thí nghiệm, cách thức và thiết bị dùng để thu mẫu, phân tích mẫu, thực hiện các phép đo đạc, điều kiện thí nghiệm và cách thức chăm sóc vật thí nghiệm, các số liệu thu thập và cách thức xử lý chúng (nếu dùng kiểm định thống kê thì tên kiểm định là gì, tại sao lại dùng kiểm định đó, tài liệu tham khảo hoặc phần mềm thống kê sử dụng). Nên sử dụng sơ đồ, ảnh chụp với những mô tả phức tạp nhằm giúp người đọc tiếp cận thông tin dễ dàng hơn. Khi cần thiết, người viết nên bảo vệ cách thức mà mình đã sử dụng bằng các

THONG - 090

5474

478

Page 88: 3. Nội dung bài giảng

82 lập luận xác đáng với dẫn chứng cụ thể (bằng thông tin từ các nghiên cứu khác hoặc kinh nghiệm của bản thân).

Người viết không cần phải mô tả các phương pháp phân tích, đo đạc hoặc xử lý số liệu … được coi là phương pháp chuẩn trong lĩnh vực nghiên cứu. Nếu sử dụng một trong những phương pháp trên, chỉ cần khi rõ tên phương pháp và trích dẫn tài liệu tham khảo mà gười viết sử dụng để thực hiện phương pháp này. Tương tự như vậy với các hệ thống thí nghiệm đã từng được mô tả trong một số báo cáo trước. Với các phương pháp phân tích mẫu phức tạp và cần thiết phải trình bày với người đọc, người viết chỉ cần nêu tên phương pháp và tài liệu tham khảo ở đây và trình bày chi tiết trong phần Phụ lục.

Phần Phương pháp nghiên cứu được coi là đạt yêu cầu nếu như người đọc thông qua phần mô tả đánh giá được độ hợp lý của phương pháp sử dụng (và độ tin cậy của kết quả thu được) và có thể lặp lại được nghiên cứu nếu muốn. Tương tự, phần này được coi là đạt yêu cầu nếu một người nghiên cứu khác chỉ cần đọc nó cũng có thể triển khai đề tài nghiên cứu theo đúng mong muốn của người nghiên cứu. Người viết không cần thiết phải đưa các công thức tính toán vào phần này nếu đó là những phép tính thông dụng. Nhưng cần thiết phải trình bày kỹ cách thức xử lý số liệu vì các kết luận do nghiên cứu đưa ra chịu ảnh hưởng rất nhiều của phương pháp xử lý số liệu. Trong các bài báo khoa học, phần này thường được gọi dưới tên là “Vật liệu và phương pháp nghiên cứu” – Materials and Methods để chỉ rõ yêu cầu mô tả các vật liệu sử dụng cho nghiên cứu, kể cả sinh vật.

II.4. Kết quả và Thảo luận Trong phần này, trước hết các kết quả nghiên cứu được trình bày. Số liệu phải được xử lý chứ không trình bày dưới dạng số liệu thô. Từ các số liệu này, người viết phân tích, lập luận và kết hợp với các định luật, nguyên lý đã được xác lập để đưa ra các nhận định liên quan trực tiếp đến câu hỏi nghiên cứu hoặc giả thuyết nghiên cứu được kiểm chứng. Tiếp theo, người viết thảo luận, so sánh kết quả của mình với các thông tin đã được khẳng định, các nghiên cứu trước, chỉ ra những điểm mới của nghiên cứu, khả năng ứng dụng cũng như các hạn chế. Phần Thảo luận chính là phần người viết rà soát lại mô hình lý thuyết mà mình đã xây dựng; thảo luận các mô hình và giả thuyết thay thế nếu giả thuyết và mô hình do mình đưa ra bị kết quả nghiên cứu phản bác; hoặc phát triển mô hình nếu giả thuyết không bị kết quả phản bác, thảo luận về hướng nghiên cứu và khả năng ứng dụng của kết quả.

Người viết có thể tách riêng hai phần này. Khi đó phần Kết quản ghiên cứu chỉ để trình bày và phân tích kết quả của đề tài. Phần Thảo luận sẽ phân tích sâu, so sánh kết quản ghiên cứu với các kết quả khác, rà soát lại mô hình lý thuyết, thảo luận về tính ứng dụng của kết quả và định hướng nghiên cứu tiếp theo. Đây là xu hướng thường được sử dụng trong các bài báo khoa học vì nó giúp tăng tính minh bạch, rõ ràng trong trình bày vấn đề. Một báo cáo khoa học nếu chỉ đơn thuần trình bày các kết quả thu được mà không kèm theo các phân tích, thảo luận thì mới chỉ thực hiện được một phần của chức năng mô tả, chức năng thấp nhất của nghiên cứu khoa học.

II.5. Kết luận và đề xuất ý kiến Phần này trình bày ngắn gọn các kết luận rút ra được từ việc phân tích và thảo luận kết quả nghiên cứu. Các kết luận nên được trình bày cho từng nội dung nghiên cứu hoặc giả thuyết nghiên cứu và không quá dài dòng. Nên nhớ đây không phải là phần tóm tắt của

THONG - 090

5474

478

Page 89: 3. Nội dung bài giảng

83 “Kết quả nghiên cứu và Thảo luận” mà là những kết luận dạng “đúng hay sai”, “cao hơn hay thấp hơn”, “hợp lý hay bất hợp lý”, “có hiệu quả hay không có hiệu quả”, “có khả năng phát triển hay không”, “bị ảnh hưởng bởi yếu tố nào, mức độ ảnh hưởng ra sao”, “có tương quan hay không có tương quan”, “tương quan thuận hay nghịch”, … kèm theo một vài số liệu quan trọng. Kết luận không đơn thuần chỉ tập trung vào các điểm hay của đề tài mà còn phải xác định được các hạn chế nếu có. Với các bài báo khoa học, hầu hết các tạp chí đều cho phép người viết dừng ở phần Thảo luận với một số đề xuất nếu như người viết cảm thấy cần dè dặt trong việc đưa ra ngay các kết luận. Đề xuất ý kiến chỉ ra cách thức hoàn thiện nghiên cứu, các hướng, nội dung cần phải nghiên cứu tìm hiểu tiếp theo. Chú ý là đề xuất ý kiến phải thật cụ thể và dựa trên các phân tích đã thực hiện trong phần Thảo luận. Phần này nếu đầu tư tốt sẽ thể hiện khả năng phát triển nghiên cứu của người viết và giúp những người nghiên cứu khác chọn đề tài nghiên cứu cho mình nếu cùng quan tâm về lĩnh vực mà người viết nghiên cứu.

II.6. Tài liệu tham khảo Người làm nghiên cứu cần tham khảo tài liệu để lựa chọn vấn đề cần nghiên cứu, xây dựng giả thuyết, lựa chọn hoặc xây dựng phương pháp nghiên cứu, so sánh kết quả nghiên cứu, lập luận phân tích để đưa ra kết luận, ... Khi thực hiện những việc này, người nghiên cứu cần chỉ rõ nguồn gốc của thông tin mình đã tham khảo. Điều này sẽ giúp cho người đọc, nếu muốn, có thể tìm đọc thêm chi tiết từ nguồn thông tin tác giả đã tham khảo và đánh giá mức độ tin cậy của nguồn thông tin. Trong báo cáo khoa học, những thông tin và nhận định không đi kèm với nguồn tham khảo được hiểu là của người viết và người viết chịu trách nhiệm về độ tin cậy của những thông tin, tính hợp lý của các nhận định này. Việc trích dẫn tài liệu tham khảo trong báo cáo và lập danh mục tài liệu tham khảo ở cuối báo cáo vì thế rất cần thiết. Có nhiều kiểu lập danh mục tài liệu tham khảo, phổ biến là trình bày tài liệu tham khảo theo kiểu Harvard và theo kiểu Vancouver. Tham khảo chi tiết tại website Trường Đại học Nha Trang / Khoa Sau Đại học / Học viên / Hướng dẫn. Tên tác giả thường được sắp xếp theo alphabet và tài liệu tiếng Việt trước, tài liệu tiếng Anh sau.”

Mỗi một cơ quan, nhà xuất bản, tổ chức khoa học hoặc quốc gia có thể có những qui định cụ thể về cách thức trích dẫn và lập danh mục tài liệu tham khảo. Người viết báo cáo khoa học phải tuân thủ các qui định này. Cách thức thực hiện, định dạng có thể khác nhau chút ít nhưng hai nguyên tắc chung nhất đó là “khẳng định sự hiện hữu của thông tin / nhận định được trích dẫn và giúp người đọc dễ dàng tìm được những tài liệu này”. Kiểu trích dẫn và lập danh mục tài liệu tham khảo của Đại học Harvard hiện được nhiều tạp chí khoa học áp dụng.

II.7. Phụ lục Những thông tin chi tiết và tương đối dài về phương pháp nghiên cứu có thể được trình bày trong phần Phụ lục. Nếu trình bày những thông tin này trong phần Phương pháp nghiên cứu có thể làm cho phần này dài quá mức cần thiết, dẫn người đọc vào những chi tiết vụn vặt hơn là nhìn tổng thể thí nghiệm, nghiên cứu. Những nội dung khác có thể đưa vào phần Phụ lục là các số liệu quan trọng dưới dạng thô, kết quả của một vài nghiên cứu mang tính chất thử nghiệm làm tiền đề để xây dựng phương pháp, kết quả phân tích thống kê, phiếu điều tra, ...

Với các báo cáo tổng kết đề tài, người viết nên đưa các bảng số liệu thô đã thu thập trong quá trình nghiên cứu vào phần Phụ lục. Số liệu nên được sắp xếp theo kiểu cơ sở dữ liệu

THONG - 090

5474

478

Page 90: 3. Nội dung bài giảng

84 một cách gọn gàng và dễ đọc. Ngược lại, trong luận văn tốt nghiệp, luận án nghiên cứu sinh ngày càng có nhiều cơ sở đào tạo đề nghị sinh viên không nên đưa số liệu thô vào phần Phụ lục. Điều này giúp giảm đáng kể chi phí in ấn và lưu giữ vì một trong những yêu cầu quan trọng đối với người làm nghiên cứu khoa học đó là tính trung thực. Với những báo cáo mà phần Phụ lục lên đến vài trăm trang thì ngay cả với người viết sau một thời gian ngắn cũng khó có thể giải trình tường tận các chi tiết. Khi người phản biện hoặc người đọc có nghi vấn, nhiệm vụ của người làm nghiên cứu hoặc người viết là giải trình với các số liệu cụ thể do chính họ tự lưu giữ. Lưu ý là bài báo khoa học đăng ở các tạp chí không có phần Phụ lục.

II.8. Tóm tắt Đây là phần bắt buộc trong mọi báo cáo khoa học. Mục đích của nó là để tóm lược một cách ngắn gọn về nghiên cứu, giúp người đọc tiếp cận được những thông tin cốt lõi, quan trọng nhất. Đây là là phần được các thư viện, nhà xuất bản lưu giữ, đưa vào các cơ sở dữ liệu để người đọc tiện tìm kiếm và đánh giá sơ bộ về mức độ cần thiết phải thu thập tài liệu tham khảo thuộc quan tâm của mình. Phần Tóm tắt được viết sau khi đã hoàn tất báo cáo nhưng lại được đặt ở trước phần Mở đầu. Dung lượng của phần này tuỳ thuộc vào qui định của cơ sở đào tạo, cơ quan quản lý khoa học hay các tạp chí. Thông thường là không quá 200, 250 hoặc 300 từ với một bài báo khoa học, 500 từ với luận văn tốt nghiệp đại học hoặc Cao học và khoảng 1-3 trang đối với luận án NCS hoặc báo cáo tổng kết đề tài.

Với dung lượng qui định như vậy, người viết phải trình bày được lĩnh vực nghiên cứu, các nội dung chính của đề tài, sơ lược phương pháp nghiên cứu và một số kết quả, kết luận quan trọng nhất. Chính vì thế trong Tóm tắt không có chỗ cho các từ, cụm từ thừa (thiếu chúng, nội dung của phần này không bị ảnh hưởng) hoặc lối hành văn rông dài. Người viết phải cân nhắc thông tin nào cần đưa, thông tin nào không. Phần tóm tắt được kết thúc bằng một số từ khoá (keyword). Tuỳ theo nội dung nghiên cứu của đề tài mà người viết sẽ chọn các từ khoá thích hợp. Mục đích là để khai báo với cơ sở dữ liệu của các nhà xuất bản vì người đọc khi tìm tài liệu tham khảo sẽ dựa trên các từ khoá. Vì thế, nếu người viết muốn công trình nghiên cứu của mình đến được với người đọc cần phải lựa chọn từ khoá một cách cẩn thận.

III. Các nguyên tắc khi viết báo cáo Rèn luyện kỹ năng viết là rất quan trọng đối với người làm nghiên cứu. Một đề tài dù được thực hiện tốt đến mấy mà người nghiên cứu không biết cách chuyển tải thông tin một cách có hiệu quả đến người đọc thì sẽ mất đi rất nhiều ý nghĩa. Đã có rất nhiều nghiên cứu hay không đến được với xã hội đơn giản chỉ vì người làm nghiên cứu có kỹ năng viết không đạt yêu cầu (của các tạp chí khoa học hay nhà xuất bản). Để viết được một báo cáo hay cần tuân thủ các nguyên tắc sau:

• Tuân thủ các qui định về hình thức

• Đảm bảo tính rõ ràng

• Nhất quán

• Đơn giản trong cách trình bày

• Tạo được điểm nhấn cần thiết

THONG - 090

5474

478

Page 91: 3. Nội dung bài giảng

85 • Ngắn gọn đến mức tối đa về dung lượng

III.1. Tuân thủ các qui định về hình thức trình bày Các cơ sở đào tạo, nhà xuất bản hay cơ quan tài trợ đều có qui định về cách thức trình bày một báo cáo khoa học. Các qui định này nhằm đảm bảo định dạng thống nhất của báo cáo, các tiêu chuẩn về chất lượng trình bày và thể hiện được điểm riêng của cơ sở đào tạo hay nhà xuất bản. Các vấn đề cần được qui định là: cấu trúc của báo cáo, dung lượng, tiêu chuẩn định dạng văn bản (kiểu chữ, kích thước của kiểu chữ, căn lề), cách trình bày bảng biểu, đồ thị, cách trích dẫn tài liệu tham khảo, lập danh mục tài liệu tham khảo, đánh số các mục … Người làm nghiên cứu khi muốn công bố kết quả của mình vì thế phải tìm hiểu kỹ lưỡng và tuân thủ các qui định này. Tương tự như thế người phản biện, khi được giao nhiệm vụ nhận xét, cũng cần phải tìm hiểu trước. Không nên đem qui định của một cơ quan hay nhà xuất bản để áp đặt cho những cơ sở khác. Trình bày báo cáo khoa học theo đúng qui định sẽ giúp cho việc đánh giá kết quả được thuận lợi và chính xác. Ở các tạp chí khoa học lớn trên thế giới, khi bản thảo của báo cáo khoa học được gửi đến ban biên tập, tổng biên tập sẽ xem qua nội dung để mời người phản biện thích hợp và xem người viết có tuân thủ các qui định về hình thức trình bày hay không. Nếu không đạt yêu cầu về trình bày thì bản thảo này sẽ được gửi lại ngay cho tác giả mà không cần phải mời phản biện về nội dung.

III.2. Đảm bảo tính rõ ràng Mục đích quan trọng nhất của việc công bố kết quả nghiên cứu chính là chuyển tải thông tin một cách hữu hiệu, thuyết phục nhất đến những người quan tâm. Vì thế mà mọi thông tin, chi tiết được trình bày trong báo cáo khoa học phải rõ ràng, minh bạch đến mức tối đa. Mức độ rõ ràng của thông tin trình bày sẽ ảnh hưởng rất lớn đến tính thuyết phục của báo cáo hay độ tin cậy của kết quả. Người viết nên đặt vịtrí của mình vào người đọc để hạn chế các hiểu lầm có thể có, cung cấp đầy đủn hững thông tin cần thiết để người đọc không phải thắc mắc nhiều khi đọc báo cáo.

Tính rõ ràng của báo cáo khoa học thể hiện qua việc sắp xếp các nội dung trình bày theo logic, độ chính xác của các thông tin cung cấp và cách hành văn. Trình tự của các nội dung, các lập luận nếu hợp lý sẽ giúp cho người đọc hiểu được ý tưởng của người nghiên cứu, cách thức tiếp cận và kết quả thu được. Các thông tin trình bày phải chính xác, đặc biệt chú ý đến đơn vịcủa các thông số. Cách hành văn rất quan trọng. Nên sử dụng câu đơn, không rườm rà, tránh hiểu lầm.

III.3. Nhất quán Người viết phải nhất quán về định dạng văn bản, các thuật ngữ sử dụng và trong lập luận của mình. Định dạng của phần văn bản, các bảng biểu, đồ thị, hình ảnh, trích dẫn tài liệu tham khảo… phải được thống nhất từ đầu cho đến cuối báo cáo. Không thể trình bày mỗi bảng biểu theo một định dạng hoặc khi trích dẫn tài liệu theo kiểu tác giả và năm công bố lúc lại trích dẫn bằng số. Nếu nhiều thuật ngữ có thể được dùng để chỉ một đối tượng, người viết chỉ nên chọn lấy một thuật ngữ thông dụng nhất và chỉ sử dụng thuật ngữ này cho báo cáo của mình. Các lập luận để xác định vấn đề cần nghiên cứu hay lý giải kết quả thu được cũng cần phải nhất quán, không nên thay đổi giữa các phần khiến cho báo cáo thiếu tính thống nhất.

THONG - 090

5474

478

Page 92: 3. Nội dung bài giảng

86 III.4. Đơn giản, súc tích Sự đơn giản trong cách trình bày và hành văn là điều cần thiết cho một báo cáo khoa học. Văn phong trong khoa học đòi hỏi sự chính xác và súc tích. Viết ngắn mà đủ ý luôn luôn là một thách thức cho tất cả những người làm nghiên cứu. Các bảng biểu, đồ thị quá phức tạp, cầu kỳ trong cách trình bày, quá chú tâm tới những họa tiết không cần thiết có thể khiến cho việc truyền tải thông tin tới người đọc bị ảnh hưởng và làm lu mờ đi những điểm quan trọng của báo cáo. Nếu không cần thiết, các hình vẽ, đồ thị, ảnh chụp chỉ nên sử dụng hai màu đen trắng. Các tạp chí khoa học nổi tiếng không qui định cứng nhắc về độ dài của báo cáo nhưng ban biên tập và người phản biện sẽ đề nghị người nghiên cứu cắt bỏ tất cả những chi tiết rườm rà, không cần thiết. Để công tác xét duyệt diễn ra suôn sẻ trong thời gian ngắn, người nghiên cứu nên tựmình rút gọn báo cáo trước khi gửi bản thảo đến ban biên tập. Một báo cáo khoa học nếu dài hoặc rườm rà quá mức cần thiết sẽ khiến cho công tác in ấn, xuất bản và lưu trữ trở nên tốn kém nhiều hơn.

III.5. Tạo được điểm nhấn cần thiết Người viết phải bằng cách hành văn hoặc trình bày thông tin của mình để người đọc biết được đâu là phần quan trọng nhất của báo cáo hoặc trong một phần cụ thể, các thông tin quan trọng nhất nằm ở đâu. Trong một phần nội dung, thông tin nào quan trọng nhất phải được đề cập đến đầu tiên. Trong một đoạn văn, câu nào quan trọng nhất phải nằm ở đầu. Trong một câu văn những từ nào quan trọng nhất phải được đưa lên trước. Điểm nhấn của một trang có thể là một bảng biểu trình bày gọn gàng, một hình ảnh đẹp ấn tượng, một đồ thị giúp so sánh dễ dàng hơn giữa các nghiệm thức hoặc một dãy số liệu hay, một quan sát lý thú. Trong rất nhiều thông tin được trình bày, người viết phải chú trọng vào những thông tin quan trọng nhất (có liên quan đến sự hợp lệ của lập luận, làm cơ s cho giả thuyết nghiên cứu, giúp kiểm định giả thuyết, giúp giải thích được bản chất của vấn đề). Việc tách phần Thảo luận ra khỏi Kết quả nghiên cứu cũng là nhằm mục đích này. Thứ nhất nó tránh cho người đọc lẫn lộn giữa kết quả nghiên cứu của đề tài và những thông tin tác giả sử dụng để thảo luận sâu vấn đề. Thứ hai, trong rất nhiều vấn đề có thể thảo luận, người viết sẽ chỉ thảo luận những vấn đề quan trọng nhất trong phần Thảo luận chứ không tuân theo một khuôn mẫu cứng nhắc “kết quả 1 - thảo luận 1, kết quả 2 - thảo luận 2, …” khi viết chung kết quả nghiên cứu với thảo luận.

IV. Phản biện bài báo khoa học Phản biện báo cáo khoa học không nên hiểu đơn thuần là công việc của các hội đồng, ban biên tập hoặc cá nhân được mời phản biện độc lập. Người làm nghiên cứu khoa học phải tập cho mình kỹ năng phản biện các thông tin tiếp cận thường ngày trong hoạt động nghiên cứu của mình. Đây chính là phương pháp tự nâng cao trình độ của mình một cách hiệu quả nhất. Mục đích của phản biện là đánh giá chất lượng của nghiên cứu, độ tin cậy của thông tin và tính hợp lý của các nhận định, kết luận. Ngoài việc đánh giá các đóng góp của nghiên cứu cho khoa học, khả năng ứng dụng kết quả vào thực tiễn sản xuất, người phản biện phải chỉ ra được các hạn chế của nghiên cứu về phương pháp, về kết quả và cách thức mà người nghiên cứu phân tích, lập luận. Người phản biện có trách nhiệm chỉ ra những điểm cần phải làm rõ trong báo cáo, những thông tin người viết cần cung cấp thêm, các bằng chứng cần được bổ sung cho những nhận định còn thiếu cơ sở hoặc các lập luận còn lỏng lẻo. Người phản biện vì thế phải có sự am hiểu tường tận về chuyên ngành, kinh nghiệm thực tiễn trong nghiên cứu và sản xuất và luôn tự cập nhật

THONG - 090

5474

478

Page 93: 3. Nội dung bài giảng

87 thông tin chuyên ngành, đặc biệt là qua các hoạt động chuyên môn của mình (như nghiên cứu, tư vấn, điều tra thực tiễn, tham gia sản xuất hoặc nghiên cứu tài liệu). Người phản biện cần phải khách quan, không để các định kiến của mình ảnh hưởng đến các nhận xét. Thách thức lớn nhất cho người làm công tác phản biện là đưa ra các nhận xét cho những vấn đề được coi là cốt lõi nhất. Không nên đồng nhất các sai sót về trình bày, lập luận với các sai sót có thể ảnh hưởng nghiêm trọng đến độ hợp lệ của nghiên cứu. Các vấn đề mà người phản biện cần xem xét khi phản biện một báo cáo khoa học bao gồm:

+ Tính cần thiết của đề tài nghiên cứu: đánh giá xem vấn đề mà tác giả lựa chọn để nghiên cứu có thật sự cần thiết không và, nếu cần thiết, thì sẽ giúp giải quyết được gì cho thực tiễn sản xuất và khoa học. Cần lưu ý đây là các nhận định, đánh giá của riêng người phản biện chứ không phải người phản biện tóm tắt lại những ý mà tác giả trình bày trong báo cáo về tính cần thiết của đềtài.

+ Tính mới của đề tài: chỉ rõ các điểm mới về nội dung của đề tài (khẳng định đề tài không trùng lặp với các nghiên cứu đã thực hiện trừ trường hợp kiểm chứng một nghi vấn có cơ sở về số liệu đã được công bố hoặc sử dụng một hướng tiếp cận, phương pháp khác hợp lý hơn), về phương pháp thu thập hoặc xử lý s ốliệu. Để làm được việc này, người phản biện phải luôn cập nhật thông tin trong lĩnh vực nghiên cứu của mình.

+ Tính hợp lý của phương pháp thu thập và xử lý số liệu. Nội dung nghiên cứu, yêu cầu về độ tin cậy của thông tin sẽ qui định phương pháp sử dụng. Người phản biện vì thế phải căn cứ trên các nội dung nghiên cứu của đề tài để đánh giá phương pháp nghiên cứu mà tác giả đã áp dụng có hợp lý hay không. Nếu không thì phương pháp nào cần được sử dụng. Người phản biện cần phải đưa ra các bằng chứng, lập luận để bảo vệ cho nhận định của mình để có thể thuyết phục người được phản biện và các đồng nghiệp khác. Phương pháp xử lý số liệu hết sức quan trọng vì nó ảnh hưởng trực tiếp đến các kết luận rút ra từ đề tài nghiên cứu. Người phản biện vì thế có kiến thức và kinh nghiệm về bố trí thí nghiệm, thiết kế thu mẫu và thống kê sinh học.

+ Đánh giá về kết quả nghiên cứu và khả năng ứng dụng của kết quả. Thường thì ở nội dung này, người làm nghiên cứu có thể bị hạn chế do kinh nghiệm chuyên môn hoặc kiến thức có hạn của mình. Người phản biện ngoài các nhận xét nên giúp định hướng, tư vấn để người nghiên cứu có thể khai thác đến mức tối đa các điểm mạnh trong kết quả nghiên cứu của mình và nhận thức được các hạn chế của nghiên cứu.

+ Góp ý về cách trình bày, hoàn thiện báo cáo. Để có thể làm được phần này, người phản biện nhất thiết phải đọc và phân tích các chi tiết của báo cáo. Trước khi đọc nên tìm hiểu kỹ qui định về trình bày của cơ sở đào tạo (nếu là luận văn luận án) hoặc nhà xuất bản (nếu là tạp chí khoa học) và các yêu cầu về chất lượng. Trong quá trình đọc nên dùng bút chì để sửa các sai sót hoặc đánh dấu các nhận định, số liệu cần phải kiểm tra lại hoặc ghi ra các nhận định.

THONG - 090

5474

478

Page 94: 3. Nội dung bài giảng

88 PHỤ LỤC Bảng tra giá trị rcrit (Ravid, 1994).

THONG - 090

5474

478

Page 95: 3. Nội dung bài giảng

89

TÀI LIỆU THAM KHẢO 1. Trần Thị Tuấn Anh. Bài giảng kinh tế lượng. Đại học kinh tế thành phố Hồ Chí

Minh; 2013. 2. Nguyễn Văn Chức. Phân tích hồi quy tuyến tính với SPSS. Diễn đàn giải pháp kinh

doanh thông minh (BIS); 2013. 3. Vũ Cao Đàm. Phương pháp luận nghiên cứu khoa học. NXB Khoa học và Kỹ thuật;

1999 và 2005. 4. Nguyễn Quang Đông. Bài giảng kinh tế lượng. NXB Giao thông vận tải; 2008. 5. Lê Văn Hảo, Trần Thị Vân Khánh. Phương pháp nghiên cứu khoa học (dành cho

sinh viên khối ngành xã hội nhân văn). Đại học Nha Trang; 2016. 6. Hoàng Trọng và Chu Nguyễn Mộng Ngọc. Phân tích dữ liệu nghiên cứu với SPSS.

NXB Thống kê; 2005. 7. Trương Văn Nam. Xác định cỡ mẫu nghiên cứu. Thongke.info; 2016. 8. Hoàng Tùng. Phương pháp nghiên cưu khoa học trong nuôi trồng thủy sản. Đại học

Thủy sản; 2006. 9. Nguyễn Văn Tuấn. Phương pháp ước lượng cỡ mẫu cho một nghiên cứu khoa học.

Viện nghiên cứu y khoa Garvan, Sydney, Australia; 2006. 10. Nguyễn Văn Tuấn. Phân tích tương quan. Viện nghiên cứu y khoa Garvan, Sydney,

Australia; 2016. 11. Cohen J. Statistical power analysis for the behavioral science. NY: Academic Press, 1969. 12. Hair JF, Anderson RE, et al. Multivariate data analysis, 5th Ed. New Jersey:

PrenticeHall, 1998. 13. Green SB. How many subjects does it take to do a regression analysis. Multivariat

Behav Res 1991; 26:499-510. 14. Harris RJ. A primer of multivariate analysis, 2nd Ed. New York: Academic Press, 1985. 15. Freeman LS. Tables of the number of patients required in clinical trials using the

logrank test. Stat Med 1982; 1:121-129. 16. Lee ET. Statistical methods for survival analysis. Page 320. New York: Wiley, 1992. 17. Jones SJ, Carley S, Harrison M. An introduction to power and sample size

estimation. Emerg Med J 2003; 20:453-458.

THONG - 090

5474

478