Upload
others
View
21
Download
0
Embed Size (px)
Citation preview
สถิติพื้นฐานเพื่อการวิจัย 1
Samplinggroups
Populationgroup
สุมตัวอยาง
สถิติพืน้ฐานเพื่อการวิจัย
Parametric Statistics
คาตัวกลางความแปรปรวน
คาตัวกลางความแปรปรวน
วิสุทธิ์ กังวานตระกูล
สถิติ(Statistics)
ความแปรปรวน
พารามิเตอร(Parameter)
คาคงที่ที่แสดงลักษณะของประชากร
ฟงกชันของตัวแปรสุม ซึ่งขึ้นกับตัวอยางที่สุมมาไดจากประชากร
ความแปรปรวน
สถิติพื้นฐานเพื่อการวิจัย
ขอมูลเชิงคุณภาพ ขอมูลเชิงปริมาณ
Qualitative data or Non-numerical facts Quantitative data or Numerical facts
2
ประเภทขอมูลในงานสถิติ
มาตรวัด(คา)ขอมูลทางสถิติ•มาตรวัดจําแนกประเภท/Nominal scale
มาตรวัดสามารถแยกขอมูลเปนกลุมเดียวกันได แตไมสามารถเปรียบเทียบคามากนอยระหวางขอมูลได
•มาตรวัดอันดับ/Ordinal scale
Nominal Data Ordinal Data Interval Data Ratio Data
วิสุทธิ์ กังวานตระกูล
•มาตรวัดอันดับ/Ordinal scaleมาตรวัดสามารถแยกขอมูลวามีคามากนอยกวากันได แตความแตกตางนั้นไมมีชวงที่คงที่
•มาตรวัดแบบชวง/Interval scaleมาตรวัดสามารถแยกขอมูลวามีคามากนอยกวากันได ความแตกตางนั้นมีชวงที่คงที่ และจุดเริ่มตนของการวัดอาจจะไมเริ่มจากศูนยหรือกําหนดเริ่มที่ศูนยก็ได แตศูนยในที่นี้ไมไดหมายถึงไมมีขอมูล เชน อุณหภูมิ 0 อาศา ไมไดมีความหมายวาไมมีอุณหภูมิ
•มาตรวัดแบบอัตราสวน/Ratio scaleมาตรวัดสามารถแยกขอมูลวามีคามากนอยกวากันได ความแตกตางนั้นมีชวงที่คงที่ และจุดเริ่มตนของการวัดเริ่มจากศูนยตามธรรมชาติคือ 0 หมายถึงไมมีขอมูล เชน น้ําหนัก 0 กก. (หมายถึงไมมีน้ําหนัก)
สถิติพื้นฐานเพื่อการวิจัย 3
สถิติวิเคราะหเชิงพรรณา (descriptive statistical analysis)วิเคราะหและนําเสนอขอมูลในรูปแบบ
- การบรรยาย ตารางขอมูล รูปแผนภูมิ หรือรูปภาพ- คามัชฌิมตางๆ ความแปรปรวน อัตราสวน เปอรเซ็นต- คามัชฌิมตางๆ ความแปรปรวน อัตราสวน เปอรเซ็นต
ดัชนีตางๆ- การแปลความหมายของขอมูล
สถิติวิเคราะหเชิงอนุมาน (Inference statistical analysis)นําขอมูลตัวอยางที่เก็บไดจากประชากรมาสรุปเกี่ยวกับประชากรโดยอาศัยทฤษฎีความนาจะเปน เปนเครื่องมือชวยในการตัดสินใจ
วิสุทธิ์ กังวานตระกูล
โดยอาศัยทฤษฎีความนาจะเปน เปนเครื่องมือชวยในการตัดสินใจ
การประมาณคา (Estimation)การทดสอบนัยสําคัญ (Test of significance)
สถิติพื้นฐานเพื่อการวิจัย
สถิติ(Statistics) พารามิเตอร(Parameter)
การสรุปผลหรืออนุมานถึงขอเท็จจริง
4
Inferential Statistics (สถิติอนุมาน)
สถิติอนุมาน ประกอบดวย• สถิติพรรณนา(descriptive statistics)• ทฤษฎีความนาจะเปน(probability theory) ของคาสถิติ
วิสุทธิ์ กังวานตระกูล
• การประมาณคา(estimation)• การทดสอบสมมติฐาน(testing hypothesis)
การแจกแจงความถี่ของขอมูล
สถิติพื้นฐานเพื่อการวิจัย 5
Interval Data and Ratio Data
Nominal Data and Ordinal Data
กลุมตัวอยางเพื่อทดสอบ Parametric statistics Non-parametric statistics
One sample Z-testT-test
Chi-squareRuns testBinomial
Kolmogorov-SmirnovSign testWicoxon signed-rank testCox-Stuart test for trendCox-Stuart test for trend
2-independent samples Z-testT-test
Fisher exactProbability testChi-square
Median testMan-White U testKolmogorov-Smirnov 2 sampleWald-Wolfowitz Runs testMood testSiegel-Turkey testMoses
2-Related samples Paired t-test McNemarMarginal Homogeneity test
Sign testWilcoxon matched pairs
K-Independent samples ANOVA Chi-square Kruskal-Wallis One-way ANOVAJonckheere-Terpstra test
วิสุทธิ์ กังวานตระกูล
Jonckheere-Terpstra testMedian test
K-Related samples ANOVA Cochran Q Friedman Two-way ANOVADurbin test for BIBD
Correlation coefficient Pearson Product MomentPartial correlationEta (norminal-interval)
Chi-square test for independentContingencySomer’dSpearman rankKendall coefficient of concordance
Cram’er & PhiLambdaGammaKendall RankKendall Partial Rank
สถิติพื้นฐานเพื่อการวิจัยParametric Statistics
One sampling groupประมาณคา population meanประมาณคา population ratioทดสอบคา population meanทดสอบคา population ratio
Two sampling group dependent or independentequal variant or unequal variant
ทดสอบคา population ratio
ประมาณคาผลตางของ 2 population meanประมาณคาผลตางของ 2 population ratioทดสอบความแตกตางของ 2 population mean
วิสุทธิ์ กังวานตระกูล
ทดสอบความแตกตางของ 2 population meanทดสอบความแตกตางของ 2 population ratioวิเคราะหความสัมพันธแบบเสนตรงของ 2 populationทดสอบนัยสําคัญของคา rทดสอบความแตกตางระหวางคา r ของ sampling กับ populations
สถิติพื้นฐานเพื่อการวิจัย 7
ใชทดสอบการแจกแจงของขอมูลวาไดมาจากประชากรที่มีการแจกแจงแบบปกติหรือไม
One-Sample Kolmogorov-Smirnov Test35 25 20
28 9 22
7 26 19
18 15 33
(Non-parametric Statistics)
Parametric Statistics
VAR00001N 30Normal Parametersa,b Mean 21.7333
Std. Deviation 8.1110Most Extreme Absolute 0.089Differences Postive 0.075
30 13 31
21 23 27
18 34 9
18 35 12
25 9 18
วิสุทธิ์ กังวานตระกูล
Differences Postive 0.075Negative - 0.089
Kolmogorov-Smirnov Z 0.489Asymp. Sig.(2-tailed) 0.970
a. Test distribution is Normal.b. Calculated from data.
27 23 22
ผลการวิเคราะหโดย SPSS for Windows
สถิติพื้นฐานเพื่อการวิจัย
การตั้งสมมุติฐานเพื่อทดสอบทางสถิติ
การศึกษาวิจัยเพื่อคนหาความจริงบางอยางเกี่ยวกับประชากรโดยศึกษากลุมตัวอยางที่สุมเก็บจากประชากรจะมีการตั้งสมมุติฐานของการศึกษาไว แลวนําขอมูลของกลุมตัวอยางมาวิเคราะหทางสถิติเพื่อสรุปวาสมมุติฐานนั้นเปนจริงหรือไม
8Parametric Statistics
การตั้งสมมุติฐานเพื่อทดสอบทางสถิติ
• สมมุติฐาน H0 (Null hypothesis)
• สมมุติฐาน HA (Alternative hypothesis)
ตั้งขึน้เพื่อใชทดสอบ และตองตั้งในรูป “ไมมีความแตกตางกนั” หรือ “ไมมีความสัมพันธกัน”
เปนสมมุติฐานที่จะใชเปนทางเลือก ในกรณีวิเคราะหขอมูลจาก
วิสุทธิ์ กังวานตระกูล
เปนสมมุติฐานที่จะใชเปนทางเลือก ในกรณีวิเคราะหขอมูลจากกลุมตัวอยางแลว ทําใหปฏิเสธการยอมรับ Ho
ตั้งแบบไมกําหนดทศิทางวามากกวาหรือนอยกวา (Two-tailed hypothesis)ตั้งแบบกําหนดทิศทางวามากกวาหรือนอยกวา (One-tailed hypothesis)
สถิติพื้นฐานเพื่อการวิจัย
ขั้นตอนการทดสอบสมมุติฐาน
•ตั้งสมมุติฐาน
การทดสอบสมมุติฐานทางสถิติ
H ตองตั้งในลักษณะ “ไมมีความแตกตางกัน” หรือ “ไมมีความสัมพันธกัน”
9Parametric Statistics
•กําหนดระดับนัยสําคัญ αααα หรือความเชื่อมั่น (1-αααα) ในการสรุปผล
•คํานวณคาสถิติ ( Z, t, F, c2, …. )
•หาคาวิกฤต(คาสถิติที่ระดับนัยสําคัญ αααα) หรือ p value
H0HA
ตองตั้งในลักษณะ “ไมมีความแตกตางกัน” หรือ “ไมมีความสัมพันธกัน”ตั้งแบบ One-tailed หรือ Two-tailed ใหตางกับ H0
วิสุทธิ์ กังวานตระกูล
•หาคาวิกฤต(คาสถิติที่ระดับนัยสําคัญ αααα) หรือ p value
•ตัดสินใจและสรุผล โดย
เปรียบเทียบ คาสถิติ กับ คาวิกฤติ
เปรียบเทียบ αααα กับ p valueหรือ p value < αααα
คาสถิติอยูในชวงคาวิกฤติ
ยอมรับ HA ปฏิเสธ H0
สถิติพื้นฐานเพื่อการวิจัย 10
ดวยความเชื่อมั่น (1-α)100% ในการสรุปผล
α2
α2α α
เขตวิกฤติ เขตวิกฤติเขตวิกฤติ
เขตยอมรับ H0เขตยอมรับ H0เขตยอมรับ H0
Parametric Statistics
2 2α α
Frequency of statistics
p value
วิสุทธิ์ กังวานตระกูล
เขตวิกฤติ
Statistic value ( t )
0 tTabletcalculation
คาวิกฤตคาสถิติ
สถิติพื้นฐานเพื่อการวิจัย 11
การศึกษาวจิัยเพื่อคนหาความจริงบางอยางเกี่ยวกับประชากรโดยศึกษากลุมตัวอยางที่สุมเก็บจากประชากรจะมีการตั้งสมมุติฐานของการศึกษาไว แลวนําขอมูลของกลุมตัวอยางมาวิเคราะหทางสถิติเพื่อสรุปวาสมมุติฐานนั้นเปนจริงหรือไม
Parametric Statistics
ตั้งสมมุติฐานการศึกษา
เพื่อทดสอบ
สรุปผลจากขอมูลการศึกษา
ความจริงเกี่ยวกับประชากร
A = B A ≠≠≠≠ B
H0: A = BHA: A ≠ B
ยอมรับ H0 : A = B สรุปผลถูกตองNo error
ยอมรับ H0 ที่ไมถูกตองβ error
ยอมรับ H : A ≠ B
วิสุทธิ์ กังวานตระกูล
HA: A ≠ Bยอมรับ HA : A ≠ Bหรือ ไมยอมรับ H0
ไมยอมรับ H0 ที่ถูกตองαααα error
สรุปผลถูกตองNo error
สถิติพื้นฐานเพื่อการวิจัย 12
ตัวอยางObjective: ตองการทราบวาทารกแรกเกิดของโรงพยาบาลมีน้ําหนักเฉลี่ยเทากับเทาไร
งานวิจัยที่สุมเก็บตัวอยางจากประชากรกลุมเดียว เพื่อ
Objective: คาเฉลี่ยน้ําหนักของทารกที่เกิดในโรงพยาบาลแหงนี้อยูในเกณฑมาตรฐาน
• ประมาณคาเฉลี่ยของประชากรจากคาเฉลี่ยของกลุมตัวอยาง• เปรียบเทียบคาเฉลี่ยของกลุมตัวอยางกับคาเฉลี่ยของประชากร
Parametric Statistics
22Z σ
กรณีศึกษาเพื่อประมาณคาเฉลี่ยของประชากรกลุมเดียว
Objective: คาเฉลี่ยน้ําหนักของทารกที่เกิดในโรงพยาบาลแหงนี้อยูในเกณฑมาตรฐาน(เกณฑมาตรฐาน: มากกวา 3,000 กรัม)
Study: สุมเก็บขอมูลน้ําหนักของทารกแรกเกิด ในชวงระยะเวลาหนึ่ง ใหไดจํานวน ……………….ราย จงึจะเพียงพอ
22NZ σα
ประชากรขนาดใหญ (ไมทราบ N) ประชากรขนาดเล็ก (ทราบ N)
วิสุทธิ์ กังวานตระกูล
2
22
e
Z
n 2
σ
=α
Z = 1.960 คามาตรฐานใตโคงปกติ แบบ two-tail เมื่อกําหนด CI 95% [Z(1-0.025)]σ = 200 คาเบี่ยงเบนมาตรฐานของประชากร ประมาณการดวยคา SD ของกลุมตัวอยางที่เคยศึกษามาแลวe = 30 กําหนดคาความคลาดเคลื่อนในการประมาณการ [สมมุติไมเกิน 1% ของคาเฉลี่ยของประชากร]n = 171 จํานวนตัวอยางที่ตองใชในการศึกษา
222
22
2
2
Z)1N(e
NZ
nσ+−
σ
=α
α
สถิติพื้นฐานเพื่อการวิจัย 13
• ประมาณคาเฉลี่ยของประชากรจากคาเฉลี่ยของกลุมตัวอยางงานวิจัยที่สุมเก็บตัวอยางจากประชากรกลุมเดียว เพื่อ
ตัวอยางObjective: ตองการทราบวาทารกแรกเกิดของโรงพยาบาลมีน้ําหนักเฉลี่ยเทากับเทาไรStudy: สุมเก็บขอมูลน้ําหนักของทารกแรกเกิด ในชวงระยะเวลาหนึ่ง ไดจํานวน 500 ราย พบวามนี้ําหนักเฉลี่ย 3,100 + 200 กรัม (mean + SD)
Parametric Statistics
สถิติเชิงพรรณนา: ทารกแรกเกิดของโรงพยาบาลมีน้ําหนักเฉลี่ยเทากับ 3,100 + 200 กรัม
สถิติเชิงอนุมาณ: ดวยความเชื่อมั่น 95% ทารกแรกเกิดของโรงพยาบาลมีน้ําหนักเฉลี่ย อยูระหวาง .............กรัม ถึง ............. กรัม
ในการวิเคราะห จะประมาณคาเฉลี่ยแบบ point estimation ดวยคา mean = 3,100 กรัมแลวหาชวงที่หางจากคา mean ดวยคาสถิติ
ไดจํานวน 500 ราย พบวามนี้ําหนักเฉลี่ย 3,100 + 200 กรัม (mean + SD)
วิสุทธิ์ กังวานตระกูล
n
xZ
σµ−
=
n
sx
tµ−
=
แลวหาชวงที่หางจากคา mean ดวยคาสถิติ
หรือ
กรณี จํานวนขอมูล (n) < 30 กรณี จํานวนขอมูล (n) > 30
nZx
2
σ±=µ αn
stx
2α+=µ
Degree of freedom = n-1
สถิติพื้นฐานเพื่อการวิจัย 14
• ประมาณคาเฉลี่ยของประชากรจากคาเฉลี่ยของกลุมตัวอยางงานวิจัยที่สุมเก็บตัวอยางจากประชากรกลุมเดียว เพื่อ
ตัวอยางObjective: ตองการทราบวาทารกแรกเกิดของโรงพยาบาลมีน้ําหนักเฉลี่ยเทากับเทาไรStudy: สุมเก็บขอมูลน้ําหนักของทารกแรกเกิด ในชวงระยะเวลาหนึ่ง ไดจํานวน 500 ราย พบวามนี้ําหนักเฉลี่ย 3,100 + 200 กรัม (mean + SD)
Parametric Statistics
สถิติเชิงอนุมาณ: ดวยความเชื่อมั่น 95% ทารกแรกเกิดของโรงพยาบาลมีน้ําหนักเฉลี่ย อยูระหวาง .............กรัม ถึง ............. กรัม
nZx
2
σ±=µ α
500
20096.13100 ±=µ
3,082.5 3,117.5
สถิติเชิงพรรณนา: ทารกแรกเกิดของโรงพยาบาลมีน้ําหนักอยูระหวาง 3,100 + 200 กรัม
ไดจํานวน 500 ราย พบวามนี้ําหนักเฉลี่ย 3,100 + 200 กรัม (mean + SD)
วิสุทธิ์ กังวานตระกูล
53.173100 ±=µ
96.1t499,
205.0 =
n
stx
2α+=µ
=NORMSINV(1 – 0.025)
=TINV(0.05,499)
96.1Z205.0 =
ใช function ของ Microsoft Excel คํานวณ หรือ เปดตารางสถิติ
สถิติพื้นฐานเพื่อการวิจัย 15
ตัวอยางObjective: คาเฉลี่ยน้ําหนักของทารกที่เกิดในโรงพยาบาลแหงนี้อยูในเกณฑมาตรฐาน
หรือไม (เกณฑมาตรฐาน: มากกวา 3,000 กรัม)Study: สุมเก็บขอมูลน้ําหนักของทารกแรกเกิด ในชวงระยะเวลาหนึ่ง
• เปรียบเทียบคาเฉลี่ยของกลุมตัวอยางกับคาเฉลี่ยของประชากรงานวิจัยที่สุมเก็บตัวอยางจากประชากรกลุมเดียว เพื่อ
Parametric Statistics
Study: สุมเก็บขอมูลน้ําหนักของทารกแรกเกิด ในชวงระยะเวลาหนึ่ง ไดจํานวน 500 ราย พบวามีน้ําหนักเฉลี่ย 3,100 + 200 กรัม (mean + SD)
ตั้งสมมุติฐานH0 : µ = 3,000 กรัม (ไมไดมาตรฐาน)HA : µ > 3,000 กรัม (อยูในเกณฑมาตรฐาน)
18.11200
)30003100(Z =
−=
sx
Zµ−
=
p value =1-NORMSDIST(11.18) ไดคา < 0.001
ใช function ของ Microsoft Excel คํานวณ
วิสุทธิ์ กังวานตระกูล
500n p value =1-NORMSDIST(11.18) ไดคา < 0.001
0 1.65α=0.05
Z
Z=0Z1-α=1.65
Z=11.8 มากกวาคา Z1-α ใหปฏิเสธ H0 และยอมรับ HA
ดวยความเชื่อมั่น 95% สรุปวา น้ําหนักเฉลี่ยมากกวา 3,000 กรัม
สรุปวา น้ําหนักเฉลี่ยมากกวา 3,000 อยางมีนัยสําคัญทางสถิติ (p < 0.05)
สถิติพื้นฐานเพื่อการวิจัย
ตัวอยางObjective: ตองการทราบวาทารกแรกเกิดของโรงพยาบาลมีน้ําหนักเฉลี่ยเทากับเทาไรStudy: สุมเก็บขอมูลน้ําหนักของทารกแรกเกิด ในชวงระยะเวลาหนึ่ง ไดจํานวน 500 ราย พบวามนี้ําหนักเฉลี่ย 3,100 + 200 กรัม (mean + SD)
• เปรียบเทียบคาเฉลี่ยของกลุมตัวอยางกับคาเฉลี่ยของประชากรงานวิจัยที่สุมเก็บตัวอยางจากประชากรกลุมเดียว เพื่อ
16Parametric Statistics
จะเห็นวาคาเฉลี่ย อยูระหวาง 3,082.5 ถึง 3,117.5 กรัม ซึ่งมากกวา 3,000 กรัม
สถิติเชิงอนุมาณ: ดวยความเชื่อมั่น 95% ทารกแรกเกิดของโรงพยาบาลมีน้ําหนักเฉลี่ย อยูระหวาง .............กรัม ถึง ............. กรัม3,082.5 3,117.5
ไดจํานวน 500 ราย พบวามนี้ําหนักเฉลี่ย 3,100 + 200 กรัม (mean + SD)
สถิติเชิงพรรณนา: ทารกแรกเกิดของโรงพยาบาลมีน้ําหนักอยูระหวาง 3,100 + 200 กรัม
วิสุทธิ์ กังวานตระกูล
จะเห็นวาคาเฉลี่ย อยูระหวาง 3,082.5 ถึง 3,117.5 กรัม ซึ่งมากกวา 3,000 กรัม[คาลาง (low limit value) มากกวา 3,000 กรัม]
Objective: คาเฉลี่ยน้ําหนักของทารกที่เกิดในโรงพยาบาลแหงนี้อยูในเกณฑมาตรฐาน(เกณฑมาตรฐาน: มากกวา 3,000 กรัม)
จึงสรุปวา ดวยความเชื่อมั่น 95%คาเฉลี่ยน้ําหนักของทารกที่เกิดในโรงพยาบาลแหงนี้อยูในเกณฑมาตรฐาน
สถิติพื้นฐานเพื่อการวิจัย 17
• ประมาณคาสัดสวนของประชากรจากคาสดัสวนของกลุมตัวอยาง• เปรียบเทียบคาสัดสวนของกลุมตัวอยางกับคาสัดสวนของประชากร
งานวิจัยที่สุมเก็บตัวอยางจากประชากรกลุมเดียว เพื่อ
ตัวอยางObjective: ตองการทราบวาความชุกของ microalbuminuria ในผูปวยเบาหวานที่มารับ
การรักษาที่โรงพยาบาล
Parametric Statistics
การรักษาที่โรงพยาบาล
Study: สุมเก็บขอมูลผลตรวจ microalbumin ของผูปวยเบาหวานที่มารับการรักษาที่โรงพยาบาล ในชวงระยะเวลาหนึ่ง เพื่อคนหาผูปวยที่มีภาวะ microalbuminuriaเชน สุมมาทั้งหมด n ราย มีผลตรวจที่ระบุวามีภาวะ microalbuminuria a รายความชุก = a/n หรือ 100*a/n
สุมมาจํานวน n ราย จะเพียงพอหรือไม ในการศึกษา
)p1(pNZ 2 −
กรณีศึกษาเพื่อประมาณคาสัดสวนของประชากรขนาดใหญ (ไมทราบ N)
ขนาดเล็ก (ทราบ N)
วิสุทธิ์ กังวานตระกูล
2
2
e
pqZ
n 2α
= )p1(pZ)1N(e
)p1(pNZ
n22
2
2
2
−+−
−
=α
α
Z = 1.960 คามาตรฐานใตโคงปกติ แบบ two-tail เมื่อกําหนด CI 95% [Z0.025 = 1.96]e = 0.050 กําหนดคาความคลาดเคลื่อน เชน กําหนดคลาดเคลื่อนไมเกนิ 5%p = 0.320 คาสัดสวนของกลุมตัวอยางทีเ่คยศึกษามาแลวq = 0.680 1-pn = 334 จํานวนตัวอยางทีต่องใชในการศึกษา
ขนาดใหญ (ไมทราบ N)
สถิติพื้นฐานเพื่อการวิจัย 18
• ประมาณคาสัดสวนของประชากรจากคาสดัสวนของกลุมตัวอยาง• เปรียบเทียบคาสัดสวนของกลุมตัวอยางกับคาสัดสวนของประชากร
งานวิจัยที่สุมเก็บตัวอยางจากประชากรกลุมเดียว เพื่อ
ตัวอยางObjective: ตองการทราบวาความชุกของ microalbuminuria ในผูปวยเบาหวานที่มารับ
การรักษาที่โรงพยาบาล
Parametric Statistics
การรักษาที่โรงพยาบาล
Study: สุมเก็บขอมูลผลตรวจ microalbumin ของผูปวยเบาหวานที่มารับการรักษาที่โรงพยาบาล ในชวงระยะเวลาหนึ่ง เพื่อคนหาผูปวยที่มีภาวะ microalbuminuriaพบวา ในจํานวนผูปวยเบาหวานที่สุมมาทั้งหมด 500 ราย มีผลตรวจที่ระบุวามีภาวะ microalbuminuria 122 รายคิดเปนความชุก = 122/500 =0.24 หรือ 24.4%
สถิติเชิงพรรณนา: ผูปวยเบาหวานที่มารับการรักษาที่โรงพยาบาลมีความชุกของภาวะ microalbuminuria เทากับ 24.4 %
วิสุทธิ์ กังวานตระกูล
สถิติเชิงอนุมาณ: ดวยความเชื่อมั่น 95% ผูปวยเบาหวานที่มารับการรักษาที่โรงพยาบาลมีความชุกของภาวะ microalbuminuria อยูระหวาง ....................%
038.0244.0500
)244.01(244.096.1244.0
n
q̂p̂Zp̂p
2±=
−±=±= α
=0.206 – 0.282
20.6 – 28.2
nq̂p̂
pp̂Z
−=
สถิติพื้นฐานเพื่อการวิจัย 19
• ประมาณการคาสัดสวนของประชากรจากคาสัดสวนของกลุมตัวอยาง• เปรียบเทียบคาสัดสวนของกลุมตัวอยางกับคาสัดสวนของประชากร
งานวิจัยที่สุมเก็บตัวอยางจากประชากรกลุมเดียว เพื่อ
ตัวอยางObjective: ตองการทราบวาความชุกของ microalbuminuria ในผูปวยเบาหวานที่มารับ
การรักษาที่โรงพยาบาล
Parametric Statistics
การรักษาที่โรงพยาบาล
Study: สุมเก็บขอมูลผลตรวจ microalbumin ของผูปวยเบาหวานที่มารับการรักษาที่โรงพยาบาล ในชวงระยะเวลาหนึ่ง เพื่อคนหาผูปวยที่มีภาวะ microalbuminuriaพบวา ในจํานวนผูปวยเบาหวานที่สุมมาทั้งหมด 500 ราย มีผลตรวจที่ระบุวามีภาวะ microalbuminuria 122 รายคิดเปนความชุก = 122/500 =0.24 หรือ 24.4%
สถิติเชิงพรรณนา: ผูปวยเบาหวานที่มารับการรักษาที่โรงพยาบาลมีความชุกของภาวะ microalbuminuria เทากับ 24.4 %
วิสุทธิ์ กังวานตระกูล
สถิติเชิงอนุมาณ: ดวยความเชื่อมั่น 95% ผูปวยเบาหวานที่มารับการรักษาที่โรงพยาบาลมีความชุกของภาวะ microalbuminuria อยูระหวาง ....................%20.6 – 28.2
Objective: ตองการทราบวาความชุกของ microalbuminuria ในผูปวยเบาหวานที่มารับการรักษาที่โรงพยาบาลมากกวา 27.5% หรือไมจะสรุปวา...
สถิติพื้นฐานเพื่อการวิจัย 20
เปนที่ทราบกันวาดวยวิธีการรักษาที่ใชในปจจุบัน ผูปวยโรคมะเร็งระยะสุดทายจะมีชีวิตอยูรอดไดอีกเพียง 18.8 เดือน
หรือ รอยละ 50 ของผูปวยโรคมะเร็งระยะสุดทายจะมีชีวิตอยูรอดมากกวาหนึ่งป
นักวิจัยอยากทราบวา การรักษาดวยวิธีใหมจะชวยยืดชีวิตอยูรอดมากกวาเดิม หรือไม
ตัวอยาง
Parametric Statistics
นักวิจัยอยากทราบวา การรักษาดวยวิธีใหมจะชวยยืดชีวิตอยูรอดมากกวาเดิม หรือไม
จึงศึกษาโดยการสุมผูปวยมะเร็งระยะสุดทายมาจํานวน 38 คน เพื่อใหการรักษาดวยวิธีใหม พบวาชวงชีวิติอยูรอดมีคาเฉลี่ย 23.1 เดือน และคาเบี่ยงเบนมาตรฐานเทากับ 8.1 เดือน
หรือ มีผูปวยจํานวน 28 คน จาก 38 คน ที่มีชีวิตรอดมากกวาหนึ่งป
วิเคราะหขอมูลเพื่อสรุปวา ดวยการรักษาวิธีใหม1) สัดสวนการมีชีวิตรอดมากกวาหนึ่งปของผูปวยมะเร็งระยะสุดทายมากกวาเดิม หรือไม
(เปรียบเทียบคาสัดสวนการมีชีวิตรอดมากกวาหนึ่งปของตัวอยางศึกษา กับ รอยละ 50)สมมุติฐาน H : p = 0.50 p = 28/38 = 0.74
วิสุทธิ์ กังวานตระกูล
สมมุติฐาน H0 :HA :
2) ผูปวยมะเร็งระยะสุดทายมีชีวิตรอดมากกวาเดิม หรือไม(เปรียบเทียบคาเฉลี่ยชวงชีวิตรอดของตัวอยางศึกษา กับ 18.8 เดือน)สมมุติฐาน H0 :
HA :
p = 0.50 p > 0.50
p = 28/38 = 0.74
µ = 18.8 เดือนµ > 18.8 เดือน
สถิติพื้นฐานเพื่อการวิจัย 21
เปนที่ทราบกันวาดวยวิธีการรักษาที่ใชในปจจุบัน ผูปวยโรคมะเร็งระยะสุดทายจะมีชีวิตอยูรอดไดอีกเพียง 18.8 เดือน
หรือ รอยละ 50 ของผูปวยโรคมะเร็งระยะสุดทายจะมีชีวิตอยูรอดมากกวาหนึ่งปนักวิจัยอยากทราบวา การรักษาดวยวิธีใหมจะชวยยืดชีวิตอยูรอดมากกวาเดิม หรือไมจึงศึกษาโดยการสุมผูปวยมะเร็งระยะสุดทายมาจํานวน 38 คน เพื่อใหการรักษาดวยวิธีใหม พบวา
ชวงชีวิติอยูรอดมีคาเฉลี่ย 23.1 เดือน และคาเบี่ยงเบนมาตรฐานเทากับ 8.1 เดือน
ตัวอยางParametric Statistics
วิเคราะหขอมูลเพื่อสรุปวา ดวยการรักษาวิธีใหม1) สัดสวนการมีชีวิตรอดมากกวาหนึ่งปของผูปวยมะเร็งระยะสุดทายมากกวาเดิม หรือไม
(เปรียบเทียบคาสัดสวนการมีชีวิตรอดมากกวาหนึ่งปของตัวอยางศึกษา กับ รอยละ 50)สมมุติฐาน H0 :
HA :
สถิติทดสอบที่ใชคือ
p = 0.50 p > 0.50
q̂p̂
pp̂Z
−=
p = 28/38 = 0.74
ไมใชสถิติ
ชวงชีวิติอยูรอดมีคาเฉลี่ย 23.1 เดือน และคาเบี่ยงเบนมาตรฐานเทากับ 8.1 เดือนหรือ มีผูปวยจํานวน 28 คน จาก 38 คน ที่มีชีวิตรอดมากกวาหนึ่งป
วิสุทธิ์ กังวานตระกูล
p1 - p2 = k เมื่อ k ≠ 0 p1 - p2 > k
2
22
1
11
2121
nq̂p̂
nq̂p̂
)pp()p̂p̂(Z
+
−−−=n
q̂p̂Z =
360.3
38)74.01(74.0
50.074.0Z =
−
−=
p value = 0.00039 =1-NORMSDIST(3.360)
สถิติพื้นฐานเพื่อการวิจัย 22
เปนที่ทราบกันวาดวยวิธีการรักษาที่ใชในปจจุบัน ผูปวยโรคมะเร็งระยะสุดทายจะมีชีวิตอยูรอดไดอีกเพียง 18.8 เดือน
หรือ รอยละ 50 ของผูปวยโรคมะเร็งระยะสุดทายจะมีชีวิตอยูรอดมากกวาหนึ่งปนักวิจัยอยากทราบวา การรักษาดวยวิธีใหมจะชวยยืดชีวิตอยูรอดมากกวาเดิม หรือไมจึงศึกษาโดยการสุมผูปวยมะเร็งระยะสุดทายมาจํานวน 38 คน เพื่อใหการรักษาดวยวิธีใหม พบวา
ชวงชีวิติอยูรอดมีคาเฉลี่ย 23.1 เดือน และคาเบี่ยงเบนมาตรฐานเทากับ 8.1 เดือน
ตัวอยางParametric Statistics
วิเคราะหขอมูลเพื่อสรุปวา ดวยการรักษาวิธีใหม2) ผูปวยมะเร็งระยะสุดทายมีชีวิตรอดมากกวาเดิม หรือไม
(เปรียบเทียบคาเฉลี่ยชวงชีวิตรอดของตัวอยางศึกษา กับ 18.8 เดือน)สมมุติฐาน H0 :
HA :µ = 18.8 เดือนµ > 18.8 เดือน
x µ− 8.181.23 −
ชวงชีวิติอยูรอดมีคาเฉลี่ย 23.1 เดือน และคาเบี่ยงเบนมาตรฐานเทากับ 8.1 เดือนหรือ มีผูปวยจํานวน 28 คน จาก 38 คน ที่มีชีวิตรอดมากกวาหนึ่งป
วิสุทธิ์ กังวานตระกูล
สถิติทดสอบที่ใชคือ
n
sx
tµ−
= 272.3
38
1.88.181.23
t =−
=
=TDIST(3.272,37,1)p value = 0.00116
, df = 38-1
สถิติพื้นฐานเพื่อการวิจัย 23
• ประมาณความแตกตางคาเฉลี่ยระหวางประชากร 2 กลุม• เปรียบเทียบคาเฉลี่ยระหวางประชากร 2 กลุม
การวิจัยที่สุมเก็บตัวอยางมาจากประชากร 2 กลุม เพื่อ
สถิติสําหรับวิเคราะหความแตกตางคาเฉลี่ยระหวางกลุมตัวอยาง 2 กลุม
ประเภทสถิติ กลุมตัวอยาง 2 กลุมเปนอิสระตอกัน กลุมตัวอยาง 2 กลุมไมเปนอิสระตอกัน
Parametric Statistics
ประเภทสถิติ กลุมตัวอยาง 2 กลุมเปนอิสระตอกัน กลุมตัวอยาง 2 กลุมไมเปนอิสระตอกัน
Parametric statistics
Z-testStudent T-test for equal valence Student T-test for unequal valence
Paired t-test
Non-parametric statistics
Mann-Whitney U testWilcoxon sign rank test
Sign testWilcoxon matched-pair sign test
วิสุทธิ์ กังวานตระกูล
สถิติพื้นฐานเพื่อการวิจัย 24
การวิจัยที่สุมเก็บตัวอยางมาจากประชากร 2 กลุม เพื่อ• ประมาณความแตกตางคาเฉลี่ยระหวางประชากร 2 กลุม• เปรียบเทียบคาเฉลี่ยระหวางประชากร 2 กลุม
กรณี ตัวอยางมาจากประชากร 2 กลุม ไมอสิระตอกนัจํานวนคูตัวอยางสําหรับการศึกษาคํานวณไดจากสตูร
Parametric Statistics
Z1−α = 1.960 คามาตรฐานใตโคงปกติ แบบ two-tail เมื่อกําหนด CI 95%Z1−β = 1.282 คามาตรฐานใตโคงปกติ แบบ one-tail เมื่อกําหนด power of test 90%s = 0.50 คาสวนเบี่ยงเบนมาตรฐานของผลตางคูขอมูลdmax = 0.75 คาเฉลี่ยของผลตางคูขอมูล
n = 9 จํานวนตัวอยางของแตละกลุมที่ตองใชในการศึกษา
ddt
)( µ−=
คาสถิติสําหรับการวิเคราะห
, df = n-1 ddZ
)( µ−=ถา n > 30 อาจใช
วิสุทธิ์ กังวานตระกูล
n
sd
dt = , df = n-1
n
std d
d2αµ ±=
n
sZd d
d2αµ ±=
n
sd
dZ =ถา n > 30 อาจใช
การวิจัยที่สุมเก็บตัวอยางมาจากประชากรกลุมเดิม แตสุมเก็บ 2 ครั้ง คือกอนและหลังการกระทํา (treatment) อยางใดอยางหนึ่งตอประชากรนั้น เพื่อทดสอบวา กอนการ treatment และหลังการ treatment นั้นมีผลตอคาเฉลี่ยหรือไม กรณีนี้ ถือวากลุมขอมูลที่สุมเก็บทั้ง 2 ครั้ง ไมอิสระตอกัน จะใช paired t-test ในการทดสอบ
สถิติพื้นฐานเพื่อการวิจัย 25
การวิจัยที่สุมเก็บตัวอยางมาจากประชากร 2 กลุม เพื่อ• ประมาณความแตกตางคาเฉลี่ยระหวางประชากร 2 กลุม• เปรียบเทียบคาเฉลี่ยระหวางประชากร 2 กลุม
กรณีตัวอยางมาจากประชากร 2 กลุม อสิระตอกัน
จํานวนตัวอยางแตละกลุมสาํหรับการศึกษาคํานวณไดจากสตูร
Parametric Statistics
จํานวนตัวอยางแตละกลุมสาํหรับการศึกษาคํานวณไดจากสตูร
Zα = 1.960 คามาตรฐานใตโคงปกติ แบบ two-tail เมื่อกําหนด CI 95%Zβ = 1.282 คามาตรฐานใตโคงปกติ แบบ one-tail เมื่อกําหนด power of test 90%σ = 1.00 คาสวนเบี่ยงเบนมาตรฐานรวมของทั้ง 2 กลุมตัวอยาง ใช pooled SD ของ 2 กลุมตัวอยางµ1 = 7.32 คาเฉลี่ยของประชากรกลุมตัวอยางที่ 1 ใชคาเฉลี่ยของกลุมตัวอยางที่ 1 ประมาณการ
221
22
)(
)(2
µµ
σ βα
−
+=
ZZn
วิสุทธิ์ กังวานตระกูล
µ1 = 7.32 คาเฉลี่ยของประชากรกลุมตัวอยางที่ 1 ใชคาเฉลี่ยของกลุมตัวอยางที่ 1 ประมาณการµ2 = 7.00 คาเฉลี่ยของประชากรกลุมตัวอยางที่ 2 ใชคาเฉลี่ยของกลุมตัวอยางที่ 2 ประมาณการ
µ1 - µ2 = 0.32n = 205 จํานวนตัวอยางของแตละกลุมที่ตองใชในการศึกษา
สถิติพื้นฐานเพื่อการวิจัย 2626
การวิจัยที่สุมเก็บตัวอยางมาจากประชากร 2 กลุม เพื่อ• ประมาณความแตกตางคาเฉลี่ยระหวางประชากร 2 กลุม• เปรียบเทียบคาเฉลี่ยระหวางประชากร 2 กลุม
กรณีตัวอยางมาจากประชากร 2 กลุม อสิระตอกัน
คาสถิติสําหรับการวิเคราะห
Parametric Statistics
2
2
1
2
2121 )()(
n
s
n
s
xxt
pp +
−−−=
µµ , df = n1+n2-2
2
22
1
21
2121 )()(
nn
xxZ
σσ
µµ
+
−−−=
กรณีทราบคาความแปรปรวนของประชากรและ n1 > 30, n2 > 30
กรณีไมทราบคาความแปรปรวนของประชากรและทราบวา มีความแปรปรวนเทากัน
คาสถิติสําหรับการวิเคราะห
วิสุทธิ์ กังวานตระกูล
2
)1()1(
21
222
2112
−+−+−
=nn
snsnsp
2
2
1
2
2)()( 2121 n
s
n
s pptxx +±−=− αµµ
21 nn
2
22
1
21
2)()( 2121 nnZxx σσ
αµµ +±−=−
ประมาณความแตกตางดวยสมการ ประมาณความแตกตางดวยสมการ
สถิติพื้นฐานเพื่อการวิจัย 2727
การวิจัยที่สุมเก็บตัวอยางมาจากประชากร 2 กลุม เพื่อ• ประมาณความแตกตางคาเฉลี่ยระหวางประชากร 2 กลุม• เปรียบเทียบคาเฉลี่ยระหวางประชากร 2 กลุม
กรณีตัวอยางมาจากประชากร 2 กลุม อสิระตอกัน
คาสถิติสําหรับการวิเคราะห
Parametric Statistics
กรณีไมทราบคาความแปรปรวนของประชากรและทราบวา มีความแปรปรวนไมเทากัน
คาสถิติสําหรับการวิเคราะห
22
21
2121 )()(
ss
xxt
+
−−−=
µµ ( )2
1
22
2
1
21
2
22
1
21
+
+= n
sns
n
s
n
s
df22
21
2121 )()(
ss
xxZ
+
−−−=
µµ
กรณี n1 > 30, n2 > 30
วิสุทธิ์ กังวานตระกูล
ประมาณความแตกตางดวยสมการ
2
2
1
1
n
s
n
s+
)1()1( 21 −
− + nn
2
22
1
21
2)()( 2121 n
snstxx +±−=− αµµ
2
22
1
21
2)()( 2121 n
snsZxx +±−=− αµµ
ประมาณความแตกตางดวยสมการ
2
2
1
1
nn+
สถิติพื้นฐานเพื่อการวิจัย 28
A B C D2 ระดับ serum cholesterol (mg/dL)
สมมุติฐานH : ระดับ cholesterol กอนและหลัง
Objective: ตองการทราบวาโปรแกรมการออกกําลังกายหนึ่ง จะทําใหลดระดับ cholesterol ไดหรือไม
Study: สุมเก็บขอมูลจากอาสาสมัคร โดยตรวจเลือดในตอนเชาเปนคาอางอิงของแตละคนหลังจากนั้นอีก 1 สัปดาหใหออกกําลังกายตามโปรแกรมและตรวจเลือดในเชาวันรุงขึ้น ไดขอมูลผลตรวจ cholesterol ตามตาราง
Parametric Statistics
2
3กอนเขาโปรแกรม
หลังเขาโปรแกรม
ผลตาง
4 x y d = x - y5 1 182 198 -166 2 232 210 227 3 191 194 -38 4 200 220 -209 5 148 138 10
10 6 249 220 2911 7 276 219 57
ระดับ serum cholesterol (mg/dL) H0: ระดับ cholesterol กอนและหลังเขาโปรแกรมออกกําลังกายไมตางกัน(เทากัน)( x = y)
HA: ระดับ cholesterol กอนและหลังเขาโปรแกรมออกกําลังกายตางกัน( x ≠ y)
วิสุทธิ์ กังวานตระกูล
11 7 276 219 5712 8 213 161 5213 9 214 210 414 10 480 313 16715 11 262 226 3616 Mean = 30.7317 SD = 51.8218 0.078
=TTEST(C5:C15,B5:B15,2,1)p value = 0.078 ขอมูล xขอมูล y
2 tail testPaired t-testวิเคราะห Paired t-test ดวย Excel
สถิติพื้นฐานเพื่อการวิจัย 29
A B C สมมุติฐาน
Objective: ตองการทราบวาโปรแกรมการออกกําลังกายหนึ่ง จะทําใหลดระดับ cholesterol ไดหรือไม
Study: สุมเก็บขอมูลจากอาสาสมัคร 2 กลุม กลุม x (ไมออกกําลังกาย) และ กลุม y (ออกกําลังกายตามโปรแกรม) ทั้ง 2 กลุมนัดมาเจาะเลือดตรวจวันเดียวกัน คือ เชาวันรุงขึ้นหลังการออกกําลังกายตามโปรแกรมของกลุม yไดขอมูลผลตรวจ cholesterol ตามตาราง
Parametric Statistics
A B C2 x y3 1 132 1354 2 140 1425 3 138 1376 4 128 1237 5 135 1398 6 136 1379 7 132 129
10 8 142 14111 9 134 137
สมมุติฐานH0: ระดับ cholesterol ของประชากรกลุม x และ y
ไมตางกัน (หรือเทากัน) ( x = y)HA: ระดับ cholesterol ของประชากรกลุม x และ y
ไมเทากัน (หรือตางกัน)( x ≠ y)
=FTEST(C3:C15,B3:B15)
วิเคราะห F-test ดวย Excel
วิสุทธิ์ กังวานตระกูล
11 9 134 13712 10 135 138 0.506613 11 123 13014 12 12015 13 12116 Mean= 132.0 135.317 SD= 7.1 5.718 0.2312
=TTEST(C3:C15,B3:B15,2,2)
p value = 0.2312 ขอมูล xขอมูล y
2 tail testEqual varianceวิเคราะห student t-test ดวย Excel
p value = 0.5066
สถิติพื้นฐานเพื่อการวิจัย 30
A B C สมมุติฐาน
Study: สุมเก็บขอมูลจากอาสาสมัคร 2 กลุม กลุม x (ไมออกกําลังกาย) และ กลุม y (ออกกําลังกายตามโปรแกรม) ทั้ง 2 กลุมนัดมาเจาะเลือดตรวจวันเดียวกัน คือ เชาวันรุงขึ้นหลังการออกกําลังกายตามโปรแกรมของกลุม yไดขอมูลผลตรวจ cholesterol ตามตาราง
Objective: ตองการทราบวาโปรแกรมการออกกําลังกายหนึ่ง จะทําใหลดระดับ cholesterol ไดหรือไม
Parametric Statistics
A B C2 x y3 1 132 1404 2 140 1005 3 138 1216 4 128 1507 5 135 1288 6 136 1209 7 132 129
10 8 142 12011 9 134 135
สมมุติฐานH0: ระดับ cholesterol กอนและหลัง
เขาโปรแกรมออกกําลังกายไมตางกัน(เทากัน)( x = y)HA: ระดับ cholesterol กอนและหลัง
เขาโปรแกรมออกกําลังกายตางกัน ( x ≠ y)
=FTEST(C3:C15,B3:B15)
วิเคราะห F-test ดวย Excel
วิสุทธิ์ กังวานตระกูล
11 9 134 13512 10 135 150 0.018713 11 123 12014 12 12015 13 12116 Mean= 132.0 128.517 SD= 7.1 14.818 0.4499
=TTEST(C3:C15,B3:B15,2,3)
p value = 0.4499 ขอมูล xขอมูล y
2 tail testunequal varianceวิเคราะห student t-test ดวย Excel
p value = 0.0187
สถิติพื้นฐานเพื่อการวิจัย 3131
• ประมาณความแตกตางคาสัดสวนระหวางประชากร 2 กลุม• เปรียบเทียบคาสัดสวนระหวางประชากร 2 กลุม
การวิจัยที่สุมเก็บตัวอยางมาจากประชากร 2 กลุม เพื่อ
คาสถิติสําหรับการวิเคราะห เจาหนาที่หองปฏิบัติการชันสูตร ตองการ
กรณีตัวอยางมาจากประชากร 2 กลุม อสิระตอกัน
Parametric Statistics
2
22
1
11
2121
ˆˆˆˆ
)()ˆˆ(
n
qp
n
qp
ppppZ
+
−−−=
คาสถิติสําหรับการวิเคราะห
กรณี n1 > 30, n2 > 30
เจาหนาที่หองปฏิบัติการชันสูตร ตองการทราบวาผูรับบริการกลุมอาชีพเกษรกรและกลุมขาราชการ กลุมใดมีความพึงพอใจในการบริการมากกวากัน จึงทําการสํารวจความพึงพอใจในการใหบริการของหองปฏิบัติการชันสูตรในรอบ 2 เดือนที่ผานมาพบวา ผูรับบริการกลุมอาชีพเกษตรกรที่ตอบแบบสอบถามจํานวน 79 ราย มีความพึงพอใจในบริการจํานวน 63 ราย และกลุมผูรับ
วิสุทธิ์ กังวานตระกูล
2
22
1
112121
ˆˆˆˆ)ˆˆ()(
2 n
qp
n
qpZpppp +±−=− α
ประมาณความแตกตางดวยสมการ
ในบริการจํานวน 63 ราย และกลุมผูรับราชการที่ตอบแบบสอบถามจํานวน 72 รายมีความพึงพอใจในบริการจํานวน 62 ราย
สถิติพื้นฐานเพื่อการวิจัย 3232
• ประมาณความแตกตางคาสัดสวนระหวางประชากร 2 กลุม• เปรียบเทียบคาสัดสวนระหวางประชากร 2 กลุม
การวิจัยที่สุมเก็บตัวอยางมาจากประชากร 2 กลุม เพื่อ
กรณีตัวอยางมาจากประชากร 2 กลุม อสิระตอกันเจาหนาที่หองปฏิบัติการชันสูตร ตองการทราบวาผูรับบริการกลุมอาชีพเกษรกรและกลุมขาราชการ กลุมใดมีความพึงพอใจในการบริการมากกวากัน จึงทําการสํารวจความพึงพอใจในการ
Parametric Statistics
2211
2121
ˆˆˆˆ
)()ˆˆ(
n
qp
n
qp
ppppZ
+
−−−=
ขาราชการ กลุมใดมีความพึงพอใจในการบริการมากกวากัน จึงทําการสํารวจความพึงพอใจในการใหบริการของหองปฏิบัติการชันสูตรในรอบ 2 เดือนที่ผานมาพบวา ผูรับบริการกลุมอาชีพเกษตรกรที่ตอบแบบสอบถามจํานวน 79 ราย มีความพึงพอใจในบริการจํานวน 63 ราย และกลุมผูรับราชการที่ตอบแบบสอบถามจํานวน 72 รายมีความพึงพอใจในบริการจํานวน 62 ราย
A B C D2 สรุปการตอบแบบสอบถามความพึงใจตองานบริการ
3จํานวนผูตอบ
จํานวนทีพ่ึงพอใจ
รอยละทีพ่อใจ
4 กลุมเกษตรกร 79 63 79.75%
วิสุทธิ์ กังวานตระกูล
21 nn+
2
22
1
112121
ˆˆˆˆ)ˆˆ()(
2 n
qp
n
qpZpppp +±−=− α
ประมาณความแตกตางดวยสมการ
4 กลุมเกษตรกร 79 63 79.75%5 กลุมขาราชการ 72 62 86.11%6 Z = 1.413 6.36%7 p value = 0.0798 95% CI -1.05% 13.78%
Objective: กลุมอาชีพผูมารับบริการมีความสัมพันธกับความพึงพอใจหรือไม
สถิติพื้นฐานเพื่อการวิจัย 33
การวิจัยที่สุมเก็บตัวอยางมาจากประชากรกลุมเดิม แตสุมเก็บ 2 ครั้ง คือ กอน และ หลัง การกระทํา (treatment) อยางใดอยางหนึ่งตอประชากรนั้นเพื่อทดสอบวากอนการ treatment และหลังการ treatment นั้นมีความแตกตางกันหรือไมกรณีนี ้ถอืวากลุมขอมูลที่สุมเก็บทัง้ 2 ครั้ง ไมอสิระตอกนั
กรณี ขอมูลเปนแบบนามบัญญัติหรือแบบเรียงลําดับที่มีจําแนกเปน 2 กลุมยอย เชนการทดสอบอาการเปลี่ยนแปลง (ดีขึ้น/ไมดีขึ้น) ของคนกลุมหนึ่ง
Parametric Statistics
การทดสอบอาการเปลี่ยนแปลง (ดีขึ้น/ไมดีขึ้น) ของคนกลุมหนึ่งกอนและหลังการใชยาชนิดหนึ่ง
การทดสอบความคิดเห็น(ชอบ/ไมชอบ) ของคนกลุมหนึ่งกอนและหลังการอานบทความในหนังสือพิมพ
ความคิดเห็นของผูที่ใชครีมบํารุงผวิ
หลังการใชครีม
กอนใชครีม ไมมีคุณภาพ (-) มีคุณภาพดี (+)
มีคุณภาพดี (+) A = 14 B = 43
)(
)1( 22
DA
DA
+
−−=χ
สถิติที่ใชทดสอบคือ McNemar Test
, df = 1
)13114( 2−−
วิสุทธิ์ กังวานตระกูล
มีคุณภาพดี (+) A = 14 B = 43
ไมมีคุณภาพ (-) C = 12 D = 31689.5
)3114(
)13114( 22 =
+
−−=χ
p value = 0.017 =CHIDIST(5.689,1)χ2tab= 3.84 =CHIINV(0.05,1)
p1: กอนใชครีม คิดวามีคุณภาพดี เปนสัดสวน (14+43)/100 = 0.57p2: หลังใชครีม คิดวามีคุณภาพดี เปนสัดสวน (43+31)/100 = 0.74
P1 = 14/100 = 0.14 สัดสวนที่เปลี่ยนจาก (+) เปน (-) P2 = 31/100 = 0.31 สัดสวนที่เปลี่ยนจาก (-) เปน (+)
H0: p1 = p2 กอนและหลังไมเปลี่ยนความคิดHA: p1 ≠ P2 กอนและหลังเปลี่ยนความคิด
สถิติพื้นฐานเพื่อการวิจัย 34
• วิเคราะหความสัมพันธระหวางขอมูลของ 2 ประชากรการวิจัยที่สุมเก็บตัวอยางมาจากประชากร 2 กลุม เพื่อ
ขอมูลทั้งสองกลุมใชมาตรวดั interval หรือ ratio scale• ถาการแจกแจงขอมูลของทัง้สองกลุมเปนแบบปกติ (normal distribution)
ใชคาสัมประสิทธิ์สหสัมพันธ (r) แบบ Pearson product moment correlation
Parametric Statistics
ใชคาสัมประสิทธิ์สหสัมพันธ (r) แบบ Pearson product moment correlation
• ถาการแจกแจงขอมูลของทัง้สองกลุมเปนแบบปกติ (non-normal distribution)ใชคาสัมประสิทธิ์สหสัมพันธ (r) แบบ Spearman rank correlation
∑ ∑ ∑ ∑
∑ ∑ ∑−−
−=
])(][)([ 2222 yyNxxN
yxxyNr
x, y เปนขอมูลของกลุมตัวอยาง x และ y
วิสุทธิ์ กังวานตระกูล
x, y เปนเลขลําดับที่ตามคาขอมูล (rank) ของขอมูลกลุมตัวอยาง x และ y
r มีคาระหวาง -1 ถึง 1 ถา r = 0 แสดงวาขอมูลทั้งสองกลุมไมมีความสัมพันธกัน
สถิติพื้นฐานเพื่อการวิจัย 35
y = y = y = y = 1111....0072007200720072x x x x ---- 0000....1133113311331133
RRRR2222 = 0000....987898789878987820.0
25.0
!"#$#
%&'()
*+
• วิเคราะหความสัมพันธระหวางขอมูลของ 2 ประชากรการวิจัยที่สุมเก็บตัวอยางมาจากประชากร 2 กลุม เพื่อ
คา r ที่คํานวณได ตองพิสูจนกอนวามีคาแตกตางจาก 0 ดวยสถิติ t ตามสูตร
2
2nrt
−= , df = n-2H0: r = 0
H : r ≠ 0
Parametric Statistics
RRRR = 0000....9878987898789878
5.0
10.0
15.0
20.0
,-./
#0 C
a !"#
$#%&'(
)*
+
r = 0.9939
2r1rt
−= , df = n-2
n = 30r = 0.994
p value = 0.000
HA: r ≠ 0
H0: ρ = 0.90HA: ρ ≠ 0.90 z
zzZ
σ
µ−=
1z =σ
+ r1
วิสุทธิ์ กังวานตระกูล
0.00.0 5.0 10.0 15.0 20.0 25.0
,-./#0 ca !"#$#%&'5"675%7 (mg/dl)
R2 คือ Coefficient of determination(สัมประสิทธิ์การตัดสินใจ)ใชบอกประสิทธิภาพการประมาณการคา y จากคา x ของสมการเสนตรงความสัมพันธ (simple linear regression equation)
3nz
−=σ
−
+=
r1
r1log513.1z
ρ−
ρ+=µ
1
1log513.1z
สถิติพื้นฐานเพื่อการวิจัย
การวิเคราะหแปรปรวนทางเดียว(One-way ANOVA)ขอสมมติหรือขอตกลงเบื้องตน(Assumptions)
1. ขอมูลที่นํามาทดสอบตองเปนตัวอยางสุมจากประชากร r กลุมที่สนใจ2. การแจกแจงของประชากรแตละกลุมตองเปนแบบปกติ3. คาความแปรปรวนของแตละประชากรตองเทากัน4. ขอมูลจากประชากรแตละกลุมตองอิสระตอกัน
Parametric Statistics
ประชากรชุดที่ คาของตัวอยางที่เก็บได รวม คาเฉลี่ย
1 x11 x12 … x1i T1 Mean1
2 X21 X22 … X2i T2 Mean2
3 X31 X32 … X3i T3 Mean3
4 x X … X T Mean
4. ขอมูลจากประชากรแตละกลุมตองอิสระตอกัน
วิสุทธิ์ กังวานตระกูล
4 x41 X42 … X4i T4 Mean4
. . . . . . .
r xr1 xr2 … xri Tr Meanr
T Meanallการวิเคราะหแปรปรวนแบบหลายตัวแปร(Multivariate Analysis of Variance: MANOVA)
สถิติพื้นฐานเพื่อการวิจัยParametric Statistics
การเปรียบเทียบเชิงซอน Multiple Comparison
H0: ความแปรปรวนทุกกลุมเทากันHA: ความแปรปรวนอยางนอยหนึ่งกลุมแตกตาง
การวิเคราะหแปรปรวนทางเดียว(One-way ANOVA)
วิสุทธิ์ กังวานตระกูล
สถิติพื้นฐานเพื่อการวิจัย
การเปรียบเทียบเชิงซอน Multiple Comparison
การวิเคราะหแปรปรวนทางเดียว(One-way ANOVA)
H0: คาเฉลี่ยของทกุกลุมเทากันHA: คาเฉลี่ยนของกลุมอยางนอย 1 คูแตกตางกัน
Parametric Statistics
สถิติที่ใชทดสอบวาคูใหนตางกัน
SSBG: sum of square ระหวางกลุมSSWG: sum of square ภายในกลุม
วิสุทธิ์ กังวานตระกูล
สถิติพื้นฐานเพื่อการวิจัย
ตัวอยาง: จากการสุมหาน้ําหนกัแรกเกดิของทารกจํานวน 75 คน ไดขอมูลดังตาราง
จํานวนน้ําหนกัแรกเกดิ (กิโลกรัม)
คาเฉลี่ย SD
ทารกเพศชาย 40 3.39 0.44
ที่ระดับนัยสําคัญ 0.05ก.) สถติิทดสอบที่ใชทดสอบสมมติฐานเพื่อสรุปวา
ความแปรปรวนของน้ําหนกัแรกเกิดของทารกทั้งสองเพศแตกตางกนัหรือไม
ข.) สถติิทดสอบที่ใชทดสอบสมมติฐานเพื่อสรุปวา
ทารกเพศชาย 40 3.39 0.44
ทารกเพศหญิง 35 3.18 0.53
วิสุทธิ์ กังวานตระกูล
ข.) สถติิทดสอบที่ใชทดสอบสมมติฐานเพื่อสรุปวา มีความแตกตางระหวางน้ําหนกัแรกเกิดของทารกทัง้สองเพศหรอืไม
ค.) ขอสันนิษฐานเบือ้งตนสําหรับการทดสอบสมมติฐานนี้คือ
สถิติพื้นฐานเพื่อการวิจัย
ตัวอยางในการวิเคราะหการถดถอย (regression analysis) เพื่อหาความสัมพันธระหวางผลการตรวจวัด HDL-C ดวยวิธีอางอิง (x) และวิธีปรับปรุงใหม (y) ไดขอมูล ดังนี้y = 0.9965x + 1.815, r2 = 0.9865
ก.) คา r2 คือคาอะไร
ข.) จงเขียนอธิบายความหมายของคา r2
วิสุทธิ์ กังวานตระกูล
สถิติพื้นฐานเพื่อการวิจัย 41การวิเคราะหความสัมพันธของตวัแปรการวิเคราะหความสัมพันธของตวัแปร
• วิเคราะหความสัมพันธระหวางขอมูลของ 2 ประชากรการวิจัยที่สุมเก็บตัวอยางมาจากประชากร 2 กลุม เพื่อ
กรณีขอมูลทั้งสองกลุมถูกจําแนกเปนเพียง 2 ลักษณะ และนับความถี่ลงในตาราง 2x2
A B C D E F GExpose Out Come
A B C D E F G1 ตัวแปรตน/อิสระ2 การไดรับยา A34 ไดรับยา A n11 = 189 n12 = 10845 n1+ = 110345 ไมไดรับยา A n21 = 104 n22 = 10933 n2+ = 110376 n+1 = 293 n+2 = 21778 N = 22071
ตัวแปรตามการเปนโรคหัวใจ
เปน ไมปน
วเิคราะหความแตกตางของสัดสวน เพื่อบอกความสัมพันธของตัวแปร
วิสุทธิ์ กังวานตระกูล
วเิคราะหอัตราสวนของสัดสวน (Relative risk) เพื่อบอกความสัมพันธของตัวแปร
วเิคราะหอัตราสวนของ ODDs (ODDs ratio) เพื่อบอกความสัมพันธของตัวแปร
ในกรณีที่การศึกษา เริ่มที่ตัวแปรตน แลวคนหา ตัวแปรตาม <= Cohort study
ในกรณีที่การศึกษาเริ่มที่ตัวแปรตาม แลวคนหา ตัวแปรตน <= Case control study
สถิติพื้นฐานเพื่อการวิจัย 42การวิเคราะหความสัมพันธของตวัแปรการวิเคราะหความสัมพันธของตวัแปร
• วิเคราะหความสัมพันธระหวางขอมูลของ 2 ประชากรการวิจัยที่สุมเก็บตัวอยางมาจากประชากร 2 กลุม เพื่อ
กรณีขอมูลทั้งสองกลุมถูกจําแนกเปนเพียง 2 ลักษณะ และนับความถี่ลงในตาราง 2x2A B C D E F G H I
1 ตัวแปรตน/อิสระ2 การไดรับยา A
ตัวแปรตามการเปนโรคหัวใจ2 การไดรับยา A
34 ไดรับยา A n11 = 189 n12 = 10845 n1+ = 11034 ρ1 = 0.01715 ไมไดรับยา A n21 = 104 n22 = 10933 n2+ = 11037 ρ2 = 0.00946 n+1 = 293 n+2 = 21778 N = 2207178 low high9 |ρ1 - ρ2| = 0.0077 95%CI 0.0047 0.0107
การเปนโรคหัวใจเปน ไมปน
วเิคราะหความแตกตางของสัดสวน เพื่อบอกความสัมพันธของตัวแปร
วิสุทธิ์ กังวานตระกูล
วเิคราะหความแตกตางของสัดสวน เพื่อบอกความสัมพันธของตัวแปร
สัดสวนของกลุมที่ไมไดรับยา A เปนโรคหัว (ρ1) = 104/11037 = 0.0094สัดสวนของกลุมที่ไดรับยา A เปนโรคหัวใจ (ρ2) = 189/11034 = 0.0171
H0: ρ1 = ρ2 HA: ρ1 ≠ ρ2
(1-α) CI เทากับ2
22
1
11
2121
ˆˆˆˆ
)()ˆˆ(
n
qp
n
qp
ppppZ
+
−−−= ( ) ( )
2
22
1
11 11
nnSE
ρ−ρ+
ρ−ρ=
SEZ2
21 α±ρ−ρ
สถิติพื้นฐานเพื่อการวิจัย 43การวิเคราะหความสัมพันธของตวัแปรการวิเคราะหความสัมพันธของตวัแปร
• วิเคราะหความสัมพันธระหวางขอมูลของ 2 ประชากรการวิจัยที่สุมเก็บตัวอยางมาจากประชากร 2 กลุม เพื่อ
กรณีขอมูลทั้งสองกลุมถูกจําแนกเปนเพียง 2 ลักษณะ และนับความถี่ลงในตาราง 2x2A B C D E F G H I
1 ตัวแปรตน/อิสระ2 การไดรับยา A
ตัวแปรตามการเปนโรคหัวใจ2 การไดรับยา A
34 ไดรับยา A n11 = 189 n12 = 10845 n1+ = 11034 ρ1 = 0.01715 ไมไดรับยา A n21 = 104 n22 = 10933 n2+ = 11037 ρ2 = 0.00946 n+1 = 293 n+2 = 21778 N = 2207178 low high
10 RR = 1.817895%CI 1.4330 2.3059
การเปนโรคหัวใจเปน ไมปน
วเิคราะหอัตราสวนของสัดสวน (Relative risk) เพื่อบอกความสัมพันธของตัวแปร ในกรณีที่การศึกษา เริ่มที่ตัวแปรตน แลวคนหา ตัวแปรตาม <= Cohort study
วิสุทธิ์ กังวานตระกูล
ในกรณีที่การศึกษา เริ่มที่ตัวแปรตน แลวคนหา ตัวแปรตาม <= Cohort study
(1-α) CI ของ RR เทากับ
2
1
ρ
ρRelative risk(RR) =
( )
ρ
ρ=
2
1lnln RR
( ) ( ) ( )
+−+
+−=
222121121111ln
1111
nnnnnnSE RR
)ln(2
)ln( RRSEZRR
eα±
สถิติพื้นฐานเพื่อการวิจัย 44การวิเคราะหความสัมพันธของตวัแปรการวิเคราะหความสัมพันธของตวัแปร
• วิเคราะหความสัมพันธระหวางขอมูลของ 2 ประชากรการวิจัยที่สุมเก็บตัวอยางมาจากประชากร 2 กลุม เพื่อ
กรณีขอมูลทั้งสองกลุมถูกจําแนกเปนเพียง 2 ลักษณะ และนับความถี่ลงในตาราง 2x2A B C D E F G H I
1 ตัวแปรตน/อิสระ2 การไดรับยา A
ตัวแปรตามการเปนโรคหัวใจ2 การไดรับยา A
34 ไดรับยา A n11 = 189 n12 = 10845 n1+ = 11034 ODD1 0.01745 ไมไดรับยา A n21 = 104 n22 = 10933 n2+ = 11037 ODD2 0.00956 n+1 = 293 n+2 = 21778 N = 22071 OR = 1.832178 low high9 OR = 1.8321 95%CI 1.4400 2.3308
การเปนโรคหัวใจเปน ไมปน
วเิคราะหอัตราสวนของ ODDs (ODDs ratio) เพื่อบอกความสัมพันธของตัวแปร
วิสุทธิ์ กังวานตระกูล
วเิคราะหอัตราสวนของ ODDs (ODDs ratio) เพื่อบอกความสัมพันธของตัวแปรในกรณีที่การศึกษาเริ่มที่ตัวแปรตาม แลวคนหา ตัวแปรตน <= Case control study
(1-α) CI ของ OR เทากับ )ln(
2)ln( ORSEZOR
eα±
( )22211211
ln1111
nnnnSE OR +++=
2112
2211
22
21
12
11
nnnn
nnnn
=ODDs ratio(OR) =
=
2112
2211ln)ln(nnnn
OR