6
การวิเคราะหทางสถิติดวยโปรแกรม Stata สถิติเชิงพรรณนา ผูชวยศาสตราจารยนิคม ถนอมเสียง สาขาวิชาวิทยาการระบาดและชีวสถิติ คณะสาธารณสุขศาสตร มหาวิทยาลัยขอนแกน Email: [email protected] WebPage: https://home.kku.ac.th/nikom การวิเคราะหสถิติเชิงพรรณนา ตัวแปรตอเนื่อง (interval, ratio) คาเฉลี่ย (Mean) ความแปรปรวน (Variance) สวนเบี่ยงเบนมาตรฐาน (Standard Deviation) มัธยฐาน (Median) คลอรไทร (Quartile) etc. คําสั่ง summarize, tabstat ตัวแปร nominal, ordinal การแจกแจงความถี่ รอยละ คําสั่ง tabulate, tab1 การสรางตัวแปรใหม: generate/การเปลี่ยนแปลง ขอมูล: recode และวิเคราะหขอมูลที่จัดกลุtabulate, tab1 Prompt พิมพคําสั่ง คําสั่ง summarize: วิเคราะห Mean, Standard deviation (sd) minimum, maximum ใช Stata command: sum age weight height chol [Enter] summarize -- Summary statistics คําสั่ง summarize [varlist] [if] [in] [weight] [, options] *detail=display additional statistics พิมพคําสั่ง .summarize age weight height chol หรือ .sum age weight height chol คําสั่ง summarize [varlist], detail: วิเคราะห สถิติ Mean, Standard deviation (sd) minimum, maximum, variance, Median, Quartile etc. ใช Stata command: summarize age, detail [Enter] พิมพคําสั่ง .summarize age, detail หรือ .sum age, detail ผลลัพธจากคําสั่ง summarize age, detail: วิเคราะห สถิติ Mean, Standard deviation (sd) minimum, maximum, variance, Median, Quartile etc. จํานวนขอมูล คาเฉลี่ย สวนเบี่ยงเบนมาตรฐาน ความแปรปรวน ความเบ ความโดง เปอรเซ็นไทลที่ 25 (P 25 ) sinv คลอรไทลที่ 1 (Q 1 ) เปอรเซ็นไทลที่ 75 (P 75 ) หรือ คลอรไทลที่ 3 (Q 3 ) เปอรเซ็นไทลที่ 50 (P 50 ) หรือคลอรไทลที่ 2 (Q 2 ) หรือมัธยฐาน

ðÖ øü Ùø dì Üÿë ê é aü÷ ðø Öøö ð4UBUB ÿë ê ß Üóøøèî · 2 4 Ù ÿ Ü ðtvnnbsj[f ð ðefubjm ð ðü Ùø d ðÿë ê ð.fbo ð ð 4uboebse

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: ðÖ øü Ùø dì Üÿë ê é aü÷ ðø Öøö ð4UBUB ÿë ê ß Üóøøèî · 2 4 Ù ÿ Ü ðtvnnbsj[f ð ðefubjm ð ðü Ùø d ðÿë ê ð.fbo ð ð 4uboebse

การวิเคราะหทางสถิติดวยโปรแกรม Stataสถิติเชิงพรรณนา

ผูชวยศาสตราจารยนิคม ถนอมเสียงสาขาวชิาวิทยาการระบาดและชีวสถิติ

คณะสาธารณสุขศาสตร มหาวิทยาลัยขอนแกนEmail: [email protected]

WebPage: https://home.kku.ac.th/nikom

การวิเคราะหสถิติเชงิพรรณนา

ตัวแปรตอเนื่อง (interval, ratio)คาเฉลี่ย (Mean) ความแปรปรวน (Variance)

สวนเบี่ยงเบนมาตรฐาน (Standard Deviation)มัธยฐาน (Median) คลอรไทร (Quartile) etc. คําสั่ง summarize, tabstat

ตัวแปร nominal, ordinalการแจกแจงความถี่ รอยละ คําสั่ง tabulate, tab1

การสรางตัวแปรใหม: generate/การเปลี่ยนแปลง ขอมูล: recode และวเิคราะหขอมูลท่ีจัดกลุม tabulate, tab1

Prompt พิมพคําสั่ง

คําสั่ง summarize: วิเคราะห Mean, Standard deviation (sd)minimum, maximum

ใช Stata command: sum age weight height chol [Enter]summarize -- Summary statisticsคําสั่ง summarize [varlist] [if] [in] [weight] [, options]*detail=display additional statistics

พิมพคําสั่ง .summarize age weight height chol หรือ

.sum age weight height chol

คําสั่ง summarize [varlist], detail: วิเคราะห สถิติ Mean, Standard deviation (sd) minimum, maximum, variance, Median, Quartile etc. ใช Stata command: summarize age, detail [Enter]

พิมพคําสั่ง .summarize age, detail หรือ

.sum age, detail

ผลลัพธจากคาํสั่ง summarize age, detail: วิเคราะห สถิติ Mean, Standard deviation (sd) minimum, maximum, variance, Median, Quartile etc.

จํานวนขอมูลคาเฉลี่ย

สวนเบี่ยงเบนมาตรฐานความแปรปรวนความเบความโดง

เปอรเซ็นไทลที่ 25 (P25) sinv คลอรไทลที่ 1 (Q1)

เปอรเซ็นไทลที่ 75 (P75) หรือ คลอรไทลที่ 3 (Q3)

เปอรเซ็นไทลที่ 50 (P50) หรือคลอรไทลที่ 2 (Q2)หรือมัธยฐาน

Page 2: ðÖ øü Ùø dì Üÿë ê é aü÷ ðø Öøö ð4UBUB ÿë ê ß Üóøøèî · 2 4 Ù ÿ Ü ðtvnnbsj[f ð ðefubjm ð ðü Ùø d ðÿë ê ð.fbo ð ð 4uboebse

คําสั่ง summarize: วิเคราะห Mean, Standard deviation (sd)minimum, maximum, variance, Median, Quartile etc. ใช Stata Menu: Statistics/Summaries, table, and tests/Summary and descriptive statistics/Summary statistics

คําสั่ง summarize [varlist], detail: วิเคราะห สถิต ิMean, Standard deviation (sd) …, variance, Median, Quartile etc. ใช Stata Menu: Statistics/Summaries, table, and tests/Summary and descriptive statistics/Summary statistics

คลิกเลือก

คําสั่ง tabstat [varlist], statistics(สถิติตางๆ):วเิคราะห สถิติเชิงพรรณนา โดยกําหนดเองใช Stata command:

tabstat age weight height chol, statistics(mean sd median p25 p75) [Enter]

พิมพคําสั่ง tabstat age weight height chol,

statistics(mean sd median p25 p75)

mean meancount count of nonmissing observationsn same as countsum summax maximummin minimumrange range = max - minsd standard deviationvariance variancecv coefficient of variation

(sd/mean)semean standard error of mean

(sd/sqrt(n))skewness skewnesskurtosis kurtosis

p1 1st percentilep5 5th percentilep10 10th percentileP25 25th percentilemedian median (same as p50)p50 50th percentile

(same as median)p75 75th percentileP90 90th percentilep95 95th percentilep99 99th percentileiqr interquartile range = p75 - p25q equivalent to specifying

p25 p50 p75

tabstat - Compact table of summary statisticsคําสั่ง tabstat varlist [if] [in] [weight] [, options]

คําสั่ง tabstat [varlist], statistics(สถิติตางๆ) column(variable)วเิคราะห สถิติเชิงพรรณนา โดยกําหนดเอง สถิติตามคอลัมนใช Stata command: tabstat age chol, statistics(mean sd median p25 p75) column(variable) [Enter]

พิมพคําสั่ง tabstat age chol, statistics(mean sd

median p25 p75) column(variable)

คําสั่ง tabstat [varlist], statistics(สถิติตางๆ):วเิคราะห สถิติเชิงพรรณนา โดยกําหนดเองใช Stata Menu: Statistics/Summaries, table, and tests/Others tables/

Compact table of summary statistics

Page 3: ðÖ øü Ùø dì Üÿë ê é aü÷ ðø Öøö ð4UBUB ÿë ê ß Üóøøèî · 2 4 Ù ÿ Ü ðtvnnbsj[f ð ðefubjm ð ðü Ùø d ðÿë ê ð.fbo ð ð 4uboebse

ตัวแปรจําแนกประเภท (Categorical)nominal, ordinal เชน เพศ อาชีพ

การแจกแจงความถี ่และวิเคราะหสถิติแจกแจงจํานวนความถี่และรอยละตามกลุมตัวแปรเดี่ยว tabulate, tab1 เชน

.tabulate sex

.tab1 sex occสองตวัแปร (two way) แสดงรอยละ, คาสถิติ

tabulate ตัวแปร1 ตัวแปร2, [เงื่อนไข]tab ตัวแปร1 ตัวแปร2ม [เงื่อนไข]

.tab sex occ, chi exact exp col row

คําสั่ง tabulate <varlist1> วิเคราะหตารางแจกแจงความถี่ (ตัวแปรเดี่ยว) ใช Stata command

พิมพคําสั่ง tabulate sex [Enter]

พิมพคําสั่ง tabulate occ [Enter]

ผลการวิเคราะห ตารางแจกแจงความถ่ี ตัวแปรเพศ พบเพศชาย (รหัส 1) จํานวน 1 ราย 20%

เพศหญิง(รหัส 2) จํานวน 4 ราย 80%จํานวนขอมูลทั้งหมด 5 ราย ไมมีขอมูลสูญหาย

ผลการวิเคราะห ตารางแจกแจงความถ่ี ตัวแปรอาชีพ พบ รหัส 1 จํานวน 2 ราย 40%

รหัส 3 จํานวน 1 ราย 20%รหัส 4 จํานวน 2 ราย 40%

จํานวนขอมูลทั้งหมด 5 ราย ไมมีขอมูลสูญหาย

คําสั่ง tabulate วิเคราะหตารางแจกแจงความถี่ใช Stata Menu: Statistics/Summaries table, and tests/

Frequency tables/ One-way table

คําสั่ง tab1 <varlist> วิเคราะหตารางแจกแจงความถี่ (ตัวแปรเดี่ยว หรือมากกวา 1 ตัวแปร)

ใช Stata command

พิมพคําสั่ง tab1 occ [Enter]

ผลการวิเคราะห ตารางแจกแจงความถ่ี ตัวแปรเพศ พบเพศชาย (รหัส 1) จํานวน 1 ราย 20%

เพศหญิง(รหัส 2) จํานวน 4 ราย 80%จํานวนขอมูลทั้งหมด 5 ราย ไมมีขอมูลสูญหาย

ผลการวิเคราะห ตารางแจกแจงความถ่ี ตัวแปรอาชีพ พบ รหัส 1 จํานวน 2 ราย 40%

รหัส 3 จํานวน 1 ราย 20%รหัส 4 จํานวน 2 ราย 40%

จํานวนขอมูลทั้งหมด 5 ราย ไมมีขอมูลสูญหาย

คําสั่ง tab1 วิเคราะหตารางแจกแจงความถี ่(ตัวแปรมากกวา 1 ตัวแปร)

ใช Stata Menu: Statistics/Summaries table, and tests/Frequency tables/ Multiple One-way table

การสรางตัวแปรใหม: generate/การเปลี่ยนแปลงขอมูล: recodeสรางตัวแปรใหมจาก คํานวณ Body Mass Index (BMI)

BMI = weight (kg) ÷ height2 (m2)

สรางตัวแปรใหมใหเทากับ BMI

จัดกลุม ตามทฤษฏี

วิเคราะหขอมูลท่ีจัดกลุม tabulate, tab1

. gen bmi=weight/(height/100)^2

. list

. gen bmi_gr=bmi

. recode bmi_gr min/18.4=1 18.5/25=2

25.1/max=3

. tab1 bmi_gr

The World Health Organisation (WHO)

BMI BMI Category

Less than 15 Very severely

underweight

Between 15 to 16 Severely

underweight

Between 16 to 18.5Underweight

Between 18.5 to 25 Normal (healthy

weight)

Between 25 to 30 Overweight

Between 30 to 35 Moderately obese

Between 35 to 40 Severely obese

Over 40 Very severely obese

Page 4: ðÖ øü Ùø dì Üÿë ê é aü÷ ðø Öøö ð4UBUB ÿë ê ß Üóøøèî · 2 4 Ù ÿ Ü ðtvnnbsj[f ð ðefubjm ð ðü Ùø d ðÿë ê ð.fbo ð ð 4uboebse

คาํสั่ง

สรางตัวแปรใหม

แสดงขอมูลตัวแปรที่สราง

สรางตัวแปรใหมใหมีคาเทากบั

bmi

เปลี่ยนคาขอมูล

วิเคราะหขอมูล

กลุม BMI

ปกติ 2 ราย 40%

สูง 3 ราย 60%

การตรวจสอบลักษณะขอมูล

ลักษณะการแจกแจงขอมูล: เบเชิงบวก/เบเชิงลบ, สมมาตร

การแจกแจงแบบปกติ

การตรวจสอบดวย graph histogram –graph two way

normal probability plot – pnorm

stem & leaf plot -stem

Box & Whisker เบเชิงบวก/ลบ, สมมาตร

ขอมูลสูงหรือต่ํากวาปกติ (outliers)

ขอมูลอยูนอกชวงกําหนด

การตรวจสอบการแจกแจงแบบปกติดวยสถิต ิ-swilk

ลักษณะการแจกแจงขอมูลHistogram Normal Probability Plot

Stem & Leaf Box-Whisker

Histogram Stata Command พิมพคําสั่ง histogram chol , normal bin(5)

พิมพคําสั่ง histogram chol , normal bin(5) [Enter]

ตัวแปร sysbp มีลักษณะเบเชงิลบ (เบซาย)จํานวนแทงสี่เหลี่มผืนผาจํานวน 3 แทง (bin)Stata คํานวณจํานวนแทง (bin) จาก

)10ln(

)ln(10,min

nnk

Histogram Stata Menu: Graphics/Histogram

กรณีระบจุํานวนแทง

normal probability plot – Stata Commandpnorm [varlist]

พิมพคําสั่ง pnorm age [Enter]

Page 5: ðÖ øü Ùø dì Üÿë ê é aü÷ ðø Öøö ð4UBUB ÿë ê ß Üóøøèî · 2 4 Ù ÿ Ü ðtvnnbsj[f ð ðefubjm ð ðü Ùø d ðÿë ê ð.fbo ð ð 4uboebse

normal probability plot – Stata Menu Statistics/Summaries, table, and tests/Distributional plots

and tests/ Normal probability plot, standardized

กรณีระบจุํานวนแทง

Stem & leaf plot: Stata Comand: stem [varlist] พิมพคําสั่ง stem chol [Enter]

พิมพคําสั่ง stem chol [Enter]

Stem & leaf plot ปรากฏขอมูลแบงเปน stem และ leafจํานวนขอมูล 5 ราย ไดแก 178, 257, 261, 265, 279คาต่ําสุดของ chol=178, คาสูงสุด=279ลักษณะเบเชิงลบ (เบซาย)

Stem & leaf plot: Stata MenuStatistics/Summaries, table, and tests/Distributional plots and tests/

Stem-and-leaf display

กรณีระบจุํานวนแทง

แผนภาพกลอง (Box & Whisker): Stata Command graph hbox [varlist] /* กราฟแนวนอน */ graph box [varlist] /* กราฟแนวตั้ง */

พิมพคําสั่ง graph box age, horizontal [Enter] หรือ graph hbox age [Enter]

แผนภาพกลอง (Box & Whisker) มีแนวโนมลักษณะสมมาตร

ระยะหาง Q2-Q1 = Q3-Q2ไมมีคานอกเกณฑ (outliers)

Q1 Q2 Q3

แผนภาพกลอง (Box & Whisker): Stata MenuGraphics/ Box plot/

กรณีระบุแผนภาพกลองแนวนอน

การตรวจสอบทางสถิติ

Shapiro-Wilk Test; 4<=n<=2000

Shapiro-Fransia test; 10<=n<=5000

H0: ขอมูลมีการแจกแจงแบบปกติ

HA: ขอมูลไมใชการแจกแจงแบบปกติ

เมื่อ p-value >0.05 ขอมูลมีการแจกแจง

แบบปกติ

Page 6: ðÖ øü Ùø dì Üÿë ê é aü÷ ðø Öøö ð4UBUB ÿë ê ß Üóøøèî · 2 4 Ù ÿ Ü ðtvnnbsj[f ð ðefubjm ð ðü Ùø d ðÿë ê ð.fbo ð ð 4uboebse

Shapiro-Wilk test/Shapiro-Francia test: Stata Commandswilk [varlist…]Sfracia [varlist…]

พิมพคําสั่ง swilk age chol [Enter]พิมพคําสั่ง swilk age chol [Enter]

การวิเคราะหดวยสถิติ Shapiro-Wilk /Shapiro-Franciaตัวแปร age มีการแจกแจงแบบปกติ (p-value > 0.05)ตัวแปร chol มีการแจกแจงไมปกต ิ(p-value < 0.05)

การวิเคราะหดวยสถิติ Shapiro-Franciaในผลลัพธนี ้ไมสามารถคํานวณได

เนื่องจาก n < 10 ราย

Shapiro-Wilk test/Shapiro-Francia test: Stata MenuStatistics/Summaries, table, and tests/Distributional plots and tests/

Shapiro-Wilk normality test