Data Analysis for Descriptive Statistics - Pirun Web...

Preview:

Citation preview

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentation

ดร.ฐณฐั วงศ์สายเชื อ20150402

da2008

Data Analysis for Descriptive Statistics

คณะศกึษาศาสตร์และพฒันศาสตร์Tel: 08-1923-0303E-mail: fedutnw@ku.ac.thHomepage: http://pirun.ku.ac.th/~fedutnw/

การวิเคราะห์ข้อมลูด้วยสถิตเชิงพรรณนา

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentation

การกระจายตวัแบบปกติ (Normal distribution)ปัญหาข้อมลูมีความเบ้ ?

• ข้อมลูมี Positive และ Negative skewness มีลกัษณะรูปร่างอยา่งไร?• กรณีทีข้อมลูมี Positive skewness ต้องแก้ไขปัญหาอยา่งไร?• กรณีทีข้อมลูมี Negative skewness ต้องแก้ไขปัญหาอยา่งไร?

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentation

ข้อมลูมีความเบ้

Positive Skew Negative SkewSymmetry

-1 ≤ Skewness ≥ 1Skewness > 1 Skewness < -1

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentation

การกระจายตวัแบบปกติ (Normal distribution): ปัญหาข้อมลูมีความเบ้

การแก้ไขความเบ้ วิธีหนึงคือต้อง Transformation ข้อมลู

1. หาก positive skew มากๆ ต้องใช้ negative reciprocal root = -1/sqrt(oldvar)2. หาก positive skew กลางๆ ต้องใช้ log = lg10(oldvar)3. หาก positive skew เลก็น้อย-กลางๆ ต้องใช้ square root = sqrt(oldvar)4. หาก negative skew เลก็น้อย-กลางๆ ต้องใช้ square = (oldvar)*(oldvar)5. หาก negative skew มากๆ ต้องใช้ cube = (oldvar)*(oldvar) *(oldvar)

Source: Vaus, 2002

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationงานวิจยัเชิงปริมาณทีผา่นมาของนิสติ

ให้นิสติเลา่ และแลกเปลียนถงึงานวิจยัของตนทีผา่นมา1. ชือเรือง โครงการวิจยั งานวิจยั วิทยานิพนธ์2. ความสําคญัและความเป็นมา3. งานวิจยัทีเกียวข้อง4. วตัถปุระสงค์5. ระเบียบวิธีวิจยั6. ขอบเขตการวิจยั7. ระยะเวลาทําวิจยั8. สถานทีทําการวิจยั หรือเก็บข้อมลู9. วิธีการวิเคราะห์ข้อมลูและนําเสนอ10. สรุปผลการวิจยั11. ประโยชน์ทีได้รับจากการวิจยั

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationการวิเคราะห์ข้อมลูด้วยสถิตเชิงพรรณนา

1. การกระจายตวั (Distribution)2. แนวโน้มเข้าสูส่ว่นกลาง (Central tendency)3. ความแปรปรวน (Variation)4. ความเบ้ (Skewness)

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationการนําเสนอสถิตเชิงพรรณนา

1. ตารางแจกแจงความถี (Frequency tables)2. กราฟ (Graphs)3. สถิติโดยภาพรวม (Summary statistics)

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationตารางความถี (Frequency table)

สิงทีควรมี1. มีหมายเลขตารางและชือตาราง2. ตวัแปรกลุม่ ต้องมีป้ายชือแตล่ะกลุม่3. หวัตารางต้องมีร้อยละของข้อมลู

ทีสามารถวิเคราะห์ได้4. จํานวนข้อมลูทั งหมดทีวิเคราะห์ได้5. จํานวนข้อมลูทีขาด (Missing case)6. แหลง่ข้อมลู7. หมายเหตุ (เช่น ตวัอยา่งข้อคําถาม)

Source: Vaus, 2002

สิงทีไมค่วรมี1. ทศนิยม2. จํานวนตวัอยา่งในแตล่ะกลุม่3. ร้อยละรวม4. จํานวนกลุม่ตวัอยา่งทั งหมด

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentation

ตวัอยา่งทีใช้ในรายวิชานี เป็นข้อมลูจากสํามะโนประชากรและเคหะ

ปี พ.ศ. 2543(ชดุข้อมลู 1%)

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationตาราง 1 จํานวนสมาชิกในครัวเรือน

Total member

14036 2.3 2.3 2.351958 8.7 8.7 11.0

107516 18.0 18.0 29.0170994 28.6 28.6 57.6123955 20.7 20.7 78.355542 9.3 9.3 87.632746 5.5 5.5 93.017896 3.0 3.0 96.010287 1.7 1.7 97.8

6400 1.1 1.1 98.82453 .4 .4 99.21944 .3 .3 99.61118 .2 .2 99.7

574 .1 .1 99.8375 .1 .1 99.9144 .0 .0 99.968 .0 .0 99.9

180 .0 .0 100.019 .0 .0 100.020 .0 .0 100.022 .0 .0 100.072 .0 .0 100.025 .0 .0 100.031 .0 .0 100.0

598375 100.0 100.0

123456789101112131415161718192022242531Total

ValidFrequency Percent Valid Percent

CumulativePercent

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationการใช้กราฟในแตล่ะประเภทข้อมลู

BarDot plotPie chartHistogramLine graphBox and whisker plot

Source: Vaus, 2002

FewFewFewManyManyMany

DiscreteDiscreteDiscreteContinuousContinuousContinuous

Usually nominal or ordinalUsually nominal or ordinalUsually nominal or ordinalIntervalIntervalOrdinal or interval

Type of graph # ofcategories

Discrete orcontinuous

Level of measurementof variable

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Bar graph

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Pie chart

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Histogram

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentation

Age group

0-45-910-1415-1920-2425-2930-3435-3940-4445-4950-5455-5960-6465-6970-7475-7980-8485-8990-9495-99Total

43,62150,00151,40852,57048,17451,63553,73853,22247,99738,36328,86822,58419,72014,99910,2495,8403,1641,493

512217

598,375

Frequency

สาํมะโนประชากรไทย ปี 2543

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Line graph

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543 Box plot

ยงัไมต่ดัoutlier cases

25%25%

25%

25%

Median

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Box plot

ตดัoutlier casesแล้ว

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and PresentationSummary statistics ในแตล่ะระดบัการวดั

Measure ofcentral tendency

Source: Vaus, 2002

Type of statistic

Measure ofdispersion

Mode Median Mean

Nominal Ordinal Interval

Variation ratio Range, decile range,Interquartile range

Variance,Standard deviation

Shape - - Skewness,Kurtosis

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Measures ofCentral Tendency

Statistics

Recode age598375

031.0030.00

35

ValidMissing

N

MeanMedianMode

Mode

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Measures ofDispersion

Variation ratio= 1-(31.4/100)= 0.69

Relationship to head of household

161920 27.1 27.1 27.1112631 18.8 18.8 45.9187600 31.4 31.4 77.230251 5.1 5.1 82.316810 2.8 2.8 85.1

44382 7.4 7.4 92.5

9688 1.6 1.6 94.130212 5.0 5.0 99.24881 .8 .8 100.0

598375 100.0 100.0

HH headWife/husbandUnmarried childrenMarried childrenChildren in-lawChildren of children,couples of childrenParents, grand parentsOther councilsOther residents, servantsTotal

ValidFrequency Percent Valid Percent

CumulativePercent

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Measures ofDispersion

= 98-0 = 98 yearsRange = Highest value – Lowest value

Range = 98 years

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Measures ofDispersion

10% Decile range (80%)

Decile range59 – 6 = 53 years

Statistics

Recode age598375

06.00

12.0018.0024.0030.0035.0041.0048.0059.00

ValidMissing

N

102030405060708090

Percentiles

10%

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentationสาํมะโนประชากรไทย ปี 2543

Measures ofDispersion

25% Interquartilerange(50%)

Interquartile range44 – 15 = 29 years

25%

Statistics

Recode age598375

015.0030.0044.00

ValidMissing

N

255075

Percentiles

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentation

Statistics

598375 5983750 0

31.00 4.5119.513 1.955

380.776 3.82398 300 1

98 31

ValidMissing

N

MeanStd. DeviationVarianceRangeMinimumMaximum

Recode age Total member

Measures of Dispersion

sqrt (Variance) = Standard deviation

สาํมะโนประชากรไทย ปี 2543

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentation

Shape: Skewness & Kurtosisสาํมะโนประชากรไทย ปี 2543

Statistics

598375 5983750 0

31.00 4.5119.513 1.955

.445 1.592

.003 .003-.465 7.151.006 .006

ValidMissing

N

MeanStd. DeviationSkewnessStd. Error of SkewnessKurtosisStd. Error of Kurtosis

Recode age Total member

Positive Skew Negative SkewSymmetry

Positive Kurtosis Negative KurtosisNormal

-1 ≤ Skewness ≥ 1Skewness > 1 Skewness < -1

-1 ≤ Kurtosis ≥ 1Kurtosis > 1 Kurtosis < -1

Thanut Wongsaichue, Ph.D. (Demography)Human and Community Resource Development

190693 Data Analysis and Presentation

Recommended