10
การวิเคราะหการถดถอยเชิงเสนอยางงาย 213 ภาควิชาสถิติ คณะวิทยาศาสตร มหาวิทยาลัยเกษตรศาสตร | การวิเคราะหการถดถอยเชิงเสนอยางงาย เปนการวิเคราะหความสัมพันธของ 2 ตัวแปร โดย ที่ตัวแปรทั้งสองคือตัวแปรอิสระและตัวแปรตาม จะตองเปนตัวแปรเชิงปริมาณ สมการถดถอยเชิงเสนอยางงาย ขอมูลประชากร β β ε i 0 1 i i Y= + X+ ขอมูลตัวอยาง i i Y = a+ bX ˆ โดยทีY เปนตัวแปรตามซึ่งเปนตัวแปรเชิงปริมาณ X เปนตัวแปรอิสระซึ่งเปนตัวแปรเชิงปริมาณ a เปนคาคงทีb เปนสัมประสิทธิ์สหสัมพันธ (regression coefficient) คาประมาณของ β 0 คือ a และคาประมาณของ β 1 คือ b ซึ่งใชเทคนิคกําลังสองนอยที่สุด (Ordinary Least Square) จะทําใหไดคา a และ b ดังนีn i i i=1 n 2 i i=1 (X - X)(Y - Y) b= (X - X) a = Y - bX เครื่องหมายของสัมประสิทธิ์การถดถอย (b) จะแสดงถึงทิศทางของความสัมพันธ - ถาเครื่องหมายของ b เปนบวก หมายถึงความสัมพันธระหวาง X และ Y อยูในทิศทางเดียวกัน นั่นคือถา X เพิ่ม จะทําให Y เพิ่มขึ้นดวย แตถา X ลดลง จะทําให Y ลดลง เชนกัน บทที9 การวิเคราะหการถดถอยเชิงเสนอยางงาย

Simple Linear Regression

Embed Size (px)

DESCRIPTION

Simple Linear Regression

Citation preview

Page 1: Simple Linear Regression

การวเคราะหการถดถอยเชงเสนอยางงาย 213

ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |

การวเคราะหการถดถอยเชงเสนอยางงาย เปนการวเคราะหความสมพนธของ 2 ตวแปร โดย

ทตวแปรทงสองคอตวแปรอสระและตวแปรตาม จะตองเปนตวแปรเชงปรมาณ

สมการถดถอยเชงเสนอยางงาย

ขอมลประชากร β β εi 0 1 i iY = + X +

ขอมลตวอยาง i iY = a+ bXˆ

โดยท Y เปนตวแปรตามซงเปนตวแปรเชงปรมาณ

X เปนตวแปรอสระซงเปนตวแปรเชงปรมาณ

a เปนคาคงท

b เปนสมประสทธสหสมพนธ (regression coefficient)

คาประมาณของ β0 คอ a และคาประมาณของ β1 คอ b ซงใชเทคนคกาลงสองนอยทสด

(Ordinary Least Square) จะทาใหไดคา a และ b ดงน

n

i ii=1

n2

ii=1

(X - X)(Y - Y)b =

(X - X) a = Y - bX

เครองหมายของสมประสทธการถดถอย (b) จะแสดงถงทศทางของความสมพนธ

- ถาเครองหมายของ b เปนบวก หมายถงความสมพนธระหวาง X และ Y อยในทศทางเดยวกน

นนคอถา X เพม จะทาให Y เพมขนดวย แตถา X ลดลง จะทาให Y ลดลง เชนกน

บทท 9 การวเคราะหการถดถอยเชงเสนอยางงาย

Page 2: Simple Linear Regression

214 Microsoft Excel 2007 เพอการวเคราะหขอมล

ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |

- ถาเครองหมายของ b เปนลบ หมายถงความสมพนธระหวาง X และ Y อยในทศทางตรงขามกน

นนคอถา X เพม จะทาให Y มคาลดลง ในขณะเดยวกนถา X ลดลง จะทาให Y มคาเพมขน

สมมตฐานของการวเคราะหการถดถอยเชงเสนอยางงาย

การวเคราะหการถดถอยเชงเสนอยางงาย จะมเงอนไขเกยวกบคาคลาดเคลอน (error: e )

โดยท

ขอมลประชากร β β εi 0 1 i iY = + X +

ขอมลตวอยาง i iY = a+ bXˆ

ดงนน คาคลาดเคลอน i i ie =Y - Y

เงอนไข

คาคลาดเคลอน (e) จะตองมการแจกแจงแบบปกต และคาเฉลยของคาคลาดเคลอน

เปนศนย

คาความแปรปรวนของคาคลาดเคลอนคงท

คาคลาดเคลอนเปนอสระกน

Page 3: Simple Linear Regression

การวเคราะหการถดถอยเชงเสนอยางงาย 215

ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |

การใช Excel ในการวเคราะหการถดถอยเชงเสนอยางงาย คาสงทใช คอ

Data > Data Analysis > Regression

1. เลอกคาสง Data > Data Analysis > Regression จะไดหนาตางดงรปดานลาง

Page 4: Simple Linear Regression

216 Microsoft Excel 2007 เพอการวเคราะหขอมล

ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |

2. ทหนาตาง Regression

สวนท 1 Input

Input Y Range: ใชระบชวงขอมลของตวแปร Y

Input X Range: ใชระบชวงขอมลของตวแปร X

Label ถาแถวแรกของขอมลเปนชอตวแปรตองเลอก Label ดวย

Constant is zero เลอกเมอตองการกาหนดใหคาคงท a = 0

Confidence Level ระบความเชอมนเมอตองการหาชวงความเชอมนของ

β0 และ β1

สวนท 2 Output Options ใหระบตาแหนงทตองการเกบผลลพธ

Residuals คอคาคลาดเคลอน (e) มใหเลอก 4 รปแบบ คอ

o Residuals เปนการคานวณคา error หรอ residual ของแตละคา

i i ie =Y - Y

o Standardized Residuals เปนคาทแสดงคา error ทปรบเปนใหเปน

คามาตรฐานแลว โดยท i i

e - e eZ = =

SE(e) SE(e) (เนองจาก e เปน

ศนย)

o Residual Plots เปนการพลอตกราฟระหวาง ตวแปรอสระ X ซง

อยในแกนนอน กบคา error หรอ residual ซงจะอยแนวตง เพอนา

กราฟมาตรวจสอบเงอนไขทวา คาความแปรปรวนของ residual ตอง

คงท

Page 5: Simple Linear Regression

การวเคราะหการถดถอยเชงเสนอยางงาย 217

ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |

o Line Fit Plots เปนกราฟทแสดงความสมพนธระหวาง X และ Y

และสมการเสนตรง i iY = a+ bXˆ

ภาพดานซายแสดงใหเหนวาไมวาตวแปรอสระ X

จะมคามากหรอนอยกตาม คา residual หรอ

error จะมคารอบ ๆ ศนย จงสรปไดวา คาความ

แปรปรวนของ error คงท ซงเปนไปตามเงอนไข

X

Residual

0

ภาพดานซายแสดงใหเหนเมอตวแปรอสระ X ม

คามากขน คา residual จะมคามากขนดวย จง

สรปไดวา คาความแปรปรวนของ error ไมคงท

ซงไมเปนไปตามเงอนไขของการวเคราะหการ

ถดถอยเชงเสนอยางงาย

X

Residual

0

ภาพดานซายแสดงใหเหนวา คาความแปรปรวน

ของ error ไมคงท ซงไมเปนไปตามเงอนไขของ

การวเคราะหการถดถอยเชงเสนอยางงาย

X

Residual

0

i iY = a+ bXˆ

X

Y

a

Page 6: Simple Linear Regression

218 Microsoft Excel 2007 เพอการวเคราะหขอมล

ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |

Normal Probability Plots เปนกราฟทพลอตคาขอมลจรง ในแนวแกนนอน

และคาขอมลทตาดไว (expected value)ในแนวแกนตง เมอขอมลมการแจก

แจงแบบปกต ดงนนNormal Probability Plots จงเปนกราฟทใชตรวจสอบวา

ขอมลมการแจกแจงแบบปกตหรอไม ถาขอมลมการแจกแจงแบบปกต กราฟ

จะมลกษณะตามรปดานลาง

ตวอยาง 1 จากแฟม “Data_Income” จงทดสอบวา “รายได” ขนอยกบ “รายจายรวม” หรอไม ท

ระดบนยสาคญ 0.05

วธทา

1. สรางตวแปร“รายจายรวม”

2. พลอตกราฟเพอตรวจสอบความสมพนธระหวาง“รายได” กบ“รายจายรวม” วาอยในรป

เชงเสนหรอไม ในทนตวแปร“รายได” และ“รายจายรวม” ควรอยในคอลมนตดกน เพอ

สามารถลากคลมทงสองคอลมนไดงาย จากนนเลอก Insert > Scatter

ขอมลจรง

Expected value

Page 7: Simple Linear Regression

การวเคราะหการถดถอยเชงเสนอยางงาย 219

ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |

3. จะไดแผนภาพการกระจาย (Scatter Plot) ของรายไดและรายจายรวม พบวารายได

และรายจายรวมนาจะมความสมพนธในรปเชงเสน และมความชนเปนบวก

0

10,000

20,000

30,000

40,000

50,000

60,000

0 10,000 20,000 30,000 40,000 50,000 60,000 70,000

Scatter Plot

รายจายรวม

Page 8: Simple Linear Regression

220 Microsoft Excel 2007 เพอการวเคราะหขอมล

ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |

4. วเคราะหการถดถอยดวยคาสง Data > Data Analysis > Regression ใสขอมลตาม

ภาพดานลาง

5. เมอกด OK จะไดผลการวเคราะหน

Page 9: Simple Linear Regression

การวเคราะหการถดถอยเชงเสนอยางงาย 221

ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |

ทดสอบสมมตฐาน

H0: รายจายรวมไมขนอยกบรายไดในรปเชงเสน

H1: รายจายรวมขนอยกบรายไดในรปเชงเสน

หรอ

H0: 1β = 0

H1: 1β ≠ 0

คาสถตทดสอบ MSRegression

F = = 952.94MSResidual

และ Significance F = 0.000 นอยกวา 0.05 ดงนน ปฏเสธ H0 นนคอ รายจายรวมขนอย

กบรายไดในรปเชงเสน

H0: β1 = 0

H1: β1 ≠ 0

คาสถตทดสอบ t = 2.064

และ Significance F = 0.042 นอยกวา 0.05 ดงนน ปฏเสธ H0 นนคอ β1 ≠ 0

จะไดสมการการถดถอยเปน

รายจายรวม = 1354.772 + 0.745(รายได)

Page 10: Simple Linear Regression

222 Microsoft Excel 2007 เพอการวเคราะหขอมล

ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |

จาก Residual Plot แสดงวาคาความแปรปรวนของ error คงท

จากรปแสดงวา รายจายรวมมการแจกแจงแบบปกต

-20000

0

20000

40000

0 10,000 20,000 30,000 40,000 50,000 60,000 70,000

Resi

dual

s

รายได

รายได Residual Plot

0200004000060000

0.16

6666

6…

6.83

3333

3…

13.5

20.1

6666

6…

26.8

3333

3…

33.5

40.1

6666

6…

46.8

3333

3…

53.5

60.1

6666

6…

66.8

3333

3…

73.5

80.1

6666

6…

86.8

3333

3…

93.5

รายจ

ายรว

Sample Percentile

Normal Probability Plot

Series1