Upload
kitisakp99
View
13
Download
3
Embed Size (px)
DESCRIPTION
Simple Linear Regression
Citation preview
การวเคราะหการถดถอยเชงเสนอยางงาย 213
ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |
การวเคราะหการถดถอยเชงเสนอยางงาย เปนการวเคราะหความสมพนธของ 2 ตวแปร โดย
ทตวแปรทงสองคอตวแปรอสระและตวแปรตาม จะตองเปนตวแปรเชงปรมาณ
สมการถดถอยเชงเสนอยางงาย
ขอมลประชากร β β εi 0 1 i iY = + X +
ขอมลตวอยาง i iY = a+ bXˆ
โดยท Y เปนตวแปรตามซงเปนตวแปรเชงปรมาณ
X เปนตวแปรอสระซงเปนตวแปรเชงปรมาณ
a เปนคาคงท
b เปนสมประสทธสหสมพนธ (regression coefficient)
คาประมาณของ β0 คอ a และคาประมาณของ β1 คอ b ซงใชเทคนคกาลงสองนอยทสด
(Ordinary Least Square) จะทาใหไดคา a และ b ดงน
∑
∑
n
i ii=1
n2
ii=1
(X - X)(Y - Y)b =
(X - X) a = Y - bX
เครองหมายของสมประสทธการถดถอย (b) จะแสดงถงทศทางของความสมพนธ
- ถาเครองหมายของ b เปนบวก หมายถงความสมพนธระหวาง X และ Y อยในทศทางเดยวกน
นนคอถา X เพม จะทาให Y เพมขนดวย แตถา X ลดลง จะทาให Y ลดลง เชนกน
บทท 9 การวเคราะหการถดถอยเชงเสนอยางงาย
214 Microsoft Excel 2007 เพอการวเคราะหขอมล
ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |
- ถาเครองหมายของ b เปนลบ หมายถงความสมพนธระหวาง X และ Y อยในทศทางตรงขามกน
นนคอถา X เพม จะทาให Y มคาลดลง ในขณะเดยวกนถา X ลดลง จะทาให Y มคาเพมขน
สมมตฐานของการวเคราะหการถดถอยเชงเสนอยางงาย
การวเคราะหการถดถอยเชงเสนอยางงาย จะมเงอนไขเกยวกบคาคลาดเคลอน (error: e )
โดยท
ขอมลประชากร β β εi 0 1 i iY = + X +
ขอมลตวอยาง i iY = a+ bXˆ
ดงนน คาคลาดเคลอน i i ie =Y - Y
เงอนไข
คาคลาดเคลอน (e) จะตองมการแจกแจงแบบปกต และคาเฉลยของคาคลาดเคลอน
เปนศนย
คาความแปรปรวนของคาคลาดเคลอนคงท
คาคลาดเคลอนเปนอสระกน
การวเคราะหการถดถอยเชงเสนอยางงาย 215
ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |
การใช Excel ในการวเคราะหการถดถอยเชงเสนอยางงาย คาสงทใช คอ
Data > Data Analysis > Regression
1. เลอกคาสง Data > Data Analysis > Regression จะไดหนาตางดงรปดานลาง
216 Microsoft Excel 2007 เพอการวเคราะหขอมล
ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |
2. ทหนาตาง Regression
สวนท 1 Input
Input Y Range: ใชระบชวงขอมลของตวแปร Y
Input X Range: ใชระบชวงขอมลของตวแปร X
Label ถาแถวแรกของขอมลเปนชอตวแปรตองเลอก Label ดวย
Constant is zero เลอกเมอตองการกาหนดใหคาคงท a = 0
Confidence Level ระบความเชอมนเมอตองการหาชวงความเชอมนของ
β0 และ β1
สวนท 2 Output Options ใหระบตาแหนงทตองการเกบผลลพธ
Residuals คอคาคลาดเคลอน (e) มใหเลอก 4 รปแบบ คอ
o Residuals เปนการคานวณคา error หรอ residual ของแตละคา
i i ie =Y - Y
o Standardized Residuals เปนคาทแสดงคา error ทปรบเปนใหเปน
คามาตรฐานแลว โดยท i i
e - e eZ = =
SE(e) SE(e) (เนองจาก e เปน
ศนย)
o Residual Plots เปนการพลอตกราฟระหวาง ตวแปรอสระ X ซง
อยในแกนนอน กบคา error หรอ residual ซงจะอยแนวตง เพอนา
กราฟมาตรวจสอบเงอนไขทวา คาความแปรปรวนของ residual ตอง
คงท
การวเคราะหการถดถอยเชงเสนอยางงาย 217
ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |
o Line Fit Plots เปนกราฟทแสดงความสมพนธระหวาง X และ Y
และสมการเสนตรง i iY = a+ bXˆ
ภาพดานซายแสดงใหเหนวาไมวาตวแปรอสระ X
จะมคามากหรอนอยกตาม คา residual หรอ
error จะมคารอบ ๆ ศนย จงสรปไดวา คาความ
แปรปรวนของ error คงท ซงเปนไปตามเงอนไข
X
Residual
0
ภาพดานซายแสดงใหเหนเมอตวแปรอสระ X ม
คามากขน คา residual จะมคามากขนดวย จง
สรปไดวา คาความแปรปรวนของ error ไมคงท
ซงไมเปนไปตามเงอนไขของการวเคราะหการ
ถดถอยเชงเสนอยางงาย
X
Residual
0
ภาพดานซายแสดงใหเหนวา คาความแปรปรวน
ของ error ไมคงท ซงไมเปนไปตามเงอนไขของ
การวเคราะหการถดถอยเชงเสนอยางงาย
X
Residual
0
i iY = a+ bXˆ
X
Y
a
218 Microsoft Excel 2007 เพอการวเคราะหขอมล
ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |
Normal Probability Plots เปนกราฟทพลอตคาขอมลจรง ในแนวแกนนอน
และคาขอมลทตาดไว (expected value)ในแนวแกนตง เมอขอมลมการแจก
แจงแบบปกต ดงนนNormal Probability Plots จงเปนกราฟทใชตรวจสอบวา
ขอมลมการแจกแจงแบบปกตหรอไม ถาขอมลมการแจกแจงแบบปกต กราฟ
จะมลกษณะตามรปดานลาง
ตวอยาง 1 จากแฟม “Data_Income” จงทดสอบวา “รายได” ขนอยกบ “รายจายรวม” หรอไม ท
ระดบนยสาคญ 0.05
วธทา
1. สรางตวแปร“รายจายรวม”
2. พลอตกราฟเพอตรวจสอบความสมพนธระหวาง“รายได” กบ“รายจายรวม” วาอยในรป
เชงเสนหรอไม ในทนตวแปร“รายได” และ“รายจายรวม” ควรอยในคอลมนตดกน เพอ
สามารถลากคลมทงสองคอลมนไดงาย จากนนเลอก Insert > Scatter
ขอมลจรง
Expected value
การวเคราะหการถดถอยเชงเสนอยางงาย 219
ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |
3. จะไดแผนภาพการกระจาย (Scatter Plot) ของรายไดและรายจายรวม พบวารายได
และรายจายรวมนาจะมความสมพนธในรปเชงเสน และมความชนเปนบวก
0
10,000
20,000
30,000
40,000
50,000
60,000
0 10,000 20,000 30,000 40,000 50,000 60,000 70,000
Scatter Plot
รายจายรวม
220 Microsoft Excel 2007 เพอการวเคราะหขอมล
ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |
4. วเคราะหการถดถอยดวยคาสง Data > Data Analysis > Regression ใสขอมลตาม
ภาพดานลาง
5. เมอกด OK จะไดผลการวเคราะหน
การวเคราะหการถดถอยเชงเสนอยางงาย 221
ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |
ทดสอบสมมตฐาน
H0: รายจายรวมไมขนอยกบรายไดในรปเชงเสน
H1: รายจายรวมขนอยกบรายไดในรปเชงเสน
หรอ
H0: 1β = 0
H1: 1β ≠ 0
คาสถตทดสอบ MSRegression
F = = 952.94MSResidual
และ Significance F = 0.000 นอยกวา 0.05 ดงนน ปฏเสธ H0 นนคอ รายจายรวมขนอย
กบรายไดในรปเชงเสน
H0: β1 = 0
H1: β1 ≠ 0
คาสถตทดสอบ t = 2.064
และ Significance F = 0.042 นอยกวา 0.05 ดงนน ปฏเสธ H0 นนคอ β1 ≠ 0
จะไดสมการการถดถอยเปน
รายจายรวม = 1354.772 + 0.745(รายได)
222 Microsoft Excel 2007 เพอการวเคราะหขอมล
ภาควชาสถต คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร |
จาก Residual Plot แสดงวาคาความแปรปรวนของ error คงท
จากรปแสดงวา รายจายรวมมการแจกแจงแบบปกต
-20000
0
20000
40000
0 10,000 20,000 30,000 40,000 50,000 60,000 70,000
Resi
dual
s
รายได
รายได Residual Plot
0200004000060000
0.16
6666
6…
6.83
3333
3…
13.5
20.1
6666
6…
26.8
3333
3…
33.5
40.1
6666
6…
46.8
3333
3…
53.5
60.1
6666
6…
66.8
3333
3…
73.5
80.1
6666
6…
86.8
3333
3…
93.5
รายจ
ายรว
ม
Sample Percentile
Normal Probability Plot
Series1