27
การวิเคราะหการถดถอยพหุคูณ (Multiple Regression) ฉัตรศิริ ปยะพิมลสิทธิในการวิเคราะหการถดถอยอยางงายจะเปนการวิเคราะหกับตัวแปรตามหรือตัวแปร เกณฑ (Y) โดยมีตัวแปรอิสระหรือตัวแปรทํานาย (X) เพียงตัวเดียว อยางไรก็ตาม ในบาง ปรากฏการณที่ตองอธิบายหรือทํานายทางสังคมศาสตร หากใชตัวแปรอิสระเพียงตัวเดียวจะมี ขอจํากัด ในการอธิบายพฤติกรรมของมนุษยซึ่งโดยมากจะมีความซับซอน การใชตัวแปรทํานาย เพียงตัวเดียวจะไมมีประสิทธิภาพพอที่จะอธิบายตัวแปรเกณฑได ในกรณีที่จะพยายามอธิบาย สัดสวนความแปรปรวนของตัวแปรเกณฑไดอยางมีประสิทธิภาพ จําเปนตองมีตัวแปรทํานาย มากกวา 1 ตัว ซึ่งจะนําไปสูการวิเคราะหการถดถอยพหุคูณเมื่อมีตัวแปรทํานายตั้งแต 2 ตัวขึ้นไป ใชในการทํานายตัวแปรเกณฑ ซึ่งโดยปกติตัวแปรทํานายหรือตัวแปรอิสระจะใชสัญลักษณ X และ ตัวแปรเกณฑหรือตัวแปรตามจะใชสัญลักษณ Y ตัวอยางกรณีที่ผูบริหารสถานศึกษาตองการใชคะแนนสอบเขาศึกษาตอในระดับ บัณฑิตศึกษา (Graduate Record Exam : GRE) ในการทํานายเกรดเฉลี่ยระดับบัณฑิตศึกษา (GPA) ที่จะชวยผูบริหารในการตัดสินใจทางการบริหาร แตเนื่องดวยมีตัวแปรทํานายอื่น ที่มี ศักยภาพในการทํานายซึ่งอาจจะเปนเกรดเฉลี่ยในระดับปริญญาตรี ผลการประเมินจากอาจารย หรือผลการสอบสัมภาษณ คําถามการวิจัยเพื่อที่จะพิจารณาวา GRE, GPA ระดับปริญญาตรี, ผล การประเมินจากอาจารย และคะแนนสอบสัมภาษณ (ตัวแปรอิสระหรือตัวแปรทํานาย) สามารถ ทํานายเกรดเฉลี่ยระดับบัณฑิตศึกษาไดหรือไม (ตัวแปรตามหรือตัวแปรเกณฑ) ซึ่งในตัวอยางทียกมานี้สามารถใชการวิเคราะหการถดถอยเนื่องจากเหมาะในสถานการณที่มีตัวแปรทํานายหลาย ตัว แนวคิดของการวิเคราะหการถดถอยพหุคูณจะคลายกับการวิเคราะหการถดถอยอยาง งาย อยางไรก็ตาม เนื่องจากมีตัวแปรทํานายหลายตัว การคํานวณก็จะยากและซับซอนมากขึ้น ซึ่ง ในเนื้อหานี้จะแสดงตัวแปรการคํานวณในกรณีที่มีตัวแปรทํานายเพียง 2 ตัว การคํานวณกรณีมีตัว แปรทํานายมากกวา 2 ตัวตองใชเมตริกและแคลคูลัสเขาชวย ซึ่งจะไมกลาวถึงในที่นีแตการ คํานวณทั้งหมดนี้จะงายขึ้นหากมีการใชโปรแกรมคอมพิวเตอรเขาชวยในการคํานวณ ในเนื้อหานี้จะแสดงแนวคิดของสหสัมพันธแยกสวน (partial correlation) สหสัมพันธ ครึ่งสวน (semipartial correlation) และสหสัมพันธพหุคูณ (multiple correlation) สัมประสิทธิการอธิบาย (coefficient of multiple determination) การเพิ่มขึ้นของสัดสวนความแปรปรวนใน การอธิบายเมื่อเพิ่มตัวแปรทํานาย กระบวนการเลือกตัวแปรเขาสมการทํานาย การตรวจสอบ นัยสําคัญ และขอตกลงเบื้องตนของการวิเคราะหการถดถอยพหุคูณ

การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

การวิเคราะหการถดถอยพหุคูณ (Multiple Regression)

ฉัตรศิริ ปยะพิมลสิทธิ์ ในการวิเคราะหการถดถอยอยางงายจะเปนการวิเคราะหกับตัวแปรตามหรือตัวแปรเกณฑ (Y) โดยมีตัวแปรอิสระหรือตัวแปรทํานาย (X) เพียงตัวเดียว อยางไรก็ตาม ในบางปรากฏการณที่ตองอธิบายหรือทํานายทางสังคมศาสตร หากใชตัวแปรอิสระเพียงตัวเดียวจะมีขอจํากัด ในการอธิบายพฤติกรรมของมนุษยซึ่งโดยมากจะมีความซบัซอน การใชตัวแปรทํานายเพียงตัวเดียวจะไมมีประสิทธิภาพพอที่จะอธิบายตัวแปรเกณฑได ในกรณีที่จะพยายามอธิบายสัดสวนความแปรปรวนของตัวแปรเกณฑไดอยางมีประสิทธิภาพ จําเปนตองมตีัวแปรทํานายมากกวา 1 ตัว ซึ่งจะนาํไปสูการวิเคราะหการถดถอยพหุคูณเมื่อมีตัวแปรทํานายตั้งแต 2 ตัวข้ึนไป ใชในการทํานายตัวแปรเกณฑ ซึ่งโดยปกตติัวแปรทํานายหรือตัวแปรอิสระจะใชสัญลกัษณ X และตัวแปรเกณฑหรือตัวแปรตามจะใชสัญลักษณ Y ตัวอยางกรณีที่ผูบริหารสถานศึกษาตองการใชคะแนนสอบเขาศึกษาตอในระดบับัณฑิตศึกษา (Graduate Record Exam : GRE) ในการทํานายเกรดเฉลี่ยระดับบณัฑิตศึกษา (GPA) ที่จะชวยผูบริหารในการตัดสนิใจทางการบริหาร แตเนื่องดวยมีตัวแปรทํานายอื่น ๆ ที่มีศักยภาพในการทํานายซึ่งอาจจะเปนเกรดเฉลี่ยในระดบัปริญญาตร ีผลการประเมินจากอาจารย หรือผลการสอบสัมภาษณ คําถามการวิจยัเพื่อที่จะพิจารณาวา GRE, GPA ระดับปริญญาตรี, ผลการประเมินจากอาจารย และคะแนนสอบสัมภาษณ (ตวัแปรอิสระหรือตัวแปรทํานาย) สามารถทํานายเกรดเฉลี่ยระดับบณัฑิตศึกษาไดหรือไม (ตัวแปรตามหรือตัวแปรเกณฑ) ซึง่ในตัวอยางที่ยกมานี้สามารถใชการวิเคราะหการถดถอยเนื่องจากเหมาะในสถานการณที่มีตัวแปรทํานายหลายตัว แนวคดิของการวิเคราะหการถดถอยพหุคณูจะคลายกบัการวิเคราะหการถดถอยอยางงาย อยางไรกต็าม เนื่องจากมีตัวแปรทํานายหลายตัว การคํานวณกจ็ะยากและซับซอนมากขึ้น ซึ่งในเนื้อหานี้จะแสดงตัวแปรการคํานวณในกรณีที่มีตัวแปรทํานายเพียง 2 ตัว การคาํนวณกรณีมีตัวแปรทํานายมากกวา 2 ตัวตองใชเมตริกและแคลคูลัสเขาชวย ซึ่งจะไมกลาวถึงในที่นี ้แตการคํานวณทั้งหมดนี้จะงายขึ้นหากมีการใชโปรแกรมคอมพิวเตอรเขาชวยในการคาํนวณ ในเนื้อหานี้จะแสดงแนวคิดของสหสัมพันธแยกสวน (partial correlation) สหสัมพันธครึ่งสวน (semipartial correlation) และสหสัมพันธพหุคูณ (multiple correlation) สัมประสิทธิ์การอธิบาย (coefficient of multiple determination) การเพิ่มขึ้นของสัดสวนความแปรปรวนในการอธิบายเมื่อเพ่ิมตัวแปรทํานาย กระบวนการเลือกตวัแปรเขาสมการทํานาย การตรวจสอบนัยสําคัญ และขอตกลงเบื้องตนของการวิเคราะหการถดถอยพหุคูณ

Page 2: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 2

สหสัมพันธแยกสวน ครึ่งสวนและพหุคณู ในการอธิบายเกี่ยวกับการวิเคราะหการถดถอย ลองพิจารณาแนวคดิเกี่ยวกับการวิเคราะหความสัมพันธระหวางตัวแปร 2 ตัว โดยเฉพาะการอธิบายเกี่ยวกับสหสัมพันธแยกสวน และครึ่งสวน การวิเคราะหการถดถอยพหุคูณจะเกี่ยวของกับการใชตัวแปรทํานายตั้งแต 2 ตัวข้ึนไปและตัวแปรเกณฑเพียง 1 ตัว ดังนั้นจํานวนที่นอยที่สุดของตัวแปรคือ 3 ตัวแปรที่จะอยูในการวิเคราะห ถาคดิวาตัวแปรในการวิเคราะหนี้จะใชการหาความสัมพันธแบบเพียรสัน (the Pearson Product-Modment Correlation Coefficient) แลว จะเกดิปญหาเพราะสหสัมพันธนีเ้ปนการหาความสัมพันธระหวางตัวแปรไดครั้งละ 2 ตัวแปรเทานัน้ อยางไรก็ตามตัวแปรที่เพ่ิมเขามาในการหาความสัมพนัธจะทาํอยางไร คําตอบนีต้องหาโดยใชสหสัมพันธแยกสวน สหสัมพันธครึ่งสวน และสหสัมพันธพหุคูณ ดังจะไดอธิบายตอไปนี ้ สหสัมพนัธแยกสวน (Partial Correlation) ในเบื้องตนจะอธิบายแนวคดิของสหสัมพันธแยกสวนเสยีกอน กรณีที่งายที่สุดจะเก่ียวของกับความสัมพันธระหวาง 3 ตัวแปร ซึ่งใหช่ือวา X1, X2 และ X3 การวิเคราะหสหสัมพันธแยกสวนระหวาง X1 และ X2 เมื่อ X3 ถูกควบคุมเอาไวหรือถูกขจัดออก นั่นคือ อิทธพิลของ X3 ถูกขจัดออกจากทั้ง X1 และ X2 (ตัวแปรทัง้สองถูกปรับแกดวย X3) ดังนั้นสหสัมพันธแยกสวนจะแสดงความสมัพันธเชิงเสนตรงระหวาง X1 และ X2 ที่เปนอิสระจากอิทธิพลของ X3 สหสัมพันธแยกสวนนี้ใชสัญลักษณวา r12.3 สังเกตวา ในสัญลักษณไมแสดง X และมี . เปนตัวแบงระหวางตัวแปรที่สัมพันธกับตัวแปรที่ถูกควบคุม วธิีการคํานวณ r12.3 มีสูตรดังนี ้ r12.3 = )]r1)(r1[(/]rrr[ 2

232

13231312 −−− สังเกตวาในสตูรคํานวณนี้จะใชสหสัมพันธระหวางตัวแปร 2 ตัว ตัวอยางการหาสหสัมพันธแยกสวน เชน นักวิจัยสนใจหาความสัมพนัธระหวางสวนสูง (X1) และน้ําหนัก (X2) ซึ่งจะเกี่ยวของถึงชวงอายุของแตละคน (X3) จาก 6 เดือน ถึง 65 ป สหสัมพันธอยางงาย ไดคา r12 = 0.7, r13 = 0.1 และ r23 = 0.6 สามารถคํานวณ r12.3 ไดวา r12.3 = )]r1)(r1[(/]rrr[ 2

232

13231312 −−− = )]36.01)(01.01[(/)]6.0(1.07.0[ −−− = 0.80 สหสัมพันธระหวางตัวแปร 2 ตัวหรือสวนสูงและน้ําหนกัที่ไมสนใจอายุ (r12 = 0.7) จะมีคานอยกวาสหสัมพันธแยกสวนระหวางสวนสูงและน้ําหนักที่ควบคุมอายุเอาไว (r12.3 = 0.8) นั่นคือ สหสัมพันธระหวางสวนสูงและน้ําหนกัจะสูงข้ึนเมื่อมีการขจัดอิทธิพลของอายุออก แมวาสถิตนิี้จะเกี่ยวของกับการควบคุมตัวแปรเอาไว แตในสถานการณจริงตัวแปรบางตัวไมสามารถจะควบคุมใหคงที่ได

Page 3: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 3

ในบางครั้งอาจจะสนใจผลของสหสัมพันธแยกสวนที่มีโอกาสเกิดขึ้นไดในกรณีที่มคีาผิดปกติ ถาทั้ง r13 และ r23 มีคาเทากับ 0 แลว r12 = r12.3 นั่นคือ ถาตวัแปรที่ตองการควบคุมไมมีความสัมพันธกับตัวแปรอีก 2 ตัวที่ตองการหาความสัมพันธกันแลว การใชสหสัมพันธแยกสวนก็จะไมมีประโยชน มีความเปนไปไดในกรณีที่สหสัมพันธแยกสวนอาจจะมีความสัมพันธมากกวาหรือนอยกวาสหสัมพันธระหวาง 2 ตัวแปร และบางกรณีที่มีสหสัมพันธแยกสวนเทากับ 0 เมื่อสหสัมพันธระหวาง 2 ตัวแปรไมเทากับ 0 ในการอางอิงการเรียกสหสัมพันธแยกสวนนั้น สหสัมพันธระหวาง 2 ตัวแปรที่มีการควบคุมตัวแปร 1 ตัวแปร จะเรียกวา first-order partial correlation (เชน r12.3) หากมีตัวแปรที่ควบคุม 2 ตัวแปร จะเรียกวา second-order partial correlation (เชน r12.34) หรือใชสัญลักษณทั่วไปไดวา r12.w เมื่อ w แสดงถึงจํานวนตวัแปรที่ถูกควบคุมทั้งหมด และการคํานวณสหสัมพันธแยกสวนก็จะซับซอนมากกวา first-order partial correlation ถาสนใจทีจ่ะทดสอบนัยสําคญัของสหสัมพันธแยกสวน จะคลายกับการทดสอบนัยสําคัญของสหสัมพันธระหวาง 2 ตัวแปร ซึ่งสหสัมพันธระหวาง 2 ตัวแปรจะเขียนสมมติฐานไดวา H0 : ρ = 0 มีสูตรวา z = ]3n][zz[ 0r −− เมื่อ zr และ z0 เปนคาฟชเชอรแปลงรูป และนําคา z ที่ไดไปเปรียบเทียบกับคาวิกฤติที่เปดจากตารางสถิติ การทดสอบแบบสองทางของคาวิกฤติ α/2z และ 1-α/2z สําหรับการทดสอบแบบทางเดียวคาวิกฤตจิะเปน αz และ 1-αz ข้ึนอยูกับสมมติฐานอืน่ การทดสอบสหสัมพันธแยกสวน (H0 : ρ12.w = 0) แลว z = ]n3n][z)r(z[ w0w.12 −−− เมื่อ nw คือจาํนวนของตัวแปรที่ถูกควบคมุ และอางอิงคาวิกฤตจิากตารางสถิต ิ สหสัมพันธครึ่งสวน (Semipartial (Part) Correlation) แนวคดิถัดมาคือสหสัมพันธครึ่งสวน (Semipartial or Part Correlation) กรณีที่งาย คือกรณีที่มีตัวแปรเพียง 3 ตัว ซึ่งใหช่ือวา X1, X2 และ X3 การวิเคราะหสหสัมพันธครึ่งสวนจะเปนการหาสหสัมพันธระหวาง X1 และ X2 เมื่อ X3 ถูกขจัดออกจาก X2 เทานั้น นั่นคอื อิทธิพลของ X3 จะถูกขจัดออกจาก X2 เทานั้น ดังนั้น สหสัมพันธครึ่งสวนจึงเปนการแสดงถึงความสัมพันธเชิงเสนระหวาง X1 และ X2 หลังจากสัดสวนความแปรปรวนของ X2 ที่สามารถทํานายไดจาก X3 ถูกขจัดออกจาก X2 สหสัมพันธครึ่งสวนจะใชสัญลักษณวา r1(2.3) เมื่อ X จะไมแสดงในสญัลกัษณและจดุทีค่ั่นหมายถึงการขจัดอิทธิพลของตัวแปร วิธีการคํานวณมีสูตรดังนี ้ r1(2.3) = )r1(/)rrr( 2

23231312 −− สังเกตวาสูตรคํานวณจะใชคาสหสัมพันธระหวางตัวแปรเพียง 2 ตัว

Page 4: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 4

ตัวอยางในกรณีการหาคาสหสัมพันธครึ่งสวน เชน ผูวิจยัสนใจหาความสัมพันธระหวาง GPA (X1) และคะแนน GRE (X2) และผูวิจัยตองการขจัดอิทธิพลของเชาวนปญญา (X3) ออกจากคะแนน GRE แตไมตองการขจัดออกจาก GPA คาสหสัมพันธระหวางตัวแปรไดคา r12 = 0.5, r13 = 0.3 และ r23 = 0.7 สามารถคาํนวณ r1(2.3) ไดคาดังนี ้ r1(2.3) = )r1(/)rrr( 2

23231312 −− = )49.01(/))7.0(3.05.0( −− = 0.41 ซึ่งจะกลายเปนวาสหสัมพันธระหวางตัวแปร GPA และ GRE ที่ไมสนใจตัวแปรเชาวนปญญา (r12 = 0.5) มีคาสูงกวาสหสัมพันธครึ่งสวนระหวาง GPA และ GRE ที่ไดควบคุมเชาวนปญญาออกจากตัวแปร GRE (r1(2.3)= 0.41) ในการเรียกชื่อสหสัมพันธครึ่งสวนทํานองเดียวกับสหสัมพันธแยกสวน ถามีเพียงตวัแปรเดียวที่ขจัดออกจาก X2 จะเรียกวา the first-order semipartial correlation กรณีที่มีตัวแปร 2 ตัวที่ขจัดออกจาก X2 ใชสัญลักษณ r1(2.34) จะเรียกวา the second-order semipartial correlation และ the higher-order semipartial correlation (r1(2.345)) หรืออาจจะแสดงสหสัมพันธครึง่สวนโดยทั่วไปดวยสัญลักษณ r1(2.w) เมื่อ w คือตัวแปรที่ตองการขจัดออกจาก X2 และการคํานวณคาสหสัมพนัธครึ่งสวนจะซับซอนกวากรณีมีตัวแปรที่ตองการขจัดออกเพียงตัวเดียว สุดทายคือการทดสอบนัยสําคัญของสหสัมพันธครึ่งสวนจะมีสูตรคํานวณทํานองเดียวสหสัมพันธแยกสวน สังเกตวาในการหาสหสัมพันธระหวางตัวแปร 2 ตัวหรือมากกวา (เชน สหสัมพันธแยกสวน หรือสหสัมพันธครึ่งสวน) จะใชสําหรับการตรวจในโมเดลการวิเคราะหการถดถอยพหุคูณ (multiple regression model) เมื่อมีตัวแปรพยากรณตัง้แต 2 ตัวข้ึนไป การถดถอยพหุคูณเชิงเสนตรง (Multiple Linear Regression) ตอไปเปนแนวคิดของการถดถอยพหุคูณเชิงเสนตรง เพ่ือรวบรัดจะไมกลาวถึงสมการที่อยูในรูปของคาพารามิเตอรของกลุมประชากร จะกลาวถงึสมการที่อยูในรูปคาสถิติของกลุมตัวอยาง สมการการถดถอยพหุคุณที่อยูในรูปคะแนนมาตรฐานและคะแนนดบิ สัมประสิทธิ์การอธิบาย สหสัมพันธพหุคูณ การทดสอบนยัสําคัญ และขอตกลงเบื้องตนของสถิติ สมการถดถอยที่อยูในรูปคะแนนดิบ (Unstandardized Regression Equation) พิจารณาสมการถดถอยเชิงเสนของกลุมตัวอยางสําหรับการถดถอย Y บน X1,2,...,m คือ Yi = b1X1i + b2X2i + ... + bmXmi + a + ei

เมื่อ Y คือตัวแปรเกณฑ และ Xk คือตัวแปรพยากรณ เมื่อ k = 1, ..., m , bk คือความชัน (partial slope) ของเสนถดถอยสําหรับ Y ที่ถูกทํานายดวย Xk, a คือจุดตัดของเสนถดถอย

Page 5: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 5

สําหรับ Y ที่ถูกทํานายดวย Xk , ei คือความคลาดเคลื่อนของการพยากรณของ Y ที่ไมสามารถพยากรณไดดวย Xk และ i คือสัญลักษณแทนตัวอยางที่ i โดยที่ i มคีาตั้งแต 1 จนถึง n เมื่อ n แทนขนาดของกลุมตัวอยาง (โดยปกติเขียน i = 1, ..., n) มีการใชความชัน (partial slope) เพราะวาจะแสดงถึงความชันของ Y บน Xk เฉพาะตัวนั้น ๆ ซึ่งมีการขจัดอิทธิพลของ Xk ตัวอื่น ๆ ออก จึงเปนเหตุใหมีการใชสหสัมพันธแยกสวน สมการทํานายของกลุมตัวอยางคือ Yi' = b1X1i + b2X2i + ... + bmXmi + a

เมื่อ Y' คือคาที่ถูกทํานายของ Y เมื่อมีการแทนคา Xk และคาอ่ืน ๆ ในสมการ สามารถคํานวณความคลาดเคลื่อน ei สําหรับแตละตัวอยางจากสมการทํานาย โดยการหาความแตกตางระหวาง Y จริงกับ Y ที่ถูกทํานาย จะไดคาความคลาดเคลื่อนของตัวอยางดวยสมการ ei = Yi - Yi' สําหรับทุกคา i = 1, ..., n ในการคาํนวณความชันและจดุตดัในการถดถอยพหุคูณกรณีมีตัวแปรทํานาย 2 ตัว โดยปกติจะใชโปรแกรมคอมพิวเตอรชวยในการคํานวณ สําหรับกรณีมีตัวแปรทํานาย 2 ตัวแลว ความชันและจดุตัดสามารถคาํนวณไดดวยสตูร b1 = ]s)r1/[(]s)rrr[( 1

212Y122Y1Y −−

b2 = ]s)r1/[(]s)rrr[( 2212Y121Y2Y −−

และ a = 2211 XbXbY −− ความชัน b1 อางอิงวาเปน 1) คาคาดหวังหรือการเปลี่ยนแปลงใน Y เมื่อ X1 เปลี่ยนแปลงไป 1 หนวยโดยที่ X2 คงที่ 2) อิทธิพลของ X1 ที่มีตอ Y เมื่อ X2 คงที่ และ 3) สัมประสิทธิ์การถดถอยในรปูของคะแนนดิบ สําหรับ b2 ก็อางอิงทํานองเดียวกัน จดุตดัอางอิงวาเปน 1) คาของ Y เมื่อ X1 และ X2 เปน 0 และ 2) คาเฉล่ียของ Y เมื่อ X1 และ X2 เปน 0 อีกวิธีสําหรับการคํานวณความชันจะเกี่ยวของกับการใชสหสัมพันธแยกสวน มีสูตรการคํานวณดังนี ้ b1 = ]})r1(s/[])r1(s{[r 2

1212

2YY2.1Y −−

และ b2 = ]})r1(s/[])r1(s{[r 2121

22YY2.1Y −−

มีเกณฑอยางไรในการใชคาความชันและจดุตดัในสมการการถดถอย มีอยูหลายวิธีในการคํานวณหาความชันและจุดตดั สําหรับเกณฑนั้นโดยปกติจะใชการวิเคราะหการถดถอยพหุคณูเชิงเสน ซึ่งใชเกณฑกําลังสองต่ําสุด เกณฑกําลังสองต่ําสุดจะเปนการคาํนวณหาคาสําหรับความชันและจุดตัดที่เปนผลรวมของกําลังสองของความคลาดเคลื่อนในการทํานายคือคาความคลาดเคลื่อนต่ําสุด นัน่คือตองคํานวณหาสมการถดถอยที่นิยามวาเปนชุดของความชันและจดุตดัที่มีผลรวมของกําลังสองของความคลาดเคลื่อนต่าํสุด

Page 6: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 6

พิจารณาการวเิคราะหกับตัวอยางจริง ๆ ที่จะนําเสนอในเนื้อหานัน้ โดยตัวอยางจะเปนคะแนนสอบเขาระดับบัณฑติศึกษาฉบับภาษา (GRETOT) และเกรดเฉลี่ยระดับปรญิญาตร ี(UGPA) ในการทํานายเกรดเฉลี่ยระดับบณัฑิตศึกษา (GGPA) สําหรับ GRETOT มีพิสัยของคะแนนอยูระหวาง 40 ถึง 160 และ GPA มีพิสัยของอยูระหวาง 0.00 ถึง 4.00 เก็บตัวอยางกับนักเรียน 11 คน แสดงขอมูลในตาราง 1 จากตัวอยางนี้ใชการวิเคราะหการถดถอยพหุคูณ ตาราง 1 ขอมูล GRE-GPA

นักเรียนคนท ี GRETOT UGPA GGPA 1 2 3 4 5 6 7 8 9 10 11

145 120 125 130 110 100 95 115 105 90 105

3.2 3.7 3.6 2.9 3.5 3.3 3.0 2.7 3.1 2.8 2.4

4.0 3.9 3.8 3.7 3.6 3.5 3.4 3.3 3.2 3.1 3.0

ตัวแปร GRETOT (X1) ไดคา⎯X1 = 112.73 และ s1

2 = 266.82 สําหรับ UGPA (X2) ไดคา⎯X2 = 3.11 และ s2

2 = 0.16 และ GGPA (Y) ไดคา⎯Y = 3.50 และ sY2 = 0.11

นอกจากนี้ยังคํานวณ rY1 = 0.78, rY2 = 0.75 และ r12 = 0.30 ความชันและจุดตดัคํานวณไดดงันี้ b1 = ]s)r1/[(]s)rrr[( 1

212Y122Y1Y −−

= ]33.16)30.01/[(]33.0))30.0(75.078.0[( 2−− = 0.01 b2 = ]s)r1/[(]s)rrr[( 2

212Y121Y2Y −−

= ]40.0)30.01/[(]33.0))30.0(78.075.0[( 2−− = 0.47 และ a = 2211 XbXbY −− = )11.3(47.0)73.112(01.05.3 −− = 0.91

Page 7: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 7

ในการแปลความหมายความชันและจุดตดั ความชันมีคา 0.01 สําหรับตัวแปร GRETOT มีความหมายวา ถาคะแนน GRETOT เพ่ิมขึ้น 1 หนวยแลว GGPA จะเพิ่มขึ้น 0.01 หนวย เมื่อควบคุม UPGA ไว ทํานองเดียวกัน ความชนัมีคา 0.47 สําหรับตัวแปร UGPA หมายความวา ถา UPGA เพ่ิมขึ้น 1 หนวยแลว GGPA จะเพิ่มขึ้น 0.47 หนวย เมื่อควบคุม GRETOT ไว จุดตดัมีคา 0.91 หมายความวา ถาคะแนน GRETOT และ UGPA มีคาเปน 0 แลว GGPA จะมีคา 0.91 อยางไรก็ตาม มันไมสําคัญในการอางอิง GRETOT เปน 0 เพราะวาคะแนนต่าํสุดที่เปนไปไดคือ 40 คะแนน ทํานองเดียวกนั UGPA เปน 0 ก็เปนไปไมได ไมง้ันคงไมสําเร็จการศกึษาระดับปรญิญาตรี จากนั้นนาํคาทั้งหมดที่คํานวณไดนาํมาใสสมการการถดถอยพหุคูณ ไดดังนี้ Yi = b1X1i + b2X2i + a + ei

Yi = 0.01X1i + 0.47X2i + 0.91 + ei ถาคะแนน GRETOT มีคา 130 และ UGPA มีคา 3.5 แลว สามารถทํานายคะแนน GGPA ไดเทากับ Yi = 0.01(130) + 0.47(3.5) + 0.91 = 3.86 ผลของการใชสมการทํานาย สามารถทํานายเกรดเฉลี่ยระดับบัณฑติศกึษา GGPA ได 3.86 สมการการถดถอยในรูปของคะแนนมาตรฐาน (Standardized Regression Equation) จากขางตนทั้งหมดที่กลาวมา เปนการคํานวณการวิเคราะหการถดถอยพหุคูณเชิงเสนที่เก่ียวของกับการใชคะแนนดบิในการคํานวณ ดังนัน้สมการการถดถอยที่ไดจะเรียกวาเปนสมการถดถอยในรูปของคะแนนดบิ ความชันจะประมาณคาไดจากคะแนนดบิ เพราะวาเปนการเปลี่ยนแปลงคะแนนดบิใน Y เมื่อคาคะแนนในตัวแปร Xk เปลี่ยนแปลง 1 หนวย เมื่อมีการควบคุมตัวแปร Xk อ่ืน ๆ เอาไว มบีางครัง้ที่อาจตองการแสดงการถดถอยในรูปของคะแนนมาตรฐาน z (z-score) มากกวา คาเฉล่ียและความแปรปรวนของตัวแปรที่อยูในรูปของคะแนนมาตรฐาน (z1 , z2 และ zY) มีคาเปน 0 และ 1 ตามลําดับ สมการทํานายเชิงเสนในรูปของคะแนนมาตรฐานจะกลายเปน mimi22i11i z...zz)Y(z β++β+β=′ เมื่อ kβ คือความชันในรูปมาตรฐานและเทอมอื่น ๆ ก็ทาํนองเดียวกับทีก่ลาวไปขางตน ในกรณีที่เปนการถดถอยอยางงาย จะไมมีจุดตดัในสมการทํานายรูปคะแนนมาตรฐานเพราะวามีคาเฉล่ียของคะแนนมาตรฐานในทุกตัวแปรเปน 0 ความชันมาตรฐานโดยทั่วไปคํานวณไดวา )s/s(b Ykkk =β สําหรับกรณีมีตัวแปรพยากรณ 2 ตัว ความชันมาตรฐานสามารถคาํนวณไดวา

Page 8: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 8

)s/s(b Y111 =β หรือ )r1/()rrr( 2

12122Y1Y −−= และ )s/s(b Y222 =β หรือ )r1/()rrr( 2

12121Y2Y −−= ถา r12 = 0 แลวแสดงวาตัวแปรพยากรณทั้งสองตัวไมมีความสัมพันธกันแลว 1Y1 r=β และ 2Y2 r=β สําหรับตัวอยาง คํานวณความชันมาตรฐานไดคาเทากับ )s/s(b Y111 =β = 0.01(16.33/0.33) = 0.49 และ )s/s(b Y222 =β = 0.47(0.40/0.33) = 0.57 สมการทํานายเขียนไดวา i2i1i z57.0z49.0)Y(z +=′ ความชันมาตรฐานของตัวแปร GRETOT มีคา 0.49 แปลความหมายเปนคาที่ถูกคาดหวังวาจะเพิ่มขึ้นในตัวแปร GGPA หนวยคะแนนมาตรฐานเมื่อ GRETOT เพ่ิมขึ้น 1 หนวยคะแนนมาตรฐาน เมื่อควบคุม UGPA ไว ทํานองเดียวกันกับตัวแปร UGPA โดยที ่ kβ สามารถแปลความหมายเปนคาที่ถูกคาดหวังวา Y จะเปลี่ยนแปลงไปเมื่อมีการเปลี่ยนแปลงใน Xk 1 หนวยเมื่อมีการควบคุม Xk อ่ืน ๆ เอาไว ในกรณีใดที่ควรใชการวิเคราะหการถดถอยในรูปของคะแนนมาตรฐานหรือคะแนนดิบ นักสถิติอยาง Pedhazur ไดอธบิายถึง kβ จะใชกับกลุมตัวอยางเฉพาะกลุมและจะไมคงที่หากมีการนําไปใชกับตัวอยางตางกลุมกัน อันเนือ่งมาจากความแปรปรวนใน Xk ที่เปลี่ยนแปลงไปเมื่อกลุมตัวอยางแตกตางกัน (เมื่อกลุมตัวอยางมีความแปรปรวนของ Xk เพ่ิมขึ้นแลว คาของ kβ ก็จะเพิ่มขึ้นดวย) ดังนั้นนักวิจยัโดยมากจะใช kb ในการเปรียบเทียบอิทธพิลของตัวแปรพยากรณเมื่อนําไปใชกับกลุมตัวอยางหรือกลุมประชากรที่แตกตางกัน อยางไรก็ตาม kβ มีประโยชนในการประเมินความสัมพันธระหวางตัวแปรพยากรณแตละตัวสําหรับกลุมตวัอยางเฉพาะกลุมที่ศึกษา เพราะวาตัวแปรพยากรณแตละตัวจะมีสเกลที่แตกตางกัน ดังนั้น GGPA จะมีความสัมพันธกับ GRETOT มากกวา UGPA ดังแสดงในคาความชันมาตรฐาน ซึ่งจะผลใหตองมีการทดสอบนัยสําคัญของตัวแปรพยากรณทั้งสองตัว

Page 9: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 9

สัมประสิทธิ์การอธิบายและสหสัมพันธพหุคูณ (Coefficient of Multiple Determination and Multiple Correlation) มีคําถามวา "ตัวแปรพยากรณสามารถทํานายตัวแปรเกณฑไดเทาใด" จากตัวอยางที่ผานมาตัวแปรเกณฑคือ GGRE ถูกทํานายดวย UGRE และ GRETOT ดังนัน้ชุดของตัวแปรพยากรณมีประโยชนในการทํานายตัวแปรเกณฑเทาใด วิธีการงาย ๆ สําหรับคําถามนี้คือการแบงสวนความแปรปรวนออกเปนผลรวมกําลังสองใน Y ซึ่งจะใชสัญลักษณวา SSY ในการถดถอยพหุคูณเชิงเสน สามารถคํานวณ SSY ไดวา SSY = [nΣY2 - (ΣY) 2]/n หรือ = (n - 1) 2

Ys เมื่อผลรวมของ Y ตั้งแต i = 1, ..., n ถัดมาจะแบงสวน SSY ไดเทากับ SSY = SSreg + SSres หรือ Σ(Y -⎯Y)2 = Σ(Y' -⎯Y)2 + Σ(Y - Y')2 เมื่อ SSreg คือผลรวมกําลังสองอันเนื่องมาจาการถดถอย Y บน Xk (หรือเขียนวา SSY')และ SSres คอืผลรวมกําลังสองของความคลาดเคลื่อน SSY เปนสวนที่นําเสนอความแปรปรวนรวมของ Y และ SSreg เปนสวนที่นําเสนอความแปรปรวนใน Y ที่ถูกทํานายดวย Xk และ SSres เปนที่นําเสนอความแปรปรวนใน Y ที่ไมสามารถทํานายไดดวย Xk กอนหนานี้ไดอธิบายการคํานวณหา SSreg และ SSres ไปแลว ในหัวขอนี้จะอธบิายถึงสัมประสิทธิ์การอธิบาย ในการวิเคราะหการถดถอยอยางงายใชสัญลักษณวา 2

XYr ในกรณีที่มีตัวแปรพยากรณมากกวาหนึ่งตวั จะใชสัญลักษณวา 2

m,...,1.YR ตัวหอยจะบอกถึงตัวแปรเกณฑ Y กับตัวแปรพยากรณที่มีตั้งแต X1, ..., m กระบวนการอยางงายในการคาํนวณ R2 คือ 2

m,...,1.YR = Ymm2Y21Y1 r...rr β++β+β สัมประสิทธิ์การอธิบายจะบอกถึงสัดสวนของความแปรปรวนรวมใน Y ที่สามารถพยากรณไดดวยชุดของตัวแปรพยากรณในสมการถดถอยเชิงเสน อาจเขียนไดในเทอมของ SS ดังนี ้ 2

m,...,1.YR = SSreg/SSY ดังนั้นวธิีการหนึ่งในการคํานวณหา SSreg และ SSres จาก R2 คือ SSreg = R2SSY และ SSres = (1 - R2)SSY = SSY - SSreg โดยทั่วไป กรณีของการถดถอยเชิงเสนไมมีกฏตายตัววาควรมีขนาดของสัมประสิทธิ์การอธิบายมากเทาใดที่จําเปนในการบอกถึงขนาดของความแปรปรวนที่ถูกทํานายไดอยางมีความหมาย มกีารทดสอบนยัสําคัญอยูหลายวิธีที่จะอธบิายตอไป สังเกตวา RY.1,...,m อางอิงวาเปนสัมประสิทธิ์สหสัมพันธพหุคูณ

Page 10: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 10

ตัวอยางขอมูลในการทาํนาย GGPA จาก GRETOT และ UGPA สามารถคํานวณหาคาของ SSY ไดคา SSY = (n - 1) 2

Ys SSY = (10)0.11 = 1.1 ถดมาคาํนวณหา R2 2

12.YR = 2Y21Y1 rr β+β = 0.49(0.78) + 0.57(0.75) = 0.81 สามารถใช SSy คํานวณหา SSreg และ SSres ได SSreg = R2SSY = 0.81(1.1) = 0.89 และ SSres = (1 - R2)SSY = (1 - 0.81)(1.1) = 0.21 ทายสุดสรุปผลสําหรับขอมูลที่เปนตัวอยาง จะพบวาสัมประสิทธิ์การตดัสินใจจะมีคาเทากับ 0.91 ดังนั้น GRETOT และ UGPA สามารถทาํนายความแปรปรวนใน GGPA ได 91 เปอรเซ็นต ซึ่งเปนผลที่ดีทีค่ะแนนสอบและเกรดเฉลี่ยปริญญาตรีสามารถทํานายความสําเร็จในการศึกษาได สังเกตวา R2 จะออนไหวตอขนาดของกลุมตัวอยางและจํานวนของตัวแปรพยากรณ ในเทอมของ R จะประมาณคาความสัมพันธพหุคูณของประชากรไดลําเอียงเนื่องจากความคลาดเคลื่อนในการสุมตัวอยางในความสมัพันธระหวางสองตัวแปรและในสวนเบี่ยงเบนมาตรฐานของ X และ Y เพราะวา R จะประมาณคาสหสัมพันธพหุคูณของประชากรไดสูงเกินความเปนจรงิและสัมประสิทธิ์การอธบิายปรับแก (adjusted coefficient of multiple determination) ก็จะถูกนํามาใชในการอภิปรายผล คา R2 ปรับแกสามารถคํานวณไดดวยสูตร Adjusted R2 = 1 - (1 - R2)[(n - 1)/(n - m - 1)] ดังนั้นคา R2 ปรับแกจะใชเมื่อขนาดกลุมตัวอยางมีจํานวน และจาํนวนของตัวแปรพยากรณมีจํานวนมาก และเปรียบเทียบความเหมาะสมของสมการถดถอยที่ไดในชดุขอมูลเดียวกันนี้กับจํานวนตัวแปรพยากรณที่แตกตางกันและมีขอมูลของกลุมตัวอยางที่แตกตางออกไป ความแตกตางระหวาง R2 และ R2 ปรับแกจะเรียกวา shrinkage เมื่อ n มีจํานวนนอย จะมคีวามลําเอียงใหคา R2 มีคามาก ในกรณีนี้การปรับแกจะเขามีประโยชน โดยใช R2 ปรับแก นอกจากนี้กรณีมีกลุมตัวอยางขนาดเล็ก สัมประสิทธิ์การถดถอย

Page 11: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 11

อาจจะประมาณคาอางอิงไปยังประชากรไดไมดี แตอยางไรก็ตาม ควรมี n จํานวนมากกวา m หลายเทา จะชวยใหเกิดความลําเอียงนอยและจะชวยสรุปอางอิงไปยังประชากรไดดข้ึีน เมื่อจํานวนตัวแปรพยากรณมีมากในการวิเคราะหการถดถอยพหุคูณ อํานาจการทดสอบจะลดลง และจะไปเพิ่มความคลาดเคลื่อนแบบที่ 1 ในการทดสอบนัยสําคญั ในกรณีการวิเคราะหการถดถอยพหุคณู อํานาจการทดสอบจะเกี่ยวของกับขนาดของกลุมตัวอยาง จํานวนของตัวแปรพยากรณ ระดับนัยสําคัญและขนาดของอิทธิพลประชากร ไมมีกฎวาจะตองใชกลุมตัวอยางจํานวนเทาใดที่จะสัมพันธกับจํานวนของตัวแปรพยากรณ แตโดยปกตินักวิจัยจะใชอัตราสวนของจํานวน n ตอ m มาก ๆ สําหรับขอมูลจากตัวอยางนี ้คํานวณหา R2 ปรับแก ไดคา Adjusted R2 = 1 - (1 - R2)[(n - 1)/(n - m - 1)] = 1 - (1 - 0.81)[(11 - 1)/(11 - 2 - 1)] = 0.76 บงช้ีวามีคาปรับแกจะมีคาต่าํกวาเมื่อเปรียบเทียบกับ R2 การทดสอบนัยสําคัญ ในหัวขอนี้จะอธิบาย 3 วิธีที่ใชในการถดถอยพหุคูณ เก่ียวของกับการทดสอบนัยสําคญัของสมการถดถอยทั้งหมด ทดสอบความชันในแตละคา (หรือสัมประสิทธิ์การถดถอย) และการเพ่ิมขึ้นของสัดสวนของความแปรปรวนที่อธิบายไดดวยตัวแปรพยากรณแตละตัว การทดสอบนัยสําคัญของสมการถดถอยทั้งหมด การทดสอบแรกเปนการทดสอบนัยสําคญัของสมการถดถอยทั้งหมดหรือเรียกอีกอยางวาการทดสอบนัยสําคัญของสัมประสิทธิ์การอธิบาย เปนการทดสอบที่จําเปนในการทดสอบคา bk ทั้งหมดที่อยูในสมการ สามารถเขียนสมมติฐานศูนยและสมมติฐานอืน่ไดดังนี ้ H0 : 2

m,...,1.Yρ = 0 H1 : 2

m,...,1.Yρ ≠ 0 ถา H0 ถูกปฏิเสธแลวแสดงวา มีสัมประสิทธิ์การถดถอยอยู 1 ตัวหรือมากกวา (bk) อาจจะมีนัยสาํคัญทางสถติิแตกตางจาก 0 อยางไรก็ตาม เปนไปไดที่จะมีนัยสําคัญของ R2 ทั้งหมด เมื่อไมมีตัวแปรพยากรณแตละตัวมนีัยสําคัญ ซึ่งจะบงช้ีวาไมมีตัวแปรพยากรณแตละตัวที่มีความแกรงเหนือตัวแปรอื่น ๆ แตอยาลืมวาตัวแปรพยากรณแตละตัวอาจจะสัมพันธกัน ดงันั้น "ตองควบคุมตัวแปรพยากรณอ่ืน" ซึ่งเปนความสําคัญอนัดบัแรก ถา H0 ไมถูกปฏิเสธแตไมมีสัมประสิทธิ์การถดถอยที่มนีัยสําคัญทางสถิติแตกตางจากศนูย การทดสอบอยูบนพื้นฐานสถิติที่วา

Page 12: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 12

F = )]1mn/()R1[(

]m/R[2

2

−−−

เมื่อ F คือสถิติทดสอบ F สวน R2 คือสัมประสิทธิ์การอธิบาย (สัดสวนความแปรปรวนใน Y ที่ถูกทํานายไดดวย Xk) สวน 1 - R2 คือสัมประสทิธิ์การไมอธิบาย (สัดสวนความแปรปรวนใน Y ที่ไมสามารถทํานายไดดวย Xk) m คือจํานวนของตัวแปรพยากรณ และ n คอืขนาดของกลุมตัวอยาง สถิตทิดสอบ F จะถูกเปรียบเทียบกับ F วิกฤตทิี่ไดจากตารางสถิติเปนแบบทิศทางเดียว โดยมีองศาแหงความเปนอิสระเทากับ m และ (n - m - 1) คาวิกฤต ิF จะเทากับ (1-α)Fm,(n-m-1) สถิติทดสอบสามารถเขียนไดในรูปหนึ่งวา

F = )df/SS()df/SS(

resres

regreg

= MSreg/MSres เมื่อ dfreg = m และ dfres = (n - m - 1) สําหรับตัวอยางขอมูล สามารถคํานวณสถติิทดสอบไดคา

F = )]1mn/()R1[(

]m/R[2

2

−−−

= )]1211/()81.01[(

]2/81.0[−−−

= 17

หรือ F = )df/SS()df/SS(

resres

regreg

= )8/21.0()2/89.0(

= 17 คาวิกฤติที่ระดบันัยสําคัญ 0.05 และ 0.95F2,8 = 4.46 สถิติทดสอบมีคามากกวาคาวิกฤติ จะปฏิเสธ H0 และสรุปผลวา ρ2 ไมเทากับ 0 ที่ระดับนัยสําคญั 0.05 นั่นคือ GRETOT และ UGPA รวมกันทํานายสัดสวนความแปรปรวนใน GGPA ไดอยางมีนัยสําคญัทางสถิต ิ การทดสอบนัยสําคัญของ bk การทดสอบทีส่องเปนการทดสอบนัยสําคญัทางสถิติของความชันและสัมประสิทธิ์การถดถอย bk ในอีกกรณีหนึ่ง สัมประสิทธิ์การถดถอยที่อยูในรูปคะแนนดบิมีนัยสําคญัทางสถิติแตกตางจากศนูยหรือไม ซึ่งจะเหมือนกับการทดสอบ kβ แตจะไมแสดงการทดสอบแยกสวนออกมา สมมติฐานศูนยและสมมติฐานอืน่สามารถเขียนไดดังนี ้ H0 : βk = 0 H1 : βk ≠ 0

Page 13: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 13

เมื่อ βk คือความชันของประชากรในตัวแปร Xk การถดถอยพหุคูณจําเปนทีจ่ะตองคาํนวณความคลาดเคลื่อนมาตรฐานสําหรับแตละ bk ซึ่งสามารถคํานวณไดดังนี ้ 2

ress = SSres/dfres = MSres เมื่อ dfres = (n - m - 1) องศาแหงความเปนอิสระจะสูญหายไปเพราะมีการประมาณคาความชันของประชากรและจุดตดั นั่นคือ βk และ α ตามลําดบั จากขอมูลตัวอยาง ความคลาดเคลื่อนของความแปรปรวนของการประมาณคาหาไดจากปริมาณของความแปรปรวนในความคลาดเคลื่อน ความคลาดเคลื่อนมาตรฐานของการประมาณคาไดโดยการถอดรากทีส่องของความความคลาดเคลื่อนของความแปรปรวนของการประมาณคา และสามารถไดโดยผานความเบี่ยงเบนมาตรฐานของความคลาดเคลื่อนของการประมาณคา เรียกวา ความคลาดเคลื่อนมาตรฐานของการประมาณคา ใชสัญลักษณวา sres ทายสุดจะคํานวณความคลาดเคลื่อนมาตรฐานของ bk แตละตัว ใชสัญลักษณความคลาดเคลื่อนมาตรฐานของ bk วา s(bk) คํานวณไดดังนี้ s(bk) = )]R1(s)1n[(/s 2

k2kres −−

เมื่อ sk คือความแปรปรวนของกลุมตัวอยางสําหรับตัวแปรทํานาย Xk และ 2kR คือ

กําลังสองของสหสัมพันธพหุคูณระหวาง Xk ตัวหนึ่งกับ Xk ที่เหลือ 2kR จะแสดงถึงการซอนทับ

กันระหวางตัวแปรพยากรณ (Xk) ในกรณีที่มีตัวแปรพยากรณ 2 ตัว 2kR จะเทากับ 2

12r ตอมาเปนการทดสอบทางสถิติสําหรับการทดสอบนัยสาํคัญของ bk ในการทดสอบทางสถิตินี้จะเปนอัตราสวนของคาสัมประสิทธิ์การถดถอยหารดวยความคลาดเคลื่อนมาตรฐาน ดังสูตร t = bk/s(bk) สถิติทดสอบ t จะนาํไปเปรียบเทียบกับคาวิกฤติแบบสองทางกับระดบันัยสําคัญที ่(n - m - 1) โดยเปดจากตารางสถิติ วาวิกฤติจะเทากับ ±(α/2)t(n-m-1) กรณีแบบสองทาง ในการหาชวงความเชื่อมั่นของ bk โดยการนํา bk มาบวกและลบออกจากคาวิกฤติทีเ่ปดจากตารางแลวคูณดวยความคลาดเคลื่อนมาตรฐาน ชวงความเชื่อมั่นของ bk คํานวณไดดวยสูตร CI(bk) = bk ± (α/2)t(n-m-1)s(bk) จําไดวาสมมตฐิานศนูยคือ βk เทากับ 0 (H0 : βk = 0) ดังนั้น ถาชวงความเชื่อมั่นครอมศูนยแลว bk จะไมมีนัยสําคญัทางสถิติแตกตางจากศนูยที่ระดับนัยสาํคัญ นั่นคือแปลความหมายไดวา เมื่อเก็บขอมูลซ้ํากับกลุมตัวอยางหลาย ๆ กลุม จะมีจํานวน (1 - α) เปอรเซ็นต ที่คา βk จะตกอยูในชวงความเชื่อมั่นนี้ รูปแบบโดยทัว่ไปของการทดสอบที่สองนีจ้ะแสดงเปนสมมติฐานไดวา H0 : βk = β0 H1 : βk ≠ β0

Page 14: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 14

เมื่อ β0 คือคาที่ βk ถูกสมมติใหเทากับ เมื่อ β0 = 0 แลว ก็จะทดสอบเหมือนกับทีก่ลาวไวขางตน รูปแบบการทดสอบโดยทั่วไปของ bk คือ t = (bk - β0)/s(bk) ในรูปแบบโดยมากของชวงความเชื่อมั่น ก็จะรวม β0 ไวในดวย สําหรับตัวอยางขอมูล มีสมมติฐานวา βk = 0 และเปนแบบสองทาง กอนดาํเนินการทดสอบนัยสาํคัญตองคํานวณความคลาดเคลื่อนของความแปรปรวนเสียกอน ไดคาดงันี้ 2

ress = SSres/dfres = MSres = 0.21/8 = 0.026 ความคลาดเคลื่อนมาตรฐานของการประมาณคา sres จะคํานวณไดเทากับ 0.11 ถัดมาคํานวณความคลาดเคลื่อนมาตรฐานของ bk ไดคา s(b1) = )]R1(s)1n[(/s 2

1221res −−

= )]30.01(82.266)10[(/16.0 2− = 0.003

และ s(b2) = )]R1(s)1n[(/s 212

22res −−

= )]30.01(16.0)10[(/16.0 2− = 0.1326 สุดทายคาํนวณสถิติทดสอบ t ไดคา t1 = b1/s(b1) = 0.01/0.003 = 3.33 t2 = b2/s(b2) = 0.47/0.1326 = 3.54 ประเมินสมมติฐานโดยการนําคาสถิติทดสอบที่คํานวณไดไปเปรียบเทียบกับคาวิกฤติ ±.025t8 = ±2.306 สถิติทดสอบ t ทั้งสองคามีคามากกวาคาวิกฤติ แสดงวาจะปฏิเสธ H0 ยอมรับ H1 ในตัวแปรพยากรณทั้งคู เราจะสรุปไดวาความชันมนียัสําคัญแตกตางจาก 0 ที่ระดับนัยสําคญั 0.05 สุดทายคาํนวณหาชวงความเชื่อมั่นสําหรับ bk ไดคา CI(b1) = b1 ± (α/2)t(n-m-1)s(b1) = b1 ± .025t8 s(b1) = 0.01 ± 2.306(0.002)

Page 15: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 15

= (0.007, 0.02) และ CI(b2) = b2 ± (α/2)t(n-m-1)s(b2) = b2 ± .025t8 s(b2) = 0.47 ± 2.306(0.09) = (0.25, 0.68) สังเกตวาชวงความเชื่อมั่นจะไมครอม 0 ซึ่งเปนคาเฉพาะในสมมติฐาน H0 แลวจะสรุปไดวา ทั้งคูของ bk จะมีนัยสําคัญแตกตางจากศูนยที่ระดบั 0.05 การทดสอบการเพิ่มขึ้นของสัดสวนความแปรปรวนที่สามารถอธิบายได การทดสอบทีส่าม เปนการทดสอบการเพิ่มขึ้นของสัดสวนความแปรปรวนที่สามารถอธิบายไดไดวยตัวแปรพยากรณแตละตัว ตัวอยางที่เปนโมเดลมีตัวพยากรณ 2 ตัว สามารถทดสอบการเพิ่มขึ้นได เปนสัดสวนของความแปรปรวนที่สามารถอธบิายไดดวยตัวแปร 2 ตัวเปรียบเทียบกับตัวแปร 1 ตวั ซึ่งเปนความจําเปนในกรณีที่มีโมเดลตวัแปรพยากรณ 2 ตัวกบัโมเดลทีมีตัวแปรพยากรณ 1 ตัว การทดสอบการเพิ่มขึ้นของ X1 มีสถิติทดสอบคือ

F = )]1mn/()R1[()]mm/()RR[(

22

12.Y

122

2.Y2

12.Y

−−−−−

เมื่อ 22.YR = 2

2Yr แลว m2 คือจาํนวนของตัวแปรพยากรณในโมเดลที่มีตัวพยากรณ 2 ตัว และ m1 คอืจํานวนของตวัแปรพยากรณในโมเดลทีม่ีตัวพยากรณ 1 ตัว สถิต ิF จะนาํไปเปรียบเทียบกับ F วิกฤติที่เปดจากตารางแบบทศิทางเดียว ใชสัญลักษณวา (1-α)F(m2-m1,n-m2-1) ทดสอบการเพิ่มขึ้นของ X2 ใชสถิติทดสอบ

F = )]1mn/()R1[()]mm/()RR[(

22

12.Y

122

1.Y2

12.Y

−−−−−

เมื่อ 21.YR = 2

1Yr แลว m2 คือจาํนวนของตัวแปรพยากรณในโมเดลที่มีตัวพยากรณ 2 ตัว และ m1 คอืจํานวนของตวัแปรพยากรณในโมเดลทีม่ีตัวพยากรณ 1 ตัว สถิต ิF จะนาํไปเปรียบเทียบกับ F วิกฤติที่เปดจากตารางแบบทศิทางเดียว ใชสัญลักษณวา (1-α)F(m2-m1,n-m2-1) โดยทั่วไป สามารถเปรียบเทียบโมเดลการถดถอย 2 โมเดลสําหรับกลุมตัวอยางเดยีวกัน เมื่อโมเดลเตม็รูปแบบ (full model) นิยามวามีตัวแปรพยากรณทุกตวัอยูในโมเดล และโมเดลที่ลดรูป (reduced model) นิยามวาเปนโมเดลที่มีเพียงบางชุดของตัวแปรพยากรณในโมเดล นั่นคือสําหรับโมเดลลดรูปอาจจะมีตัวแปรพยากรณเพียง 1 ตัวหรือมากกวา ซึ่งเปนสวนหนึ่งของโมเดลเต็มรูปแบบที่มีการลดตัวแปรพยากรณลงบางตัว สถิติทดสอบโดยทั่วไปเขียนไดวา

F = )]1mn/()R1[(

)]mm/()RR[(full

2full

redfull2red

2full

−−−−−

Page 16: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 16

เมื่อ "full" และ "red" เปนสญัลักษณของโมเดลเต็มรูปแบบ (full model) และโมเดลลดรูป (reduced model) สวน mfull คือจํานวนของตัวแปรพยากรณในโมเดลเต็มรูปแบบ และ mred คือจํานวนของตัวแปรพยากรณในโมเดลลดรูป สถิต ิF จะนําไปเปรียบเทียบกับ F วิกฤติที่เปดจากตารางแบบทิศทางเดียว ใชสัญลักษณวา (1-α)F(mfull-mred,n-mfull-1) จากตัวอยางขอมูล สามารถทดสอบการเพิ่มขึ้นของ X1 (GRETOT) ไดดังนี ้

F = )]1mn/()R1[()]mm/()RR[(

22

12.Y

122

2.Y2

12.Y

−−−−−

= )]1211/()81.01[()]12/()75.081.0[( 2

−−−−−

= 10.42 สถิต ิF จะนาํไปเปรียบเทียบกับ F วิกฤติ ซึ่งจะไดคา .95F1,8 = 5.32 การทดสอบการเพ่ิมขึ้นของ X2 (UGPA) ไดดังนี ้

F = )]1mn/()R1[()]mm/()RR[(

22

12.Y

122

1.Y2

12.Y

−−−−−

= )]1211/()81.01[()]12/()78.081.0[( 2

−−−−−

= 8.488 การทดสอบทีส่องนี้นําคา F ที่คํานวณไดไปเปรียบเทียบคา F วิกฤติ ดงันั้นเราจะสรปุผลไดวา เมื่อรวมตัวแปรพยากรณทั้งสองตัว (GRETOT หรือ UGPA) ถูกเพ่ิมเขาไปอยางมีนัยสําคัญทางสถิติในการอธบิายความแปรปรวนใน GGPA ไดมากกวามีตัวแปรเดียว เพราะวา t2 = F ดังนัน้ผลการทดสอบนีส้ามารถทําไปเปรียบเทียบกับคา t ที่ทดสอบสัมประสิทธิ์การถดถอยได ขอตกลงเบื้องตนทางสถิต ิ ขอตกลงเบื้องตนของการวิเคราะหการถดถอยพหุคุณจะเหมือนกับขอตกลงเบื้องตนของการวิเคราะหการถดถอยอยางงาย แตมบีางขอตกลงเบื้องตนทีแ่ตกตางออกไป ดงันี้ การถดถอย Y บน Xk เปนเชิงเสนตรง ขอตกลงเบื้องตนขอแรก คอืการถดถอย Y บน Xk เปนเชิงเสนตรง ถาความสัมพันธระหวาง Xk แตละตัวกบั Y เปนเชิงเสนตรงแลว ความชนัและจดุตดัของกลุมตัวอยางจะเปนตัวประมาณคาทีไ่มลําเอียงของความชันและจดุตดัของประชากร ขอตกลงเบื้องตนนี้มคีวามสําคัญเพราะวาคาของ Xk โดยปกตจิะคาดหวังวา Y เพ่ิมขึ้นเทากับ bk หนวยเมื่อ Xk เพ่ิมขึ้น 1 หนวย โดยการควบคมุตัวแปร Xk อ่ืน ๆ ใหคงที ่ถาความสัมพันธไมเปนเชิงเสนตรงแลว การเพิ่มขึ้นของ Y ที่ข้ึนอยูกับคาของ Xk นัน้จะไมคงที่เสมอไป

Page 17: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 17

การละเมิดขอตกลงเบื้องตนสามารถถูกคนพบผานการพล็อตความคลาดเคลื่อนของ e กับ Xk แตละตัว และ e กับ Y' (อีกกรณีหนึ่งคือการพล็อต Y กับ Xk และ Y กับ Y') ความคลาดเคลื่อนควรจะมีตําแหนงภายในแกนที่มคีาภายใน ±2sres ในภาพประกอบ 1 ในภาพ a เมื่อพล็อต e กับ Y' ภาพ b พล็อต e กับ GRETOT และภาพ c พล็อต e กับ UGPA ในแตละคูจะมีกลุมตัวอยางนอยมาก จะเห็นเปนแบบแผนอยางสุมของความคลาดเคลื่อนในแตละภาพ และจะเห็นวาแตละจดุอยูใกลกับเสนไมเกินชวงความเชื่อมั่นที่กําหนดเปนไปตามขอตกลงเบื้องตนความเปนเสนตรงระหวางตัวแปร มีอยู 2 วิธีที่สามารถจะใชไดเมื่อความสัมพันธไมเปนเชงิเสนตรง (nonlinearity) โดยใชการแปลงรูปและโมเดลเชิงเสนโคง

ภาพประกอบ 1 พล็อตความคลาดเคลื่อน

Page 18: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 18

การแจกแจงของความคลาดเคลื่อนในการทํานาย ขอตกลงเบื้องตนประการที่สองจะเกี่ยวกับรูปแบบของความคลาดเคลื่อนในการทํานาย หรือก็คือ ei มอียู 4 ประการที่จะอธิบายในที่นี้ ประการแรก ความคลาดเคลื่อนในการทํานายจะถูกสมมติวาเปนไปอยางสุมและเปนอิสระจากกัน นั่นคือไมมีความคลาดเคลื่อนอยางเปนระบบเกิดข้ึนและความคลาดเคลื่อนแตละคาที่เกิดขึ้นจะเปนอสิระจากความคลาดเคลื่อนอื่น วิธีการที่งายทีสุ่ดสําหรับการประเมินความเปนอิสระของความคลาดเคลื่อนคือการนาํมาพล็อตเปนแผนภาพ ถาขอตกลงเบื้องตนของความเปนอสิระเปนจริงแลว ความคลาดเคลื่อนควรจะตกลงอยางสุมในแผนภาพ ถาขอตกลงเบื้องตนถกูละเมิดแลวความคลาดเคลื่อนจะตกลงเปนกระจุกอยูรวมกัน สถิต ิDurbin-Watson สามารถใชในการตรวจสอบ autocorrelation ได การละเมิดความเปนอิสระของความคลาดเคลื่อนเกิดขึ้นได 3 กรณีคือ ขอมูลเปนอนุกรมเวลา คาสังเกตถูกจัดเปนบล็อก และมีการวัดซ้าํ ความไมเปนอสิระจะมีอิทธพิลตอความคลาดเคลื่อนมาตรฐานของโมเดลการถดถอย วิธีการแกไขความไมเปนอิสระของความคลาดเคลื่อนคือใชวิธ ีgeneralized หรือ weighted least squares ในการประมาณคาพารามิเตอร หรือใชวิธีการแปลงรูป ประการที่สอง การแจกแจงอยางมีเง่ือนไขของความคลาดเคลื่อนของการทํานายในทุกคาของ Xk จะมีคาเฉล่ียเปนศูนย ถาขอตกลงเบื้องตน 2 ประการแรกนีเ้ปนจริงแลว Y' จะเปนตัวประมาณคาทีไ่มลําเอียงของคาเฉล่ีย ประการที่สาม การแจกแจงอยางมีเง่ือนไขของความคลาดเคลื่อนของการทํานายมีความแปรปรวนคงที ่ 2

ress สําหรับทุกคาของ Xk ซึ่งขอตกลงเบื้องตนนี้มักจะเรียกอีกอยางวาความเปนเอกพันธของความแปรปรวน นั่นคือทุกคาของ Xk การแจกแจงแบบมีเง่ือนไขของความคลาดเคลื่อนของการทํานายจะมีความแปรปรวนเทาเทียมกัน ถาขอตกลงเบื้องตนสามประการแรกนี้เปนจริงแลว 2

ress จะเปนตวัประมาณคาที่ไมลําเอียงของความแปรปรวนสําหรับการแจกแจงแบบมีเง่ือนไข ในการพล็อตความคลาดเคลื่อนกับ Xk และกับ Y' ความสอดคลองของความแปรปรวนของการแจกแจงแบบมีเง่ือนไขของความคลาดเคลื่อนอาจจะถูกตรวจสอบได มีอีกวิธหีนึ่งในการคนหาการละเมิดความเปนเอกพันธของความแปรปรวนโดยการใชสถิติทดสอบ ก็มทีั้ง Hartley's Fmax หรือ Cochran's test หรือ Bartlett-Box test และอ่ืน ๆ การละเมิดความเปนเอกพันธของความแปรปรวนอาจจะนําไปสูการมากเกินไปของความคลาดเคลื่อนมาตรฐาน หรือการแจกแจงแบบมีเง่ือนไขไมเปนโคงปกติ วิธีการแกไขนั้นก็ทํานองเดียวกันคือใชการแปลงรูปขอมูล (เชน

Y หรือ Log Y) อาจใชวธิีการประมาณคาแบบ generalized หรือ weighted least squares ประการที่สี่ คอืการแจกแจงแบบมีเง่ือนไขของความคลาดเคลื่อนของการทํานายมีการแจกแจงแบบปกติ สําหรับทุกคาของ Xk ความคลาดเคลื่อนในการทํานายจะมีการแจกแจงเปนโคงปกติ การละเมิดขอตกลงเบื้องตนนี้อาจจะมีผลมาจากการเกิดคาผดิปกต ิ(outliers) อาจจะคนหา

Page 19: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 19

โดยการแจกแจงความถี่ พล็อตกราฟ หรือคํานวณการวัดการกระจายของขอมูล ซึ่งตัวอยางขางตนสามารถนาํมาแสดงไดดังภาพประกอบ 2

ภาพประกอบ 2 พล็อตความนาจะเปนปกต ิ

ตัวแปร X เปนโมเดลกําหนด ขอตกลงเบื้องตนที่สามคือคาของ Xk เปนแบบกาํหนด นั่นคือ Xk จะเปนตัวแปรกําหนด ไมใชตัวแปรสุม ผลนี้ในโมเดลการถดถอยจะเที่ยงตรงเฉพาะสําหรับคาของ Xk ที่ถูกสังเกตและใชในการวิเคราะห ดังนัน้คาเดยีวกันของ Xk ควรจะถูกใชในกลุมตัวอยางที่ซ้ํากัน นั่นหมายความวาการวิจัยเชิงทดลอง ผูวิจัยควรจะกําหนดคาของ Xk ในการออกแบบและการวิจัยที่ไมใชเชิงทดลอง ผูวิจัยควรจะเลือกคาของ Xk มาจากประชากรคาของ Xk และควรจะเลือกมาอยางเจาะจงสําหรับการศึกษา แนวคิดทํานองเดยีวกันคือจะแสดงในการวิเคราะหอิทธิพลสุม (random effects) และอิทธิพลกําหนด (fixed effects) ในเรื่องการวิเคราะหความแปรปรวน Multicollinearity ขอตกลงเบื้องตนประการสุดทาย คือ Multicollinearity เปนความสัมพันธเชิงเสนระหวางตัวแปรพยากรณตั้งแต 2 ตัวข้ึนไป ซึ่งการมีอยูของความสัมพันธระหวางตวัแปรพยากรณจะมีปญหาในหลายลักษณะ ประการแรก จะนําไปสูการไมคงที่ของสัมประสิทธิ์การถดถอย ทั้งขนาดและเครือ่งหมาย (อาจเปนไดทั้งบวกและลบ) ทั้งนี้เพราะความคลาดเคลื่อนมารฐานของสัมประสิทธิ์การถดถอยมีมาก ดังนั้นจะนาํไปสูความยากในการมีนัยสาํคัญทางสถิติ นอกจากนี้ผลอาจจะเกี่ยวของกับการมีนยัสําคัญของ R2 รวม แตไมมผีลกับตัวแปรพยากรณแตละตัวที่มีนัยสําคัญแตกตางจาก 0 ความแปรปรวนของสัมประสิทธิ์การถดถอยมีแนวโนมจะมีคามาก ซึ่ง Multicollinearity จะมีผลโดยทั่วไปของการประมาณคาในโมเดลการถดถอย

Page 20: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 20

จําไดวาสัมประสิทธิ์การถดถอยแบบแยกสวน จะเปนการควบคุมตัวแปรพยากรณอ่ืน ๆ ใหคงที่ ในกรณีที่เกิด Multicollinearity ตวัแปรอื่น ๆ ไมสามารถจะคงที่ไดเพราะวามีความสัมพันธกันสูงมากๆ ซึง่ Chatterjee และ Price (1977) อธิบายวา Multicollinearity อาจจะบงช้ีถึงการเปลี่ยนแปลงอยางมากในสัมประสิทธิท์ี่ถูกประมาณคา เนื่องมาจาก 1) ตัวแปรถูกเพ่ิมหรือลด และ/หรือ 2) คาสังเกตถูกเพ่ิมหรือลด Multicollinearity จะเกิดขึ้นไดเมื่อตัวแปรพยากรณเปนตัวแปรที่แสดงถึงองคประกอบของตัวแปรพยากรณอ่ืน ๆ (เชน GRETOT ประกอบดวย GREQ และ GREV) ในการคนหาการละเมิดขอตกลงเบื้องตนนี ้วิธีการที่งายทีสุ่ดคือใชชุดของการวิเคราะหการถดถอย อยางในตัวอยางขางตนนี้มตีัวแปรพยากรณ 3 ตัว ตองวิเคราะหการถดถอย 3 ครั้ง คือ 1) ถดถอยตัวแปรพยากรณตัวแรก X1 บนตัวแปรพยากรณอีก 2 ตัวที่เหลือ (X2 และ X3) 2) ถดถอยตัวแปรพยากรณตัวที่สอง X2 บนตัวแปรพยากรณอีก 2 ตัวทีเ่หลือ (X1 และ X3) และ 3) ถดถอยตัวแปรพยากรณตัวที่สาม X3 บนตัวแปรพยากรณอีก 2 ตัวทีเ่หลือ(X1 และ X2) ถาผลของ

2kR มีคาเขาใกล 1 (เกณฑคือมากกวาหรือเทากับ 0.9) แลวอาจจะเกิดปญหา Multicollinearity

อยางไรก็ตาม คา R2 ที่มากเนื่องมาจากกลุมตัวอยางขนาดเล็กก็เปนได การเก็บรวบรวมขอมูลใหมากขึ้นก็จะมปีระโยชน สําหรับตัวอยางขอมูลขางตน 2

12R = 0.09 และไมเกิด Multicollinearity ตาราง 2 ขอตกลงเบื้องตนและผลของการละเมิดขอตกลงเบื้องตนในการวิเคราะหการถดถอยพหุคูณ

ขอตกลงเบื้องตน ผลการละเมิดขอตกลงเบือ้งตน 1. การถดถอย Y บน Xk เปนเชิงเสน เกิดความลาํเอียงในความชนัและจดุตดั 2. ความคลาดเคลื่อนเปนอสิระจากกัน มีอิทธิพลของความคลาดเคลื่อนมาตรฐานของโมเดล 3. ความคลาดเคลื่อนมีคาเฉล่ียเปน 0 มีความลําเอียงใน Y' 4. ความเปนเอกพันธของความแปรปรวนของความคลาดเคลื่อน

มีความลําเอียงใน 2ress

5. ความคลาดเคลื่อนมีการแจกแจงเปนโคงปกต ิ

มีความเที่ยงตรงต่ําในคาของความชันและสัมประสิทธิ์การอธิบาย

6. คาของ Xk เปนแบบกําหนด ความคลาดเคลื่อนในการทํานายมีคาสูง มคีวามลําเอียงในความชันและจุดตัด

7. ไมเกิด Multicollinearity ระหวาง Xk

สัมประสิทธิ์การถดถอยไมคงที่ R2 รวม อาจมีนัยสําคัญในขณะที่ตัวแปรพยากรณแตละตัวอาจไมมีนัยสําคัญ มีขอจํากัดในการสรุปอางอิงของโมเดล

Page 21: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 21

มีอีกสถิติหนึ่งสําหรับการคนหาการเกิด Multicollinearity คือการใช variance inflation factor (VIF) สําหรับตัวแปรพยากรณแตละตัว หรือมีคาเทากับ 1/(1 - 2

kR ) คา VIF นี้จะเปนคาที่บงบอกถงึโอกาสของสัมประสิทธิ์การถดถอยแตละคาที่จะสัมพันธกันเอง Wetherill (1986) แนะนาํวา คาที่มากที่สุดของ VIF ควรจะไมเกิน 10 จึงถือวาไมเกิด Multicollinearity วิธีการแกไขปญหาเมื่อมีการละเมิดขอตกลงเบื้องตนนีค้อื ประการแรก ขจัดตัวแปรพยากรณที่สัมพันธกันออกตวัหนึ่ง ประการที่สอง ใชเทคนิคการถดถอย ridge ประการที่สาม นาํตวัแปรพยากรณมาวิเคราะหองคประกอบ ประการที่ส่ี ใชการแปลงรปูตัวแปร และสุดทายเปนตัวเลือกที่ควรเลือกสุดทายคอืใชการถดถอยอยางงายกับตัวแปรพยากรณทีละตัว กระบวนการเลือกตัวแปรเขาสมการ โมเดลที่มีตัวแปรพยากรณหลายตัวเราตองมีการพิจารณาวาตัวแปรใดที่สามารถเขาไปทํานายในสมการได นัน่คือตวัแปรพยากรณทั้งหมดถูกเลือกเขาในสมการ พารามิเตอรทั้งหมดถูกประมาณคา ชุดของตัวแปรพยากรณที่ถูกเลือกเอาไวแลวจะเปนโมเดลที่มีตัวแปรพยากรณเขาสมการ (entered) หรือถูกเลือกเขาสมการ (selected) แตมีบางกรณีที่มีตัวแปรพยากรณที่ไมไดถูกเลือกเขาสมการ ซึ่งโมเดลที่มีตัวแปรเขาสมการหรือไมมีตัวแปรเขาสมการจะเรียกวา กระบวนการเลือกตัวแปร (variable selection procedures) ซึ่งมีอยูหลายวิธีในการเลือกตัวแปรทั้งแบบ backward elimination, forward selection, stepwise selection และ ชุดยอยของตัวแปรพยากรณ (all possible subsets regression) ซึ่งกระบวนการทั้งหมดนี้จะเกี่ยวโยงไปถึงขอตกลงเบื้องตนของการเกดิ Multicollinearity ดวย วิธีแรก จะอธบิายวิธ ีbackward elimination ซึ่งเปนกรณีที่ตวัแปรถูกขจัดออกจากโมเดลโดยเลือกตัวแปรที่ทํานายตัวแปรเกณฑไดนอยที่สุด ในขั้นตอนแรกของการวิเคราะห ตัวแปรพยากรณทั้งหมดจะถูกรวมอยูในโมเดล ในขั้นตอนที่สอง ตัวแปรพยากรณจะถูกลบออกจากโมเดล โดยเลอืกตัวแปรที่อธิบายความแปรปรวนในตวัแปรเกณฑไดนอยที่สุด ซึง่การขจัดออกนี้อาจจะเลือกตวัแปรที่มีคา t หรือ F ต่ําสุดที่ไมมีนัยสําคญั หรือคือตัวแปรพยากรณที่ถูกขจัดออกจะเปนตัวแปรที่พยากรณ Y ไดนอยที่สุดและไมมีนัยสําคญั และวิเคราะหเชนนี้ตอเนือ่งจนกระทั่งเหลือตัวแปรพยากรณในโมเดลที่สามารถทํานายตัวแปรเกณฑไดอยางมีนัยสําคญั อาจเปรียบเทียบคาสถิต ิt หรือ F ของตัวแปรพยากรณแตละตัว ในโปรแกรมคอมพิวเตอรบางโปรแกรมสามารถเลือกเกณฑการขจัดออกไดโดยกาํหนดเปนคา F สูงสุดในการขจัดออก โดยโปรแกรมจะเลือกตัวแปรพยากรณที่มีคา F นอยกวาคา F ที่เปนเกณฑในการขจัดออก โดยตัวแปรพยากรณที่เหลืออยูในโมเดลจะมีคา F สูงกวาคา F ที่เปนเกณฑ วิธีถัดมาคือ forward selection ตัวแปรจะถูกเพ่ิมหรือถูกเลือกเขาโมเดลบนพืน้ฐานของความสามารถในการพยากรณตัวแปรเกณฑไดสูงสุด ในขั้นแรกของการวิเคราะหจะไมมีตัวแปรพยากรณใดอยูในโมเดล ในขั้นตอนที่สอง ตัวแปรพยากรณจะถูกเพ่ิมเขาไปในโมเดลโดยเลือกตัว

Page 22: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 22

แปรพยากรณที่สามารถอธบิายตัวแปรเกณฑไดสูงที่สุด คอืตัวแปรที่มีคาสถิต ิt หรือ F สูงที่สุดและมีนัยสําคญัทางสถิต ิหรือคือตัวแปรพยากรณที่ถูกเลือกถัดมาจะสามารถพยากรณ Y ไดสูงสุด วิเคราะหตอเนื่องจนกระทั่งตัวแปรพยากรณแตละตัวทีถู่กเลือกเขาในโมเดลจะมีนยัสําคัญทางสถิติในการพยากรณ Y โมเดลคอมพิวเตอรบางโปรแกรมจะใชเกณฑคา F ต่ําสุด โปรแกรมจะเลือกตัวแปรพยากรณที่มีคา F มากกวาคา F ที่เปนเกณฑเขาในโมเดลทีละตัว ถามีการอางถึงชุดของขอมูลเดียวกันและมรีะดับของนัยสําคัญเหมือนกันแลว การใชวิธี backward elimination และ forward selection ไมจาํเปนวาจะไดโมเดลที่เหมือนกัน เนื่องจากความแตกตางของตัวแปรที่ถูกเลือก วิธี backward elimination จะถกูใชมากกวาวธิี forward selection เพราะงายที่จะดอิูทธิพลโดยรวมทั้งหมดและพิจารณาในแตละข้ันของการประมาณคาพารามิเตอรและความคลาดเคลื่อนมาตรฐาน วิธี stepwise selection เปนการประยุกตใชวิธ ีforward selection กับความแตกตางที่สําคัญประการหนึ่ง คือตัวแปรทํานายจะถกูเลือกเขาในโมเดลสามารถจะถูกขจัดออกจากโมเดลได ดังนั้นก็จะเปนการใชแนวคดิที่เก่ียวกับวิธี backward elimination ในกรณีนี้มีโอกาสที่ตัวแปรพยากรณเมื่อเปนตัวแปรสําคัญในขั้นตอนที่นําเขาสมการแลว อาจจะไมมีนัยสําคัญเมื่ออยูในโมเดล นั่นคือตัวแปรพยากรณก็อาจจะถกูขจัดออกและมีการเพิ่มตัวแปรพยากรณใหมเขาในสมการ วิธี stepwise selection ในขั้นแรกของการวิเคราะหจะไมมีตัวแปรพยากรณใด ๆ ในโมเดล ในขั้นตอนที่สอง ตัวแปรพยากรณจะถูกเพ่ิมเขาในโมเดล ซึ่งจะเปนตัวแปรที่สามารถอธิบายตัวแปรเกณฑไดสูงทีสุ่ด หรืออาจพจิารณาเลือกจากคา t หรือ F ที่สูงที่สุดซึ่งมีนัยสําคัญทางสถิติ หรือคือตัวแปรพยากรณที่ถูกเลือกจะสามารถพยากรณ Y ไดสูงสุด ตัวแปรพยากรณที่ถูกนําเขาแลวก็จะถูกตรวจสอบ ถาตัวแปรพยากรณที่อยูในสมการมีนยัสําคัญก็จะอยูในโมเดลตอไป แตถาไมมีนัยสําคัญทางสถิติ ตัวแปรพยากรณที่อยูในสมการนัน้ก็จะถูกขจัดออกจากโมเดล การวิเคราะหดําเนนิการตอเนื่องไปจนกระทั่งตัวแปรพยากรณแตละตัวที่อยูในโมเดลสามารถพยากรณ Y ไดอยางมีนัยสําคัญทางสถติิ ในขณะที่ไมมีตวัแปรพยากรณอ่ืนที่มีนัยสําคัญทางสถติิ อาจจะเปรียบเทียบสถิต ิt หรือ F สําหรับตัวแปรพยากรณแตละตัวกบัคาวกิฤติ โปรแกรมคอมพิวเตอรอาจจะใชเกณฑคา F ในการเลือกตัวแปรเขาหรือขจัดตัวแปรออก ถาหากมีการอางถึงขอมูลชุดเดียวกันและระดบันัยสําคัญเทากันแลว ผลทีไ่ดจากวิธ ีblackward elimination, forward selection และ stepwise selection อาจจะไมไดโมเดลเหมือนกัน เนื่องจากความแตกตางในการเลือกตัวแปรนําเขา วิธีการเลือกตวัแปรวิธีสุดทายคือ ใชชุดยอยของตัวแปรพยากรณที่เปนไปได (all possible subsets regression) สมมติวามีตวัแปรพยากรณ 5 ตัว ในวิธีคดัเลือกดวยวิธีนี้อาจจะมีโมเดลที่มีตัวแปรพยากรณ 1, 2, 3 และ 4 ตัวแปรที่ถูกวิเคราะห (ตัวแปรพยากรณ 5 ตัวจะมไีดเพียงโมเดลเดยีว) ดังนั้นอาจจะไดโมเดลตัวแปรพยากรณเดียว 5 ตวัแปร หรือโมเดลที่มีตัวแปร

Page 23: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 23

พยากรณ 2 ตวัแปรถึง 10 โมเดล หรือมีตวัแปรพยากรณที่มี 3 ตัวแปร 10 โมเดล และมีตัวแปรพยากรณที่มี 4 ตัวแปรถึง 5 โมเดล โมเดลที่มีตัวแปรพยากรณ k ตวัแปรสามารถจะถูกเลือกเขาโมเดลโดยพิจารณาจาก R2 สูงสุด ตัวอยางเชน โมเดลทีม่ีตัวแปรพยากรณ 3 ตัวจะตองประมาณคา R2 ทั้ง 10 โมเดล และโมเดลที่ถูกเลือกควรเปนโมเดลที่ดีที่สุดหรือโมเดลที่มีคา R2 ปรับแกสูงสุด นั่นคือโมเดลที่มีคา R2 สูงสุดสําหรับจํานวนตัวแปรพยากรณที่มีจํานวนนอย อยางไรก็ตาม นักวิจัยไมแนะนําใหใชวิธีนี ้หากสามารถใชวิธีการเลือกตัวแปรดวยวิธอ่ืีน เมื่อจํานวนของตัวแปรพยากรณมีจํานวนมาก สําหรับวิธีการนี ้ผูวิจัยอาจจะไดโมเดลที่เปนขยะ (Gabagein gabage out : GIGO) นั่นคือจํานวนของโมเดลที่ไดจะเทากับ 2m สําหรับกรณีที่มีตัวแปรพยากรณ 10 ตัวจะมีชุดของโมเดลยอย ๆ ได 1,024 โมเดล ในวิธีการเลือกตัวแปร มีวิธอ่ืีน ๆ อีก 2 วิธีที่จะกลาวถึงอยางคราว ๆ คือ 1) การวิเคราะหแบบเชิงช้ัน (Hierarchical regression) ผูวิจัยจะมีลําดบัเฉพาะในการนาํเขาตัวแปร ดังนั้น การวิเคราะหจะเปนแบบ forward selection (หรือ backward elimination) เปนวิธีทีจ่ะนําเขาตัวแปรตามลาํดบัเชิงทฤษฎี 2) การวิเคราะห setwise regression (หรือ blockwise, chunkwise, forced stepwise regression) ผูวิจัยจะมลํีาดบัสําหรับชุดของตัวแปร ซึ่งชุดของตัวแปรจะถูกกําหนดโดยผูวิจยั เชน เปนชุดตัวแปรเชิงทฤษฎี (เชน ชุดตัวแปรภูมิหลัง ประกอบดวย ความถนดัทางการเรียน, ความสนใจใฝรู และอ่ืน ๆ) ตวัแปรที่อยูภายในชุดจะถูกเลือกตามลําดบัดวยวิธีการเลอืกตัวแปร (เชน backward elimination, forward selection, stepwise selection) ตัวแปรที่ถูกเลือกในแตละชุดที่นาํเขาสมการจะเขาตามลาํดบัชุดที่มีความสําคญักอนหลังเชิงทฤษฎี ลองพิจารณาดวยตัวอยางใหมที่แสดงถึงวิธีการคดัเลือกตัวแปร โดยขอมูลใหมนี้จะมีตัวแปรพยากรณ 4 ตัว และมีกลุมตัวอยาง 20 คน แสดงในตาราง 3 ตัวแปรเกณฑคือความเขาใจในการอาน (Reading comprehension) ตัวแปรอิสระคือ การระบุอักษร (Letter identification : X1) ความรูในคําศพัท (Word knowledge : X2) ทักษะการถอดรหัส (Decoding skill : X3) และ อัตราการอาน (Reading rate : X4) วิธีการแรกคือการเลือกตวัแปรแบบ forward selection แสดงอยูในตาราง 4 ในขั้นตอน 0 สังเกตวาไมมตีวัแปรพยากรณอยูในโมเดล แตทักษะการถอดรหัสจะเปนตัวแปรแรกที่ถูกเลือกเขาในโมเดล ทักษะการถอดรหัสจะถูกเลือกโมเดลในขั้นตอน 1 คา R2 ปรับแกมีคา 0.47 และการระบุอักษรจะถกูเลือกเขาโมเดลเปนตัวแปรถัดไป ในขั้นตอน 2 การระบุอักษรจะถกูเลือกเขาโมเดล มีคา R2 ปรับแกเพ่ิมขึ้นเปน 0.57 ที่ระดับนัยสําคญั 0.05 ไมมีตัวแปรพยากรณใด ๆ ถูกเลือกขาโมเดล (คาสถิต ิF สูงสุดคือตัวแปร X2 มีคา 3.06 ไมมีนัยสําคัญทางสถิติที่ระดบั 0.05) และโดยปกติจะหยดุการวิเคราะห อยางไรก็ตาม หากลองดําเนนิการเลอืกตัวแปรอยางตอเนื่องเขาสมการทุกตัวแปรแลว ในขั้น 3 ความรูในคําศัพทจะถกูเพ่ิมเขาในโมเดล คา R2 ปรบัแกจะมีคาเพ่ิมเปน 0.61 และอัตราการอานจะถูกเลือกเขาโมเดลถัดไป ในขั้นสดุทายอตัราการอานจะถูกเพ่ิมเขาในโมเดลและ R2 ปรับแกจะมีคาลดลงเหลือ 0.61 และตัวแปรทกุตัวพรอมอยูในโมเดล

Page 24: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 24

ตาราง 3 ตัวอยางขอมูลความเขาใจในการอาน

คนที่ ความเขาใจในการอาน

การระบุอักษร ความรูในคําศัพท

ทักษะการถอดรหัส

อัตราการอาน

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

54 53 40 53 49 53 53 54 50 40 51 47 46 53 53 53 52 52 48 52

2 10 4 5 9 10 7 9 8 4 5 5 9 9 7 10 10 9 6 7

26 29 6 20 10 25 21 25 6 11 19 9 6 26 34 20 14 23 28 10

16 15 5 16 8 11 11 13 13 6 7 10 5 16 16 16 5 15 10 16

3 4 3 5 4 6 5 4 4 5 3 3 2 3 6 5 4 6 4 5

Page 25: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 25

ตาราง 4 ผลการวิเคราะหการถดถอยคดัเลือกตัวแปรแบบ forward selection ตัวแปรใน

โมเดล สัมประสิทธิ ์ F ตัวแปรที่ไม

อยูในโมเดล F

ขั้นตอน 0 ไมม ี X1 3.64 X2 12.29 X3 18.05 X4 1.95 R2 = 0.00 Adj R2 = 0.00

ขั้นตอน 1 X3 0.70 18.05 X1 4.92 X2 3.07 X4 0.01 R2 = 0.50 Adj R2 = 0.47

ขั้นตอน 2 X1 0.58 4.92 X2 3.06 X3 0.66 19.52 X4 0.13 R2 = 0.61 Adj R2 = 0.57

ขั้นตอน 3 X1 0.55 4.81 X4 0.52 X2 0.15 3.06 X3 0.49 7.90 R2 = 0.67 Adj R2 = 0.61

ขั้นตอน 4 X1 0.59 5.12 ไมม ี X2 0.16 3.33 X3 0.52 8.19 X4 -0.44 0.52 R2 = 0.69 Adj R2 = 0.60

ขอมูลชุดเดียวกันนี้ ผลของการใช backward elimination และ stepwise selection จะใหผลคลายกนักับ forward selection นั่นคือ การระบอัุกษรและทักษะการถอดรหัสจะถูกเลือกเขาในโมเดลที่ระดับนัยสําคญั 0.05 แตก็ไมใชเสมอไปที่ผลที่ไดจากการเลือกตัวแปรแตละวิธีจะใหผลเหมือนกัน ผลการเลือกตัวแปรแบบ backward elimination และ stepwise selection จะไมนําเสนอในที่นี้ สุดทายจะใชขอมูลเดียวกันนี้วิเคราะหแบบวิธ ีall possible subsets regression ซึ่งสรุปผลการวิเคราะหดงัตาราง 5 สังเกตวา โมเดลที่มีตวัแปรพยากรณเดียว ทักษะการถดถอดรหัสจะใหผลดีที่สุด (คา R2 ปรบัแก มีคา 0.47) โมเดล 3 ตัวแปรพยากรณที่ดีที่สุดคอื การระบุอักษร

Page 26: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 26

ความรูในคําศพัท และทักษะการถอดรหัส (คา R2 ปรับแก มีคา 0.61) และสุดทายโมเดลที่มีตัวแปรพยากรณ 4 ตัว (คา R2 ปรับแก มีคา 0.60) บนพืน้ฐานของความมีนัยสําคัญทางสถิติที่ระดับ 0.05 โมเดลที่มีตัวแปรพยากรณ 2 ตัวแปร (คอื การระบุอักษรและทักษะการถอดรหัส) จะเปนโมเดลที่ดีที่สุดในบรรดาโมเดลทั้งหมด และการเพิ่มขึ้นของตัวแปรที่เหลือไมไดชวยใหเพ่ิมความสามารถในการพยากรณความเขาใจในการอานไดอยางมีนัยสําคญัทางสถิต ิ ตาราง 5 ผลการเลือกตัวแปรแบบ all possible subsets regression ตัวแปรในโมเดล R2 R2 ปรับแก โมเดลตัวแปรเดียว X1 0.71 0.12 X2 0.41 0.37 X3 0.50 0.47 X4 0.10 0.50 โมเดล 2 ตัวแปร X1, X2 0.51 0.46 X1, X3 0.61 0.57 X1, X4 0.22 0.12 X2, X3 0.58 0.53 X2, X4 0.41 0.34 X3, X4 0.50 0.44 โมเดล 3 ตัวแปร X1, X2, X3 0.67 0.61 X1, X2, X4 0.51 0.42 X1, X3, X4 0.62 0.54 X2, X3, X4 0.58 0.50 โมเดล 4 ตัวแปร X1, X2, X3, X4 0.69 0.60

ตัวอยางกรณีมีกลุมตัวอยาง 100 คน และมีตัวแปรพยากรณเพียง 2 ตัวในโมเดล มีคา R2 เทากับ 0.05 กับกรณีมีตัวแปรพยากรณ 90 ตัวแปร กับมีคา R2 เทากับ 0.90 ถาคํานวณคา R2 ปรับแกในตัวอยางนี้เราจะพบวากรณตีวัแปรพยากรณ 2 ตัวมีคา R2 ปรับแก เทากับ 0.03 เปรียบเทียบกับกรณี 90 ตัวแปรมีคา R2 ปรับแกเทากับ 0.10 เมื่อ ซึ่งเปนที่นาสงสัยถึงความแตกตางของ R2 ที่มีความความแตกตางกันมาก กรณีมตีัวแปรพยากรณจํานวนมาก ในกรณีของจํานวนตัวแปรและคาของ R2 มีความสําคัญในการประเมินผลประโยชนของโมเดลการถดถอยที่ได สําหรับเกณฑที่ประเมินวาโมเดลการถดถอยมีประโยชนมากนอยเพียงใดคือควรจะเปนโมเดลที่มีคา MSres ต่ําสุด หรือมีความคลาดเคลื่อนมาตรฐานของ bk นอยที่สุด

Page 27: การวิเคราะห การถดถอยพห ุคูณ ...และคร งส วน การว เคราะห การถดถอยพห ค ณจะเก

http://www.watpon.com 27

แปลและเรียบเรียงจาก Lomax, Richard G. (1992). Statistical Concepts : A Second Course for Education and the Behavioral Sciences. London : Lawrence Erlbaum Associates, Inc.