Upload
others
View
1
Download
0
Embed Size (px)
ก
การเปรยบเทยบประสทธภาพของการประยกตเทคนคการคนหากฎความสมพนธบนขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนและตวแบบคาสนบสนน-คาความ
เชอมนใหม
นายสญชย พทกษชลทรพย
วทยานพนธนเปนสวนหนงของการศกษาตามหลกสตรปรญญาวทยาศาสตรมหาบณทต สาขาวชาการพฒนาซอฟตแวรดานธรกจ ภาควชาสถต
คณะพาณชยศาสตรและการบญช จฬาลงกรณมหาวทยาลย ปการศกษา 2553
ลขสทธของจฬาลงกรณมหาวทยาลย
ข
A COMPARISON OF THE EFFICIENCY OF APPLYING ASSOCIATION RULE DISCOVERY ON SOFTWARE ARCHIVE USING SUPPORT – CONFIDENCE MODEL AND
SUPPORT – NEW CONFIDENCE MODEL
Mr. Sunchai Pitakchonlasup
A Thesis Submitted in Partial Fulfillment of the Requirements for the Degree of Master of Science Program in Business Software Development
Department of Statistics Faculty of Commerce and Accountancy
Chulalongkorn University Academic Year 2010
Copyright of Chulalongkorn University
ฉ
กตตกรรมประกาศ
วทยานพนธนจะส าเรจลลวงและสมบรณไปไดดวยดตองขอกราบขอบพระคณผ ชวย
ศาสตราจารย ดร. อษฎาพร ทรพยสมบรณ อาจารยทปรกษาวทยานพนธเปนอยางยงทไดให
ค าแนะน าและขอคดเหนตางๆ ตรวจแกวทยานพนธฉบบนอยางละเอยด ตลอดจนแนวทางในการ
วจยดวยดตลอดมา ขอขอบพระคณผชวยศาสตราจารย ดร.สมจาร ปรยานนท และอาจารย ดร.
จนทรเจา มงคลนาวน กรรมการสอบวทยานพนธทกรณาเสยสละเวลาใหค าปรกษาและให
ค าแนะน า เพอแกไขรปแบบและเนอหาวทยานพนธฉบบนจนเสรจสมบรณ และขอบพระคณ
อาจารย ดร. อรณ ก าลง ทใหค าปรกษาเกยวกบการวเคราะหขอมลในการทดลอง
ขอบคณเพอนๆ ทใหค าปรกษาและความชวยเหลอในดานตางๆ ซงท าใหงานวจยเปนไป
ไดอยางราบรนตลอดจนก าลงใจทมอบใหเสมอมา
สดทายน ผ วจยใครกราบขอบพระคณบดา มารดาและครอบครวทคอยชวยเหลอใหการ
สนบสนนและคอยเปนแรงกระตนใหแกผวจยเสมอจนส าเรจการศกษา
ช
สารบญ
หนา บทคดยอภาษาไทย……………………………………………………………………….……...…ง
บทคดยอภาษาองกฤษ..........................................................................................................จ
กตตกรรมประกาศ.................................................................................................................ฉ
สารบญ…………..................................................................................................................ช
สารบญตาราง.…..................................................................................................................ฏ
สารบญภาพ……..................................................................................................................ฐ บทท 1 ทมาและความส าคญของปญหา……... ............................................................... 1
1.1 บทน า ......................................................................................................................... 1
1.2 ความเปนมาและความส าคญของปญหา ...................................................................... 2
1.2.1 ความส าคญของระบบควบคมการเปลยนแปลงแกไขและปญหาของนกพฒนาในโครงการพฒนาซอฟตแวรขนาดใหญ ............................................................................. 2
1.2.2 ความส าคญและปญหาของกฎความสมพนธและคาประเมนความนาสนใจของกฎความสมพนธ ............................................................................................................... 4
1.2.3 ความส าคญและปญหาของการประยกตใชเทคนคการคนหากฎความ สมพนธกบขอมลซอฟตแวรอารไคฟว ............................................................................................. 9
1.3 วตถประสงคของงานวจย ........................................................................................... 11
1.4 ขนตอนโดยสรปของการท าวจย .................................................................................. 12
1.5 ตวแปรทศกษา .......................................................................................................... 12
1.6 ขอบเขตของการวจย .................................................................................................. 15
1.7 ประโยชนทคาดวาจะไดรบ ......................................................................................... 16
1.8 นยามศพท ................................................................................................................ 16
บทท 2 ทบทวนวรรณกรรมทเกยวของ…….. ................................................................ 19
2.1 บทน า ....................................................................................................................... 19
2.2 การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธ (Association Rules Discovery) ..................................................................................................................... 20
ซ
2.3 การประเมนความนาสนใจของกฎความสมพนธ (Interestingness Measure of Association Rules) ........................................................................................................ 21
2.3.1 คาสนบสนน (Support) ..................................................................................... 22
2.3.2 คาความเชอมน (Confidence) ........................................................................... 23
2.3.3 คาคอนวคชน (Conviction) ................................................................................ 24
2.3.4 คาลฟท (Lift) .................................................................................................... 25
2.3.5 คาเลฟเวอเรจ (Leverage) ................................................................................. 26
2.3.6 คาคฟเวอเรจ (Coverage) ................................................................................. 27
2.3.7 คาสหสมพนธ (Correlation) .............................................................................. 27
2.3.8 คาอตราสวนออดส (Odds Ratio) ...................................................................... 28
2.4 ตวแบบการประเมนความนาสนใจของกฎความสมพนธใหม ........................................ 29
2.4.1 ขอบกพรองของตวแบบคาสนบสนน-คาความเชอมน ........................................... 29
2.4.2 ตวแบบการประเมนความนาสนใจของกฎความสมพนธใหม ................................. 31
2.5 คณสมบตทคาประเมนความนาสนใจของกฎความสมพนธควรจะม .............................. 33
2.6 การควบคมการเปลยนแปลงแกไข (Revision Control, Version Control) ..................... 51
2.6.1 แนวคดของการควบคมการเปลยนแปลงแกไข (Concept of Revision Control, Version Control) ....................................................................................................... 52
2.6.2 ซอฟตแวรควบคมการเปลยนแปลงแกไข (Revision Control Software, Version Control Software) ..................................................................................................... 55
2.6.3 ระบบคอนเคอเรนทเวอรชน (Concurrent Versions System, CVS) ..................... 57
2.7 การประยกตใชการท าเหมองขอมลดวยเทคนคคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว (Applying Association Rule Discovery in Software Archive) ........................ 60
2.8 ขนตอนวธการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว (Data Mining in Software Archives) ............................................................... 63
2.8.1 การจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Preparing Data for Mining in Software Archives) ..................................................................... 63
2.8.2 การท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Data Mining in Software Archives) .................................................................................................................. 75
ฌ
2.9 การวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว ................................................................................................ 81
2.9.1 คาความถกตอง (Precision) .............................................................................. 83
2.9.2 คาเรยกคน (Recall) .......................................................................................... 83
2.9.3 คาเอฟเมสเชอร (F-measure) ............................................................................ 84
2.9.4 คาผลสะทอนกลบ (Feedback) ......................................................................... 86
บทท 3 ระเบยบวธวจย……… ........................................................................................ 87
3.1 บทน า ....................................................................................................................... 87
3.2 แผนแบบการทดลอง .................................................................................................. 87
3.2.1 ตวแปรตน ......................................................................................................... 88
3.2.2 ตวแปรตาม ....................................................................................................... 89
3.3 สมมตฐานงานวจย .................................................................................................... 90
3.4 ประชากรและหนวยตวอยาง ...................................................................................... 93
3.5 แนวทางการท าวจย ................................................................................................... 97
3.6 ขนตอนทดสอบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว ......................................................................................................... 99
3.6.1 การจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว ............ 100
3.6.2 การสรางขอสอบถาม ....................................................................................... 114
3.6.3 การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ .................................................................................................... 125
3.6.4 การสรางเซตของค าแนะน าส าหรบเหตการณ .................................................... 127
3.6.5 การประเมนผลการทดสอบ .............................................................................. 130
3.6.6 การทดสอบสมมตฐาน ..................................................................................... 134
3.7 เครองมอทใชในงานวจย .......................................................................................... 136
3.8 ความถกตอง (Validity) และคาความนาเชอถอ (Reliability) ของขอมลทเกบ .............. 142
3.9 กรอบการวเคราะหขอมล (Data Analysis Framework) ............................................. 144
บทท 4 ผลการวเคราะหขอมล……. ............................................................................. 146
4.1 บทน า ..................................................................................................................... 146
4.2 ผลการทดลอง ......................................................................................................... 146
ญ
4.3 ผลการวเคราะหขอมล ............................................................................................. 149
4.3.1 การวเคราะหการแจกแจงขอมล ........................................................................ 150
4.3.2 การวเคราะหเปรยบเทยบประสทธภาพการคนหากฎความสมพนธทง 2 ตวแบบ .. 153
4.3.3 สรปผลการวเคราะหขอมล ............................................................................... 156
4.4 ผลการศกษาเพมเตม ............................................................................................... 157
4.4.1 การเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ................................................... 160
4.4.2 การเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยเปลยนขอก าหนดของการสรางเซตของค าแนะน า .... 169
4.4.3 การเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยเปลยนขอก าหนดของการสรางเซตของค าแนะน า ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ........................................................................................................ 177
4.4.4 การเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน า .......................................................................................................... 187
4.4.5 การวเคราะหคาประเมนระดบความนาสนใจของกฎความสมพนธในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด .............................................. 204
4.4.6 สรปผลการศกษาเพมเตม ................................................................................ 208
บทท 5 สรปผลการวจย……… ..................................................................................... 210
5.1 บทน า ..................................................................................................................... 210
5.2 การออกแบบการวจยและลกษณะของขอมลทน ามาใช .............................................. 210
5.3 สรปผลการวจย ....................................................................................................... 211
5.3.1 ผลการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบตวแบบคาสนบสนน-คาความเชอมนใหม ในสถานการณการน าทาง ................................ 212
ฎ
5.3.2 ผลการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบตวแบบคาสนบสนน-คาความเชอมนใหม ในสถานการณการปองกนการเกดขอผดพลาด .. 213
5.3.3 ผลการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบตวแบบคาสนบสนน-คาความเชอมนใหม ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว ............................................................................................................................... 214
5.4 การน างานวจยไปประยกตใช ................................................................................... 215
5.4.1 การน างานวจยไปใชในเชงทฤษฎ ...................................................................... 215
5.4.2 การน างานวจยไปใชในเชงประยกต .................................................................. 216
5.5 ขอจ ากดของงานวจย ............................................................................................... 217
5.6 แนวทางการศกษาตอเนอง ....................................................................................... 219
รายการอางอง .................................................................................................................. 220 ภาคผนวก ภาคผนวก ก การเลอกทรานแซคชนชดทดสอบ………….. ...................................... 229
ภาคผนวก ข ประเดนความถกตองและนาเชอถอของเครองมอทดสอบ............... .. 245
ภาคผนวก ค ตารางผลการทดสอบ .......................................................................... 250
ประวตผเขยนวทยานพนธ ............................................................................................... 261
ฏ
สารบญตาราง
ตาราง หนา
ตารางท 1-1 แสดงตารางสรปคาประเมนความนาสนใจของกฎความสมพนธ ............................ 6
ตารางท 2-1 แสดงตวอยางทรานแซคชนทประกอบดวยรายการ X Y และ Z ............................ 30
ตารางท 2-2 แสดงตวอยางรอยละของการปรากฏของรายการบนทรานแซคชนของรานขายของช าแหงหนง .............................................................................................................................. 31
ตารางท 2-3 แสดงตารางหลายตวแปร (Contingency Table) ขนาด 2 x 2 ของกฎความสมพนธ XY .................................................................................................................................. 36
ตารางท 2-4 แสดงการเปรยบเทยบคณสมบตของคาประเมนความนาสนใจของกฎความสมพนธทงหมด ................................................................................................................................ 50
ตารางท 3-1 แสดงรายละเอยดของซอฟตแวรทางการบญชชอเคมายมนน (KMyMoney) เกบขอมลในวนท 10 มกราคม พ.ศ. 2553 ................................................................................... 94
ตารางท 3-2 แสดงจ านวนของทรานแซคชนในแตละกลมทจะเลอกขนมาสรางเปนขอสอบถาม ......................................................................................................................................... 116
ตารางท ก-1 แสดงคาทางสถตเชงพรรณนาของขนาดทรานแซคชนในฐานขอมลซอฟตแวรอารไควฟโครงการเคมายมนน (KMyMoney) ……………………………………………….…….. 229 ตารางท ก-2 แสดงจ านวนของรปแบบของทรานแซคชนในขนาดตางๆและจ านวนการปรากฎตางๆ …………………………………………………………………………………………….……..237 ตารางท ก-3 แสดงการแบงกลมจ านานการปรากฎของทรานแซคชนแตละขนาด ……….…….234 ตารางท ก-4 แสดงทรานแซคชนชดทดสอบ ……………………………………………….……235 ตารางท ค-1 แสดงคาเอฟเมสเชอรของการทดสอบสถานการณการน าทาง ……………….…..250 ตารางท ค-2 แสดงคาเอฟเมสเชอรของการทดสอบสถานการณการปองกนการเกดขอผดพลาด ……………………………………………………………………………………………….…..255 ตารางท ค-3 แสดงขอสอบถามทไดเซตของค าแนะน าเปนเซตวางในการทดสอบสถานการณการเปลยนแปลงแกไขทสมบรณแลว ………………………………………..………………….…..260
ฐ
สารบญภาพ
ภาพประกอบ หนา
รปท 2-1 แสดงการไหลของกจกรรมการควบคมการเปลยนแปลงแกไข ..................................... 53
รปท 2-2 แสดงตวอยางการคอมมทลงบนล าตนและบนกง ...................................................... 55
รปท 2-3 แสดงตวอยางแฟมขอมลบนทกของคอนเคอเรนทเวอรชน ......................................... 59
รปท 2-4 แสดงการท างานของขนตอนการสกดขอมล (Data Extraction) ................................. 67
รปท 2-5 แสดงการพจารณาชวงเวลาของการคอมมทดวยวธก าหนดกรอบเวลาทแนนอนและวธเลอนกรอบเวลา ................................................................................................................... 70
รปท 2-6 แสดงตวอยางการตอกงและผสานกง ....................................................................... 75
รปท 3-1 แสดงขนตอนการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว .............................................................................................................. 99
รปท 3-2 แสดงตวอยางแฟมขอมลบนทกของระบบคอนเคอเรนทเวอรชน ............................... 102
รปท 3-3 แสดงตวอยางการพจารณาการเปลยนแปลงแกไขเวอรชนระหวางชวงของเวลาดวยวธเลอนกรอบเวลา ................................................................................................................. 106
รปท 3-4 แสดงตวอยางการระบเอนทตภายในซอรสโคด 2 เวอรชนของแฟมขอมล IBuffer.java ......................................................................................................................................... 108
รปท 3-5 แสดงภาพรวมของเครองมอทใชในการทดสอบทดสอบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว ....................................................... 137
รปท 3-6 แสดงแผนภาพออาร (ER Diagram) ฐานขอมลของเครองมอทใชในการทดสอบ ....... 138
รปท 4-1 แสดงกราฟผลตางคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 กบการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง ................................... 148
รปท 4-2 แสดงกราฟผลตางคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 กบการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด ..... 149
รปท 4-3 แสดงกราฟเสนคาเฉลยของคาเอฟเมสเชอรของการคนหากฎความสมพนธทง 2 ตวแบบเมอปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในสถานการณการน าทาง ....................................................................................................... 189
ฑ
รปท 4-4 แสดงกราฟเสนคาเฉลยของคาเอฟเมสเชอรของการคนหากฎความสมพนธทง 2 ตวแบบเมอปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในสถานการณการปองกนการเกดขอผดพลาด ......................................................................... 189
รปท 4-5 แสดงทกฎความสมพนธมคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนและเซตรายการทตามมามคาสง แตคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนแตไมมเซตรายการทตามมามคาสงกวา.................................................................. 207
1
บทท 1 ทมาและความส าคญของปญหา……...
1.1 บทน า
ในโครงการพฒนาซอฟตแวรขนาดใหญทมชวงการพฒนาและชวงการบ ารงรกษาทยาวนาน นกพฒนามกจะประสบปญหาหลายประการในแงของการท างานเปนทม เชน ปญหาการท าความเขาใจพฒนาการของซอฟตแวรของนกพฒนาทเขารวมทมใหม ปญหาการเปลยนแปลงแกไขซอฟตแวรในชวงการบ ารงรกษาทอาจเกดกบทมบ ารงรกษาทไมใชทมเดยวกบทมพฒนา ปญหาการเรยกใชซอฟตแวรไลบรารทผดของนกพฒนาทเขารวมทมใหมทอาจน าไปสการเกดขอผดพลาด เปนตน ปญหาตางๆเหลานสามารถตอบสนองไดโดยการประยกตใชเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว (Association Rule on Software Archives) งานวจยในอดตทศกษาการประยกตเทคนคดงกลาวมกจะใชตวแบบคาสนบสนน-คาความเชอมน (Support-Confidence Model) เปนตวแบบในการประเมนความนาสนใจของกฎความสมพนธ แตตวแบบคาสนบสนน-คาความเชอมนมขอบกพรองทส าคญ คอ การใหผลลพธทเปนผลบวกลวงจ านวนมาก ตอมาในปค.ศ. 2008 Liu และคณะ (Liu et al., 2008) ไดเสนอตวแบบในการประเมนความนาสนใจของกฎความสมพนธใหมขนมาและใหชอวาคาสนบสนน-คาความเชอมนใหม (Support-New confidence Model) เพอปรบปรงขอบกพรองดงกลาวของตวแบบคาสนบสนน-คาความเชอมนโดยเฉพาะ ผวจยเหนวาการน าคาสนบสนน-คาความเชอมนใหมมาประยกตใชกบการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวนาจะสามารถเพมประสทธภาพใหกบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรได สงผลใหนกพฒนาสามารถท างานเปนทมไดอยางมประสทธภาพมากขนดวย
งานวจยนมวตถประสงคเพอศกษาเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว ดวยตวแบบคาสนบสนน-คาความเชอมน ตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) ในสถานการณของการใหค าแนะน านกพฒนาใน 3 สถานการณไดแก 1) สถานการณการน าทาง (Navigation) 2) สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) และ 3) สถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure)
2
ในนผ วจยจะน าเสนอความส าคญของปญหาในเบองตนทประกอบไปดวย ความเปนมาและความส าคญของปญหา วตถประสงคของการวจย ตวแปรทศกษา ประโยชนทคาดวาจะไดรบ ขอจ ากดของงานวจยน และนยามของศพทส าคญในงานวจยน
1.2 ความเปนมาและความส าคญของปญหา
การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธเปนเทคนคหนงทไดรบความนยมและถกน าไปประยกตใชกบขอมลหลายหลากแขนง หนงในนนกคอการประยกตใชกบขอมลซอฟตแวรอารไคฟวหรอขอมลการเปลยนแปลงแกไขซอฟตแวรในอดตทไดมาจากระบบควบคมการเปลยนแปลงแกไข (Revision Control System, Version Control System) เพอประโยชนในการแกไขปญหาตางๆทเกดขนกบนกพฒนาในระหวางการพฒนาซอฟตแวร ความส าคญของระบบควบคมการเปลยนแปลงแกไขและปญหาของนกพฒนาในโครงการพฒนาซอฟตแวรขนาดใหญถกรวบรวมเอาไวหวขอ 1.2.1 แตการตอบสนองปญหาเหลานนดวยการประยกตใชเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในอดต เลอกใชตวแบบคาสนบสนน-คาความเชอมนเปนตวแบบในการประเมนความนาสนใจของกฎความสมพนธทงหมด ตวแบบคาสนบสนน-คาความเชอมนเปนตวแบบทไดรบความนยมมากแตในบางกรณทประยกตใชกบขอมลบางประเภทกสามารถท าใหเกดผลลพธทเปนผลบวกลวงจ านวนมากได ปญหาของคาประเมนความนาสนใจของกฎความสมพนธทอาจมผลกระทบมาถงประสทธภาพของการน าไปประยกตใชรวบรวมเอาไวในหวขอ 1.2.2 สวนการประยกตใชเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวของงานวจยในอดตรวมถงการประยกตใชกในระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรแสดงไวในหวขอ 1.2.3
1.2.1 ความส าคญของระบบควบคมการเปลยนแปลงแกไขและปญหาของนกพฒนาในโครงการพฒนาซอฟตแวรขนาดใหญ
เปนทยอมรบกนวาโลกธรกจทางดานซอฟตแวรในปจจบนมการแขงขนสงมาก บรษททจะอยในตลาดไดจ าเปนอยางยงทจะตองมเงนทน บคคลากรและกลยทธทนาสนใจ ฉะนนการสรางความไดเปรยบทางการแขงขนจ าเปนตองมกลยทธดานกระบวนการทมประสทธภาพและมมาตรฐานเปนทยอมรบในระดบสากล เพอใหการผลตซอฟตแวรมคณภาพ ตอบสนองความ
3
ตองการและสรางความพงพอใจสงสดตอลกคา มาตรฐานซเอมเอมไอ (CMMI, Capability Maturity Model Integration) เปนตวแบบของการวดระดบวฒภาวะ (Maturity) ความสามารถในการท างานของบรษท มาตรฐานซเอมเอมไอทใชในปจจบนคอเวอรชน 2.1 ระดบวฒภาวะของมาตรฐานซเอมเอมไอมทงหมด 5 ระดบระดบวฒภาวะทงหมดประกอบดวยกลมกระบวน 22 กลมกระบวนการ ในการบรรลระดบวฒภาวะท 2 ของมาตรฐานซเอมเอมไอ บรษทจ าเปนตองบรรลเปาหมายของกลมกระบวนการทงหมด 7 กลม หนงในนนคอกลมกระบวนการการจดการการตงคาองคประกอบ (CM: Configuration Management) ซงมเปาหมายเฉพาะเจาะจง (Specific Goal) ทจ าเปนตองบรรลใหได 3 เปาหมาย และ 1 ใน 3 ของเปาหมายเฉพาะเจาะจงนนคอ การตดตามและควบคมการเปลยนแปลงแกไข (Track and Control Changes) การบรรลเปาหมายขอนนนจ าเปนตองใชเครองมอทมชอวาระบบควบคมการเปลยนแปลงแกไข (Revision Control System, Version Control System) เขามาชวย (Grune et al., 2006)
ระบบควบคมการเปลยนแปลงแกไข คอ ระบบทใชในจดการการจดเกบ การคนคน การระบและการผสานการเปลยนแปลงแกไขแฟมขอมลซอรสโคดของโปรแกรมประยกต และสารสนเทศส าคญอนๆทพฒนาขนมาโดยทมอยางเปนอตโนมต ในซอฟตแวรควบคมการเปลยนแปลงแกไขนนจะมการบนทกแฟมขอมลซอรสโคดและแฟมขอมลบนทก (Log Files) ทบรรจขอมลทเกยวของกบการเปลยนแปลงแกไขอนๆ อาทเชน ซอรสโคดสวนใดทถกแกไข นกพฒนาแกไข วนเวลาบนทกเวอรชนใหมของซอรสโคด และหมายเหตของการบนทกเวอรชนใหมเปนตน แฟมขอมลซอรสโคดและแฟมขอมลบนทกทงหมดจะถกเรยกรวมกนวา ซอฟตแวร อารไคฟว (Software Archives) (Zimmermann et al., 2004; Zimmermann et al., 2005)
ระบบควบคมการเปลยนแปลงแกไขทไดรบความนยมและถกน าไปใชอยางแพรหลายกวา 2 ทศวรรษ คอ ระบบควบคมการเปลยนแปลงแกไขทมชอวา ระบบคอนเคอเรนทเวอรชน (Concurrent Versions System) (O’Sullivan et al., 2009) ระบบคอนเคอเรนทเวอรชนถกสรางขนมาใหบรณาการรวมกบไอดอ (IDE: Integrated Development Environment) ท าใหนกพฒนาสามารถบรรลเปาหมายการตดตามและควบคมการเปลยนแปลงแกไขได ในขณะทก าลงพฒนาซอฟตแวรในขนตอนการพฒนาซอฟตแวร (Development Phase) ของวงจรชวตการพฒนาซอฟตแวร (Software Development Life Cycle) ได
ปญหาทมกจะเกดขนกบนกพฒนาในโครงการพฒนาซอฟตแวรขนาดใหญทตองมการท างานเปนทมในแงของการควบคมและตดตามการเปลยนแปลงแกไขมหลายประการ เชน ปญหา
4
การเกดขนของการเชอมโยงกน (Evolution coupling) ระหวางคลาสหรอระหวางไฟลทไมสามารถดกจบไดในชวงของการออกแบบ (Design phase) (Gall et al., 1998; Bieman et al., 2003; Burch et al., 2005) ปญหาการท าความเขาใจพฒนาการของซอฟตแวร (Software Evolution) (Ball et al., 1997) ทอาจเกดกบนกพฒนาทเขารวมทมใหม ปญหาการเปลยนแปลงแกไขซอฟตแวรในชวงการบ ารงรกษา (Maintenance phase) ทอาจเกดกบทมบ ารงรกษาทไมใชทมเดยวกบทมพฒนา ปญหาการเรยกใชซอฟตแวรไลบรารทผดและน าไปสการเกดขอผดพลาด (Li et al., 2005; Livshits et al., 2005; Williams et al., 2005) นอกจากปญหาตางๆขางตนแลว ในระหวางการพฒนาซอฟตแวรนนอาจท าใหเกดความตองการบางอยางเกดขนดวย เชน ความตองการน ารปแบบการเรยกใชซอฟตแวรไลบราร (Software Libraries) ทถกตองกลบมาใชใหม (Michail, 2000) ความตองการระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวร (Zimmermann et al., 2004; Zimmermann et al., 2005; Methanias et al., 2009) ปญหาและความตองการทกลาวมาขางตนนสามารถตอบสนองไดโดยการน าขอมลซอฟตแวรอารไคฟว (Software Archives) ทไดมาจากระบบคอนเคอเรนทเวอรชนมาวเคราะหและสรางวธการในการแกปญหาและตอบสนองความตองการดงกลาวได ซงจะกลาวถงในหวขอท 1.2.3 ตอไป
1.2.2 ความส าคญและปญหาของกฎความสมพนธและคาประเมนความนาสนใจของกฎความสมพนธ
ทกครงทผ ใชเขาไปใชบรการเลอกซอหนงสอหรอสนคาตางๆ ภายในเวบไซตอเมซอนดอทคอม (Amazon.com) ผ ใชจะสามารถมองเหนสวนหนงของหนาเวบไซตปรากฏขอความทวา “ลกคาหลายๆคนทซอหนงสอเลมน (หรอสนคาชนน) มกจะซอหนงสอ (หรอสนคา) …ดวย” พรอมกบแสดงรายการหนงสอ (หรอสนคา) ทมกจะถกซอรวมกนดวย ขอมลสารสนเทศทเวบไซตอเมซอนดอทคอมน ามาใชเพอประโยชนในการเพมยอดขายนเปนขอมลสารสนเทศทสรางมาจากการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธ (Association Rules Discovery) ทงสน การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลการซอของลกคานนยงสามารถน าไปประยกตใชในการออกแบบแคตตาลอกสนคา การขายสนคาแขวน การออกแบบรายการสงเสรมการขาย การจดวางสนคาภายในราน การแบงกลมลกคาตามรปแบบของพฤตกรรมการซอสนคา เปนตน (Agrawal et al., 1994) นอกจากนนแลวในตลอดชวงทศวรรษทผานมาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธนยงมบทบาททส าคญในการคนหารปแบบความสมพนธทมคณคาในขอมลประเภทอนๆอก เชน ขอมลเครอขายโทรคมนาคม
5
ขอมลการจดการความเสยง ขอมลการควบคมคลงสนคา และขอมลทางพนธกรรมของสงมชวต เปนตน (Kotsiantis et al., 2006)
แนวคดของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธนถกน าเสนอขนมาครงแรกในปค.ศ. 1993 โดย Agrawal และคณะ (Agrawal et al., 1993) ตอมาในปค.ศ. 1994 Agrawal และคณะ (Agrawal et al., 1994) ไดน าเสนอขนตอนวธในการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธใหมขนมาชอวาขนตอนวธอพรโอร (Apriori Algorithm) นอกจากนน Agrawal และคณะ (Agrawal et al., 1993) ยงไดน าเสนอตวแบบของการประเมนระดบความตรงประเดนหรอระดบความนาสนใจของกฎความสมพนธตวแบบแรกและดงเดมคอตวแบบคาสนบสนน-คาความเชอมน (Support-Confidence Model) ซงใชคา 2 คาในการประเมนคอ คาสนบสนน (Support) และคาความเชอมน (Confidence) ของกฎความสมพนธ ในตวแบบคาสนบสนน-คาความเชอมนน คาสนบสนนถกใชในการคดกรองรายการทมความถสงออกมา และคาความเชอมนจะถกใชเปนคาทวดระดบความนาสนใจของกฎความสมพนธ หลงจากนนตอมามงานวจยหลายงานวจยออกมาเสนอคาประเมนคาอนๆ ทใชในการประเมนความนาสนใจของกฎความสมพนธแทนการใชคาความเชอมน ผ วจยรวบรวมงานวจยทเสนอคาประเมนความนาสนใจของกฎความสมพนธทไดรบความนยมและถกน าไปประยกตกบตางๆ อยางละเอยดไวในบทท 2 ซงสามารถสรปไดดงตารางตอไปน
ก าหนดให P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมล P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทไมมรายการ X ในฐานขอมล
P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ Y ในฐานขอมล
P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทไมมทงรายการ X และ Y ในฐานขอมล
P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และไมรายการ Y ในฐานขอมล
6
ตารางท 1-1 แสดงตารางสรปคาประเมนความนาสนใจของกฎความสมพนธ
ชอคาประเมนฯ สมการค านวณ อางอง
คาสนบสนน (Support) Support(X Y) = P(X and Y) (Agrawal et al., 1993) คาความเชอมน (Confidence) Conf(X Y) =
(Agrawal et al., 1993)
คาคอนวคชน (Conviction) Conviction(X Y) =
(Brin et al., 1997)
คาลฟท (Lift) Lift(X Y) =
(Brin et al., 1997)
คาเลฟเวอเรจ (Leverage) Leverage(X Y) = P(X and Y) - P(X)P(Y) (Piatetsky-Shapiro et al., 1991)
คาคฟเวอเรจ (Coverage) Coverage(X Y) = P(X) (Michael., 2009) คาสหสมพนธ (Correlation) Corr(X Y) =
√ (Sheikh et al., 2004)
คาอตราสวนออดส (Odds Ratio) Odds(X Y) =
(Sheikh et al., 2004)
ตอมาปค.ศ. 2008 Liu และคณะ (Liu et al., 2008) ไดน าเสนอขอบกพรองประการหนงของการใชตวแบบคาสนบสนน-คาความเชอมนและการใชคาความเชอมนเปนคาประเมนความนาสนใจของกฎความสมพนธ โดยการยกตวอยางฐานขอมลการซอสนคาของลกคาในกรณทท าใหการใชคาความเชอมนเปนคาประเมนความนาสนใจของกฎความสมพนธมผลลพธทออกมาเปนกฎความสมพนธทมเซตรายการทมากอนมความสมพนธเชงลบกบเซตรายการทตามมา กลาวคอ ทรานแซคชนสวนใหญถามเซตรายการทมากอนมกจะไมมเซตรายการทตามมาของกฎนนนนเอง หรอกคอไดกฎความสมพนธทเปนผลบวกลวง (False Positive) นนเอง ดวยสาเหตน Liu และคณะ (Liu et al., 2008) จงไดน าเสนอคาประเมนความนาสนใจของกฎความสมพนธใหมขนมาและใหชอวาคาความเชอมนใหม (New Confidence) พรอมกบพสจนวาคาความเชอมนใหมนไมขดแยงกบคาสหสมพนธและคาความเชอมนเดมซงเปนคาสถต นอกจากนนยงไดแสดงตวอยางของฐานขอมลทรานแซคชนสมมตชดหนงขนมาเพอพสจนวาคาความเชอมนใหมสามารถลดการเกดกฎความสมพนธทเปนผลบวกลวงดวย คาความเชอมนใหมสามารถค านวณไดจากสตรดงตอไปน
ก าหนดให P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมล
P( ) คอ คาความนาจะเปนในการไมพบทรานแซคชนทมรายการ X ในฐานขอมล
P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และรายการ Y
7
ในฐานขอมล
P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และไมรายการ Y ในฐานขอมล
NConf(X Y) =
–
ในงานวจยของ Liu และคณะ (Liu et al., 2008) ทไดเสนอคาความเชอมนใหมขางตนนน Liu และคณะไดท าการเปรยบเทยบความสามารถของคาความเชอมนใหมกบคาประเมนความนาสนใจของกฎความสมพนธอนๆ ทงหมด 8 คาคอ คาสนบสนน (Support), คาความเชอมน (Confidence), คาคอนวคชน (Conviction), คาลฟท (Lift), คาเลฟเวอเรจ (Leverage), คาคฟเวอเรจ (Coverage), คาสหสมพนธ (Correlation) และ คาอตราสวนออดส (Odds Ratio) โดยใชฐานขอมลทรานแซคชนสมมตขนาด 10 ทรานแซคชน ผลของการเปรยบเทยบคอ คาความเชอมนใหมสามารถบงบอกทศของความสมพนธไดอยางถกตองและสอดคลองกบคาเลฟเวอเรจและคาสหสมพนธ แตคาความเชอมนใหมนนสามารถระบความแตกตางของความนาสนใจของกฎความสมพนธ 2 กฎความสมพนธใดๆทคาเลฟเวอเรจและคาสหสมพนธไมสามารถระบได (กลาวคอกฎความสมพนธ 2 กฎทค านวณคาคาเลฟเวอเรจหรอคาสหสมพนธไดเทากนทง 2 กฎแตคาความเชอมนใหมใหคาทแตกตางกนระหวาง 2 กฎ) สวนคาประเมนความนาสนใจของกฎความสมพนธอนๆใหคาทขดแยงกบคาสหพนธ (กลาวคอเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธนนมความสมพนธเชงลบตอกนแตกลบใหคาประเมนความนาสนใจของกฎความสมพนธทสงออกมา)
จากงานวจยในอดตทท าการเสนอคาประเมนความนาสนใจของกฎความสมพนธตางๆทกลาวไปขางตน แตละคานนกแสดงคณสมบตเฉพาะตวทแตกตางกน ผลลพธของกฎความสมพนธทไดออกมากแตกตางกนออกไป ผวจยจงสนใจทจะท าการเปรยบเทยบความสามารถของแตละคาประเมนความนาสนใจของกฎความสมพนธ ผ วจยจงทบทวนและรวบรวมงานวจยทเสนอคณสมบตตางๆทคาประเมนความนาสนใจของกฎความสมพนธควรจะม และท าการเปรยบเทยบความสามารถของคาประเมนความนาสนใจของกฎความสมพนธเหลานนดวยคณสมบตทควรจะมทงหมด คณสมบตของคาประเมนความนาสนใจของกฎความสมพนธทงหมด 16 คณสมบตอธบายอยางละเอยดไวในบทท 2 หวขอ 2.5 และสามารถสรปไดดงน
8
- คณสมบต 3 ขอของ Piatetsky-Shapiro และคณะ (Piatetsky-Shapiro, 1991) - คณสมบต 1 ขอของ Major และ Mangano (Major and Mangano, 1995)
เพมเตมจากของ Piatetsky-Shapiro และคณะ - คณสมบต 5 ขอของ Tan และคณะ (Tan et al, 2002) - คณสมบต 5 ขอของ Lenca และคณะ (Lenca et al, 2004) - คณสมบต 2 ขอของ Geng และ Hamilton (Geng and Hamilton, 2006)
คณสมบตทคาประเมนความนาสนใจของกฎความสมพนธควรจะมทงหมด 16 ขอขางตน คณสมบตทไดรบการยอมรบและถกอางองถงโดยงานวจยตางๆ (Freitas, 1999; Major and Mangano, 1995; Mcgarry, 2005; Geng and Hamilton, 2006; Liu et al., 2008; Heravi, 2009) มากทสดคอคณสมบต P1 P2 และ P3 ของ Piatetsky-Shapiro และคณะ (Piatetsky-Shapiro, 1991) และคณสมบต P4 ของ Major และ Mangano (Major and Mangano, 1995)
เนองจากงานวจยของ Liu และคณะในป 2008 (Liu et al., 2008) ไดท าการพสจนคณสมบตของคาความเชอมนใหมไวทงหมดเพยง 5 คณสมบตคอ คณสมบต P1 P2 P3 O1 และ O2 เทานน ดงนนผวจยจงพสจนคณสมบต P4 O3 O4 O5 Q1 Q2 Q3 S1 และ S2 ของคาความเชอมนใหมอยางละเอยดและแสดงไวในบทท 2 หวขอ 2.5 ผลของการพสจนคณสมบตของคาความเชอมนใหมแสดงไวในตารางท 2-4 ขางตน
การเปรยบเทยบในตารางท 2-4 แสดงใหเหนวาคาความเชอมนใหมมคณสมบตทคาประเมนความนาสนใจของกฎความสมพนธควรจะม 10 คณสมบตจากทงหมด 14 คณสมบตซงมากกวาคาประเมนความนาสนใจของกฎความสมพนธอนๆ โดยเฉพาะอยางยงการมคณสมบต O3 ของคาความเชอมนใหมจะท าใหการน าคาความเชอมนใหมไปใชนนจะสามารถขจดการเกดกฎความสมพนธทมเซตรายการทมากอนและเซตรายการทตามทมความสมพนธเชงลบออกไปได ผวจยจงเชอวาถาน าคาความเชอมนใหมนไปประยกตใชกบการคนหากฎความสมพนธกบขอมลประเภทตางๆรวมถงขอมลซอฟตแวรอารไควฟ แลวนาจะท าใหกฎความสมพนธทไดมาเปนกฎความสมพนธทนาสนใจและชวยลดการเกดกฎความสมพนธทเปนผลบวกลวง (False Positive) ได
9
1.2.3 ความส าคญและปญหาของการประยกตใชเทคนคการคนหากฎความ สมพนธกบขอมลซอฟตแวรอารไคฟว
ในชวงตนของการคดคนและพฒนาแนวคดการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธนน การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธถกพฒนามาเพอการคนหารปแบบความสมพนธของพฤตกรรมการซอสนคาของลกคาจากฐานขอมลรายการซอสนคาขนาดใหญ ตอจากนนมาไมนานเรมมนกวจยหลายคณะน าการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธมาประยกตใชกบขอมลประเภทตางๆมากมาย หนงในนนคอ ขอมลซอฟตแวรอารไคฟว (Software Archive) ทไดจากระบบคอนเคอเรนทเวอรชนในขนตอนการพฒนาซอฟตแวร (Development Phase) ในวงจรชวตการพฒนาซอฟตแวร (Software Development Life Cycle) คณะนกวจยเหลานนน าขอมลซอฟตแวรอารไคฟวมาวเคราะหในรปแบบตางๆกนแบงตามการน าไปใช ดงตอไปน
1) การวเคราะหเพอความเขาใจพฒนาการของการพฒนาซอฟตแวร (Ball et al., 1997) 2) การวเคราะหเพอดกจบพฒนาการของการเชอมโยงกน (Gall et al.,1998; Bieman et
al., 2003; Zimmermann et al., 2004) 3) การวเคราะหเพอเปดเผยรปแบบการเรยกใชงานซอฟตแวรไลบราร (Michail, 1999;
Michail, 2000; Li et al., 2005; Livshits et al., 2005; Williams et al., 2005) 4) การวเคราะหเพอสรางค าแนะน าในการเปลยนแปลงแกไข (Zimmermann et al.,
2005; Methanias et al., 2009)
รายละเอยดของแตละงานวจยแสดงในหวขอ 2.7 จากงานวจยทน าขอมลซอฟตแวร อารไคฟวมาวเคราะหทงหมด มคณะวจยของ Li และคณะวจยของ Livshits (Li et al., 2005; Livshits et al., 2005) ไดแสดงใหเหนวาการประยกตเทคนคการท าเหมองขอมลดวยกฎความสมพนธกบขอมลซอฟตแวรอารไคฟวเปนเทคนคทคอนขางมประสทธภาพแตในบางกรณกสามารถท าใหเกดผลลพธของการคนหาทเปนผลบวกลวง (False Positive) เปนจ านวนมากได
ในปค.ศ. 2005 Zimmermann และคณะ (Zimmermann et al., 2005) ไดเสนอการประยกตใชการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวร อารไคฟวอกรปแบบหนง คอการสรางค าแนะน าในการเปลยนแปลงแกไขใหกบนกพฒนาในระหวางขนตอนการพฒนาซอฟตแวร ในงานวจยน Zimmermann และคณะเสนอวาระบบสราง
10
ค าแนะน านกพฒนานนควรจะสามารถใหค าแนะน าแกนกพฒนาทงหมด 3 สถานการณคอ 1) สถานการณการน าทาง (Navigation) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหนงแลว ระบบจะใหค าแนะน ากบนกพฒนาใหแกไขเอนทตใดตอไป 2) สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหลายๆเอนทตตอเนองกนแตยงขาดการเปลยนแปลงแกไขเอนทตอกหนงเอนทตจงจะสมบรณ ระบบจะใหค าแนะน ากบนกพฒนาใหแกไขเอนทตทเหลอนน และ 3) สถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหลายๆเอนทตตอเนองกนจนสมบรณแลว ระบบจะไมควรใหค าแนะน าทเปนผลบวกลวง (False Positive) ออกมาแกนกพฒนา งานวจยของ Zimmermann และคณะ (Zimmermann et al., 2005) ไดท าการทดสอบประสทธภาพของการใหค าแนะน าในรปแบบตางๆหลายรปแบบกบขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรแบบโอเพนซอรส (Open Source) และขอสรปของการทดสอบไดแนะน าสงทเปนประโยชนตอการตอยอดการประยกตใชการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวไดเปนอยางด เชน การใหค าแนะน าในระดบเอนทตละเอยด (ตวแปร เมธอดหรอฟงกชน) ใหประสทธภาพไมตางกบการใหค าแนะน าในแฟมขอมลหรอคลาส การใหค าแนะน านกพฒนามประสทธภาพมากส าหรบการเปลยนแปลงแกไขในชวงการบ ารงรกษา (Maintenance Phase) (เนนทการแกไข (alter) มากกวาการเพม (add to) กบการลบ (delete from)) เปนตน นอกจากนนผ วจยสงเกตเหนวาผลการทดสอบประสทธภาพในงานวจยของ Zimmermann และคณะ (Zimmermann et al., 2005) ยงใหประสทธภาพไมสงเทาทควร
จากความส าคญและปญหาทกลาวไปทงหมดในหวขอ 1.2.1 ถง 1.2.3 ขางตนผวจยเหนวาการเพมประสทธภาพใหกบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรของ ไอดอนนควรเพมประสทธภาพโดยการปรบปรงขนตอนวธในการคนหากฎความสมพนธใหดขนและลดจ านวนของการเกดผลบวกลวงลง ผ วจยจงคาดวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) นนนาจะมประสทธภาพทดกวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความ
11
เชอมนเดมจากการแสดงคณสมบตทคาประเมนความนาสนใจควรจะมมากทสดและโดยเฉพาะอยางยงการแสดงคณสมบต O3
โดยทวไปแลวระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรของไอดอจะท าหนาทหลก 2 ประการคอ 1) การชน านกพฒนาวาควรเปลยนแปลงแกไขสวนใดตอเมอมการเปลยนแปลงแกไขสวนนแลว และ 2) การแจงเตอนนกพฒนากอนการบนทกวายงท าการแกไขเปลยนแปลงไมสมบรณเพอปองกนการเกดขอผดพลาด (error) นอกจากหนาท 2 ประการนแลวสงทส าคญอกประการหนงคอระบบใหค าแนะน าตองไมมการใหค าแนะน าใดๆออกมาถาการเปลยนแปลงแกไขทงหมดสมบรณดแลวดวย (Zimmermann et al., 2005) ดงนนในการทดสอบประสทธภาพของระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรของไอดอควรทดสอบสถานการณของการใหค าแนะน านกพฒนาตางๆกน 3 สถานการณไดแก 1) สถานการณการน าทาง (Navigation) 2) สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) 3) สถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure)
ดงนนผ วจยจงตองการศกษาเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมน (Support-Confidence Model) ดงเดมกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) ในสถานการณของการใหค าแนะน านกพฒนาตางๆกน 3 สถานการณ
1.3 วตถประสงคของงานวจย
1. เปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมน (Support-Confidence Model) ดงเดมกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) โดยทประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบ
12
ขอมลซอฟตแวรอารไคฟวนนสามารถแบงออกไดเปนประสทธภาพใน 3 สถานการณของการพฒนาซอฟตแวรดงน
- สถานการณการน าทาง (Navigation) - สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) - สถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure)
1.4 ขนตอนโดยสรปของการท าวจย
1. ศกษารายละเอยดเกยวกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทมอยในปจจบน
2. ศกษารายละเอยดเกยวกบการประเมนระดบความนาสนใจของกฎความสมพนธ (Interestingness Measure of Association Rules) ในการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) และตวแบบตางๆทมอยในปจจบน
3. ออกแบบเครองมอทดสอบตางๆตามทไดศกษา 4. พฒนาเครองมอทดสอบตามทไดออกแบบไว 5. ทดสอบการท างานของเครองมอทพฒนา 6. ประเมนการท างานของเครองมอ 7. วเคราะหผลการทดลองและส ารวจขอมลเพมจากผลการทดลอง 8. จดท าเอกสารสรปงานวจย และขอเสนอแนะ
1.5 ตวแปรทศกษา
1. ตวแปรอสระ (Independent variables)
งานวจยนสนใจวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) สามารถเพมประสทธภาพของระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวร
13
ของไอดอ (IDE: Integrated Development Environment) ไดหรอไม ดงนนตวแปรตนของการศกษานกคอตวแบบของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธ ซงงานวจยนจะศกษาเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทงหมด 2 ตวแบบ ดงน
1) การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน -คาความเชอมน (Support-Confidence Model)
2) การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Support-New Confidence Model) (Liu et al., 2008)
โดยในงานวจยนจะเปรยบเทยบประสทธภาพของทง 2 ตวแบบขางตนในสถานการณทตางกน 3 สถานการณ คอ สถานการณการน าทาง (Navigation) สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) และสถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure) เชนเดยวกบงานวจยของ Zimmermann และคณะในป ค.ศ. 2005 (Zimmermann et al., 2005) และงานวจยของ Methanias และคณะในป ค.ศ. 2009 (Methanias et al., 2009)
2. ตวแปรตาม (Dependent variables)
ตวแปรตามของงานวจยน คอ ประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบตางๆ การเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวจะพจารณาจากค าแนะน าส าหรบนกพฒนาทถกสรางมาจากกฎความสมพนธทไดมานนมความถกตองแมนย าในการท านายและใหค าแนะน าในระหวางการพฒนาซอฟตแวรมากนอยเพยงใด โดยการวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในแตละสถานการณมวธการในการประเมนทแตกตางกนออกไปดงน
ในสถานการณ การน าทาง (Navigation) สามารถประเมนประสทธภาพจากคาเอฟเมสเชอร (F-measure) ทค านวณมาจากคาความถกตอง (Precision) และคาเรยกคน (Recall) (Methanias et al., 2009) รายละเอยดและวธการค านวณคาเอฟเมสเชอร คาความถกตองและคาเรยกคนส าหรบการท าเหมองขอมลดวย
14
เทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวนนไดกลาวเอาไวในบทท 2
ในสถานการณ การปองกนการเกดขอผดพลาด (Error Prevention) สามารถประเมนประสทธภาพจากคาเอฟเมสเชอร (F-measure) ทค านวณมาจากคาความถกตอง (Precision) และคาเรยกคน (Recall) (Methanias et al., 2009) รายละเอยดและวธการค านวณคาเอฟเมสเชอร คาความถกตองและคาเรยกคนส าหรบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวนนไดกลาวเอาไวในบทท 2
ในสถานการณ การเปลยนแปลงแกไขทสมบรณแลว (Closure) สามารถประเมนประสทธภาพจากคาผลสะทอนกลบ (Feedback) (Zimmermann et al., 2005; Methanias et al., 2009) รายละเอยดและวธการค านวณคาผลสะทอนกลบส าหรบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวนนไดกลาวเอาไวในบทท 2
3. ตวแปรควบคม
ตวแปรควบคมกบการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว มทงหมด 2 ตวแปร ไดแก
1) ขอสอบถาม ส าหรบงานวจยน คอ เซตทประกอบไปดวยเซตเหตการณการเปลยนแปลงแกไขและเซตผลลพธทคาดไว โดยจะมขอสอบถามทงหมด 3 แบบส าหรบ 3 สถานการณทแตกตางกนคอสถานการณการน าทาง สถานการณการปองกนขอผดพลาด และสถานการณการเปลยนแปลงแกไขทสมบรณแลว (Zimmermann et al., 2005; Methanias et al., 2009)
2) เครองมอทใชในงานวจย ประกอบดวยเครองมอทงหมด 5 เครองมอไดแก เครองมอจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว เครองมอสรางขอสอบถามส าหรบการทดสอบ 3 สถานการณ เครองมอการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบส าหรบ 3 สถานการณ เครองมอสรางเซตของค าแนะน าส าหรบเหตการณ และเครองมอประเมนผลการทดสอบ
15
1.6 ขอบเขตของการวจย
1. ขอมลซอฟตแวรอารไคฟวทน ามาใชในการศกษาเปนขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรทพฒนาดวยภาษาซพลสพลส (C++) เทานน
2. ขอมลซอฟตแวรอารไคฟวทน ามาใชในการศกษาเปนขอมลซอฟตแวรอารไคฟวทมาจากซอฟตแวรควบคมการแกไขปรบปรง (Revision Control) ทชอวาระบบคอนเคอเรนทเวอรชน (Concurrent Version System) เทานน
3. ค าแนะน าส าหรบนกพฒนาในระหวางการพฒนาซอฟตแวรในงานวจยน หมายถง ค าแนะน าทไดมาจากการคนหารปแบบของการเปลยนแปลงแกไขในการพฒนาซอฟตแวรทเกดขนบอยในอดตเทานน ไมรวมถงรปแบบของการเปลยนแปลงแกไขทเกดขนไมบอยแตมความส าคญมาก
4. ค าแนะน าส าหรบนกพฒนาในระหวางการพฒนาซอฟตแวรในงานวจยน สนใจเพยงการเปลยนแปลงแกไขทควรจะอยในทรานแซคชนเดยวกนเทานน ไมสนใจล าดบของการเปลยนแปลงแกไข
5. ทรานแซคชนของการเปลยนแปลงแกไขทน ามาทดสอบในงานวจยน ไมรวม ทรานแซคชนทถกระบวาเปนสงแปลกปลอม 2 ประเภทคอ ทรานแซคชนขนาดใหญและทรานแซคชนการผสานกง
6. ทรานแซคชนของการเปลยนแปลงแกไขทน ามาทดสอบในงานวจยน คอ ทรานแซคชนของการเปลยนแปลงแกไขในระดบของแฟมขอมลและคลาสเทานน ไมไดพจารณาถงการเปลยนแปลงแกไขในระดบเอนทตทละเอยดเชน เมธอดหรอตวแปร
7. การทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว 3 สถานการณแยกจากกน แตใช ทรานแซคชนชดทดสอบชดเดยวกนทง 3 สถานการณ
8. การทดสอบของงานวจยนเลอกตวอยางขอมลซอฟตแวรอารไคฟวเพยงตวอยางเดยว เนองจากงานวจยนตองการวจยเพอหาขอมลเบองตน (Exploratory Research) เทานน
16
1.7 ประโยชนทคาดวาจะไดรบ
1. ผ ทตองการพฒนาระบบใหค าแนะน าส าหรบนกพฒนาระหวางการพฒนาซอฟตแวรบนไอดอ สามารถน างานวจยนไปเปนแนวทางในการประยกตใชเขากบไอดอได
2. ผ ทตองการพฒนาระบบตดตามพฒนาการการเกดความเชอมโยงกน (Evolution Coupling) สามารถน างานวจยนไปเปนแนวทางในการประยกตใชได
3. ผ ทตองการพฒนาระบบคนหารปแบบการเรยกใชงานไลบราร (Software Library Call Pattern) สามารถน างานวจยนไปเปนแนวทางในการประยกตใชได
4. ผลการทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในงานวจยน ท าใหทราบตวแบบทเหมาะส าห รบการ คนหากฎความสมพน ธ ใน สถานการณการน าทาง (Navigation) สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) และสถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure) ในการพฒนาซอฟตแวรได
5. ผลการทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในงานวจยนเปนประโยชนส าหรบนกวจยทตองการตอยอดศกษาการประยกตใชกฎความสมพนธกบระบบใหค าแนะน าส าหรบนกพฒนาระหวางการพฒนาซอฟตแวรตอไป
1.8 นยามศพท
1. ซอฟตแวรอารไคฟว (Software Archives) คอ แฟมขอมลซอรสโคด (Source Code Files) ทกเวอรชน และแฟมขอมลบนทกทไดจากระบบควบคมการพฒนาเวอรชน (CVS Log File)
2. ซอรสโคด (Source Code) คอ รหสคอมพวเตอรซงไดรบการเปลยนเปนภาษาทางเครองคอมพวเตอรกอนท างานบนเครองคอมพวเตอร
17
3. เอนทต (Entity) คอ เอกลกษณหรอสงทผ วจยสนใจศกษา ในทนค าวา เอนทต สามารถหมายถง แฟมขอมลเอกสาร (File) คลาส (Class) เมธอดหรอฟงกชน (Method or Function) และตวแปร (Variable)
4. การเปลยนแปลงแกไข (Changes) คอ การทมนกพฒนาแกไขเอนทตใดๆ ค าวา การเปลยนแปลงแกไขในทนสามารถแสดงได 3 มต คอ 1) การแกไขเอนทต (alter) 2) การเพมลงในเอนทต (add to) และ 3) การลบออกจากเอนทต (delete from)
5. ทรานแซคชน (Transaction) ส าหรบงานวจยน คอ เซตของการเปลยนแปลงแกไขทเกดขนพรอมกนหรอในเวลาใกลเคยงกนและถกบนทกเขาสระบบคอนเคอเรนทเวอรชนโดยนกพฒนาคนเดยวกน
6. เหตการณ (Situation) คอเซตของการเปลยนแปลงแกไขใดๆ ทเกดขนจากนกพฒนา
7. กฎความสมพนธ (Association Rules) สามารถนยามไดดงน ก าหนดให เซต I = {i1, i2, ... ,im} เปนเซตของรายการขอมล (items) ทมอยทงหมดและให เซต T = {t1, t2, ... ,tn} เปนเซตของทรานแซคชน โดยทแตละทรานแซคชน tn ประกอบดวยเซตยอย Ij (j = 1, 2, .. m) ทเปนเซตยอยของเซตของรายการขอมล I เซตของรายการขอมล Ij นนถกเรยกวา เซตรายการ (Itemset) ดงนนกฎความสมพนธ r กคอคของเซตรายการ I1 และเซตรายการ I2 โดยทเซตรายการ I1 และเซตรายการ I2 เปนเซตยอยของเซต I ทไมมสมาชกทซอนทบกนและเซตรายการ I2 ไมเทากบเซตวาง เซตรายการ I1 ถกเรยกวา เซตรายการทมากอน (Antecedent Itemset) และเซตรายการ I2 ถกเรยกวา เซตรายการทตามมา (Consequent Itemset) และก าหนดสญลกษณ I1 I2 แทนกฎความสมพนธ R ทมเซตรายการ I1 เปนเซตรายการทมากอน และเซตรายการ I2 เปนเซตรายการทตามมา โดยท I2 ไมใชเซตวาง (Olivier et al., 2008) ส าหรบงานวจยน กฎความสมพนธ คอ กฎความสมพนธทตอบขอถามทวา ถานกพฒนาเปลยนแปลงแกไข (เปลยนแปลง เพมลง หรอ ลบออก) เอนทตใดเอนทตหนงแลวนกพฒนาคนนนควรจะตองเปลยนแปลงแกไข (เปลยนแปลง เพมลง หรอ ลบออก) เอนทตใดดวยตอไป (Zimmermann et al., 2005; Methanias et al., 2009)
18
8. ค าแนะน าส าหรบเหตการณ Q (Suggestions for Situation Q) คอ เซตของการเปลยนแปลงแกไขทนกพฒนาควรจะท าตามหลงจากทนกพฒนาไดเปลยนแปลงแกไขตามเหตการณ Q โดยอางองมาจากเซตของกฎความสมพนธทมเซตรายการทมากอนเปนเซตเหตการณ Q (Zimmermann et al., 2005)
9. สถานการณการน าทาง (Navigation) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหนงแลว ระบบจะตองใหค าแนะน ากบนกพฒนาใหแกไขเอนทตใดตอไป (Zimmermann et al., 2005; Methanias et al., 2009)
10. สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหลายๆเอนทตตอเนองกนแตยงขาดการเปลยนแปลงแกไขเอนทตอกหนงเอนทตจงจะสมบรณ ระบบจะตองใหค าแนะน ากบนกพฒนาใหแกไขเอนทตทเหลอนนได (Zimmermann et al., 2005; Methanias et al., 2009)
11. สถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหลายๆเอนทตตอเนองกนอยางครบถวนแลว ระบบจะตองไมใหค าแนะน าแกไขเอนทตใดๆกบนกพฒนา (Zimmermann et al., 2005; Methanias et al., 2009)
12. ไอดอ (IDE: Integrated Development Environment) คอ โปรแกรมประยกตทจดเตรยมสงแวดลอมซงอ านวยความสะดวกใหแกนกพฒนาซอฟตแวร โดยปกตแลวประกอบดวย เครองมอพฒนาซอรสโคด (Source Code Editor) ตวแปลภาษาคอมพวเตอร (Compiler) หรอ ตวแปลค าสงคอมพวเตอร ( interpreter) หรอทงสอง เครองมอสรางระบบอตโนมต (Build Automation Tools) และเครองมอตรวจแกขอผดพลาด (Debugger) เปนพนฐาน
19
บทท 2 ทบทวนวรรณกรรมทเกยวของ……..
2.1 บทน า
วรรณกรรมทเกยวของกบงานวจยนถกเรยบเรยงไวตามล าดบ เรมตนจากแนวคดของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธ (Association Rules Discovery) รวมถงคาทใชในการประเมนความนาสนใจของกฎความสมพนธ ( Interestingness Measure of Association Rules) ทมงานวจยในอดตเคยเสนอไวทงหมด 8 คา ตอมาจะอธบายถงตวแบบการประเมนความนาสนใจของกฎความสมพนธใหม โดยเรมจากการอธบายถงขอบกพรองของตวแบบคาสนบสนน-คาความเชอมนดงเดม ตามดวยการอธบายตวแบบการประเมนความนาสนใจของกฎความสมพนธแบบใหม และตอดวยการอธบายคณสมบตทคาประเมนความนาสนใจควรจะมทงหมด 16 คณสมบต รวมถงสรปคณสมบตทคาประเมนความนาสนใจทง 8 คาและคาความเชอมนใหมม หวขอถดมาเปนการอธบายแนวคดของการควบคมการเปลยนแปลงแกไข (Concept of Revision Control, Version Control) ซอฟตแวรควบคมการเปลยนแปลงแกไข (Revision Control Software, Version Control Software) รวมถงระบบคอนเคอเรนทเวอรชน (Concurrent Versions System, CVS) ซงเปนระบบทผวจยสนใจน าขอมลมาท าการทดสอบ หวขอถดมาเปนการรวบรวมวรรณกรรมทเกยวของกบการประยกตใชการท าเหมองขอมลดวยเทคนคคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว (Applying Association Rule Discovery in Software Archive) ตงแตอดตจนถงปจจบน รวมถงอธบายถงขนตอนวธการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว (Data Mining in Software Archives) ของงานวจยตางๆในอดตอยางละเอยด ตงแตการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Preparing Data for Mining in Software Archives) จนถงขนตอนการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Data Mining in Software Archives) และขนตอนการสรางค าแนะน าจากกฎความสมพนธ (Generating Suggestions for Situation) สดทายจะกลาวถงการวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว
20
2.2 การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธ (Association Rules Discovery)
การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธ (Association Rules discovery) คอการคนหาความสมพนธทมความเกยวของและเชอมโยงกนระหวางรายการขอมล (Data Items) ภายในฐานขอมลขนาดใหญทมอยเพอน าไปใชในการวเคราะหหรอท านายปรากฏการณตางๆ (Agrawal et al., 1993) ตวอยางในการน ากฎความสมพนธไปประยกตใชในทางปฏบตทไดรบความนยมมากทสดคอ การวเคราะหพฤตกรรมการซอของลกคา (Market Basket Analysis)
นยามทางคณตศาสตรของการคนหากฎความสมพนธนนสามารถอธบายไดดงน ก าหนดให เซต I = {i1, i2, ... ,im} เปนเซตของรายการขอมล (items) ทมอยทงหมดและให เซต T = {t1, t2, ... ,tn} เปนเซตของทรานแซคชน โดยทแตละทรานแซคชน tn ประกอบดวยเซตยอย Ij (j = 1, 2, .. m) ทเปนเซตยอยของเซตของรายการขอมล I เซตของรายการขอมล Ij นนถกเรยกวา เซตรายการ (Itemset) ดงนนกฎความสมพนธ r กคอคของเซตรายการ I1 และเซตรายการ I2 โดยทเซตรายการ I1 และเซตรายการ I2 เปนเซตยอยของเซต I ทไมมสมาชกทซอนทบกนและเซตรายการ I2 ไมเทากบเซตวาง เซตรายการ I1 ถกเรยกวา เซตรายการทมากอน (Antecedent Itemset) และเซตรายการ I2 ถกเรยกวา เซตรายการทตามมา (Consequent Itemset) และก าหนดสญลกษณ I1 I2 แทนกฎความสมพนธทมเซตรายการ I1 เปนเซตรายการทมากอน และเซตรายการ I2 เปนเซตรายการทตามมา โดยท I2 ไมใชเซตวาง (Olivier et al., 2008)
วธการทดวธหนงทจะระบวากฎความสมพนธนนๆมความตรงประเดนมากนอยเพยงใด คอการก าหนดคาทใชในการประเมนคณภาพของกฎความสมพนธหรอทเรยกวาคาประเมนความนาสนใจของกฎความสมพนธ ตวแบบของการประเมนความนาสนใจของกฎความสมพนธทเปนตวแบบแรกและดงเดมคอตวแบบคาสนบสนน-คาความเชอมน (Support-Confidence Model) ซงใชคา 2 คาในการประเมน คาแรกถกเรยกวาคาสนบสนน (Support) ของกฎความสมพนธ ใชสญลกษณ Support(I1 I2) คาสนบสนนนสามารถค านวณไดจากจ านวนของทรานแซคชนทมทงสวนเซตรายการทมากอน (I1) และเซตรายการทตามมา (I2) ของกฎความสมพนธหารดวยจ านวนของทรานแซคชนทงหมด ซงคาสนบสนนนกคอคาความนาจะเปนทจะมทรานแซคชนทมทงรายการในเซตรายการทมากอนและเซตรายการทตามมาในทรานแซคชนทงหมดนนเอง ในบางครงคาสนบสนนของกฎความสมพนธนนอาจถกน าไปใชในรปรอยละของจ านวนทรานแซคชน
21
ทงหมด คาสนบสนนถกใชในการประเมนความถ (Frequent) ในการปรากฏของรายการ (Item) หรอเซตรายการ หรอกฎความสมพนธ นอกจากการพจารณาคาสนบสนนของกฎความสมพนธกคอการพจารณาคาความเชอมน (Confidence) ของกฎความสมพนธ ใชสญลกษณ Conf(I1 I2)) คาความเชอมนนกคออตราสวนของคาสนบสนนของกฎความสมพนธกบคาสนบสนนของเซตรายการทมากอน หรออาจเรยกไดวาคาความเชอมน กคอคาความนาจะเปนทจะมรายการทกรายการในเซตรายการทมากอนแลวจะมรายการทกรายการในเซตรายการทตามมาดวย คาความเชอมนนนถกน าไปใชในการประเมนระดบความนาสนใจของกฎความสมพนธ
นอกจากตวแบบคาสนบสนน-คาความเชอมน (Support-Confidence Model) แลวการประเมนระดบความนาสนใจของกฎความสมพนธยงสามารถใชวธการอนๆได ซงถกรวบรวมเอาไวและอธบายอยางละเอยดในหวขอถดไป
2.3 การประเมนความนาสนใจของกฎความสมพนธ (Interestingness Measure of Association Rules)
หวขอนไดรวบรวมวรรณกรรมตางๆทเกยวของกบการเสนอตวแบบทน ามาใชในการประเมนความนาสนใจของกฎความสมพนธตงแตในอดตจนถงในปจจบนอนไดแก คาสนบสนน (Support), คาความเชอมน (Confidence), คาคอนวคชน (Conviction), คาลฟท (Lift), คา เลฟเวอเรจ (Leverage), คาคฟเวอเรจ (Coverage), คาสหสมพนธ (Correlation) และ คาอตราสวนออดส (Odds Ratio) ตามล าดบ รวมถงวรรณกรรมทมการสนบสนนตวแบบขางตนและวรรณกรรมทพสจนขอบกพรองของตวแบบบางตวดวย เพอใหงายตอการเปรยบเทยบกนของทกตวแบบทนยามขนมาจากคาทางสถตจงก าหนดนยามคาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมลดงน
ก าหนดให P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมล n(X) คอ จ านวนของทรานแซคชนทมรายการ X ปรากฏอย
N คอ จ านวนของทรานแซคชนทงหมดในฐานขอมล
P(X) =
22
2.3.1 คาสนบสนน (Support)
คาสนบสนนถกน าเสนอขนมาครงแรกโดย Agrawal และคณะในปค.ศ. 1993 (Agrawal et al., 1993) คาสนบสนนคอคาความนาจะเปนของรายการนนนนเอง โดยปกตคาสนบสนนนนเปนคาทถกใชในการแสดงความถในการปรากฎของแตละรายการ แตคาสนบสนนนกสามารถน ามาใชในการประเมนความนาสนใจของกฎความสมพนธได สมการในการค านวณคาสนบสนนของรายการ X แสดงไดดงน
ก าหนดให Support(X) คอ คาสนบสนนของรายการ X P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ใน
ฐานขอมล
Support(X) = P(X)
การหาคาสนบสนนของรายการหรอบางทกถกเรยกวาคาความถของรายการ เซตรายการทมคาสนบสนนมากกวาคาสนบสนนขนต าทก าหนดไวจะเรยกเซตรายการนนวาเซตรายการความถสง (Frequent Itemset) หรอเซตรายการใหญ (large Itemset) หรอกลาวคอคาสนบสนนน จะถกน ามาใชเพอเปนการคดกรองรายการทงหมดในฐานขอมลใหเหลอแตเพยงรายการทมความถสงตามทก าหนดไวเพอน าเซตรายการเหลานนไปคนหากฎความสมพนธในภายหลง
ในกรณทจะใชคาสนบสนนมาประเมนระดบความนาสนใจ กคอคาความถของกฎความสมพนธนนนนเอง สมการในการค านวณคาสนบสนนของกฎความสมพนธ แสดงไดดงน
ก าหนดให Support(R) คอ คาสนบสนนของกฎความสมพนธ R P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ใน
ฐานขอมล P(Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ Y ใน
ฐานขอมล P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ Y ใน
ฐานขอมล
23
Support(X Y) = P(X and Y)
ขอเสยของการใชคาสนบสนนกคอการกอใหเกดปญหาขาดแคลนรายการ (rare item problem) เนองจากบางรายการนนเปนรายการทปรากฏอยในฐานขอมลจ านวนนอยจงถกคดออกไป แตในความจรงนนรายการทปรากฏอยในฐานขอมลจ านวนนอยอาจสามารถน าไปสรางเปนกฎความสมพนธทนาสนใจหรอมคณคาได คาทเปนไปไดของคาสนบสนนนนอยในพสย [0, 1] ถาเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธเปนอสระตอกนแลวคาสนบสนนจะเทากบ 0 ถาเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธมการปรากฏขนพรอมกนเสมอคาสนบสนนจะเทากบ 1 (Agrawal et al., 1993; Sheikh et al., 2004)
2.3.2 คาความเชอมน (Confidence)
คาความเชอมนถกน าเสนอขนมาครงแรกโดย Agrawal และคณะในปค.ศ. 1993 (Agrawal et al., 1993) เชนเดยวกบคาสนบสนนนยามของคาความเชอมนคอความนาจะเปนทจะพบกฎความสมพนธ X Y ในทรานแซคชนทมรายการ X ปรากฏอย ดงนนการค านวณคาความเชอมนของกฎความสมพนธ X Y และกฎความสมพนธ Y X นนจะใหคาทแตกตางกน สมการในการค านวณคาความเชอมนแสดงไดดงน
ก าหนดให Conf(R) คอ คาความเชอมนของกฎความสมพนธ R P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมล
P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ Y ในฐานขอมล
P(Y|X) คอ คาความนาจะเปนในการพบรายการ Y ในทรานแซคชนทมรายการ X อยแลว
Conf(X Y) =
หรอ Conf(X Y) = P(Y|X)
เนองจากคาความเชอมนและคาสนบสนนนนถกพฒนาขนมาพรอมกนโดย Agrawal และคณะ คาสนบสนนจะถกน ามาใชเพอเปนการคดกรองรายการทงหมดในฐานขอมลใหเหลอแตเพยงรายการทมความถสงตามทก าหนดไว ตอจากนนคาความเชอมนจะถกน ามาใชในการสรางกฎ
24
ความสมพนธขนมาจากผลลพธเซตรายการทมความถสงทไดมาจากการหาคาสนบสนนโดยการค านวณหาคาความเชอมนของทกกฎความสมพนธทเปนไปไดจากเซตรายการทมความถสงทงหมด คาความเชอมนของกฎความสมพนธใดทมากกวาคาความเชอมนขนต า (Minimum Confidence) ทก าหนดไวจะถอวากฎความสมพนธนนมอยจรงและมความนาสนใจ
ปญหาทเกดขนจากการใชคาความเชอมนคอคาความเชอมนนนคอนขางจะออนไหวงายตอความถของเซตรายการทตามมา กลาวคอถากฎความสมพนธนนมเซตรายการทตามมาทมความถสงมาก (ในขณะทเซตรายการทมากอนมความถทนอยกวามาก) จะท าใหคาความเชอมนของกฎความสมพนธมคาสงสงผลใหกฎความสมพนธนนถกพจารณาวามความนาสนใจ ซงในความจรงเซตรายการทมากอนและเซตรายการทตามมาอาจมความสมพนธกนนอยมากกได (Sheikh et al., 2004) คาทเปนไปไดของคาความเชอมนนนอยในพสย [0, 1] ถาเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธเปนอสระตอกนแลวคาความเชอมนจะเทากบ 0 ถาเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธมการปรากฏขนพรอมกนเสมอคาความเชอมนจะเทากบ 1 (Agrawal et al., 1993; Sheikh et al., 2004)
2.3.3 คาคอนวคชน (Conviction)
คาคอนวคชนถกเสนอขนมาครงแรกโดย Brin และคณะในปค.ศ. 1997 (Brin et al., 1997) คาคอนวคชนถกพฒนาขนมาเพอแกไขขอดอยของคาความเชอมนทไมสามารถจะบงบอกทศของกฎความสมพนธไดภายในการค านวณครงเดยว กลาวคอการใชคาความเชอมนจะตองมการค านวณทงคาความเชอมนของกฎความสมพนธทงไปและกลบเพอเลอกกฎความสมพนธทมคาคาความเชอมนสงกวากน คาคอนวคชนของกฎความสมพนธ X Y นนจะเปรยบเทยบความนาจะเปนในการมรายการ X ปรากฏโดยทไมมรายการ Y ปรากฏ สมการในการค านวณคาคอนวคชนแสดงไดดงน
ก าหนดให Conviction(R) คอ คาคอนวคชนของกฎความสมพนธ R P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ใน
ฐานขอมล P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทไมมรายการ X ใน
ฐานขอมล P(X and ) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X แตไมม
25
รายการ Y ในฐานขอมล
Conviction(X Y) =
โดยท P( ) คอความนาจะเปนทไมมรายการ Y ปรากฏในทรานแซคชน คาทเปนไปไดของ
คาคอนวคชนนนอยในพสย [0, + ] ถาเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธเปนอสระตอกนแลวคาคอนวคชนจะเทากบ 1 แตถาเซตรายการทมากอนและเซต
รายการทตามมาของกฎความสมพนธมการปรากฏขนพรอมกนเสมอคาคอนวคชนจะเทากบ + (Brin et al., 1997; Sheikh et al., 2004)
2.3.4 คาลฟท (Lift)
คาลฟทถกเสนอขนมาครงแรกโดย Brin และคณะในปค.ศ. 1997 (Brin et al., 1997) คาลฟทนนเปนคาทใชในการประเมนความถในการปรากฏรวมกนของเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธโดยทเซตรายการทมากอนและเซตรายการทตามมานนเปนอสระตอกนทางสถต ขอดประการหนงของการค านวณคาลฟทคอการใชคาลฟทจะไมพบกบปญหาขาดแคลนรายการ สมการในการค านวณคาลฟทแสดงไดดงน
ก าหนดให Lift(R) คอ คาลฟทของกฎความสมพนธ R
P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมล
P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และรายการ Y ในฐานขอมล
P(Y|X) คอ คาความนาจะเปนในการพบรายการ Y ในทรานแซคชนทมรายการ X อยแลว
Conf(R) คอ คาความเชอมนของกฎความสมพนธ R
Lift(X Y) =
หรอ Lift(X Y) =
26
หรอ Lift(X Y) =
คาทเปนไปไดของคาลฟทนนอยในพสย [0, + ] ถาเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธเปนอสระตอกนแลวคาลฟทจะเทากบ 1 ถาคาลฟทมคามากกวา 1 หมายถงเซตรายการทมากอนและเซตรายการทตามมามความสมพนธเชงบวกตอกน ถาคาลฟทมคานอยกวา 1 หมายถงเซตรายการทมากอนและเซตรายการทตามมามความสมพนธเชงลบตอกน (Brin et al., 1997; Sheikh et al., 2004)
2.3.5 คาเลฟเวอเรจ (Leverage)
คาเลฟเวอเรจถกเสนอขนมาครงแรกโดย Piatetsky-Shapiro และคณะในป 1991 (Piatetsky-Shapiro et al., 1991) คาเลฟเวอเรจถกพฒนาขนมาเพอประเมนความตางของคาความนาจะเปนของการปรากฏเซตรายการทมากอนและเซตรายการทตามมาขนพรอมกนโดยทเซตรายการทงสองนนมการขนตอกนทางสถตกบคาความนาจะเปนของการปรากฏเซตรายการทมากอนและเซตรายการทตามมาทปรากฏอยางเปนอสระตอกนในฐานขอมล สมการในการค านวณคาเลฟเวอเรจแสดงไดดงน
ก าหนดให Leverage(R) คอ คาเลฟเวอเรจของกฎความสมพนธ R P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ใน
ฐานขอมล P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ
รายการ Y ในฐานขอมล
Leverage(X Y) = P(X and Y) - P(X)P(Y)
เหตผลส าคญทมการพฒนาคาเลฟเวอเรจขนมานนมาจากความตองการตงวธการขายสนคา โดยท าการคนหาวาการขายสนคาทงสองเซตรายการรวมกนกบการขายทเปนอสระตอกนแบบไหนมคามากกวากน ขอดอยส าคญของคาเลฟเวอเรจกคอการใชคานอาจท าใหประสบกบ
ปญหาขาดแคลนรายการได คาทเปนไปไดของคาเลฟเวอเรจนนอยในพสย [- , + ] (Piatetsky-Shapiro et al., 1991; Sheikh et al., 2004)
27
2.3.6 คาคฟเวอเรจ (Coverage)
คาคฟเวอเรจคอคาสนบสนนของเซตรายการทมากอน หรอ คาความนาจะเปนในการพบทรานแซคชนทมรายการทมากอนในฐานขอมลนนเอง แนวคดของคาคฟเวอเรจคอการใชความถของเซตรายการทมากอนของกฎความสมพนธมาใชเปนตวระบถงความนาสนใจของกฎความสมพนธนน สมการในการค านวณคาคฟเวอเรจแสดงไดดงน
ก าหนดให Coverage (R) คอ คาคฟเวอเรจของกฎความสมพนธ R P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ใน
ฐานขอมล
Coverage(X Y) = P(X)
คาทเปนไปไดของคาคฟเวอเรจนนอยในพสย [0, 1] (Michael., 2009)
2.3.7 คาสหสมพนธ (Correlation)
คาสหสมพนธหรอคาสหสมพนธนเปนเทคนคทางสถตทสามารถแสดงไดวาเซตรายการใดมความสมพนธกนอยางแขงแรง สมการในการค านวณคาสหสมพนธแสดงไดดงน
ก าหนดให Corr(R) คอ คาสหสมพนธของกฎความสมพนธ R P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ใน
ฐานขอมล P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ
รายการ Y ในฐานขอมล
Corr(X Y) =
√
คาสหสมพนธนสามารถน ามาใชประเมนลกษณะของความสมพนธระหวางเซตรายการทมากอนและเซตรายการทตามมาได คาทเปนไปไดของคาสหสมพนธนนอยในพสย [-1, 1] โดยทคาสหสมพนธทเปนคาลบ หมายถง เซตรายการทงสองแปรผกผนกน ถาคาสหสมพนธเทา -1 จะหมายถงเซตรายการทงสองแปรผกผนกนอยางสมบรณ คาสหสมพนธทเปนคาบวก หมายถง เซต
28
รายการทงสองแปรตามกน ถาคาสหสมพนธเทา 1 จะหมายถงเซตรายการทงสองแปรผกตามกนอยางสมบรณ และถาคาสหสมพนธเปน 0 หมายถงเซตรายการทงสองไมมความสมพนธตอกนเลย (Sheikh et al., 2004)
2.3.8 คาอตราสวนออดส (Odds Ratio)
คาอตราสวนออดส คอคาประเมนทางสถตทค านวณหาความสมพนธระหวางตวแปร 2 ตวทแตละตวเปนตวแปรจดกลมทแบงออกเปน 2 กลม แนวคดของออดสมาจากการเสยงโชค (gambling) ตวอยางเชน ออดสของมาทจะแขงชนะเปน 3 : 1 หมายถงความนาจะเปนทมาจะชนะ 3 คร งตอการไมชนะ 1 ครง เ มอน าคาทางสถตนมาประยกตใชกบการประเมนกฎความสมพนธจะไดวา คาอตราสวนออดส คออตราสวนระหวางออดสของเหตการณทมเซตรายการทมากอนและเซตรายการทตามมาปรากฏหรอไมปรากฏทงคกบออดสของเหตการณทมเซตรายการทมากอนปรากฏแตเซตรายการทตามมาไมปรากฏหรอเหตการณทไมมเซตรายการทมากอนปรากฏแตมเซตรายการทตามมาปรากฏ โดยคาอตราสวนออดส มสตรค านวณดงน สมการในการค านวณคาคอนวคชนแสดงไดดงน
ก าหนดให Odds(R) คอ คาอตราสวนออดสของกฎความสมพนธ R P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ใน
ฐานขอมล P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทไมมรายการ X ใน
ฐานขอมล P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ
รายการ Y ในฐานขอมล P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทไมมรายการ X และ
รายการ Y ในฐานขอมล P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และไม
รายการ Y ในฐานขอมล
Odds(X Y) =
29
คาทเปนไปไดของคาอตราสวนออดสนนอยในพสย [0, + ] ถาเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธเปนอสระตอกนแลวคาอตราสวนออดสจะเทากบ 0 กฎ
ความสมพนธทมความนาสนใจมากจะมคาอตราสวนออดสเทากบ + (Sheikh et al., 2004)
2.4 ตวแบบการประเมนความนาสนใจของกฎความสมพนธใหม
การคนหากฎความสมพนธนนจดเปนหนงในงานทส าคญและไดรบความนยมมากในการท าเหมองขอมล ตวแบบดงเดมทใชในประเมนในการคนหากฎความสมพนธนนกคอตวแบบคาสนบสนน-คาความเชอมน ทไดกลาวไปแลวในขางตน ตวแบบคาสนบสนน-คาความเชอมนนจะใชการประเมนคาความเชอมนเปนตวชวดระดบความนาสนใจของกฎความสมพนธ การประเมนความนาสนใจของกฎความสมพนธดวยวธแบบดงเดมนมขอบกพรองอยหลายประการซงจะอธบายขอบกพรองเหลานอยางละเอยดในหวขอ 2.4.1 ตอจากนนจะกลาวถงตวแบบการประเมนความนาสนใจของกฎความสมพนธทเสนอโดย Liu และคณะในป 2008 (Liu et al., 2008) ในงานวจยนผ วจยจะเรยกตวแบบใหมดงกลาวนวา ตวแบบคาสนบสนน -คาความเชอมนใหม (Support-New Confidence Model) ของ Liu และคณะ (Liu et al., 2008)
2.4.1 ขอบกพรองของตวแบบคาสนบสนน-คาความเชอมน
การท าเหมองขอมลของกฎความสมพนธโดยใชตวแบบคาสนบสนน-คาความเชอมน (Support-Confidence Model) นนคาทใชในการประเมนความนาสนใจของกฎความสมพนธ X Y กคอคาความเชอมนของกฎความสมพนธ (Conf(X Y)) แตในบางครงการท าเหมองขอมลของกฎความสมพนธโดยตวแบบนอาจจะท าใหไดรบกฎความสมพนธทไมมความเกยวของกนจรงและอาจน าไปสการก าหนดกฎความสมพนธทผดหรอเปนผลบวกลวง (False Positive) ได การน าตวแบบคาสนบสนน-คาความเชอมนไปใชงานจงมขอจ ากดดงแสดงในตวอยางตอไปน
ตวอยางท 1 ก าหนดใหตารางดานลางนเปนตารางแสดงทรานแซคชนอยางงาย แตละแถวแทนรายการตางๆในทรานแซคชน แตละหลกแทนทรานแซคชน 1 ทรานแซคชน จ านวนทรานแซคชนทงหมดทแสดงในตารางคอ 8 ทรานแซคชนคอทรานแซคชน T1-T8 มรายการทงหมด 3 รายการคอ รายการ X รายการ Y และรายการ Z หมายเลข 1 หมายถงมรายการของแถวนนปรากฏอยบนทรานแซคชนของหลกนน และหมายเลข 0 หมายถงไมมรายการของแถวนนปรากฏอยบนทรานแซคชนของหลกนน (Tan et al., 2002; Liu et al., 2008)
30
ตารางท 2-1 แสดงตวอยางทรานแซคชนทประกอบดวยรายการ X Y และ Z
T1 T2 T3 T4 T5 T6 T7 T8 X 1 1 1 1 0 0 0 0 Y 1 1 0 0 0 0 0 0 Z 0 1 1 1 1 1 1 1
พจารณาตารางขางตนจะเหนไดวารายการ X และรายการ Y นนมความสมพนธทแปรผนตรงกนหรอมสหสมพนธเชงบวกตอกน (Positively Correlated) เปนสวนใหญ กลาวคอถามรายการ X ปรากฏอยบนทรานแซคชนกจะมรายการ Y ปรากฏบนทรานแซคชนเปนสวนใหญและในทางกลบกนถาไมมรายการ X ปรากฏอยบนทรานแซคชนกจะไมมรายการ Y ปรากฏบนทรานแซคชนเปนสวนใหญเชนกน นอกจากนนยงสามารถสงเกตไดวารายการ X และรายการ Z นนมความสมพนธทแปรผกผนกนหรอมสหสมพนธเชงลบตอกน (Negatively Correlated) เปนสวนใหญ (รอยละ 62.5) ดวย กลาวคอถามรายการ X ปรากฏอยบนทรานแซคชนกจะไมมรายการ Z ปรากฏบนทรานแซคชนเปนสวนใหญและในทางกลบกนถาไมมรายการ X ปรากฏอยบนทรานแซคชนกจะมรายการ Z ปรากฏบนทรานแซคชนเปนสวนใหญเชนกน แตอยางไรกตามเมอไดค านวณหาคาสนบสนนและคาความเชอมนของกฎความสมพนธ X Y แลวไดคา 25% และ 50% ตามล าดบ และเมอค านวณหาคาสนบสนนและคาความเชอมนของกฎความสมพนธ X Z แลวไดคา 37.5% และ 75% ตามล าดบ จากคาสนบสนนและคาความเชอมนของกฎความสมพนธทงสองบงชวากฎความสมพนธ X Z มความนาสนใจมากกวากฎความสมพนธ X Y ตวอยางนไดแสดงใหเหนจดบกพรองของการใชตวแบบคาสนบสนน-คาความเชอมน ในการคนหากฎความสมพนธคอ กฎความสมพนธทมคาความเชอมนทมคาสงในตวอยางกลบเปนกฎความสมพนธทมความสมพนธแปรผกผนกนหรอมความสมพนธเชงลบตอกนสง
ตวอยางท 2 ก าหนดใหตารางดานลางนเปนตารางแสดงการปรากฏของรายการชาและรายการกาแฟในทรานแซคชนการซอสนคาในรานขายของช าแหงหนง แถว t และ t’ คอรอยละของทรานแซคชนทมรายการชาปรากฎอยและไมมรายการชาปรากฏอยตามล าดบ หลก c และ c’ คอรอยละของทรานแซคชน ทมรายการกาแฟปรากฏอยและไมมรายการกาแฟปรากฏอยตามล าดบ (Brin et al., 1997; Liu et al., 2008)
31
ตารางท 2-2 แสดงตวอยางรอยละของการปรากฏของรายการบนทรานแซคชนของรานขายของช าแหงหนง
c c’ รวม t 20 5 25 t’ 70 5 75 รวม 90 10 100
จากขอมลในตารางขางตน เมอน าไปใชตวแบบคาสนบสนน-คาความเชอมน เพอคนหากฎความสมพนธจะไดผลลพธคอไดกฎความสมพนธ t c มคาสนบสนนเทากบ 20% ซงในทางปฏบตถอวาเปนคาทคอนขางสงมาก คาความเชอมนของกฎความสมพนธ t c นจะเปนตวบงช ถงความนาจะเปนทลกคาจะซอกาแฟเมอลกคานนซอชา ซงมคาเทากบความนาจะเปนทจะซอชาและกาแฟหารดวยความนาจะเปนทจะซอชา นนคอ 20/25 = 0.8 หรอ 80% ซงจดไดวาเปนคาความเชอมนทสงมาก จากคาสนบสนนและคาความเชอมนทค านวณไวสามารถสรปไดวากฎความสมพนธ t c นเปนกฎความสมพนธทมอยจรงอยางสมเหตสมผล
แตในความจรงแลวขอมลทแสดงในตารางไมใชขอมลทงหมดในฐานขอมลของรานขายของช าแหงน ซงอาจเปนไปไดวาความสมพนธระหวางการซอชาและการซอกาแฟในทรานแซคชนใดๆเปนความสมพนธแปรผกผนกน จากตารางจะสามารถเหนไดเพยงคารอยละของการซอชาและซอกาแฟดวยคอรอยละ 20 คาทก าหนดใหในตารางไมเพยงพอจะน ามาค านวณคาสหสมพนธไดโดยตรงแตวาสามารถทราบทศของความสมพนธระหวางการซอชาและการซอกาแฟไดโดยการใชการค านวณคาลฟทดงสตร P(tUc)/(P(t)xP(c)) = 0.2/(0.25x0.9) = 0.89 คาลฟททค านวณมาไดนนมคานอยกวา 1 ซงบงชวาระหวางการซอชาและการซอกาแฟมความสมพนธเชงลบตอกนหรอการซอชาและการซอกาแฟแปรผกผนกนนนเอง จากตวอยางนแสดงเหนถงขอบกพรองของการใชตวแบบคาสนบสนน-คาความเชอมน ทท าใหไดกฎความสมพนธทขดแยงตอทศของสหสมพนธ
2.4.2 ตวแบบการประเมนความนาสนใจของกฎความสมพนธใหม
การประเมนความนาสนใจของกฎความสมพนธดวยวธการตางๆ ทกลาวไปในขางตนนน แสดงใหเหนอยางชดเจนวาการใชตวแบบประเมนทแตกตางกนสงผลใหไดกฎความสมพนธทนาสนใจตางกนออกไป (Sheikh et al., 2004) เหตผลส าคญทท าใหเปนเชนนนกเพราะความไมสอดคลองกนของความนาจะเปนของการมกฎความสมพนธปรากฎกบคาสหสมพนธของกฎ
32
ความสมพนธ ในป 2008 Liu และคณะ (Liu et al., 2008) ไดน าเสนอตวแบบการประเมนความนาสนใจของกฎความสมพนธขนมาใหม โดยการพสจนทฤษฎบททเกยวของกบตวแบบคาสนบสนน-คาความเชอมน กบทฤษฎบทคาสหสมพนธ และตงชอการประเมนความนาสนใจของกฎความสมพนธแบบใหมนวา คาความเชอมนใหม (New Confidence) โดยใชสญลกษณ NConf(X Y) แทนคาความเชอมนใหมน ซงสามารถค านวณไดจากสตรดงตอไปน
ก าหนดให NConf(R) คอ คาความเชอมนใหมของกฎความสมพนธ R
P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมล
P( ) คอ คาความนาจะเปนในการไมพบทรานแซคชนทมรายการ X ในฐานขอมล
P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และรายการ Y ในฐานขอมล
P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และไมรายการ Y ในฐานขอมล
P(X|Y) คอ คาความนาจะเปนในการพบรายการ X ในทรานแซคชนทมรายการ Y อยแลว
NConf(X Y) =
–
หรอ NConf(X Y) = P(X|Y) – P(X| )
คาทเปนไปไดของคาความเชอมนใหมนนอยในพสย [-1, 1] ถาคาความเชอมนใหมมคาเทากบ 0 หมายความวาเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธเปนอสระตอกน ถาคาความเชอมนใหมนอยกวา 0 แสดงวาทงเซตรายการทมากอนและเซตรายการทตามมาแปรผกผนกนหรอสหสมพนธเชงลบ และถาคาความเชอมนใหมมากกวา 0 แสดงวาทงเซตรายการทมากอนและเซตรายการทตามมาแปรผนตามกนหรอสหสมพนธเชงบวก (Liu et al., 2008)
33
ในงานวจยของ Liu และคณะ (Liu et al., 2008) ทไดเสนอคาความเชอมนใหมขางตนนน Liu และคณะไดท าการเปรยบเทยบความสามารถของคาความเชอมนใหมกบคาประเมนความนาสนใจของกฎความสมพนธอนๆ ทงหมด 8 คาคอ คาสนบสนน (Support), คาความเชอมน (Confidence), คาคอนวคชน (Conviction), คาลฟท (Lift), คาเลฟเวอเรจ (Leverage), คาคฟเวอเรจ (Coverage), คาสหสมพนธ (Correlation) และ คาอตราสวนออดส (Odds Ratio) โดยใชฐานขอมลทรานแซคชนสมมตขนาด 10 ทรานแซคชน ผลของการเปรยบเทยบคอ คาความเชอมนใหมสามารถบงบอกทศของความสมพนธไดอยางถกตองและสอดคลองกบคาเลฟเวอเรจและคาสหสมพนธ แตคาความเชอมนใหมนนสามารถระบความแตกตางของความนาสนใจของกฎความสมพนธ 2 กฎความสมพนธใดๆทคาเลฟเวอเรจและคาสหสมพนธไมสามารถระบได (กลาวคอกฎความสมพนธ 2 กฎทค านวณคาคาเลฟเวอเรจหรอคาสหสมพนธไดเทากนทง 2 กฎแตคาความเชอมนใหมใหคาทแตกตางกนระหวาง 2 กฎ) สวนคาประเมนความนาสนใจของกฎความสมพนธอนๆใหคาทขดแยงกบคาสหพนธ (กลาวคอเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธนนมความสมพนธเชงลบตอกนแตกลบใหคาประเมนความนาสนใจของกฎความสมพนธทสงออกมา)
เนองจากการเปรยบเทยบคาความเชอมนใหมกบคาอนๆในงานวจยของ Liu และคณะ (Liu et al., 2008) เปนการทดสอบกบฐานขอมลทรานแซคชนสมมตขนาด 10 ทรานแซคชนเทานน จงคอนขางขาดความนาเชอถอวาคาความเชอมนใหมจะใหประสทธภาพในการคนหากฎความสมพนธทดกวาคาอนๆจรง ผวจยจงรวบรวมวรรณกรรมทเกยวของกบคณสมบตทคาประเมนความนาสนใจของกฎความสมพนธควรจะมในหวขอ 2.5 ทงหมด 16 คณสมบต และท าการเปรยบเทยบคณสมบตทคาประเมนความนาสนใจของกฎความสมพนธทง 8 คารวมถงคาความเชอมนใหมม
2.5 คณสมบตทคาประเมนความนาสนใจของกฎความสมพนธควรจะม
ในปค.ศ. 1991 Piatetsky-Shapiro และคณะ (Piatetsky-Shapiro, 1991) ไดเสนอคณสมบต 3 ประการส าคญทคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะม ดงน
ก าหนดให M คอ คาประเมนความนาสนใจของกฎความสมพนธ XY คอ กฎความสมพนธทมเซตรายการทมากอนคอเซต X และเซตรายการท
ตามมาคอเซต Y
34
P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมล P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ Y ใน
ฐานขอมล
1. คาประเมนความนาสนใจของกฎความสมพนธ M ตองเทากบ 0 เมอเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธเปนอสระตอกนทางสถต (M = 0 ถา P(X and Y) = P(X)P(Y))
2. คาประเมนความนาสนใจของกฎความสมพนธ M ควรตองเพมขนเมอ P(X and Y) เพมขนในขณะท P(X) และ P(Y) คงท
3. คาประเมนความนาสนใจของกฎความสมพนธ M ควรตองเพมขนเมอ P(X) (หรอ P(Y)) ลดลงในขณะท P(X and Y) และ P(Y) (หรอ P(X)) คงท
Piatetsky-Shapiro และคณะ (Piatetsky-Shapiro, 1991) เสนอคณสมบตของคาประเมนความนาสนใจของกฎความสมพนธทง 3 คณสมบตขนมาใหมความเปนทวไป (General) มากทสด โดยในทง 3 คณสมบตจะอางองถงพารามเตอรเพยง 3 ตวคอ P(X) P(Y) และ P(X and Y) ซงเปนคาทางสถตทเกยวของกบกฎความสมพนธเทานน (Freitas, 1999) ในงานวจยนผ วจยจะใชสญลกษณ P1 P2 และ P3 แทนการอางถงคณสมบตท 1 2 และ 3 ของ Piatetsky-Shapiro และคณะ (Piatetsky-Shapiro, 1991)
คณสมบต P1 นนเปนคณสมบตทอธบายวาถาเซตรายการทมากอนและเซตรายการทตามมานนเปนอสระตอกนแลวกฎความสมพนธนนกควรจะตองไมมความนาสนใจเลยหรอมคาประเมนความนาสนใจของกฎความสมพนธนนเทากบ 0 คณะวจยหลายคณะวจารณวาคณสมบตขอนนนไมคอยยดหยนและจ ากดมากเกนไป (Tan et al, 2002) ในป ค.ศ. 2002 Tan และคณะ (Tan et al, 2002) จงเสนอใหผอนคลายคณสมบตขอนใหมเปน คาประเมนความนาสนใจของกฎความสมพนธ M ตองเทากบ k เมอเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธเปนอสระตอกนทางสถต (M = k ถา P(X and Y) = P(X)P(Y)) โดยท k คอคาคงท แตอยางไรกตามงานวจยตางๆ (Freitas , 1999; Major and Mangano, 1995; Mcgarry, 2005; Geng and Hamilton, 2006; Liu et al., 2008; Heravi, 2009) ทน าคณสมบตทง 3 ขอของ Piatetsky-Shapiro และคณะไปใชหรออางองถงกยงคงอางองตามตนฉบบคอคาประเมนความนาสนใจของกฎความสมพนธควรจะเทากบ 0 เมอกฎนนไมมความนาสนใจเลย คณสมบต P2 นน
35
เปนคณสมบตทอธบายวาในขณะทคาสนบสนนของเซตรายการทมากอนและคาสนบสนนของเซตรายการทตามมาคงท ถาคาสนบสนนของทงกฎความสมพนธเพมขน ความนาสนใจของกฎความสมพนธนนกควรจะเพมขนตามดวย กลาวคอถากฎความสมพนธมความสมพนธเชงบวกกนมากขน กฎความสมพนธนนกควรจะนาสนใจเพมขน และคณสมบต P3 นนเปนคณสมบตทอธบายวาในขณะทคาสนบสนนของกฎความสมพนธและคาสนบสนนของเซตรายการทมากอน (หรอ คาสนบสนนของเซตรายการทตามมา) คงท ถาคาสนบสนนของเซตรายการทตามมา (หรอ คาสนบสนนของเซตรายการทมากอน) ลดลงแลว ความนาสนใจของกฎความสมพนธนนควรจะเพมขน (Piatetsky-Shapiro, 1991; Geng and Hamilton, 2006)
ในปค.ศ. 1995 Major และ Mangano (Major and Mangano, 1995) เสนอใหน าคณสมบตทง 3 ขอของ Piatetsky-Shapiro และคณะ (Piatetsky-Shapiro, 1991) พรอมกบแนะน าใหเพมอก 1 คณสมบตเขาไปดงน
ก าหนดให M คอ คาประเมนความนาสนใจของกฎความสมพนธ XY คอ กฎความสมพนธทมเซตรายการทมากอนคอเซต X และเซตรายการท
ตามมาคอเซต Y P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมล P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทไมมรายการ X ในฐานขอมล
Conf(XY) คอ คาความเชอมนของกฎความสมพนธ XY
1. คาประเมนความนาสนใจของกฎความสมพนธ M ควรตองเพมขนเมอ P(X) เพมขนในขณะท P(Y) P( ) และ Conf(XY) คงท
คณสมบตของนมกจะถกอางถงและน าไปใชพรอมๆกบคณสมบตทง 3 ขอของ Piatetsky-Shapiro และคณะ (Piatetsky-Shapiro, 1991) ดงนนคณสมบตนมกจะถกเรยกวาคณสมบตของท 4 ทคาประเมนความนาสนใจของกฎความสมพนธควรจะม ในงานวจยนผวจยจะใชสญลกษณ P4 แทนการอางถงคณสมบตขอนของ Major และ Mangano (Major and Mangano, 1995)
คณสมบต P4 นน เ ปนคณสมบต ทอ ธบายวาในขณะทคาความเ ชอมนของกฎความสมพนธมคาคงท เมอคาสนบสนนของของเซตรายการทมากอนเพมขนแลว คาประเมนความ
36
นาสนใจของกฎความสมพนธ M กควรจะเพมขนตามดวย ในขณะท P(Y) P( ) และ P(Y|X) (หรอ Conf(XY) นนเอง) คงท
ในปค.ศ. 2002 Tan และคณะ (Tan et al, 2002) เสนอคณสมบตอก 5 ประการทคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะม เพมเตมจาก 4 ขอของคณะวจย Piatetsky-Shapiro (Piatetsky-Shapiro, 1991) และ Major กบ Mangano (Major and Mangano, 1995) โดยทคณสมบต 5 ประการของ Tan และคณะนนเปนคณสมบตทอยบนฐานของการด าเนนการบนตารางหลายตวแปร (Contingency Table) ขนาด 2 x 2 ดงน
ตารางท 2-3 แสดงตารางหลายตวแปร (Contingency Table) ขนาด 2 x 2 ของกฎความสมพนธ XY
Y X n(X and Y) n(X and ) n(X)
n( and Y) n( and ) n( ) n(Y) n( ) N
ก าหนดให M คอ คาประเมนความนาสนใจของกฎความสมพนธ XY คอ กฎความสมพนธทมเซตรายการทมากอนคอเซต X และเซตรายการท
ตามมาคอเซต Y N คอ จ านวนของทรานแซคชนทงหมดในฐานขอมล
n(X) คอ จ านวนของทรานแซคชนทมรายการ X ในฐานขอมล n( ) คอ จ านวนของทรานแซคชนทไมมรายการ X ในฐานขอมล
n(X and Y) คอ จ านวนของทรานแซคชนทมรายการ X และ Y ในฐานขอมล
1. คาประเมนความนาสนใจของกฎความสมพนธ M ควรมคณสมบตสมมาตรภายในการเปลยนแปลงล าดบ
2. คาประเมนความนาสนใจของกฎความสมพนธ M ควรคงทเมอมการขยายตามแถวหรอขยายตามหลก
37
3. คาประเมนความนาสนใจของกฎความสมพนธ M ควรสามารถบงชทศทางของความสมพนธได
4. คาประเมนความนาสนใจของกฎความสมพนธ M ควรคงทเมอมการด าเนนการทงตามแถวและตามหลกพรอมกน
5. คาประเมนความนาสนใจของกฎความสมพนธ M จะตองไมมความสมพนธกบจ านวนของทรานแซคชนทมเซตรายการ X เซตรายการ Y หรอทงค
ในงานวจยนผวจยจะใชสญลกษณ O1 O2 O3 O4 และ O5 แทนการอางถงคณสมบตท 1 2 3 4 และ 5 ของ Tan และคณะ (Tan et al, 2002)
คณสมบต O1 นนเปนคณสมบตทอธบายวากฎความสมพนธ X Y และกฎความสมพนธ Y X ควรมคาประเมนความนาสนใจของกฎความสมพนธทเทากน Tan และคณะ (Tan et al, 2002) ผ เสนอคณสมบตขอนกลาววาคาประเมนความนาสนใจของกฎความสมพนธทไมแสดงคณสมบตสมมาตรสามารถแกไขใหมคณสมบตสมมาตรไดโดยการก าหนดใหคา M ของกฎความสมพนธ X Y และคา M ของกฎความสมพนธ Y X มคาเทากบคาใดคาหนงทมากกวาหรอเทากบ max(M(X Y), M(Y X)) นนเอง คณสมบตขอนถกปฏเสธวาไมเปนจรงในหลายงานวจย (Geng and Hamilton, 2006) คณสมบต O2 นนเปนคณสมบตทอธบายวาคาการประเมนความนาสนใจของกฎความสมพนธ X Y เมอตอนท n(X and Y) มคาเทากบ Z ควรจะเทากบคาการประเมนความนาสนใจของกฎความสมพนธ X Y เมอตอนท n(X and Y) มคาเทากบ k1k2Z โดยท k1, k2 เปนคาคงทบวกทมาขยายตามแถวและตามหลกตามล าดบ เปนตน คณสมบต O3 นนเปนคณสมบตทอธบายวาคาการประเมนความนาสนใจของกฎความสมพนธ M ควรจะตองบงบอกไดวาเซตรายการทมากอนและเซตรายการทตามมามความสมพนธเชงบวกหรอความสมพนธเชงลบตอกนได คณสมบต O4 นนเปนคณสมบตทอธบายวาคาการประเมนความนาสนใจของกฎความสมพนธ X Y ควรเทากบคาการประเมนความนาสนใจของกฎความสมพนธ ดวย และคณสมบต O5 นนเปนคณสมบตทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M จะตองไมเปลยนแปลงเมอ n( and ) เปลยนแปลง กลาวคอคาประเมนความนาสนใจของกฎความสมพนธ M จะตองไมมความสมพนธกบจ านวนของทรานแซคชนทไมมทงเซตรายการทมากอนและเซตรายการทตาม (Tan et al, 2002)
38
ในปค.ศ. 2004 Lenca และคณะ (Lenca et al, 2004) กเสนอคณสมบต 5 ขอทคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะมเชนกน หลงจากนนในป ค.ศ. 2007 Lenca และคณะไดปรบปรงคณสมบตทง 5 ขอนนเลกนอยเพอใหมความยดหยนมากขน (Lenca et al, 2007) ดงน
ก าหนดให M คอ คาประเมนความนาสนใจของกฎความสมพนธ XY คอ กฎความสมพนธทมเซตรายการทมากอนคอเซต X และเซตรายการท
ตามมาคอเซต Y P(X) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X ในฐานขอมล P( ) คอ คาความนาจะเปนในการพบทรานแซคชนทไมมรายการ X ในฐานขอมล
P(X and Y) คอ คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ Y ในฐานขอมล
N คอ จ านวนของทรานแซคชนทงหมดในฐานขอมล
1. ถา P(X and ) = 0 แลว คาประเมนความนาสนใจของกฎความสมพนธ M ควรจะเปนคาคงทหรอเปนอนนต (infinity)
2. คาประเมนความนาสนใจของกฎความสมพนธ M ควรจะลดลงแบบเสนตรง แบบพาราโบลาหงาย หรอแบบพาราโบลาคว า เมอ P(X and ) มคาเพมขน
3. คาประเมนความนาสนใจของกฎความสมพนธ M ควรจะเพมขนเมอ N เพมขนในขณะท P(X and Y) P(X) และ P(Y) คงท
4. คาประเมนความนาสนใจของกฎความสมพนธ M ทดควรจะตองสามารถหาคาเธรสโชลด (threshold) ทแบงแยกระหวางกฎความสมพนธทนาสนใจออกจากกฎความสมพนธทไมนาสนใจไดงาย
5. คาประเมนความนาสนใจของกฎความสมพนธ M ท ดควรจะตองมอรรถศาสตร (semantics) ทผใชสามารถเขาใจไดงาย
ในงานวจยนผวจยจะใชสญลกษณ Q1 Q2 Q3 Q4 และ Q5 แทนการอางถงคณสมบตท 1 2 3 4 และ 5 ของ Lenca และคณะ (Lenca et al, 2004; Lenca et al, 2007)
39
คณสมบต Q1 นนเปนคณสมบตทอธบายวาเมอกฎความสมพนธนนมความนาสนใจสงทสด หรอคาความนาจะเปนในการพบทรานแซคชนทมรายการ X แตไมมรายการ Y ในฐานขอมลเทากบ 0 (หรอ คาความเชอมนเทากบ 1 นนเอง) แลวคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะเปนคาคงทคาใดคาหนงหรอเปนคาอนนตเพอสอความหมายอยางชดเจนวากฎความสมพนธนนนาสนใจสงทสด คณสมบต Q2 นนเปนคณสมบตทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะตองมการลงลดเมอมทรานแซคชนทมรายการ X แตไมมรายการ Y ถกเพมเขามาในฐานขอมล ลกษณะของการลดลงจะเปนอยางไรนนขนอยกบวตถประสงคของงานทน าไปประยกตใช ตวอยางเชน ถาตองการใหคาประเมนความนาสนใจของกฎความสมพนธ M มความคงทน (Tolerated) ตอการเพมขนของทรานแซคชนทมรายการ X แตไมมรายการ Y (กลาวคอเมอมทรานแซคชนทมรายการ X แตไมมรายการ Y เพมขน คาประเมนความนาสนใจของกฎความสมพนธ M ควรลดลงทละเพยงเลกนอยเทานน) กควรก าหนดใหคาประเมนความนาสนใจของกฎความสมพนธ M ลดลงแบบพาราโบลาหงาย (Concave up) เมอมทรานแซคชนทมรายการ X แตไมมรายการ Y เพมขน แตถาตองการใหคาประเมนความนาสนใจของกฎความสมพนธ M มความออนไหวมาก (กลาวคอถามทรานแซคชนทมรายการ X แตไมมรายการ Y เพมขนมาเพยงเลกนอยกจะท าใหคาประเมนความนาสนใจของกฎความสมพนธ M ลดลงอยางรวดเรว) กควรก าหนดใหคาประเมนความนาสนใจของกฎความสมพนธ M ลดลงแบบพาราโบลาคว า (Concave down, Convex) เมอมทรานแซคชนทมรายการ X แตไมมรายการ Y เพมขน เปนตน คณสมบต Q3 นนเปนคณสมบตทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะเพมขนเมอจ านวนของทรานแซคชนทงหมดเพมขนในขณะทคาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ Y คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และคาความนาจะเปนในการพบทรานแซคชนทมรายการ Y คงท คณสมบต Q4 นนเปนคณสมบตทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะตองสามารถหาคาเธรสโชลด (Threshold) ทเปนจดแบงแยกระหวางกฎความสมพนธทนาสนใจกบกฎความสมพนธทไมนาสนใจไดงาย และคาเธรสโชลดนนจะตองสอความหมายทผ ใชสามารถเขาใจไดงายดวย กลาวคอคาเธรสโชลดนนควรเปนคากลางระหวางคาสงสดกบคาต าสดนนเอง คณสมบต Q5 นนเปนคณสมบตทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M ทดควรจะตองสอความหมายทผ ใชสามารถเขาใจไดงาย กลาวคอเมอผ ใชอานคาประเมนความนาสนใจของกฎความสมพนธ M แลวจะตองสามารถเขาใจไดโดยงายวาคานหมายถงอะไร โดยไมตองอธบายใดๆเพมเตม (Lenca et al, 2004; Lenca et al, 2007)
40
ในปค.ศ. 2006 Geng และ Hamilton (Geng and Hamilton, 2006) กเสนอคณสมบต 2 ขอทคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะมเชนกน แตคณสมบตทง 2 ขอของ Geng และ Hamilton (Geng and Hamilton, 2006) นจะเนนประเมนทความสมพนธระหวางคาประเมนความนาสนใจของกฎความสมพนธ คาสนบสนน และคาความเชอมน ดงน
ก าหนดให M คอ คาประเมนความนาสนใจของกฎความสมพนธ XY คอ กฎความสมพนธทมเซตรายการทมากอนคอเซต X และเซตรายการท
ตามมาคอเซต Y Sup(XY) คอ คาสนบสนนของกฎความสมพนธ XY
Conf(XY) คอ คาความเชอมนของกฎความสมพนธ XY N คอ จ านวนของทรานแซคชนทงหมดในฐานขอมล
n(X) คอ จ านวนของทรานแซคชนทมรายการ X ในฐานขอมล n( ) คอ จ านวนของทรานแซคชนทไมมรายการ X ในฐานขอมล
n(X and Y) คอ จ านวนของทรานแซคชนทมรายการ X และ Y ในฐานขอมล
1. คาประเมนความนาสนใจของกฎความสมพนธ M ควรอยในรปของฟงกชนทขนกบคาสนบสนน (f(Sup(XY))) โดยทคาของฟงกชนนควรเพมขนเมอคาสนบสนนเพมขน ในขณะทขอบ (Margins) ของตารางหลายตวแปร (ตารางท 2-3) คงท
2. คาประเมนความนาสนใจของกฎความสมพนธ M ควรอยในรปของฟงกชนทขนกบคาความเชอมน (f(Conf(XY))) โดยทคาของฟงกชนนควรเพมขนเมอคาความเชอมนเพมขน ในขณะทขอบ (Margins) ของตารางหลายตวแปร (ตารางท 2-3) คงท
ในงานวจยนผวจยจะใชสญลกษณ S1 และ S2 แทนการอางถงคณสมบตท 1 และ 2 ของ Geng และ Hamilton (Geng and Hamilton, 2006)
สมมตให n(X) = a, n( ) = N – a, n(Y) = b, n( ) = N – b, Sup(XY) = x และ Conf(XY) = y คณสมบต S1 นนเปนคณสมบตทอธบายวา เมอคา n(X) n( ) n(Y) และ n( )
คงทจะไดวา P(X and Y) = x, P( and Y) = (
) – x, P(X and ) = (
)) – x และ P( and ) =
1 –
) + x แลวคาประเมนความนาสนใจของกฎความสมพนธ M ทเขยนใหอยในรปของ
ฟงกชนทขนกบ x นนควรจะเพมขนเมอ x เพมขน และคณสมบต S2 กเชนเดยวกบคณสมบต S1
41
คอเปนคณสมบตทอธบายวา เมอคา n(X) n( ) n(Y) และ n( ) คงทจะไดวา P(X and Y) =
,
P( and Y) =
, P(X and ) =
และ P( and ) = 1 –
+
แลวคา
ประเมนความนาสนใจของกฎความสมพนธ M ทเขยนใหอยในรปของฟงกชนทขนกบ y นนควรจะเพมขนเมอ y เพมขน (Geng and Hamilton, 2006)
คณสมบต S1 สอดคลองโดยตรงกบคณสมบต P2 (Heravi, 2009) และคณสมบต S2 สอดคลองโดยตรงกบคณสมบต Q2 (Geng and Hamilton, 2006)
คณสมบตทคาประเมนความนาสนใจของกฎความสมพนธควรจะมทงหมด 16 ขอขางตน คณสมบตทไดรบการยอมรบและถกอางองถงโดยงานวจยตางๆ (Freitas , 1999; Major and Mangano, 1995; Mcgarry, 2005; Geng and Hamilton, 2006; Liu et al., 2008; Heravi, 2009) มากทสดคอคณสมบต P1 P2 และ P3 ของ Piatetsky-Shapiro และคณะ (Piatetsky-Shapiro, 1991) และคณสมบต P4 ของ Mango และ Mangano (Major and Mangano, 1995)
จากหวขอท 2.3 ผ วจยไดทบทวนวรรณกรรมของคาประเมนความนาสนใจของกฎความสมพนธทงหมด 8 คาคอ คาสนบสนน (Support), คาความเชอมน (Confidence), คาคอนวคชน (Conviction), คาลฟท (Lift), คาเลฟเวอเรจ (Leverage), คาคฟเวอเรจ (Coverage), คาสหสมพนธ (Correlation) และ คาอตราสวนออดส (Odds Ratio) และหวขอ 2.4 ทผวจยทบทวนวรรณกรรมของคาประเมนความนาสนใจของกฎความสมพนธใหมทชอวา คาความเชอมนใหม (New Confidence) ทถกเสนอขนโดย Liu และคณะ (Liu et al., 2008) ผวจยจงรวบรวมงานวจยทท าการทดสอบคณสมบตทง 14 คณสมบตกบคาประเมนความนาสนใจของกฎความสมพนธทงหมด 8 คาและคาความเชอมนใหม การเปรยบเทยบคณสมบตของคาประเมนความนาสนใจของกฎความสมพนธ 8 คาทรวบรวมโดยคณะวจยของ Geng กบ Hamilton ในป 2006 และคณะวจยของ Heravi ในป 2009 (Geng and Hamilton, 2006; Heravi, 2009) และคาความเชอมนใหมทรวบรวมโดยผวจยแสดงดงตารางท 2-4 ในบทท 1
42
เนองจากงานวจยของ Liu และคณะในป 2008 (Liu et al., 2008) ไดท าการพสจนคณสมบตคาความเชอมนใหมไวทงหมดเพยง 5 คณสมบตคอ คณสมบต P1 P2 P3 O1 และ O2 เทานน ดงนนผ วจยจงพสจนคณสมบต P4 O3 O4 O5 Q1 Q2 Q3 S1 และ S2 ของคาความเชอมนใหมดงน
พสจนคณสมบต P4
คณสมบต P4 นน เ ปนคณสมบต ทอ ธบายวาในขณะทคาความเ ชอมนของกฎความสมพนธมคาคงท เมอคาสนบสนนของของเซตรายการทมากอนเพมขนแลว คาประเมนความนาสนใจของกฎความสมพนธ M กควรจะเพมขนตามดวย ในขณะท P(Y) P( ) และ P(Y|X) (หรอ Conf(XY) นนเอง) คงท
จาก NConf(X Y) = P(X|Y) – P(X| )
NConf(X Y) =
–
NConf(X Y) =
–
(เนองจาก = )
NConf(X Y) =
–
(เนองจาก = )
NConf(X Y) = P(X) (
–
)
จากขอก าหนด P(Y) P( ) และ P(Y|X) คงท
กรณทพจน (
–
) มคาเปนบวก จะท าให NConf(X Y) มคาเพมขนเมอ P(X)
เพมขน
กรณทพจน (
–
) มคาเปนลบ จะท าให NConf(X Y) มคาลดลงเมอ P(X)
ลดลง
ดงนน คาความเชอมนใหมไมมคณสมบต P4
43
พสจนคณสมบต O3
คณสมบต O3 นนเปนคณสมบตทอธบายวาคาการประเมนความนาสนใจของกฎความสมพนธ M ควรจะตองบงบอกไดวาเซตรายการทมากอนและเซตรายการทตามมามความสมพนธเชงบวกหรอความสมพนธเชงลบตอกนได
เนองจาก คาทเปนไปไดของคาความเชอมนใหมนนอยในพสย [-1, 1] ถาคาความเชอมนใหมมคาเทากบ 0 หมายความวาเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธเปนอสระตอกน ถาคาความเชอมนใหมนอยกวา 0 แสดงวาทงเซตรายการทมากอนและเซตรายการทตามมาแปรผกผนกนหรอสหสมพนธเชงลบ และถาคาความเชอมนใหมมากกวา 0 แสดงวาทงเซตรายการทมากอนและเซตรายการทตามมาแปรผนตามกนหรอสหสมพนธเชงบวก (Liu et al., 2008)
ดงนนคาความเชอมนใหมมคณสมบต O3
พสจนคณสมบต O4
คณสมบต O4 นนเปนคณสมบตทอธบายวาคาการประเมนความนาสนใจของกฎความสมพนธ X Y ควรเทากบคาการประเมนความนาสนใจของกฎความสมพนธ
จาก NConf(X Y) = P(X|Y) – P(X| )
NConf(X Y) =
–
และ NConf( ) = P( | ) – P( |Y)
NConf( ) =
–
ตองการพสจนวา NConf(X Y) = NConf( )
–
=
–
คณ P(Y)P( ) ทง 2 ขาง
P( )P(X and Y) – P(Y)P(X and ) = P(Y)P( and ) – P( )P( and Y)
44
เนองจาก P(X and ) = P(X) – P(X and Y)
P( )P(X and Y) – P(Y)(P(X) – P(X and Y)) = P(Y)P( and ) – P( )P( and Y)
เนองจาก P(X and ) = P(Y) - P(X and Y)
P( )P(X and Y) – P(Y)(P(X) – P(X and Y)) = P(Y)P( and ) – P( )(P(Y) - P(X and Y))
เนองจาก P( and ) = 1 – P(X) – P(Y) + P(X and Y)
P( )P(X and Y) – P(Y)(P(X) – P(X and Y)) = P(Y)(1 – P(X) – P(Y) + P(X and Y)) – P( )(P(Y) - P(X and Y))
P( )P(X and Y) – P(X)P(Y) + P(Y)P(X and Y) = P(Y) - P(X)P(Y) – P(Y)P(Y) + P(Y)P(X and Y) – P( )(P(Y) - P(X and Y))
เนองจาก P( ) = 1 – P(Y)
(1 – P(Y))P(X and Y) – P(X)P(Y) + P(Y)P(X and Y) = P(Y) - P(X)P(Y) – P(Y)P(Y) + P(Y)P(X and Y) – (1 – P(Y))(P(Y) - P(X and Y))
P(X and Y) – P(X)P(Y) = P(Y) - P(X)P(Y) - P(Y) + P(X and Y)
1 = 1 เปนจรง
ดงนนคาความเชอมนใหมมคณสมบต O4
พสจนคณสมบต O5
คณสมบต O5 นน เ ปนคณสมบต ทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M จะตองไมเปลยนแปลงเมอ n( and ) เปลยนแปลง กลาวคอคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะค านวณมาจาก n(X) n(Y) หรอ/และ n(X and Y) เทานน (ไมม n( and ) หรอ N มาเกยวของ)
จาก NConf(X Y) = P(X|Y) – P(X| )
NConf(X Y) =
–
45
NConf(X Y) =
–
NConf(X Y) =
–
NConf(X Y) =
–
มพจนทเกยวของกบจ านวนทรานแซคชนทงหมด (N) คอพจน
ดงนนคาความเชอมนใหมไมมคณสมบต O5
พสจนคณสมบต Q1
คณสมบต Q1 นนเปนคณสมบตทอธบายวาเมอกฎความสมพนธนนมความนาสนใจสงทสด หรอคาความนาจะเปนในการพบทรานแซคชนทมรายการ X แตไมมรายการ Y ในฐานขอมลเทากบ 0 (หรอ คาความเชอมนเทากบ 1 นนเอง) แลวคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะเปนคาคงทคาใดคาหนงหรอเปนคาอนนต
จาก NConf(X Y) = P(X|Y) – P(X| )
NConf(X Y) =
–
เมอกฎความสมพนธนนมความนาสนใจสงทสด นนคอ P(X and ) = 0
จะได NConf(X Y) =
NConf(X Y) =
NConf(X Y) =
เมอกฎความสมพนธนนมความนาสนใจสงทสด พจน n(X and Y) จะเปนจ านวนเตมบวกเทานน (ไมเปน 0) และพจน n(Y) คอจ านวนเตมบวก (ไมเปน 0)
จะได เมอกฎความสมพนธนนมความนาสนใจสงทสด คาความเชอมนใหมจะมคาเปน 1 ซงเปนคาคงทบวกเสมอ
ดงนนคาความเชอมนใหมมคณสมบต Q1
46
พสจนคณสมบต Q2
คณสมบต Q2 นน เ ปนคณสมบต ทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะตองมการลงลดเมอมทรานแซคชนทมรายการ X แตไมมรายการ Y ถกเพมเขามาในฐานขอมล โดยทลกษณะของการลดลงนนสามารถเปนได 3 แบบคอ ลดลงเปนเสนตรง ลดลงเปนพาราโบลาคว า หรอลดลงเปนพาราโบลาหงาย อยางใดอยางหนง
จาก NConf(X Y) = P(X|Y) – P(X| )
NConf(X Y) =
–
NConf(X Y) =
–
NConf(X Y) =
–
จะเหนวา เมอไมมทรานแซคชนทมรายการ X แตไมมรายการ Y นนคอ n(X and ) = 0
จะได NConf(X Y) =
เมอเรมมทรานแซคชนทมรายการ X แตไมมรายการ Y เพมขน นนคอ n(X and ) > 0
จะได NConf(X Y) =
–
จากสมการเสนตรง y = mx+c
จะไดวาเมอเรมมทรานแซคชนทมรายการ X แตไมมรายการ Y เพมขน สมการนเปนสมการเสนตรง
โดยท y คอ NConf(X Y)
x คอ n(X and )
m คอ –
c คอ
จะไดสมการเสนตรงทมความชนเปนลบ นนคอ NConf(X Y) ลดลง เมอม n(X and ) เพมขน
47
ดงนนคาความเชอมนใหมมคณสมบต Q2 และมลกษณะของการลดลงแบบเสนตรง (ใสหมายเลข 1 ในตารางท 2-4)
พสจนคณสมบต Q3
คณสมบต Q3 นน เ ปนคณสมบต ทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M ควรจะเพมขนเมอจ านวนของทรานแซคชนทงหมด (N) เพมขนในขณะทคาความนาจะเปนในการพบทรานแซคชนทมรายการ X และ Y คาความนาจะเปนในการพบทรานแซคชนทมรายการ X และคาความนาจะเปนในการพบทรานแซคชนทมรายการ Y คงท
จาก NConf(X Y) = P(X|Y) – P(X| )
NConf(X Y) =
–
เนองจาก P(X and ) = P(X) – P(X and Y)
และ P( ) = 1 – P(Y)
จะได NConf(X Y) =
–
จะเหนวาเมอ N เพมขนในขณะท P(X and Y) P(X) และ P(Y) คงท คา NConf(X Y) กคงท
ดงนนคาความเชอมนใหมมคณสมบต Q3
พสจนคณสมบต S1
คณสมบต S1 นน เ ปนคณสมบต ทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M ทเขยนใหอยในรปของฟงกชนทขนกบคาสนบสนนนนควรจะเพมขนเมอคาสนบสนนเพมขน เมอคา n(X) n( ) n(Y) และ n( ) คงท
จาก NConf(X Y) = P(X|Y) – P(X| )
NConf(X Y) =
–
สมมตให n(X) = a, n( ) = N – a, n(Y) = b, n( ) = N – b, Sup(XY) = x
48
จะไดวา P(X and Y) = x, P( and Y) = (
) – x, P(X and ) = (
)) – x และ P( and ) = 1 –
) + x
ดงนน NConf(X Y) =
–
–
NConf(X Y) =
–
– +
–
พจน
– คงท เนองจาก n(X) และ n( ) คงท
และเมอ x เพม พจน
และพจน
– จะเพมขนดวย เนองจาก n(Y) และ n( ) คงท
ดงนนเมอ x เพม คา NConf(X Y) กจะเพมดวย
นนคอ Sup(XY) เพม คา NConf(X Y) กจะเพมดวย
ดงนนคาความเชอมนใหมมคณสมบต S1 (ใสหมายเลข 0 ในตารางท 2-4)
พสจนคณสมบต S2
คณสมบต S1 นน เ ปนคณสมบต ทอธบายวาคาประเมนความนาสนใจของกฎความสมพนธ M ทเขยนใหอยในรปของฟงกชนทขนกบคาความเชอมนนนควรจะเพมขนเมอคาความเชอมนเพมขน เมอคา n(X) n( ) n(Y) และ n( ) คงท
จาก NConf(X Y) = P(X|Y) – P(X| )
NConf(X Y) =
–
สมมตให n(X) = a, n( ) = N – a, n(Y) = b, n( ) = N – b, Conf(XY) = y
จะไดวา P(X and Y) =
, P( and Y) =
, P(X and ) =
และ P( and ) =
1 –
+
ดงนน NConf(X Y) =
–
49
NConf(X Y) =
–
NConf(X Y) =
–
+
พจน
คงท เนองจาก n(X) และ n( ) คงท
และเมอ y เพม พจน
และพจน
จะเพมขนดวย เนองจาก n(Y) และ n( ) คงท
ดงนนเมอ y เพม คา NConf(X Y) กจะเพมดวย
นนคอ Conf(XY) เพม คา NConf(X Y) กจะเพมดวย
ดงนนคาความเชอมนใหมมคณสมบต S2 (ใสหมายเลข 0 ในตารางท 2-4)
การทดสอบคณสมบตขางตนไมรวมคณสมบต Q4 และ Q5 เนองจากคณสมบตทง 2 นนเปนคณสมบตเชงอตวสย (Subjective Properties) หรอคณสมบตทขนอยกบผ ใชและโดเมนทน าไปใช ไมสามารถตดสนไดวามคณสมบตทง 2 ขอหรอไมถาไมไดอางองถงโดเมนและวตถประสงคทน าไปประยกตใช (Geng and Hamilton, 2006; Heravi, 2009) กบคาประเมนความนาสนใจของกฎความสมพนธทงหมด 8 คาและคาความเชอมนใหม การเปรยบเทยบคณสมบตของคาประเมนความนาสนใจของกฎความสมพนธ 8 คาทรวบรวมโดยคณะวจยของ Geng กบ Hamilton ในป 2006 และคณะวจยของ Heravi ในป 2009 (Geng and Hamilton, 2006; Heravi, 2009) และคาความเชอมนใหมทรวบรวมโดยผวจย แสดงดงตารางตอไปน
50
ตารางท 2-4 แสดงการเปรยบเทยบคณสมบตของคาประเมนความนาสนใจของกฎความสมพนธทงหมด
P1 P2 P3 P4 O1 O2 O3 O4 O5 Q1 Q2 Q3 S1 S2 รวม คาสนบสนน 1 0 0 6
คาความเชอมน 1 1 0 0 7
คาคอนวคชน 2 0 0 0 7
คาลฟท 2 2 0 0 6
คาเลฟเวอเรจ 2 1 0 0 5
คาคฟเวอเรจ 3 1 0 3
คาสหสมพนธ 2 0 0 0 9
คาอตราสวนออดส 2 0 4 0 9
คาความเชอมนใหม 1 1 0 0 10
จากตารางขางตนเครองหมาย ในตารางหมายถงคาประเมนความนาสนใจของกฎความสมพนธทอยในแถวนนมคณสมบตของหลกนน เครองหมาย ในตารางหมายถงคาประเมนความนาสนใจของกฎความสมพนธทอยในแถวนนไมมคณสมบตของหลกนน ในหลกของคณสมบต P3 หมายเลข 0 หมายถง คาประเมนความนาสนใจของกฎความสมพนธเพมขนเมอคาความนาจะเปนของเซตรายการทมากอนลดลง หมายเลข 1 หมายถง คาประเมนความนาสนใจของกฎความสมพนธเพมขนเมอคาความนาจะเปนของเซตรายการทตามมาลดลง หมายเลข 2 หมายถง คาประเมนความนาสนใจของกฎความสมพนธเพมขนเมอทงคาความนาจะเปนของเซตรายการทมากอนและคาความนาจะเปนของเซตรายการทตามมาลดลงเทานน ในหลกของคณสมบต Q2 หมายเลข 0 หมายถง คาประเมนความนาสนใจของกฎความสมพนธลดลงแบบพาราโบลาคว า หมายเลข 1 หมายถง คาประเมนความนาสนใจของกฎความสมพนธลดลงแบบเสนตรง หมายเลข 2 หมายถง คาประเมนความนาสนใจของกฎความสมพนธลดลงแบบพาราโบลาหงาย หมายเลข 3 หมายถง คาประเมนความนาสนใจของกฎความสมพนธลดลงแตขนอยกบพารามเตอร หมายเลข 4 หมายถง คาประเมนความนาสนใจของกฎความสมพนธคงท หมายเลข 5 หมายถง คาประเมนความนาสนใจของกฎความสมพนธเพมขน หมายเลข 6 หมายถง คาประเมนความนาสนใจของกฎความสมพนธเพมหรอลดไมแนนอนขนอยกบพารามเตอร ในหลก
51
ของคณสมบต S1 และ S2 หมายเลข 0 หมายถงคาประเมนความนาสนใจของกฎความสมพนธเพมขนเมอคาสนบสนนเพมขน หมายเลข 1 หมายถงคาประเมนความนาสนใจของกฎความสมพนธคงทเมอคาสนบสนนเพมขน หมายเลข 2 หมายถงคาประเมนความนาสนใจของกฎความสมพนธลดลงเมอคาสนบสนนเพมขน หมายเลข 3 หมายถงไมสามารถประเมนได (not applicable) และหมายเลข 4 หมายถงคาประเมนความนาสนใจของกฎความสมพนธเพมหรอลดขนอยกบพารามเตอร (Geng and Hamilton, 2006; Heravi, 2009) หลกสดทายของตารางคอหลกทแสดงการรวมจ านวนคณสมบตทงหมดทคาประเมนความนาสนใจของกฎความสมพนธนนๆม
จากผลการพสจนคณสมบตของคาประเมนความนาสนใจของกฎความสมพนธขางตนและตารางท 2-4 แสดงใหเหนวาคาความเชอมนใหมมคณสมบตทคาประเมนความนาสนใจของกฎความสมพนธควรจะม 10 คณสมบตจากทงหมด 14 คณสมบต ซงมากทสดเมอเทยบกบคาประเมนความนาสนใจของกฎความสมพนธอนๆ โดยเฉพาะอยางยงการมคณสมบต O3 ของคาความเชอมนใหมจะท าใหการน าคาความเชอมนใหมไปใชนนจะสามารถขจดการเกดกฎความสมพนธทมเซตรายการทมากอนและเซตรายการทตามทมความสมพนธเชงลบออกไปได ผวจยจงเชอวาถาน าคาความเชอมนใหมนไปประยกตใชกบการคนหากฎความสมพนธกบขอมลประเภทตางๆรวมถงขอมลซอฟตแวรอารไควฟ แลวนาจะท าใหกฎความสมพนธทไดมาเปนกฎความสมพนธทนาสนใจและชวยลดการเกดกฎความสมพนธทเปนผลบวกลวง (False Positive) ได
2.6 การควบคมการเปลยนแปลงแกไข (Revision Control, Version Control)
ซอฟตแวรทถกพฒนาขนในปจจบนนนมความซบซอนและขนาดทใหญกวาซอฟตแวรทถกพฒนาขนมาในอดตเปนอยางมาก ความยากและความซบซอนเหลานนถกสะทอนออกมาในการบรหารจดการการพฒนาและการบ ารงรกษาของซอฟตแวรนน แมวาหลายองคกรในปจจบนจะใชซอฟตแวรควบคมการเปลยนแปลงแกไข (Revision Control Software, Version Control Software) คอยตดตามและจดการกบพฒนาการของความซบซอนของโครงการพฒนาซอฟตแวรกนอยางมาก แตทวาแนวคดของการควบคมการเปลยนแปลงแกไข (Concept of Revision Control, Version Control) นนกลบเปนศาสตรทไดไมคอยถกพดถงและไมคอยมวฒนาการมาก
52
เทาไรในตลอดทศวรรษทผานมา (Löh et al., 2007) ในหวขอนไดเรยบเรยงวรรณกรรมทเกยวของกบการควบคมการเปลยนแปลงแกไข เรมตงแตแนวคดของการควบคมการเปลยนแปลงแกไข ซอฟตแวรทประยกตแนวคดของการควบคมการเปลยนแปลงแกไข และสดทายจะกลาวถงระบบคอนเคอเรนทเวอรชน (Concurrent Version System, CVS) ซงเปนซอฟตแวรโอเพนซอรสทประยกตแนวคดของการควบคมการเปลยนแปลงแกไขทไดรบความนยมสงมากนานกวาทศวรรษ (O’Sullivan et al., 2009)
2.6.1 แนวคดของการควบคมการเปลยนแปลงแกไข (Concept of Revision Control, Version Control)
การควบคมการเปลยนแปลงแกไข (Revision Control, Version Control) เปนลกษณะอยางหนงของการควบคมเอกสาร (Documentation Control) แนวคดของการควบคมการเปลยนแปลงแกไข คอ การควบคมพฒนาการของเนอหาภายในเอกสารอเลกทรอนกสตลอดชวงอายของเอกสาร รวมถงการเรยกเนอหาในอดตกลบคน (Recovery) การบงชขอแตกตางระหวางเวอรชนของเนอหา และการใหรายละเอยดของพฒนาการแตละครงดวย (Tichy, 1982; Junqueira et al., 2008) การควบคมการเปลยนแปลงแกไขนนถกน าไปประยกตใชในทางวศวกรรมแขนงตางๆเพอการจดการการพฒนาทตอเนองไปของเอกสารอเลกทรอนกส เชน ซอรสโคดของโปรแกรมประยกต พมพเขยว แบบจ าลองอเลกทรอนกส และสารสนเทศส าคญอนๆ ซงพฒนาโดยทม การเปลยนแปลงเอกสารเหลานในแตละครงจะถกระบโดยใชการเพมหมายเลขการเปลยนแปลงแกไข (Revision Number) และมการเชอมโยงกบผกระท าการเปลยนแปลงแกไขดวย
การไหลของกจกรรมการควบคมการเปลยนแปลงแกไขเรมตนจากการสรางรพอสโทร (Creation of a Pepository) ส าหรบโครงการขนมา จากนนน าเขาแฟมขอมลทงหมดของโครงการ (Import Files of Project) ลงสรพอสโทรทสรางไว แฟมขอมลทน าเขามาครงแรกจะถกก าหนดคาเรมตน (Initial Set) ใหมหมายเลขการแกไขหรอหมายเลขเวอรชนเปน 1 เมอมความตองการเปลยนแปลงแกไขแฟมขอมลผ ใชกจะตองท าการลงทะเบยนออก (Check out) แฟมขอมลนนออกมาจากรพอสโทร การลงทะเบยนออกของแฟมขอมลกคอการส าเนาแฟมขอมลเวอรชนลาสดจากรพอสโทรมาเปนแฟมขอมลบนเครองของผ ใช (Local File) เมอผ ใชเปลยนแปลงแกไขแฟมขอมลเรยบรอยแลวจะตองการลงทะเบยนเขา (Check in) หรอคอมมท (Commit) แฟมขอมลนนกลบเขาสรพอสโทร การคอมมทแตละครงจะมผลใหหมายเลขการแกไขหรอหมายเลขเวอรชนมคาเพมขนไปเรอยๆ การไหลของกจกรรมจะวนลปเชนนไปเรอยๆตลอดชวงอายของโครงการ ใน
53
กรณทมผ ใชหลายคนท าการเปลยนแปลงแกไขแฟมขอมลเดยวกนในเวลาเดยวกน (มการลงทะเบยนออกของแฟมขอมลโดยผ ใชมากกวา 1 คนในชวงเวลาเดยวกน) จะท าใหเกดกจกรรมทส าคญขนอกกจกรรมคอการผสานเนอหา (Merge) การผสานเนอหาคอการปรบปรง (Update) เนอหาภายในแฟมขอมลบนเครองผใชทแกไขไปแลวกบเนอหาลาสดของแฟมขอมลนนในรพอสโทรซงอาจถกคอมมทเวอรชนใหมจากผ ใชอนในระหวางทผ ใชก าลงแกไขอย กลาวคอเปนการปรบปรงเนอหาของแฟมขอมลนนบนเครองของผใช (Local File) ใหสอดคลองกบเวอรชนบนรพอสโทรนนเอง ผใชสามารถท าการผสานเนอหาไดโดยการเรยกใชค าสงทชอวา update (Tichy, 1982; Ambriola et al., 1990; Junqueira et al., 2008) การไหลของกจกรรมการควบคมการเปลยนแปลงแกไขสามารถแสดงไดดงรปตอไปน (Junqueira et al., 2008)
Creation of a repository
Import files of a project
Checkout
Merge
Commit
รปท 2-1 แสดงการไหลของกจกรรมการควบคมการเปลยนแปลงแกไข
แนวคดของการควบคมการเปลยนแปลงแกไขทกลาวไปขางตนนนเปนแนวคดของการควบคมการเปลยนแปลงแกไขส าหรบเอกสารอเลกทรอนกสทวไป ส าหรบแนวคดของการควบคมการเปลยนแปลงแกไขในวศวกรรมซอฟตแวรจะหมายถงเทคนคและเครองมอทน ามาใชในการควบคมพฒนาการของแฟมขอมลซอรสโคดและแฟมขอมลอนๆภายในโครงการพฒนาซอฟตแวร (Junqueira et al., 2008) แฟมขอมลซอรสโคดนนเปนแฟมขอมลทมคณลกษณะเฉพาะตวมากกวาแฟมขอมลของเอกสารอเลกทรอนกส อนๆ ท าใหเทคนคทใชในการควบคมการเปลยนแปลงแกไขแฟมขอมลซอรส โคดมความละเอยดและเฉพาะตวมากกวาการควบคมการเปลยนแปลงแกไขของเอกสารอเลกทรอนกสอนๆ คณลกษณะเฉพาะนนกคอเนอหา (Contents) ภายในแฟมขอมลซอรสโคดนนเปนเนอหาทมโครงสรางและโครงสรางนนประกอบดวยหนวยยอยท
54
มความสมพนธกนอยภายใน ดวยเหตนการควบคมการเปลยนแปลงแกไขแฟมขอมลซอรสโคดจงตองมการด าเนนการขนสง (Advanced Operations) 2 อยางคอการตอกง (Branches) และการผสานกง (Merge) (Chadd et al., 2008)
ค าวา กง (Branch) ในทนหมายถง กลมของเวอรชนตางๆทถกสรางขนมาดวยเหตผลในการทดสอบอะไรบางอยางทยงไมมนใจเพยงพอทจะน าเวอรชนเหลานไปรวมกบเวอรชนหลกทเสถยรแลว การตอกงเปนการเปรยบเทยบการพฒนาซอรสโคดในลกษณะของตนไม (Tree) คอ การก าหนดใหซอรสโคดหลก (เวอรชนของซอรสโคดทมนใจวามความเสถยรสงแลว) เปนล าตน (Trunk) ของตนไม โดยปกตแลวเมอนกพฒนาแกไขหรอพฒนาซอรสโคดเพมเตมเขาไปจะท าใหเกดเวอรชนใหมขนมา เวอรชนใหมทเสถยรเหลานจะเรยงตอกนไปเปนล าดบ แตในกรณทนกพฒนามการแกไขหรอพฒนาซอรสโคดสวนใดสวนหนง ซงเปนการแกไขเพอทดสอบอะไรบางอยางและยงไมมนใจในความเสถยรของการแกไขครงนน เวอรชนใหมทถกสรางขนมานจะถกก าหนดใหเปนกง (Branches) ตอออกมาจากสวนล าตนหลกของตนไม ทศทางการพฒนาจะขยายออกจากสวนล าตนของตนไม การตอกงนเปนเทคนคทนยมใชมากในการควบคมการเปลยนแปลงแกไขของโครงการพฒนาซอฟตแวรทมขนาดใหญ เทคนควธการตอกงสามารถใชเพอการทดสอบซอรสโคดและเพมเตมซอรสโคดเมอเราตองการทจะขยายระบบหรอซอฟตแวรเพมเตม ในขณะทมการพฒนาสวนกงอยนนสวนล าตนกยงคงสามารถพฒนาตอออกไปไดเชนกน เมอพฒนาสวนทเปนกงเสรจแลวและมนใจความเสถยรของกงนนแลว นกพฒนาสามารถทจะน าสวนกงนนมารวมเขากบสวนล าตนหลกได เรยกวาการผสานกง (Merge)
ถาก าหนดใหการเปลยนแปลงแกไข (Change, Revision) คอการทนกพฒนาแกไข (alter) เพม (add) หรอ ลบ (delete) อยางใดอยางหนงบนแฟมขอมลซอรสโคด การคอมมท (Commit) กคอเซตของการเปลยนแปลงแกไขทกระท าโดยนกพฒนาคนเดยวกนในเวลาเดยวกนหรอใกลเคยงกนโดยทไมใชเซตวางนนเอง รปดานลางนแสดงตวอยางของการคอมมท ลงบนล าตนและบนกง โดยก าหนดให สญลกษณ C# คอการคอมมทครงท # และสญลกษณ f# คอการเปลยนแปลงแกไขบนแฟมขอมลท # (Junqueira et al., 2008)
55
รปท 2-2 แสดงตวอยางการคอมมทลงบนล าตนและบนกง
จากรปท 2-2 ขางตนนถามการผสานกงเกดขนหลงจากการคอมมทครงท 7 การด าเนนการของรพอสโทรทจะเกดขนกคอ พจารณาวาตงแตเกดการตอกงนขนมาจนถงการผสานกงมการเปลยนแปลงแกไขกบแฟมขอมลใดบาง ถาการเปลยนแปลงแกไขแฟมขอมลใดเกดขนทงบนกงและบนล าตน การเปลยนแปลงแกไขแฟมขอมลนนจะตองถกจบคกนแลวน าไปวเคราะหเชงลกวามการเปลยนแปลงแกไขทเกดความขดแยง (Conflict) ขนหรอไม ถาไมเกดความขดแยงขนเปลยนแปลงแกไขแฟมขอมลนนทงบนกงและบนล าตนกจะสามารถน ามาผสานกนไดทนท แตถาเกดความขดแยงขนจ าเปนจะตองใหผ ทท าการผสานกงเปนผตดสนวาจะแกไขความขดแยงน อยางไร ตวอยางเชน จากรปขางตน ตงแตจดเรมตนการตอกงจนถงจดการผสานกงนนมการคอมมทบนล าตนทงหมด 3 ครงคอ การคอมมทครงท 3 การคอมมทครงท 5 และการคอมมทครงท 7 และมการคอมมทบนกงทงหมด 2 ครงคอ การคอมมทครงท 4 และการคอมมทครงท 6 การเปลยนแปลงแกไขบนแฟมขอมลท 2 เกดขนทงการคอมมทบนกง (การคอมมทครงท 4) และการคอมมทบนล าตน (การคอมมทครงท 5) ดงนนการเปลยนแปลงแกไขบนแฟมขอมลท 2 ทงสองอนนจะตองถกน าไปวเคราะหเชงลกตอไป ถาพบวาเกดความขดแยงขนจะตองมการตดสนความขดแยงนน แตถาไมมการเปลยนแปลงแกไขบนแฟมขอมลท 2 ทงสองอนจะถกผสานเขาดวยกน (Junqueira et al., 2008)
เทคนคและขนตอนวธในการตอกง การผสานกง และการเปรยบเทยบความแตกตางระดบบรรทดของแตละซอฟตแวรควบคมการเปลยนแปลงแกไขนน มเทคนคและขนตอนวธทแตกตางกนออกไปตามซอฟตแวรควบคมการเปลยนแปลงแกไข ซงจะไมกลาวถงในทน
2.6.2 ซอฟตแวรควบคมการเปลยนแปลงแกไข (Revision Control Software, Version Control Software)
ซอฟตแวรควบคมการเปลยนแปลงแกไข (Revision Control Software, Version Control Software) คอ ซอฟตแวรทน าแนวคดของการควบคมการเปลยนแปลงแกไขมาประยกตใชจรงในอตสาหกรรมการพฒนาซอฟตแวร ซอฟตแวรควบคมการเปลยนแปลงแกไขคอซอฟตแวรทใชใน
56
จดการการจดเกบ การคนคน การระบและการผสานการเปลยนแปลงแกไขแฟมขอมลซอรสโคดของโปรแกรมประยกต และสารสนเทศส าคญอนๆทพฒนาขนมาโดยทมอยางเปนอตโนมต ในซอฟตแวรควบคมการเปลยนแปลงแกไขนนจะมการบนทกแฟมขอมลซอรสโคดทงโครงการเอาไว นอกจากนนขอมลทเกยวของกบการเปลยนแปลงแกไขอนๆ อาทเชน ซอรสโคดสวนใดทถกแกไข นกพฒนาผบนทกเวอรชนใหมของซอรสโคด วนเวลาบนทกเวอรชนใหมของซอรสโคด และหมายเหตของการบนทกเวอรชนใหมของซอรสโคดนนจะถกบนทกอยในรปของแฟมขอมลบนทก (Log Files) แฟมขอมลบนทกเหลานถกแกไขใหมทกครงทมนกพฒนาท าการคอมมท แฟมขอมลซอรสโคดแตละเวอรชนในอดตและแฟมขอมลบนทกทงหมดจะถกเรยกรวมกนวา ซอฟตแวรอารไคฟว (Software Archives) (Zimmermann et al., 2004; Zimmermann et al., 2005)
ซอฟตแวรแรกทไดประยกตแนวคดของการควบคมการเปลยนแปลงแกไขขนมาจรง คอ ระบบควบคมซอรสโคด (SCCS: Source Code Control System) ซงถกแนะน าขนมาและออกจ าหนายครงแรกในป ค.ศ. 1972 โดยแบลแลบส (Bell Labs) (Rochkind et al., 1975) ในชวงแรกนนระบบควบคมซอรสโคดถกน าไปใชอยเพยงแคในวงจ ากดและไมคอยไดรบความนยมมากเทาไร (Baudis, 2009) หลงจากนนในป ค.ศ. 1985 เปนปแรกทระบบควบคมการเปลยนแปลงแกไข (RCS: Revision Control System) ไดถกเผยแพรออกมาและสามารถน าไปใชไดโดยไมเสยคาใชจาย (Tichy, 1985) หลงจากทถกเผยแพรไดไมนานระบบควบคมการเปลยนแปลงแกไขไดประสบความส าเรจอยางมากในอตสาหกรรมพฒนาซอฟตแวร (Baudis, 2009) ถงแมวาในปจจบนระบบควบคมการเปลยนแปลงแกไขจะไมไดมววฒนาการใดๆเพมขนมาและไมไดถกน าไปใชแลวแตระบบควบคมการเปลยนแปลงแกไขยงคงไดรบการกลาวถงอยเรอยๆในฐานะเปนตนแบบของแนวคดและรปแบบแฟมขอมล (File Format) ของซอฟตแวรควบคมการเปลยนแปลงแกไขทด (Baudis, 2009) ตอมาในป ค.ศ. 1990 ระบบคอนเคอเรนทเวอรชน (CVS: Concurrent Versions System) ทถกพฒนาขนมาโดยมระบบควบคมการเปลยนแปลงแกไข (RCS, Revision Control System) เปนตนแบบไดถกเผยแพรออกมาและไดรบความนยมอยางมากและรวดเรว นอกจากซอฟตแวรทง 3 ซอฟตแวรในขางตนแลวหลงจากนนในชวงทศวรรษท 1990 กมซอฟตแวรทประยกตแนวคดของการควบคมการเปลยนแปลงแกไขเกดขนมาอกอยางมากมาย ทงทเปนซอฟตแวรเชงพาณชย (Commercial Software) และซอฟตแวรเสร (Free/Open Source Software) ตวอยางซอฟตแวรควบคมการเปลยนแปลงแกไขเชงพาณชยเชน ClearCase (ป ค.ศ. 1992), Visual SourceSafe (ป ค.ศ. 1994), Perforce (ป ค.ศ. 1995) และ Code Co-op
57
(ป ค.ศ. 1997) ตวอยางซอฟตแวรควบคมการเปลยนแปลงแกไขทเปนซอฟตแวรเสรเชน CVSNT (ป ค.ศ. 1998) และ Subversion (ป ค.ศ. 2000)
เนองจากงานวจยนสนใจศกษาขอมลซอฟตแวรอารไคฟวทไดจากระบบคอนเคอเรนทเวอรชนดงนนผวจยจงเรยบเรยงรายละเอยดเกยวกบระบบคอนเคอเรนทเวอรชนรวมถงขอมลซอฟตแวรอารไคฟวของระบบคอนเคอเรนทเวอรชนไวในหวขอถดไป
2.6.3 ระบบคอนเคอเรนทเวอรชน (Concurrent Versions System, CVS)
ระบบคอนเคอเรนทเวอรชน (Concurrent Versions System, CVS) คอซอฟตแวรควบคมการเปลยนแปลงแกไข (Revision Control Software, Version Control Software) ซอฟตแวรหนงทไดรบความนยมสงสดในปจจบน (O’Sullivan et al., 2009) ระบบคอนเคอเรนทเวอรชนนนถกพฒนาขนมาโดยมระบบควบคมการเปลยนแปลงแกไข (Revision Control System, RCS) เปนตนแบบ และพฒนาขนมาอยางโอเพนซอรส ดงนนระบบคอนเคอเรนทเวอรชนนจงสามารถบรรจลง (download) มาใชไดโดยไมเสยคาใชจาย ความส าคญของระบบคอนเคอเรนทเวอรชนคอระบบคอนเคอเรนทเวอรชนนถกสรางขนมาใหเปนสวนประกอบ (component) ทส าคญสวนประกอบหนงทชวยใหบรรลถงมาตรฐานของการจดการคาองคประกอบของซอฟตแวร (SCM, Software Configuration Management) ซงเปน 1 ใน 6 กลมกระบวนการหลก (Process Area) ในระดบท 2 ของมาตรฐาน CMM (Capability Maturity Model) ได (Grune et al., 2006)
ววฒนาการของระบบคอนเคอเรนทเวอรชนนนเรมตนขนในเดอนกรกฎาคมป ค.ศ. 1986 Grune และคณะไดเรมตนการเผยแพรบางสวนระบบคอนเคอเรนทเวอรชน (Concurrent Versions System, CVS) ในรปแบบของเชลลสครพท (Shell Script) ลงสกลมขาว (News-Group) ทชอวา comp.sources.unix ตอมาในเดอนเมษายนป ค.ศ. 1989 Berliner และ Polk (Berliner et al., 1989) ไดออกแบบและพฒนาระบบคอนเคอเรนทเวอรชนเพมเตมซงเวอรชนของ Berliner นกคอเวอรชนทใชกนอยในปจจบน (Cederqvist, 2006; Grune et al., 2006) จนกระทงวนท 19 พฤศจกายน ป ค.ศ. 1990 ระบบคอนเคอเรนทเวอรชนทสมบรณพรอมใชงานเวอรชนท 1 ไดถกเสนอเขาสมลนธซอฟตแวรเสร (Free Software Foundation) เพอการพฒนาและการเผยแพรตอไป (Grune et al., 2006)
ระบบคอนเคอเรนท เวอรชน เ ปนซอฟตแวรควบคมการเปลยนแปลงแกไข ทใ ชสถาปตยกรรมลกขาย-แมขาย (Client-Server) การท างานหลกของระบบคอนเคอเรนทเวอรชน
58
คอ การเกบประวตการท างานของแฟมขอมลตางๆในโครงการพฒนาซอฟตแวร เพอชวยแกปญหาในการคนหาความแตกตางของซอรสโคดพนฐานเดมกบซอรสโคดทท าการแกไขใหม นกพฒนาสามารถทจะท าการเปลยนแปลงซอรสโคด แกไขขอผดพลาดและรวม (Merge) ซอรสโคดทตนพฒนาอยกบซอรสโคดลาสดของนกพฒนาคนอนๆได ระบบคอนเคอเรนทเวอรชนนนมรปแบบการท างานแบบ 1 รพอสโทร (Repository) แตหลายๆ พนทท างาน (Workspace) ภายใตรปแบบการท างานนนกพฒนาแตละคนสามารถน าซอรสโคดมาพฒนาเพยงงานเดยวหรอหลายๆงานกได เมอแกไขเรยบรอยแลวกท าการรวม (Merge) งานทท าเขาดวยกน และสามารถชวยใหนกพฒนาคนหาไดวาขอผดพลาดเกดขนนน เกดขนทไหนและกระท าโดยใคร โดยปกตแลวการบนทกเวอรชนทกๆเวอรชนของแตละเอกสารเอาไวนนเปนการกระท าทคอนขางสนเปลองเนอทบนทก (Disk) เปนอยางมาก แตระบบคอนเคอเรนทเวอรชนนนมวธการบนทกแตละเวอรชนของเอกสารภายในแฟมขอมลแฟมเดยวดวยวธทมประสทธภาพ นนคอระบบคอนเคอเรนทเวอรชนจะบนทกเฉพาะสวนทแตกตางกนของแตละเวอรชนเอาไวเทานน (Cederqvist, 2006)
เนองจากระบบคอนเคอเรนทเวอรชน (CVS) เปนระบบทถกพฒนาขนมาโดยมระบบควบคมการเปลยนแปลงแกไข (Revision Control System, RCS) เปนตนแบบ รปแบบแฟมขอมล (File Format) ของระบบคอนเคอเรนทเวอรชนจงใชรปแบบเดยวกบระบบควบคมการเปลยนแปลงแกไขทงหมดรวมถงรปแบบของแฟมขอมลบนทก (CVS Log File) ดวย การดงแฟมขอมลบนทกของโครงการทเกบอยบนรพอสโทรสามารถท าไดโดยการใชค าสง cvs log และแฟมขอมลบนทกจะถกท าส าเนาและสงกลบมายงเครองทใชค าสงน (Fischer et al., 2003) ตวอยางบางสวนของแฟมขอมลบนทกของคอนเคอเรนทเวอรชนแสดงดงรปดานลางน (Fischer et al., 2003)
59
รปท 2-3 แสดงตวอยางแฟมขอมลบนทกของคอนเคอเรนทเวอรชน
แฟมขอมลบนทกของระบบคอนเคอเรนทเวอรชนประกอบดวยหลายสวน (Sections) โดยทแตละสวนจะอธบายถงเวอรชนในอดตของแตละแฟมขอมลทอยในโครงการ (1 สวนตอ 1 แฟมขอมล) สวนแตละสวนจะถกแบงออกจากกนดวยบรรทดของเครองหมายเทากบ (=) ภายในแตละสวนจะประกอบดวยแอททรบวต (Attributes) และคาของแอททรบวตนนๆ แอททรบวตทส าคญและถกน าไปใชในการวเคราะหตางๆ มรายละเอยดดงน (Fischer et al., 2003)
- แอททรบวต RCS file คอ พาธ (Path) ทระบต าแหนงของแฟมขอมลทสมพนธกบสวนนทบนทกอยบนรพอสโทรของระบบคอนเคอเรนทเวอรชน โดยอางองจากต าแหนงราก (Root)
ข อ ง ร พ อ ส โ ท ร จ า ก ร ป ท 2-3 ร ะ บ ว า ส ว น น เ ป น ส ว น ข อ ง แ ฟ ม ข อ ม ล ช อ nsCSSFrameConstructor.cpp ซงมพาธอยท /cvsroot/mozilla/layout/html/style/src/ nsCSSFrameConstructor.cpp
- แอททรบวต symbolic names คอ รายการของคชอแทก (Tag Name) กบหมายเลขการ
เปลยนแปลงแกไข ทนกพฒนาตงชอไวเพอสะดวกในการอางองถง จากรปท 2-3 ระบวาแฟมขอมลชอ nsCSSFrameConstructor.cpp ถกตงชอแทกไวหลายชอ ตวอยางเชนแทกชอ MOZILLA_1_3a_RELEASE คกบหมายเลขการเปลยนแปลงแกไขท 1.800
60
- แอททรบวต description คอ รายการของการเปลยนแปลงแกไขทเกดขนกบแฟมขอมลน เรมตงแตทแฟมขอมลนไดถกลงคอมมทเขาสรพอสโทรจนถงเวอรชนลาสดของแฟมขอมลน นอกจากการเปลยนแปลงแกไขทถกบนทกลงบนล าตนหลก (Main Trunk) แลวทกๆการเปลยนแปลงแกไขทถกบนทกลงบนกง (Branches) กถกบนทกไวในสวนนดวยเชนกน การเปลยนแปลงแกไขแตละการเปลยนแปลงแกไขจะถกแบงออกจากกนดวยบรรทดเครองหมายยตภงค (-) ภายในแตละสวนยอยนอธบายการเปลยนแปลงแกไขทงหมดทเคยเกดขนกบแฟมขอมล ประกอบดวย 1) หมายเลขการเปลยนแปลงแกไข (Revision Number) 2) วนและเวลา (Date) ทคอมมทการเปลยนแปลงแกไขนเขามา 3) นกพฒนา (Author) ทเปนผคอมมท 4) สเตท (Atate) ระบถงสถานภาพในขณะนนของแฟมขอมล มคาทเปนไปได 2 คา คอ Exp หมายถง สถานภาพทดสอบ (Experimental State) และ Dead หมายถง แฟมขอมลถกลบไปแลว 4) บรรทด (Lines) ระบจ านวนบรรทดทถกเพมเขาไป (น าหนาดวยเครองหมายบวก) และจ านวนบรรทดทถกลบออกไป (น าหนาดวยเครองหมายลบ) ของแฟมขอมลส าหรบการคอมมทครงน 5) รายการหมายเลขกง (Branches) คอรายการของหมายเลขการเปลยนแปลงแกไขบนกงทมการเปลยนแปลงแกไขนเปนจดตอกง และ 6) บรรทดสดทายของสวนการเปลยนแปลงแกไขระบขอความหมายเหต (Comment) ทผพฒนาเขยนระบไวในการคอมมท ตวอยางรายการการ
เปลยนแปลงแกไขหนงจากรปท 2-3 คอรายการการเปลยนแปลงแกไขทมหมายเลขการเปลยนแปลงแกไขท 1.804 บนทกวนท 13 ธนวาคม ค.ศ. 2002 เวลา 20 นาฬการ 13 นาท 16 วนาท บนทกโดย [email protected] อยในสถานภาพทดสอบ การเปลยนแปลงแกไขครงนมบรรทดทถกเพมเขาไปจ านวน 15 บรรทด บรรทดทถกลบออกไป 47 บรรทด และ ม ข อความหมายเหตจ ากผ บนทกว า Don't set NS_BLOCK_SPACE_MGR and NS_BLOCK_WARP_SIZE on ...
2.7 การประยกตใชการท าเหมองขอมลดวยเทคนคคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว (Applying Association Rule Discovery in Software Archive)
ในชวงตนของการคดคนและพฒนาแนวคดการท าเหมองขอมลดวยดวยเทคนคการคนหากฎความสมพนธ (Association Rule Mining) นน การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธถกพฒนามาเพอการคนหารปแบบความสมพนธของพฤตกรรมการซอสนคาของลกคา ตวอยางเชนการคนหาวาลกคาทซอหนงสอ ก. มกจะซอหนงสออะไรดวย จากฐานขอมล
61
รายการซอหนงสอขนาดใหญ นอกจากความสามารถในการคนหารปแบบความสมพนธของพฤตกรรมการซอสนคาของลกคาแลว ตอจากนนมาไมนานนกเรมมนกวจยหลายคณะน าการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธมาประยกตใชกบขอมลในแขนงตางๆ เชน ขอมลเครอขายโทรคมนาคม ขอมลการจดการความเสยง ขอมลการควบคมคลงสนคา และขอมลทางพนธกรรมของสงมชวต เปนตน (Kotsiantis et al., 2006) นอกจากนนการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธยงสามารถประยกตใชกบขอมลซอฟตแวรอารไคฟว (Software Archive) ของขนตอนการพฒนาซอฟตแวรในวงจรชวตการพฒนาซอฟตแวรไดอกดวย คณะนกวจยตางๆน าขอมลซอฟตแวรอารไคฟวมาวเคราะหในหลากหลายรปแบบตางๆกน เชน การวเคราะหเพอท าความเขาใจพฒนาการของการพฒนาซอฟตแวร (Software Evolution) (Ball et al., 1997) การวเคราะหเพอดกจบพฒนาการของการเชอมโยงกน (Evolution Coupling) ระหวางคลาส (Bieman et al., 2003) หรอระหวางไฟล (Gall et al.,1998; Burch et al., 2005) ตางๆในระหวางการพฒนาโปรแกรม การวเคราะหเพอดกจบพฒนาการของการเกดขนตอกนระหวางไฟลพรอมระบล าดบการเปลยนแปลง (Burch et al., 2005) การวเคราะหเพอดกจบพฒนาการของการเกดขนตอกนอยางละเอยดระหวางสวนยอยภายในโปรแกรม (Program Entities) อยางเชน ระหวางฟงกชนหรอระหวางตวแปร (ซงจดวาละเอยดกวาการพจารณาเพยงแคระดบระหวางคลาสหรอระหวางไฟล) (Zimmermann et al., 2004) การวเคราะหเพอคนหารปแบบการเรยกใชซอฟตแวรไลบราร (Software Libraries) ทถกตองเพอการน ารปแบบเหลานนกลบมาใชใหม (Michail, 2000) และรปแบบการเรยกใชซอฟตแวรไลบรารทผดและน าไปสการเกดขอผดพลาดได (Li et al., 2005; Livshits et al., 2005; Williams et al., 2005) งานวจยในอดตเหลานแสดงใหเหนถงประโยชนของการท าเหมองขอมลดวยกฎความสมพนธกบขอมลซอฟตแวรอารไคฟว ซงมสวนชวยในการท างานรวมกนของนกพฒนาซอฟตแวรระหวางขนตอนการพฒนาซอฟตแวรในวงจรชวตการพฒนาซอฟตแวรเปนอยางมาก ประโยชนของการท าเหมองขอมลดงกลาวไดแก 1) แนะน าและคาดการณลวงหนาวานกพฒนาซอฟตแวรควรจะแกไขคลาส ไฟล หรอฟงกชนใดตอไปหลงจากทไดแกไขคลาส ไฟล หรอฟงกชนหนงไปแลว 2) ปองกนการเกดขอผดพลาดจากการแกไขคลาส ไฟล หรอฟงกชนใดอยางไมสมบรณ 3) สามารถดกจบการเกดของการขนตอกนระหวางคลาส ไฟล หรอฟงกชนได โดยเฉพาะอยางยงการขนตอกนทไมสามารถดกจบไดในระหวางขนตอนการวเคราะหและออกแบบซอฟตแวร (Zimmermann et al., 2004)
ในงานวจยนสนใจเฉพาะการประยกตใชการท าเหมองขอมลดวยกฎความสมพนธจากขอมลซอฟตแวรอารไคฟวในขนตอนการพฒนาซอฟตแวร โดยจะเนนเฉพาะความสมพนธในระดบ
62
ทละเอยดทสด นนกคอในระดบความสมพนธระหวางฟงกชนหรอเมธอด รปแบบการเรยกใชฟงกชนหรอเมธอดในคลาส (Function-Call-Usage Pattern) คอเซตหรอบญชรายการของการเรยกใชฟงกชนหรอเมธอดในคลาสทพบอยในซอรสโคดของซอฟตแวร รปแบบการเรยกใชฟงกชนหรอเมธอดในคลาสเหลานมกจะเกดขนมาจากสญชาตญาณและองคความรสามญของนกพฒนาซอฟตแวร รปแบบการเรยกใชฟงกชนหรอเมธอดในคลาสบางรปแบบกเกดขนมาโดยทนกพฒนาซอฟตแวรไมรตว ซงทงหมดนมกจะไมไดถกน ามาจดท าเปนเอกสารอยางเปนทางการและอยนอกเหนอความสามารถของการตรวจหาจดบกพรองของระบบตรวจจดบกพรองภายในซอฟตแวรดวย
ในชวงป 2005 คณะวจยของ Li และคณะวจยของ Livshits (Li et al., 2005; Livshits et al., 2005) ไดท าการประยกตเทคนคการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธในการคนหารปแบบการเรยกใชฟงกชนหรอเมธอดในคลาสของระบบซอฟตแวรขนาดใหญเพอทจะแกไขปญหาดงทกลาวไว งานวจยของคณะวจยทง 2 ไดแสดงใหเหนวาการประยกตเทคนคการท าเหมองขอมลดวยกฎความสมพนธในการคนหารปแบบการเรยกใชฟงกชนหรอเมธอดในคลาสนนเปนเทคนคทคอนขางมประสทธภาพมากแตในบางกรณนนสามารถท าใหเกดผลลพธของการคนหาทเปนผลบวกลวง (False Positive) เปนจ านวนมาก กลาวคอการใชเทคนคดงกลาวอาจกอใหเกดกฎความสมพนธทเปนไปไดออกมาโดยความจรงแลวไมไดมกฎความสมพนธนนอยจรงๆ
นอกจากการนนการใชเทคนคการคนหากฎความสมพนธกยงคงมขอดอยทส าคญในการคนหารปแบบทเรยกใชฟงกชนหรอเมธอดในคลาสกคอ ธรรมชาตการเรยกใชฟงกชนหรอเมธอดในคลาสนนล าดบของการเรยกใชฟงกชนหรอเมธอดในคลาสยอมมความส าคญ เชน เมธอด open() ยอมถกเรยกใชงานกอนเมธอด close() แตการใชเทคนคการคนหากฎความสมพนธไมสามารถบงชถงล าดบได (Huzefa Kagdi et al., 2007)
ตอมาไมนานงานวจยของ Burch และคณะ (Burch et al., 2005) ไดท าการประยกตการท าเหมองขอมลดวยเทคนคการคนหารปแบบล าดบ (Sequential pattern Mining) กบขอมลซอฟตแวรอารไคฟว เพอแกไขขอบกพรองการใชเทคนคคนหากฎความสมพนธ ทไมไดใหความส าคญกบล าดบของการเรยกฟงกชนหรอเมธอดในคลาส ผลลพธทไดจากการใชเทคนคการคนหารปแบบล าดบนนมความแมนย าสงมากและใหผลลพธทเปนผลบวกลวงนอยกวาเทคนคอนๆ แตอยางไรกดการท าเหมองขอมลดวยเทคนคการคนหารปแบบล าดบนนมาพรอมกบคาใชจายในการประมวลผลทสงมาก ดวยเหตน การท าเหมองขอมลเพอคนหารปแบบทมความสมพนธกนใน
63
ขอมลซอฟตแวรอารไคฟวในทางปฏบตนนเหมาะกบการใชเทคนคการคนหากฎความสมพนธมากกวาการใชเทคนคการคนหารปแบบล าดบถงแมวาการใชเทคนคการคนหารปแบบล าดบจะใหผลลพธทแมนย ากวากตาม (Burch et al., 2005)
2.8 ขนตอนวธการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว (Data Mining in Software Archives)
วตถประสงคของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว (Data Mining in Software Archives) นนกคอ การสรางเซตของค าแนะน าในการเปลยนแปลงแกไขใหกบนกพฒนาในระหวางขนตอนการพฒนาซอฟตแวรเมอนกพฒนาไดท าใหเกดเหตการณใดเหตการณหนงเกดขน การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวมขนตอนหลกทงหมด 2 ขนตอน คอ 1) การจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Preparing Data for Mining in Software Archives) และ 2) การท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Data Mining in Software Archives) รายละเอยดของแตละขนตอนอธบายไดดงตอไปน
2.8.1 การจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Preparing Data for Mining in Software Archives)
ในป ค.ศ. 1997 คณะวจยของ Ball เปนคณะวจยแรกทไดเรมท างานวจยเกยวกบขอมลซอฟตแวรอารไคฟวและไดพบวาขอมลซอฟตแวรอารไคฟวซงประกอบดวยแฟมขอมลซอรสโคดและแฟมขอมลบนทกของซอฟตแวรควบคมการเปลยนแปลงแกไขนนสามารถแสดงไดถงพฒนาการของการพฒนาซอฟตแวรหรอระบบนนๆ และยงสามารถแสดงถงการเชอมโยงกนหรอความสมพนธกนระหวาง 2 คลาส (Class) ภายในซอฟตแวรหรอระบบไดดวย นอกจากนนยงแสดงใหเหนถงความสมพนธของสงตางๆ (aspects) ในขนตอนการพฒนาซอฟตแวรทมผลตอการเปลยนแปลงขอมลซอฟตแวรอารไคฟว (Ball et al., 1997)
งานวจยของ Ball และคณะในป ค.ศ. 1997 นถอเปนจดเรมตนแรกใหเกดงานวจยเกยวกบขอมลซอฟตแวรอารไคฟวขนมาอกมากมายในเวลาตอมา ซงสามารถยกตวอยางไดดงตอไปน
64
1) การประยกตใชการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว เพอชวยเหลอการท างานของนกพฒนาซอฟตแวรอาทเชน คาดการณและแนะน านกพฒนาซอฟตแวรวาควรจะตองแกไขซอรสโคดสวนไหนตอไป แสดงการเชอมโยงกนของคลาสทเกดขนในระหวางการพฒนาซงไมสามารถดกจบพบไดในชวงของการออกแบบซอฟตแวร และปองกนไมใหเกดขอผดพลาดทเกดขนจากการแกไขซอรสโคดไมสมบรณ (Zimmermann et al., 2004; Ying et al., 2004; Livshits et al., 2005; Weißgerber et al., 2005; Yu et al., 2007)
2) การประยกตใชการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว เพอคนหารปแบบการเรยกใชซอฟตแวรไลบราร (Software Libraries) ทถกตองเพอการน ารปแบบเหลานนกลบมาใชใหม (Michail, 2000) และคนหารปแบบการเรยกใชซอฟตแวรไลบรารทผดและน าไปสการเกดขอผดพลาดได (Li et al., 2005; Livshits et al., 2005; Williams et al., 2005)
3) การจนตทศนผลของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว เพอแสดงใหนกพฒนาซอฟตแวรเหนถงพฒนาการของการเชอมโยงกน (Evoluation Coupling) ของคลาสทเกดขนในระหวางการพฒนาซอฟตแวร (Burch et al., 2005; Voinea et al., 2005; Voinea et al., 2006; Weissgerber et al., 2007)
การท าเหมองขอมลกบขอมลประเภทตางๆนนจะตองมขนตอนสามญขนตอนหนงทตองท ากอนเปนอนดบแรกเสมอนนกคอขนตอนการจดเตรยมขอมลเพอการท าเหมองขอมล (Preparing Data for Mining) หรอทเรยกวา ขนตอนกอนกระบวนการท าเหมองขอมล (Preprocessing) งานวจยทกงานวจยเกยวกบการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวทกลาวไปในขางตนนนกตองผานการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Preparing Data for Mining in Software Archives) ดวยเชนกน ขนตอนการจดเตรยมขอมลเพอการท าเหมองขอมลนถอเปนขนตอนทมความส าคญมากส าหรบการท าเหมองขอมลในทกๆประเภท เพราะขนตอนการจดเตรยมขอมลเพอการท าเหมองขอมลนนจะสงผลกระทบโดยตรงกบคณภาพของการวเคราะหผลลพธทจะไดมาจากการท าเหมองขอมล
ในหวขอนจะกลาวถงขนตอนส าคญ 4 ขนตอนทจะเกดขนในการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว ทถกเสนอขนมาโดย Zimmermann และคณะ ในป
65
2004 (Zimmermann et al., 2004) และเปนขนตอนวธทมงานวจยทเกยวของกบการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวหลายงายวจย (Zimmermann et al., 2005; Livshits et al., 2005; Williams et al., 2005; Breu et al., 2006; Weißgerber et al, 2006) น าไปใช ขนตอนทง 4 ขนตอนไดแก 1) การสกดขอมล (Data Extraction) 2) การซอมแซมทรานแซคชน (Restoring Transactions) 3) การระบการเปลยนแปลงแกไขในระดบเอนทต (Mapping Changes to Entities) และ 4) การก าจดสงแปลกปลอม (Data Cleaning) แตกอนทจะเรมการอธบายรายละเอยดของการท างานในแตละขนตอนขางตน ผวจยจ าเปนตองนยามค าศพทและสญลกษณทเกยวของกบการอธบายขนตอนการท างานดงตอไปน
เอนทต (Entity) คอ เอกลกษณหรอสงทผ วจยสนใจศกษา ในทนค าวา เอนทต สามารถหมายถง แฟมขอมลเอกสาร คลาส เมธอดหรอฟงกชน และตวแปร นยามใหเอนทต e ถกเขยนอยในรปแบบ (c, i, p) โดยท c คอหมวดหรอประเภทของเอนทตนน (syntactic category) i คอชอของเอนทตนน (identifier) และ p คอเอนทตทเปนเอนทตแมของเอนทตนนหรอใชสญลกษณ … แทนในกรณทเอนทตนนคอเอนทตรากหรอในกรณทตองการละไวในฐานทเขาใจ ตวอยางของเอนทตเชน (method, initDefaults(), (Class, Comp, (file, Comp.java,…))) แสดงถงเมธอดชอ initDefaults() ของคลาส Comp ในแฟมขอมล Comp.java
การเปลยนแปลงแกไข (Changes, Revisions) คอ เหตการณทมนกพฒนาแกไขเอนทตใดๆ ค าวา เปลยนแปลงแกไข ในทนสามารถแสดงได 3 มต คอ 1) การเปลยนแปลงเอนทต (alter) ใชสญลกษณ alter(e) แทนการเปลยนแปลงอะไรบางอยางภายในเอนทต e 2) การเพมลงในเอนทต (add to) ใชสญลกษณ add_to(e) แทนการเพมเอนทตใหมเขาไปในเอนทต e 3) การลบออกจากเอนทต (delete from) ใชสญลกษณ del_from(e) แทนการลบเอนทตใดๆออกจากเอนทต e
ทรานแซคชน (Transaction) คอ เซตของการเปลยนแปลงแกไขทเกดขนพรอมกนและถกคอมมทเขาสระบบ โดยหนงทรานแซคชนใดๆจะเปนของนกพฒนาเพยงคนเดยวเทานน ตวอยางของทรานแซคชนเชน T = {alter(method, initDefaults(), …), alter(field, fKeys[], …), add_to(file, Comp.java, …)} การ
66
เปลยนแปลงแกไขทอยภายในทรานแซคชนบางครงอาจถกเรยกวา รายการ (item)
เหตการณ (Situation) คอเซตของการเปลยนแปลงแกไขใดๆ ใชสญลกษณ Q แทนเหตการณ ตวอยางของเหตการณเชน Q = {alter(method, initDefaults(), …)}
กฎความสมพนธ (Association Rules) ทไดจากการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว คอกฎความสมพนธทตอบขอถามทวา ถานกพฒนาเปลยนแปลงแกไข (เปลยนแปลง เพมลง หรอ ลบออก) เอนทตใดเอนทตหนงแลวนกพฒนาคนนนควรจะตองเปลยนแปลงแกไขอะไรดวย ตวอยางของกฎความสมพนธสามารถเขยนไดดงน {alter(field, fKeys[], …)} {alter(method, initDefaults(), …), alter(file, plug.properties, …)} แทนกฎความสมพนธทวา เมอมการเปลยนแปลงตวแปรชอ fKey[] แลวจะมการเปลยนแปลงเมธอดชอ initDefaults() และการเปลยนแปลงแฟมขอมลชอ plug.properties ดวย
เซตของค าแนะน าส าหรบเหตการณ Q (The Set of Suggestions for Situation Q) คอ เซตของการเปลยนแปลงแกไขทนกพฒนาควรจะท าตามหลงจากทนกพฒนาไดเปลยนแปลงแกไขตามเหตการณ Q โดยอางองมาจากเซตของกฎความสมพนธ R เซตของค าแนะน าส าหรบเหตการณ Q สามารถเขยนเปนสญลกษณไดคอ ⋃ ตวอยางเซตของค าแนะน าส าหรบเหตการณ Q เชน = {alter(method, initDefaults(), …), add_to(file, Comp.java, …)}
เมอไดท าความเขาใจกบนยามและสญลกษณของค าศพทแลว สวนตอไปนคอการอธบายรายละเอยดของการท างานในแตละขนตอนของการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว
2.8.1.1 การสกดขอมล (Data Extraction)
จดประสงคหนงของการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว คอ เพอใหสามารถเขาถงขอมลภายในระบบคอนเคอเรนทเวอรชนไดอยางรวดเรวในขณะท
67
ก าลงท าเหมองขอมล วธการทดทสดทจะบรรลจดประสงคนนไดกคอการส าเนาแฟมขอมลบนทกจากรพอสโทรของระบบคอนเคอเรนทเวอรชน ท าการสกดขอมลจากแฟมขอมลบนทกนน และน ามาบนทกไวบนฐานขอมลของผวจยเอง (Zimmermann et al., 2004)
โดยทวไปแลว ขอมลทจะถกสกดออกมาจะออกมาเปนอยางไรนนจะขนอยกบวามความตองการวเคราะหขอมลอะไร ตวอยางเชน ถามความตองการทจะวเคราะห พฒนาการของซอฟตแวร (Software Evolution) กจะใหความสนใจกบขอมลทกอยางทบนทกเอาไวรวมถงแฟมขอมลทถกลบไปแลวดวย (Zimmermann et al., 2004) แตถามความตองการทจะวเคราะหเพอใหค าแนะน ากบนกพฒนาในการแกไขแฟมขอมลทเกยวของกน กจะใหความสนใจกบขอมลทบนทกเอาไวในปจจบนเทานน (Zimmermann et al., 2004)
การสกดขอมลของระบบคอนเคอเรนทเวอรชนเรมตนจากการเรยกใชค าสง CVS log จากไดเรคทอรราก (Root Directory) ของโครงการพฒนาซอฟตแวรทตองการ ผลลพธทสงกลบคนมากคอแฟมขอมลซอรสโคด (Source Code Files) และแฟมขอมลบนทก (Log File) ของระบบคอนเคอเรนทเวอรชนทบนทกอยบนรพอสโทร แฟมขอมลบนทกทไดมาจะถกน ามาวเคราะหรปแบบไวยากรณ (Parse) และถกน าไปบนทกลงฐานขอมลตามแผนภาพขางลางน (Zimmermann et al., 2004)
รปท 2-4 แสดงการท างานของขนตอนการสกดขอมล (Data Extraction)
68
ขอมลทไดจากการสกดขอมลจากแฟมขอมลบนทกกคอ 1) แฟมขอมล (Files) ทงหมดทอยในโครงการน ทง ทเปนแฟมขอมลซอรสโคดและแฟมขอมลอนๆ ดวย 2) ไดเรคทอร (Directories) ทงหมดทอยในโครงการน 3) การเปลยนแปลงแกไขแฟมขอมล (Revisions) 4) ทรานแซคชนของการเปลยนแปลงแกไข (Transactions) 5) การตงชอแทก (Tags) และ 6) การตอกง (Branches) รายละเ อยดของขนตอนการสกดขอมลสามารถอธบายไดดงตอไปน (Zimmermann et al., 2004)
- แอททรบวต RCS file ของแตละสวน (Sections) ในแฟมขอมลบนทกสามารถสกดขอมลออกมาเปนรายชอและรายละเอยดของแฟมขอมล (Files) และไดเรคทอร (Directories) ทงหมดของโครงการ ตวอยางจากรปขางตนจะได แฟมขอมลชอ IBuffer.java และไดเรคทอร ./org.eclipse.jdt.core/Model/org/eclipse/jdt/core/
- แอททรบวต description ประกอบดวยสวนยอยหลายสวนแตละสวนแสดงถงการเปลยนแปลงแกไขแตละครงทเกดขน ขอมลในแตละสวนยอยนสามารถสกดขอมลออกมาเปนรายการการเปลยนแปลงแกไขแฟมขอมล (Revisions) ได ตวอยางจากรปขางตนจะได รายการการเปลยนแปลงแกไขแฟมขอมลทงหมด 4 รายการ คอ รายการการเปลยนแปลงแกไขหมายเลข 1.15.2.1 1.15 1.16 และ 1.17
- รายการการเปลยนแปลงแกไขแฟมขอมลทไดมาขางตนจะถกน ามาพจารณาวารายการใดบางทเกดขนในเวลาเดยวกนและเกดขนโดยนกพฒนาคนเดยวกนจะถกรวมกนไวเปนทรานแซคชนของการเปลยนแปลงแกไข (Transactions) เดยวกน ตวอยางจากรปขางตนจะไดวามทรานแซคชนทง 4 ทรานแซคชนและแตละทรานแซคชนประกอบดวยรายการการเปลยนแปลงแกไขเพยง 1 รายการ
- แอททรบวต symbolic name ในแตละสวนยอยของแอททรบวต description ในแฟมขอมลบนทกสามารถสกดขอมลออกมาเปนรายชอของแทก (Tags) ทนกพฒนาตงไวใหกบการเปลยนแปลงแกไขนนๆได ตวอยางจากรปขางตนจะไดวาส าหรบแฟมขอมล IBuffer.java มการตงชอแทกทงหมดหลายชอและมชอหนงคอ V_397 ทตงไวใหกบรายการการเปลยนแปลงแกไขหมายเลข 1.16
- การตอกง (Branches) สามารถสกดมาจากรายการการเปลยนแปลงแกไขและชอแทก ตวอยางจากรปขางตน เชน ชอแทก JDK_1_5 ตงใหรายการการเปลยนแปลงแกไขหมายเลข 1.15.0.2 จะไดชอของการตอกงนเปน 1.15.2 สวนจดตอกงนนไดมาจากตารางแฮช (Hash Map) ทใชชอของการตอกงเปนคย
69
2.8.1.2 การซอมแซมทรานแซคชน (Restoring Transactions)
ระบบคอนเคอเรนทเวอรชนโดยทวไปนนจะไมมการบนทกเอาไววาแฟมขอมลใดบางทถกเปลยนแปลงแกไขรวมกนในการคอมมทแตละครง แตวาขอมลการเปลยนแปลงแกไขดงกลาวมความจ าเปนตอการน ามาวเคราะหขอมลซอฟตแวรอารไคฟว (Zimmermann et al., 2004; Gall et al., 2003) วธการใหไดมาซงขอมลการเปลยนแปลงแกไขทเกดรวมกนในแตละการคอมมทกคอ การเขาไปอานขอมลทถกบนทกเอาไวในแฟมขอมลบนทก (Log File) บนเครองแมขายของระบบคอนเคอเรนทเวอรชนวามขอความบนทก (Log Message) ใดบางทระบการเปลยนแปลงแกไขทงหมดทเกดจากนกพฒนาคนเดยวกนและเกดขนในเวลาเดยวกน ขอมลการเปลยนแปลงแกไขทเกดจากนกพฒนาคนเดยวกนและเกดขนในเวลาเดยวกนจะถกน ามาเปลยนเปนทรานแซคชน 1 ทรานแซคชนแลวบนทกลงในตาราง Transactions บนฐานขอมล ค าวา ในเวลาเดยวกน ในทนนนหมายรวมถงในเวลาทใกลเคยงกนดวย เนองจากการคอมมทในแตละครงอาจใชเวลาในการด าเนนการหลายวนาทหรอหลายนาท โดยเฉพาะอยางยงการคอมมททละหลายๆแฟมขอมล (Zimmermann et al., 2004) ดงนนในแตทางปฏบตแลวนอกจากการพจารณาทการคอมมทในเวลาเดยวกนแลวยงตองมวธการพจารณาทการคอมมทระหวางชวงของเวลา (Time Interval) เดยวกนดวย วธการพจารณาการเปลยนแปลงแกไขระหวางชวงของเวลานนม 2 วธคอ
1) วธก าหนดกรอบเวลาทแนนอน (Fixed Time Windows) คอ การก าหนดกรอบของชวงเวลามากสดทจะพจารณาวาการเปลยนแปลงแกไขดงกลาวนนอยภายในทรานแซคชนเดยวกนหรอไม โดยก าหนดใหกรอบของชวงเวลาจะเรมตนขนใหมเมอมการเปลยนแปลงแกไขใหมเกดขนครงแรกและกรอบจะคงทเชนนจนจบการพจารณา การเปลยนแปลงแกไขใดทอยในกรอบนทงหมดจะถกพจารณาวาอยในทรานแซคชนเดยวกน วธนเปนวธทงายและสะดวกในการน าไปประยกตใช วธการพจารณาทการเปลยนแปลงแกไขระหวางชวงของเวลาเดยวโดยก าหนดกรอบเวลาทแนนอนถกน าไปใชในงานวจยของ Ubranic´ และคณะ (Ubranic´ et al., 2003) และในงานวจยของ Gall และคณะในป ค.ศ. 2003 (Gall et al., 2003)
2) วธเลอนกรอบเวลา (Sliding Time Windows) คอ การก าหนดชองวางระหวางการเปลยนแปลงแกไข 2 ครงทมากทสด จดเรมตนของกรอบของชวงเวลาจะถกเลอนไปทการเปลยนแปลงแกไขครงตอไปเสมอตราบใดทการเปลยนแปลงแกไขครงตอไปนนม
70
จดเรมตนอยภายในกรอบเวลาของการเปลยนแปลงแกไขครงกอนหนา ดงนนการพจารณาดวยวธเลอนกรอบเวลานจะสามารถรจ า (Recognize) การคอมมททใชระยะเวลาในการด าเนนการนานกวาจะสมบรณไดดกวาการพจารณาดวยวธก าหนดกรอบเวลาทแนนอน วธเลอนกรอบเวลานมตนก าเนดมาจากโปรแกรมประยกตทมชอวา cvs2cl (http://www.red-bean.com/cvs2cl) และ CVSps (http://www.cobite.com/cvsps) (Zimmermann et al., 2004)
รปท 2-5 แสดงการพจารณาชวงเวลาของการคอมมทดวยวธก าหนดกรอบเวลาทแนนอนและวธเลอนกรอบเวลา
รปท 2-5 แสดงการพจารณาชวงเวลาของการคอมมทดวยวธก าหนดกรอบเวลาทแนนอนและวธเลอนกรอบเวลา (Zimmermann et al., 2004) สวน (a) แสดงการพจารณาดวยวธก าหนดกรอบเวลาทแนนอน บรเวณสขาวเปนบรเวณทอยภายในกรอบเวลาทก าหนดเอาไวแนนอน ดงนนการแกไขเปลยนแปลงทแฟมขอมล A เวอรชนท 1.3 แฟมขอมล B เวอรชนท 1.2 และแฟมขอมล C เวอรชนท 1.4 จะถกพจารณาวาเกดขนพรอมกนและอยภายในทรานแซคชนเดยวกน รปท 2-5 สวน (b) แสดงการพจารณาดวยวธเลอนกรอบเวลา โดยเรมตนกรอบเวลาทมชวงแนนอนเรมตนทจดการแกไขเปลยนแปลงทแฟมขอมล A เวอรชนท 1.3 และกรอบเวลาถกเลอนไปเรอยๆ จนสนสดดงรป ดงนนการแกไขเปลยนแปลงทแฟมขอมล A เวอรชนท 1.3 แฟมขอมล B เวอรชนท 1.2 แฟมขอมล C เวอรชนท 1.4 แฟมขอมล D เวอรชนท 1.3 และ แฟมขอมล E เวอรชนท 1.5 จะถกพจารณาวาเกดขนพรอมกนและอยภายในทรานแซคชนเดยวกน
โดยปกต การใชวธเลอนกรอบเวลาส าหรบทกการเปลยนแปลงแกไข α1, α2, …, αk (เรยงตามล าดบเวลาทบนทก (time(αi)) ) ทเปนสวนหนงของทรานแซคชน T เดยวกนนน จะตองอยภายใตเงอนไข
71
{ }
นอกจากนนการเปลยนแปลงแกไขเวอรชนของแตละแฟมขอมลจะปรากฏอยบน 1 ทรานแซคชนไดเพยงครงเดยว เนองจากระบบคอนเคอเรนทเวอรชนไมอนญาตใหมการคอมมทการเปลยนแปลงเวอรชนของแฟมขอมลเดยวกน 2 ครงในเวลาเดยวกนได ดงนนจงมเงอนไขเพมอก 1 ขอดงน
ขนตอนวธในการรวมกลม (grouping) การเปลยนแปลงแกไขเวอรชนของแตละแฟมขอมลใหมาเปนทรานแซคชนนน เปนขนตอนวธทเรยบงายและตรงไปตรงมา ดงน (Zimmermann et al., 2004)
1) เรยงล าดบการเปลยนแปลงแกไขเวอรชนของแตละแฟมขอมลตาม เวลา ชอของนกพฒนาทท าการเปลยนแปลง และขอความในแฟมขอมลบนทก (log messager)
2) เรมตนทรานแซคชนท i โดยวนซ าพจารณาแตละ การเปลยนแปลงแกไขเวอรชนของแตละแฟมขอมล ถากรอบเวลาของทรานแซคชนปจจบนจบลง หรอ ชอนกพฒนา เวลา และ/หรอ ขอความในแฟมขอมลบนทกของการเปลยนแปลงแกไขเวอรชนของแฟมขอมลท i แตกตางจากชอนกพฒนา เวลา และ/หรอ ขอความในแฟมขอมลบนทกของการเปลยนแปลงแกไขเวอรชนของแฟมขอมลท i-1 แลว ถอเปนการสนสดทรานแซคชนท i
3) วนซ าขอ 2 ไปจนกวาจะหมดขอมลเปลยนแปลงแกไขเวอรชนของแตละแฟมขอมล
งานวจยของ Zimmermann และคณะในป ค.ศ. 2004 (Zimmermann et al., 2004) งานวจยของ Livshits และคณะในป ค.ศ. 2005 (Livshits et al., 2005) งานวจยของ Weißgerber และคณะในป ค.ศ. 2005 (Weißgerber et al., 2005) และป ค.ศ. 2007 (Weißgerber et al., 2007) เลอกพจารณาการเปลยนแปลงแกไขเวอรชนระหวางชวงของเวลาดวยวธเลอนกรอบเวลา และก าหนดชวงของกรอบเวลาอยท 200 วนาท
72
2.8.1.3 การระบการเปลยนแปลงแกไขในระดบเอนทต (Mapping Changes to Entities)
ขอมลทถกจดเกบไวในรพอสโทรของระบบคอนเคอเรนทเวอรชนนนมเพยงขอมลแฟมขอมลทกแฟมขอมลในโครงการและขอมลการเปลยนแปลงแกไขในระดบแฟมขอมล (File) หรอคลาส (Class) ทเกบอยในรปของแฟมขอมลบนทก (Log File) เทานน แตไมมบนทกวาการเปลยนแปลงแกไขทเกดขนนนเกดขนกบฟงกชน (Function) หรอ เมธอด (Method) ใดบาง มตวแปร (Variable) ใดถกเพมเขามา แกไข หรอถกลบออกไปบาง (Zimmermann et al., 2004)
การเปรยบเทยบความแตกตางอยางละเอยดถงในระดบตวแปร และ ฟงกชน หรอ เมธอดนมวธการหลายวธ วธการอยางงายๆกคอการเปรยบเทยบในระดบแฟมขอมล โดยการประยกตใชฟงกชนดฟฟ (diff) (Miller et al., 1985) กบแตละบรรทดของซอรสโคดระหวางแฟมขอมลของเวอรชนเกากบแฟมขอมลเวอรชนใหม ผลลพธทไดคอสวนของโคดทมการเปลยนแปลง สวนทมการเพมเขาใหมและสวนทถกลบออกไป วธการนมขอเสยทส าคญอย 2 ประการคอ 1) คณภาพของผลลพธทไดจะขนอยกบคณภาพของฟงกชนดฟฟ (diff) ทน ามาใช 2) วธการนระบความแตกตางไดแคในระดบบรรทดของซอรสโคด ไมสามารถระบ ไ ดวาเ ปนตรงไหนของบรรทดนน (Zimmermann et al., 2004)
วธการทมความแมนย าสงกวาแตกมคาใชจายในการค านวณสงวธหนง คอการก าหนดเอนทต (ตวแปร ฟงกชนหรอเมธอด คลาส แฟมขอมล) ทงหมดภายในแฟมขอมลทง 2 เวอรชนโดยการน าไปผานตววเคราะหไวยากรณ (Parser) จากนนกท าการเปรยบเทยบซอรสโคดของเอนทต เดยวกนใน 2 เวอรชน หรอกลาวคอเปนการประยกตใชฟงกชนดฟฟ (diff) ในระดบของเอนทต นนเอง วธการนสามารถด าเนนการไดดงตอไปน (Zimmermann et al., 2004)
1) ก าหนดเซต E1 คอเซตของเอนทตทมอยทงหมดในเวอรชน r1 ของแฟมขอมล และก าหนดเซต E2 คอเซตของเอนทตทมอยทงหมดในเวอรชน r2 ของแฟมขอมลเดยวกน
2) เอนทตทถกเพมเขามาใหมสามารถหาไดจาก E2 - E1 3) เอนทตทถกลบออกไปสามารถหาไดจาก E1 - E2 4) ทกๆเอนทตทอยในเซต E1 E2 อาจจะเปนเอนทตทมการเปลยนแปลงภายใน การตดสน
วาเอนทตใดบางทมการเปลยนแปลงแกไขสามารถท าไดโดยการประยกตใชฟงกชนดฟฟ (diff) กบซอรสโคดของเอนทตนนๆของทง 2 เวอรชน
73
ภายในแพลตฟอรม (Platform) ของอคลพซ (Eclipse) นนมการจดเตรยมโครงราง (Framework) ส าหรบการเปรยบเทยบความแตกตางระหวาง 2 ซอรสโคดใดๆทมประสทธภาพสงและสามารถน าไปประยกตเพมเตมได วธการทง 2 วธการทไดกลาวไปขางตนนนสามารถน ามาประยกตใชจรงไดโดยเรยกใช 2 โครงรางดงตอไปน (Zimmermann et al., 2004)
1) โครงรางเรนจดฟเฟอรเรนเซอร (Range Differencer) คลาสเรนจดฟเฟอรเรนเซอร (RangeDifferencer Class) ท าการเปรยบเทยบความแตกตางของแฟมขอมล 2 เวอรชนโดยใชโทเคน (Token) เปนฐาน วธการนอางองวธการในการเปรยบเทยบมาจากขนตอนวธดฟฟ (diff Algorithm) ดงเดมของ Miller และ Myers (Miller et al., 1985) โทเคนแตละโทเคนจะถกสรางขนมาโดยคลาสทมการอมพลเมนต (Implementing) อนเตอรเฟส (Interface) ชอวา ไอโทเคนคอมพาราเตอร (ITokenComparator interface) ตวอยางคลาสทมการอมพลเมนตโทเคนคอมพาราเตอร คอ คลาสดอคไลนคอมพาราเตอร (DocLineComparator Class) ทสามารถค านวณความแตกตางของแตละบรรทดในคลาสไดและใหผลลพธออกมาเปนรายการ (List object) ของบรรทดทแตกตางกนระหวาง 2 เวอรชนของแฟมขอมลทน ามาเปรยบเทยบกน
2) โครงรางสตรคเชอรเมรจววเวอร (Structure Merge Viewer) คลาสดฟเฟอรเรนเซอร (Differrencer Class) ท าการเปรยบเทยบความแตกตางของแฟมขอมล 2 เวอรชนโดยใชโครงสรางล าดบขน (hierarchical Structure) เปนฐาน ผลลพธทไดจากการเปรยบเทยบคอตนไมทอธบายการความแตกตางระหวาง 2 เวอรชนของแฟมขอมลอยางละเอยด โครงสรางล าดบขนแตละโครงสรางทเปนตวแทนของแฟมขอมลนนๆจะถกสรางขนมาโดยคลาสทมการอมพลเมนตอนเตอรเฟสชอวาไอสตรคเชอรครเอเตอร (IStructureCreator Interface) แตถาไมตองการสรางคลาสทมการอมพลเมนตอนเตอรเฟสไอสตรคเชอรครเอเตอร มาใชเองกสามารถใชคลาสจาวาสตรคเชอรครเอเตอร (JavaStructureCreator Class) ทแพลตฟอรมอคลพซจดเตรยมไวใหแลวส าหรบการสรางโครงสรางล าดบขนของคลาสแฟมขอมลภาษาจาวา (Java)
74
2.8.1.4 การก าจดสงแปลกปลอม (Data Cleaning)
ในหวขอกอนหนานอธบายถงการสกดขอมล การซอมแซมทรานแซคชน และการแปลงการเปลยนแปลงแกไขไปสระดบเอนทต ซงผลลพธทไดมานนยงมสงแปลกปลอม (Noise) ปะปนมาดวย ขนตอนการก าจดสงแปลกปลอม (Data Cleaning) เปนขนตอนทเขาไปตรวจสอบขอมลทงหมดเพอคนหาสงแปลกปลอมและก าจดสงแปลกปลอมเหลานนออกไป ลกษณะของขอมลทรานแซคชนทจะถกระบวาเปนสงแปลกปลอมมอย 2 ลกษณะคอ 1) ทรานแซคชนขนาดใหญ (Large Transactions) และ 2) ทรานแซคชนการผสานกง (Merge Transactions) รายละเอยดของสงแปลกปลอมและวธการในการก าจดสงแปลกปลอมทง 2 ลกษณะนสามารถอธบายไดดงตอไปน (Zimmermann et al., 2004)
ทรานแซคชนขนาดใหญ (Large Transactions)
ทรานแซคชนขนาดใหญเปนเหตการณปกตทสามารถเกดขนไดจรงกบขอมลจรงในทกประเภท ขอมลทไดจากระบบคอนเคอเรนทเวอรชนนนอาจมขอมลทไมเกยวกบของกบการน าไปวเคราะหมาปะปนอยดวย ขอมลทไมเ กยวของกบการว เคราะหอาท ขอความทระบการเปลยนแปลงแกไขแฟมขอมลทเปนการแกไขโครงสรางภายในของแตละแฟมขอมลเองทเกดขนตอเนองกนแตไมไดมความสมพนธเชงตรรกะระหวางแฟมขอมลเหลานน เชน ขอความ “Chage #include filenames from <foo.h> [sign] to <openssl.h>.” ทปรากฎตอเนองกน 552 ครงส าหรบการแกไขแฟมขอมล 552 แฟมขอมล ขอความลกษณะดงกลาวจะถกระบวาเปนสงแปลกปลอมทอาจสงผลใหผลลพธของการวเคราะหผดพลาดได วธก าจดสงแปลกปลอมลกษณะน ท าไดโดยการกรอง (filter out) ทรานแซคชนทมขนาดใหญเกนกวาคา N ทก าหนดไวออก
ทรานแซคชนการผสานกง (Merge Transactions)
ในระหวางทนกพฒนาก าลงพฒนาซอฟตแวรดวยระบบคอนเคอเรนทเวอรชนอยนนอาจมการสรางกง (Branches) ของเวอรชนขนมาหลากหลายกง กงเหลานนบางกงอาจจะถกผสานกง (Merge) เขากบล าตนเวอรชนหลกในอนาคต แตบางกงของเวอรชนกถกปลอยทงเอาไว
75
รปท 2-6 แสดงตวอยางการตอกงและผสานกง
รปท 2-6 แสดงตวอยางการตอกงและการผสานกงอยางงายในระบบคอนเคอเรนทเวอรชน กงทตอออกมานนประกอบดวยการคอมมททงหมด 4 ทรานแซคชน ไดแก ทรานแซคชน {A, B} ทรานแซคชน {C, D} ทรานแซคชน {E, F} และทรานแซคชน {G, H} แฟมขอมล A B C D E F G และ H เหลานจะถกเปลยนแปลงแกไขอกครงตอนทมการผสานกงเขากบล าตนเกดเปนทรานแซคชน {A, B, C, D, E, F, G, H} ทจดผสาน (Merge Point) และเรยกทรานแซคชน {A, B, C, D, E, F, G, H} วา ทรานแซคชนการผสานกง
ทรานแซคชนการผสานกงถกระบวาเปนสงแปลกปลอมดวยสาเหตส าคญ 2 สาเหตคอ 1) ทรานแซคชนการผสานกงเปนทรานแซคชนทประกอบดวยการเปลยนแปลงแกไขแฟมขอมลทไมมความสมพนธเกยวของกนอยางแทจรง ตวอยางเชน ทรานแซคชนการผสานกงขางตนมการเปลยนแปลงแกไขแฟมขอมล B และการเปลยนแปลงแกไขแฟมขอมล C อยภายใน ซงในความเปนจรงทง 2 แฟมขอมลไมมความสมพนธเกยวของกน 2) ทรานแซคชนการผสานกงถกสรางมาจากการน าการเปลยนแปลงแกไขทมทงหมดบนกงนนมาเรยงตอกน ดงนนทรานแซคชนการผสานกงจงเปนทรานแซคชนทมความซ าซอนกบทรานแซคชนอนทมอยบนกงนนอยแลว
จากเหตผลทง 2 ขอขางตน การน าทรานแซคชนการผสานกงไปใชในการท าเหมองขอมลดวย อาจท าใหผลลพธทไดจากการท าเหมองขอมลผดพลาดได ดงนนทรานแซคชนการผสานกงทจะเกดขนทกครงทมการผสานกงเกดขนจะตองถกคนหาใหพบและก าจดออก
2.8.2 การท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Data Mining in Software Archives)
หลงจากทขอมลการเปลยนแปลงแกไขภายในรพอสโทรของระบบคอนเคอเรนทเวอรชนไดถกน ามาด าเนนการตามขนตอนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวร
76
อารไคฟวทกลาวไปขางตนและไดผลลพธของการด าเนนการออกมาเปนขอมลรายการทรานแซคชนแลว ขอมลรายการทรานแซคชนเหลานนจะถกน ามาเปนขอมลเขาส าหรบการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Data Mining in Software Archives) ผลลพธหรอขอมลออกทไดจากการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวกคอ กฎความสมพนธทสามารถตอบขอถามทวา ถานกพฒนาเปลยนแปลงแกไข (เปลยนแปลง เพมลง หรอ ลบออก) เอนทตใดเอนทตหนงแลวนกพฒนาคนนนควรจะตองเปลยนแปลงแกไขอะไรดวย ตวอยางเชน
{alter(field, fKeys[], …)} {alter(method, initDefaults(), …), alter(file, plug.properties, …)}
กฎความสมพนธในขางตนนนหมายความวา เมอไรกตามทนกพฒนามการเปลยนแปลงอะไรบางอยางกบตวแปรชอ fkey[] แลวนกพฒนาควรจะตองไปเปลยนแปลงแกไขอะไรบางอยางใน เมธอดชอ initDefaults() และเปลยนแปลงแกไขอะไรบางอยางในแฟมขอมลชอ plug.properties
โดยทวไปแลว กฎความสมพนธ r จะอยในรปของค (x1, x2) โดยทเซตรายการ x1 และ x2 ไมมสวนซอนทบกน (disjoint) หรออยในรปของ x1 x2 ซง x1 จะถกเรยกวาเซตรายการทมากอน (Antecedent Itemset) และ x2 จะถกเรยกวาเซตรายการทตามมา (Consequent Itemset) กฎความสมพนธแตละกฎนนถกสราง (derived) ขนมาจากการพจารณาความนาจะเปนจากทรานแซคชนทเกดขนจรงในอดต วธทนยมน ามาใชในการประเมนความนาสนใจของแตละกฎความสมพนธคอการพจารณาคาสนบสนน (Support) และคาความเชอมน (Confidence) ของกฎความสมพนธ แตส าหรบการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวนนจะใชวธการประเมนความนาสนใจของแตละกฎความสมพนธโดยการพจารณาทคาสนบสนนนบ (Support Count) และคาความเชอมน (Confidence) ของกฎความสมพนธ (Zimmermann et al., 2005) นยามของคาสนบสนนนบ และคาความเชอมน ของกฎความสมพนธส าหรบการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวนน สามารถอธบายไดดงน
คาสนบสนนนบ (Support Count) คอ จ านวนของทรานแซคชนทกฎความสมพนธนนปรากฏอย ตวอยางเชน สมมตใหตวแปร fKey[] เคยปรากฏวาถกเปลยนแปลงแกไขไปทงหมด 11 ทรานแซคชน ภายใน 11 ทรานแซคชนนนม 10 ทรานแซคชนทมการเปลยนแปลงแกไขเมธอด initDefaults() และแฟมขอมล plug.properties ดวย ดงนนคาสนบสนนนบของกฎความสมพนธ {alter(field, fKeys[], …)} {alter(method, initDefaults(), …), alter(file, plug.properties, …)} เทากบ 10 การท าเหมองขอมลกบ
77
ขอมลซอฟตแวรอารไคฟวนนใชคาสนบสนนนบ แทนทการใชคาสนบสนนอยางในการท าเหมองขอมลทวๆไปเพราะสาเหตส าคญ 2 ประการคอ 1) คาสนบสนนนบ สามารถสอสารใหนกพฒนาเขาใจไดดกวาคาสนบสนน กลาวคอ คาสนบสนนนบ เทากบ 10 หมายถงทผานมาในอดตเคยมเหตการณตามกฎความสมพนธเกดขนมาแลวทงหมด 10 ครง แตคาสนบสนน เทากบ 0.000145 นนไมสามารถสอสารอะไรไดเลยถาไมไดบอกขอมลเพมเตมวาจ านวนทรานแซคชนทมอยทงหมดนนเทากบเทาไร 2) คาสนบสนนนบ สามารถถกน าไปใชในการวเคราะหอนๆได ตวอยางเชน นอกจากการใชกฎความสมพนธในการใหค าแนะน านกพฒนาในระหวางการพฒนาแลว กฎความสมพนธสามารถบอกไดถงพฒนาการของการเชอมโยงกนระหวางแฟมขอมล (Evoluation Coupling) ได ในการระบพฒนาการของการเชอมโยงกนระหวางแฟมขอมลนนใชแคเพยงคาสนบสนนนบกสามารถระบได เพราะจ านวนทรานแซคชนทงหมดมผลตอการระบพฒนาการของการเชอมโยงกนระหวางแฟมขอมลนอยมาก (Zimmermann et al., 2005)
คาความเชอมน (Confidence) คอ คาความนาจะเปนทจะพบกฎความสมพนธในทรานแซคชนทม เซตรายการทมากอนอย จากตวอยางขางตนคาความเชอมนของกฎความสมพนธ {alter(field, fKeys[], …)} {alter(method, initDefaults(), …), alter(file, plug.properties, …)} เทากบ 10/11 = 0.909
นยามการเขยนกฎความสมพนธพรอมระบคาสนบสนนนบ และคาความเชอมน ในรปสญลกษณดงน r [s;c] โดยท r แทนกฎความสมพนธ s แทนคาสนบสนนนบของกฎความสมพนธนน และ c แทนคาความเชอมนของกฎความสมพนธนน ตวอยางเชน {alter(field, fKeys[], …)} {alter(method, initDefaults(), …)} [4;0.57]
สมมตใหนกพฒนามการเปลยนแปลงแกไขบางอยางลงไป ท าใหเกดเซตรายการของการเปลยนแปลงแกไขขนมา นยามเซตรายการของการเปลยนแปลงแกไขดงกลาววาเปนเซตเหตการณ (Situation) และใชสญลกษณ Q แทนเหตการณ เซตเหตการณจะถกปรบปรง (Update) ทกครงทนกพฒนาท าการบนทกการเปลยนแปลงแกไขลงสเครองลกขายของนกพฒนาเอง เมอนกพฒนามนใจในเวอรชนใหมของแตละแฟมขอมลทนกพฒนาแกไขไปแลวท าการคอมมทเพอบนทกการเปลยนแปลงแกไขทงหมดลงสรพอสโทรของระบบคอนเคอเรนทเวอรชน เซตเหตการณสดทายกจะถกเพมเขาไปฐานขอมลทรานแซคชน ตวอยางของเซตเหตการณเชน
Q = {alter(field, fKeys[], …)}
78
สมการขางตนแสดงเซตเหตการณทประกอบดวย 1 รายการการเปลยนแปลงแกไข ระบวานกพฒนาไดท าการเปลยนแปลงเอนทตระดบตวแปรชอ fKey[] ในแฟมขอมล ComparePerferencePage.java (ในสมการขางตนละการเขยนถงเอนท ตแฟมขอมล ComparePerferencePage.java เอาไวโดยแทนทดวย … เพอความสะดวกในการเขยน)
จดมงหมายในการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวของงานวจยนคอ การใหค าแนะน านกพฒนาวาควรจะเปลยนแปลงแกไขทใดตอไปเมอนกพฒนาท าใหเกดเหตการณนนๆขน ในหวขอตอไปนจะอธบายถงขนตอนวธในการสรางกฎความสมพนธจากการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว และอธบายการสรางค าแนะน าจากกฎความสมพนธทไดมา
2.8.2.1 การสรางกฎความสมพนธจากการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว
ขนตอนวธในการสรางกฎความสมพนธทไดรบความนยมมากทสดกคอ ขนตอนวธอพรโอร (Apriori algorithm) ทถกน าเสนอโดย Agrawal และ Srikant ในป ค.ศ. 1994 (Agrawal and Srikant, 1994) ขนตอนวธอพรโอรนนจ าเปนตองระบคาสนบสนนขนต า (Minimum Support) (ส าหรบงานวจยนเปนคาสนบสนนนบขนต า (Minimum Support Count) แทน) และคาความเชอมนขนต า (Minimum Confidence) เพอใชในการค านวณผลลพธของขนตอนวธอพรโอรคอเซตของกฎความสมพนธทงหมดทมคาสนบสนนนบมากกวาคาสนบสนนนบขนต าและมคาความเชอมนมากกวาคาความเชอมนขนต า
การน าขนตอนวธอพรโอรมาประยกตใชกบการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวโดยค านวณหากฎความสมพนธทงหมดเอาไวกอนลวงหนาและสรางค าแนะน าทเหมาะสมกบเหตการณทนกพฒนาสรางขน แตวธการดงกลาวสามารถท าใหเกดปญหาตามมาได เนองจากเหตการณใหมๆทเกดขนหลงจากการสรางกฎความสมพนธเกบไวแลวจะไมไดถกน าไปสรางเปน ทรานแซคชนและน าไปเปนสวนหนงของขอมลทใชในการท าเหมองขอมล ดงนนเมอเวลาผานไปเซตของกฎความสมพนธทสรางเอาไวลวงหนาจะไดถกตองตรงกบความเปนจรง วธทถกตองกคอกฎความสมพนธทงหมดจะตองถกค านวณใหมอยเสมอทกครงทนกพฒนาท าใหเกดเหตการณใหมๆ แตในความเปนจรงการค านวณโดยใชขนตอนวธอพรโอรกบขอมลซอฟตแวรอารไคฟวใชเวลานานมาก (ในกรณโครงการใหญๆและผานระยะเวลาการพฒนามานานๆ ตองใชเวลาในการค านวณหลายวน) ป ค.ศ. 2005 Zimmermann และคณะไดเสนอวธการในปรบปรงขนตอนวธอพร
79
โอรมาเพอใหเหมาะสม (Optimization) กบการท าเหมองขอมลของขอมลซอฟตแวรอารไคฟว โดยการเพมขอก าหนด 2 ขอใหกบขนตอนวธอพรโอร (Zimmermann et al., 2005) ดงน
การคนหากฎความสมพนธเฉพาะกฎทมเซตรายการทมากอนทตองการเทานน กลาวคอการท าเหมองขอมลจะเกดขนในขณะทผพฒนาก าลงท าใหเกดเหตการณขนและคนหาเฉพาะกฎความสมพนธทมเซตทเหตการณ Q ทนกพฒนาพงจะกระท าเปนเซตรายการทมากอนของกฎ (Srikant et al., 1997) การกระท าเชนนท าใหการค านวณทงหมดใชเวลาเพยงเลกนอยเทานน ขอดอกประการหนงของการใชการคนหากฎความสมพนธเฉพาะกฎทม เซตรายการ ทมากอนคอ ว ธการน สามารถกระท า ไ ดแบบเพมข นตอ เ นอง (Incrementally) ได จงท าใหเหตการณใหมๆทพงการจะถกน าไปสรางเปนทรานแซคชนและมผลตอการค านวณหากฎความสมพนธในครงถดไป
การก าหนดใหทกกฎความสมพนธทคนหามเซตรายการทตามมาเพยง 1 รายการเทานน การกระท านท าใหการท าเหมองขอมลเรวขนกวาเดมมาก ดงนนกฎความสมพนธ ทไดหลงจากทนกพฒนากระท าใหเกดเหตการณ Q กคอ Q {e} โดยท e คอสมาชกของเซตรายการทตามมา การก าหนดใหทกกฎความสมพนธทคนหามเซตรายการทตามมาเพยงรายการเดยวนไมไดสงผลกระทบใหผลลพธของค าแนะน าทจะไดนนผดเพลยนไปเพราะถงแมวาเซตของค าแนะน าทไดจะมสมาชกมากกวา 1 รายการแตนกพฒนากสามารถกระท าตามค าแนะน าไดเพยงครงละ 1 รายการอยด หรอการพสจนทางคณตศาสตรดงน ก าหนดให รายการ e x2 ของกฎความสมพนธ Q x2 [s;c] ดงนนยอมมกฎความสมพนธ r ทมเซตรายการทตามมารายการเดยวคอ กฎความสมพนธ Q {e}[sr;cr] ซง sr ≥ s และ cr ≥ c เนองจาก Q U {e} Q U x2 ท าให จ านวนรายการของ Q U {e} ≥ Q U x2
80
2.8.2.2 การสรางค าแนะน าจากกฎความสมพนธ (Generating Suggestions for
Situation)
การสรางเซตของค าแนะน า (Suggestions) จากเซตของกฎความสมพนธ R ส าหรบเหตการณ Q ทนกพฒนากระท าออกมาสามารถนยามใหอยในรปของการยเนยน (Union) ของเซตรายการทตามมาของกฎความสมพนธ R ทมเซตรายการทมากอนตรงกบเซตเหตการณ Q ดงน
⋃ { }
ตวอยางการสรางค าแนะน าจากกฎความสมพนธ {alter(field, fKeys[], …)} {alter(method, initDefaults(), …), alter(file, plug.properties, …)} ส าหรบเหตการณ Q จะท าใหไดผลลพธคอเซตของค าแนะน าคอ {alter(method, initDefaults(), …), alter(file, plug.properties, …)} โดยทค าแนะน าการเปลยนแปลงแกไขทอยภายในเซตของค าแนะน านนจะถกเรยงล าดบตามคาสนบสนนนบ และคาความเชอมน จ านวนของค าแนะน าภายในเซตของค าแนะน านจะขนอยกบการก าหนดคาสนบสนนนบ และคาความเชอมนขนต า โดยปกตแลวมกจะเรมตนก าหนดคาสนบสนนนบขนต าเปน 1 และคาความเชอมนขนต าเปน 0.1
ในงานวจยของ Zimmermann และคณะ (Zimmermann et al., 2005) ไดตงขอสนนษฐานไววา การใหค าแนะน าในการเปลยนแปลงแกไขกบนกพฒนานน ค าแนะน าทจะไดรบความสนใจจากนกพฒนากคอค าแนะน าทอยใน 10 อนดบแรกเทานน ดงนนในการสรางเซตของค าแนะน าจงควรใหความสนใจกฎความสมพนธทอยใน 10 อนดบแรกโดยเรยงจากคาสนบสนนนบและคาความเชอมนเทานน ดงนนผ วจยจงก าหนดสมการในการสรางเซตของค าแนะน าดงแสดงในสมการตอไปน
ก าหนดให q คอ ขอสอบถาม (Query) ทประกอบดวยเซตเหตการณ (Situation) Q และเซตผลลพธทคาดไว (Expected Result) E และเขยนใหอยในรป q = (Q, E)
R คอ เซตของกฎความสมพนธทอยในรปแบบ Q{x} โดยท x คอรายการการเปลยนแปลงแกไข และก าหนดให R10 คอเซตของกฎความสมพนธทมระดบความนาสนใจสงสด 10 กฎแรกซงเรยงล าดบดวยคาความเชอมน โดยท R10 R
Aq คอ เซตของรายการการเปลยนแปลงแกไข x ทไดจากกฎความสมพนธใน
81
เซต R10 ทสอดคลองกบเซตเหตการณ Q ของขอสอบถาม q ซงสามารถเขยนในรป Aq =
ดงนนขนาดของเซต Aq จะนอยกวาหรอเทากบ 10 เสมอ
Aq =
สมมตวาเมอนกพฒนาเหนเซตของค าแนะน าแลว นกพฒนาจะตดสนใจด าเนนการเปลยนแปลงแกไขตามค าแนะน าแรกเสมอ (ค าแนะน าทมคาความเชอมนสงทสด) เมอนกพฒนากระท าตามค าแนะน านนกจะท าใหเกดเหตการณใหมขนและเหตการณใหมนนกจะถกน าไปสรางเซตของค าแนะน าใหมจากกฎความสมพนธทไดจากการท าเหมองขอมลกบทรานแซคชนทงหมดทรวมเอาเหตการณครงกอนหนาเอาไวดวย
ขนตอนวธทกลาวมาทงหมดในหวขอ 2.8.1 และ 2.8.2 น ไดถกน าไปสรางเปนระบบใหค าแนะน าส าหรบนกพฒนาในระหวางการพฒนาซอฟตแวรชอโปรแกรมประยกตอโรส (eROSE) โดย Zimmermann และคณะ (Zimmermann et al., 2005) โปรแกรมประยกตอโรสประกอบดวย 3 สวน คอ 1) สวนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว 2) สวนการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว และ 3) สวนการใหค าแนะน านกพฒนาระหวางการพฒนาซอฟตแวร
2.9 การวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว
การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวนนสามารถกระท าไดในสถานการณทแตกตางกน 3 สถานการณ ไดแก 1) สถานการณการน าทาง (Navigation) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหนงแลว ระบบจะใหค าแนะน ากบนกพฒนาใหแกไขเอนทตใดตอไปไดถกตองหรอไม 2) สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทต หลายๆเอนทตตอเนองกนแตยงขาดการเปลยนแปลงแกไขเอนทตอกหนงเอนทตจงจะสมบรณ ระบบจะใหค าแนะน ากบนกพฒนาใหแกไขเอนทตทเหลอนนไดถกตองหรอไม 3) สถานการณการ
82
เปลยนแปลงแกไขทสมบรณแลว (Closure) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหลายๆเอนทตตอเนองกนจนสมบรณแลว ระบบจะใหค าแนะน าทเปนผลบวกลวง (False Positive) เปนผลลพธแกนกพฒนาหรอไม
การวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวใชวธการวดประสทธภาพเหมอนกบการวดประสทธภาพของการคนคนขอมล (Information Retrieval) (Zimmermann et al., 2005) กคอการค านวณหาคาความถกตอง (Precision) และคาเรยกคน (Recall) ของแตละหนวยทดลอง จากนนน าคาความถกตอง (Precision) และคาเรยกคน (Recall) ทไดมาค านวณหาคาเอฟเมสเชอร (F-measure) ซงคาเอฟเมสเชอรนกคอคาประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในสถานการณการน าทาง (Navigation) และสถานการณการปองกนการเกดขอผดพลาด (Error Prevention) นนเอง นอกนนผวจยยงสามารถค านวณคาผลสะทอนกลบ (Feedback) หรอคารอยละของขอสอบถามทไมไดใหเซตรายการการเปลยนแปลงแกไขทถกดงขนมาเปนเซตวางกบขอสอบถามทงหมด ซงคาผลสะทอนกลบนกคอคาประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบ ขอมลซอฟตแวรอารไคฟวในสถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure)
การใชคาเอฟเมสเชอรเปนคาทใชการระบระดบประสทธภาพของการคนคนขอมลเปนทนยมในงานวจยทเกยวของกบการคนคนขอมล เชน งานวจยการขยายค าในขอสอบถามโดยรวมกฎความสมพนธกบสงทศกษารวมกบเทคนคการคนคนสารสนเทศ (Song et al., 2005) และงานวจยการจดกลมเอกสารทางเวบโดยใชเซตรายการทมากทสด (Zhuang and Dai, 2004) เปนตน นอกจากนนงานวจยของ Methanias และคณะ (Methanias et al., 2009) ทท าการเปรยบเทยบประสทธภาพของการท าเหมองขอมลบนขอมลซอฟตแวรอารไคฟวของโครงการซอฟตแวรสงแวดลอมอตสาหกรรม (Industrial Environment) กใชคาเอฟเมสเชอรเปนคาทใชการระบระดบประสทธภาพเชนกน คาความถกตอง (Precision) คาเรยกคน (Recall) และคาเอฟเมสเชอร (F-measure) นนสามารถค านวณไดดงน
ก าหนดให q คอ ขอสอบถาม (Query) ทประกอบดวยเซตเหตการณ (Situation) Q และเซตผลลพธทคาดไว (Expected Result) E และเขยนใหอยในรป q = (Q, E)
R คอ เซตของกฎความสมพนธทอยในรปแบบ Q{x} โดยท x คอรายการ
83
การเปลยนแปลงแกไข และก าหนดให R10 คอเซตของกฎความสมพนธทมระดบความนาสนใจสงสด 10 กฎแรกซงเรยงล าดบดวยคาความเชอมน โดยท R10 R
Aq คอ เซตของรายการการเปลยนแปลงแกไข x ทไดจากกฎความสมพนธในเซต R10 ทสอดคลองกบเซตเหตการณ Q ของขอสอบถาม q ซงสามารถเขยนในรป Aq =
ดงนนขนาดของเซต Aq จะนอยกวาหรอเทากบ 10 เสมอ
2.9.1 คาความถกตอง (Precision)
คาความถกตอง (Precision) เปนสดสวนรายการการเปลยนแปลงแกไขทถกดงขนมาแลวตรงกบรายการการเปลยนแปลงแกไขทอยใน เซตผลลพธทคาดไว เทยบกบรายการการเปลยนแปลงแกไขทงหมดทถกดงขน ดงสมการตอไปน (Zimmermann et al., 2005)
ก าหนดให |Aq E| คอ จ านวนรายการการเปลยนแปลงแกไขทถกดงขนมาแลวตรงกบรายการการเปลยนแปลงแกไขทอยในเซตผลลพธทคาดไว
|Aq| คอ จ านวนรายการการเปลยนแปลงแกไขทถกดงขนมา
ในกรณทเซตรายการการเปลยนแปลงแกไขทถกดงขนมาเปนเซตวาง (|Aq| = 0) จะก าหนดใหคาความถกตองมคาเทากบ 1
2.9.2 คาเรยกคน (Recall)
คาเรยกคน (Recall) เปนสดสวนรายการการเปลยนแปลงแกไขทถกดงขนมาแลวตรงกบรายการการเปลยนแปลงแกไขทอยในเซตผลลพธทคาดไว เทยบกบรายการการเปลยนแปลงแกไขทอยในเซตผลลพธทคาดไว ดงสมการตอไปน (Zimmermann et al., 2005)
ก าหนดให |Aq E| คอ จ านวนรายการการเปลยนแปลงแกไขทถกดงขนมาแลวตรงกบรายการการเปลยนแปลงแกไขทอยในเซตผลลพธทคาดไว
84
|E| คอ จ านวนรายการการเปลยนแปลงแกไขทอยในเซตผลลพธทคาดไว
ในกรณทเซตผลลพธทคาดไวเปนเซตวาง (|E| = 0) จะก าหนดใหคาความถกตองมคาเทากบ 1
2.9.3 คาเอฟเมสเชอร (F-measure)
คาเอฟเมสเชอร (F-measure) หรอคาเอฟเมสเชอรแบบถวงน าหนก (Weighted Harmonic mean of Precision and Recall) ถกเสนอขนโดย Rijsbergen ในป ค.ศ. 1979 (Rijsbergen, 1979) คอ คาทใชในการประเมนความถกตองแมนย า (accuracy) ของการทดสอบซงพจารณาจากทงคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการทดสอบโดยมการถวงน าหนกใหกบคาทงสองดวย คาเอฟเมสเชอรมพสยอยระหวาง 0 กบ 1 คาเอฟเมสเชอรทเทากบ 1 แสดงวามความถกตองแมนย ามากทสด สวนคาเอฟเมสเชอรทเทากบ 0 แสดงวามความถกตองแมนย านอยทสด สมการรปทวไปของคาเอฟเมสเชอรแสดงไดดงตอไปน (Tsunenori, 2003)
ก าหนดให F คอ คาเอฟเมสเชอร (F-measure) Precision คอ คาความถกตอง
Recall คอ คาเรยกคน คอ คาอตราสวนน าหนกของคาความถกตองตอคาเรยกคน
โดยท คา β หรอคาอตราสวนน าหนกของคาความถกตองตอคาเรยกคนเปนจ านวนจรงบวก ตวอยางของการก าหนดคา เชน คา β = 1 หมายความวาใหน าหนกของคาความถกตองกบคาเรยกคนมน าหนกความส าคญเทากน คา β = 2 หมายถงก าหนดใหคาความถกตองมน าหนกความส าคญเปนสองเทาเมอเทยบกบคาเรยกคน และคา β = 0.5 หมายถงก าหนดใหคาเรยกคนมน าหนกความส าคญเปนสองเทาเมอเทยบกบคาความถกตอง เปนตน ส าหรบทก าหนดให β = 1 นนคาเอฟเมสเชอรจะถกเรยกวา คาบาลานซเอฟเมสเชอร (balanced F-score) หรอคาเอฟหนง
85
สกอร (F1 score) หรอกคอคาเอฟเมสเชอรทถวงน าหนกอยางสมดลนนเอง สมการของคาเอฟหนงสกอรแสดงไดดงน (Tsunenori, 2003)
ก าหนดให F1 คอ คาเอฟหนงสกอร (F1 score) Precision คอ คาความถกตอง
Recall คอ คาเรยกคน
คาเอฟเมสเชอรเปนคาทนยมใชในการวดประสทธภาพของการคนคนขอมล (Information Retrieval) อยางแพรหลาย (Tsunenori, 2003) งานวจยทเกยวของกบการคนหากฎความส าคญหลายงานวจย (Beil et al., 2002; Geyer-Schulz and Hahsler, 2002) แนะน าใหใชคาเอฟหนงสกอรหรอคาเอฟเมสเชอรทใหน าหนกของคาความถกตองและคาเรยกคนอยางสมดล
ในป 2005 งานวจยของ Zimmermann และคณะ (Zimmermann et al., 2005) ) ท าการเปรยบเทยบประสทธภาพของการท าเหมองขอมลบนขอมลซอฟตแวรอารไคฟวกบโครงการพฒนาระบบปฏบตการคอมพวเตอรตางๆ (Operating system) และกลาววา จดมงหมายของการทดสอบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรคอคาความถกตองทสง (คาใกลเคยง 1) และคาเรยกคนทสง (คาใกลเคยง 1) นนคอตองการใหระบบสามารถแนะน าค าแนะน าทงหมด (คาเรยกคนเทากบ 1) และแตละค าแนะน านนถกตองหรอตรงกบเซตผลลพธทคาดไวทงหมด (คาความถกตองเทากบ 1) ดงนนงานวจยของ Zimmermann และคณะจงใชคาเฉลยฮารโมนนคของคาความถกตองและคาเรยกคน (Harmonic mean of Precision and Recall) หรอกคอคาเอฟเมสเชอรทใหน าหนกของคาความถกตองและคาเรยกคนอยางสมดล เปนคาประเมนประสทธภาพของการท าเหมองขอมล (Zimmermann et al., 2005)
ตอมาในป 2009 งานวจยของ Methanias และคณะ (Methanias et al., 2009) ท าการเปรยบเทยบประสทธภาพของการท าเหมองขอมลบนขอมลซอฟตแวรอารไคฟวของโครงการซอฟตแวรสงแวดลอมอตสาหกรรม (Industrial Environment) ใน 3 สถานการณเชนเดยวกน และแนะน าใหใชคาเอฟเมสเชอรทใหน าหนกของคาความถกตองและคาเรยกคนอยางสมดลส าหรบการประเมนประสทธภาพในสถานการณการน าทางและสถานการณการปองกนขอผดพลาด (Methanias et al., 2009)
86
2.9.4 คาผลสะทอนกลบ (Feedback)
คาผลสะทอนกลบ (Feedback) คอ คารอยละของเซตรายการการเปลยนแปลงแกไขทถกดงขนมาทไมใชเซตวางกบเซตรายการการเปลยนแปลงแกไขทถกดงขนมาทงหมด คาผลสะทอนกลบแสดงไดดงสมการตอไปน (Zimmermann et al., 2005)
ก าหนดให คอ คาผลสะทอนกลบ
|Z*| คอ จ านวนขอสอบถามทอยในเซตของขอสอบถามทมเซตของค าแนะน าทไมเปนเซตวาง โดยท Z* = {q | q = (Q, E) Z,
≠ } |Z| คอ จ านวนขอสอบถามทงหมด โดยท Z = {q | q = (Q, E) }
เมอน าคาผลสะทอนกลบมาใชประเมนในสถานการณการเปลยนแปลงแกไขทสมบรณแลวจะสามารถแสดงใหเหนถงรอยละของการเกดการแจงเตอนทผด (False Alarm) หรอการใหค าแนะน าทเปนผลบวกลวงนนเอง เนองจากคาผลสะทอนกลบมพสยอยระหวาง 0 กบ 1 คาผลสะทอนกลบทมคาเทากบ 0 หมายถงไมมขอสอบถามใดเลยทใหค าแนะน าทเปนผลบวกลวงออกมาในสถานการณนนนคอมประสทธภาพดทสด และคาผลสะทอนกลบทมคาเทากบ 1 หมายถงขอสอบถามทงหมดใหค าแนะน าทเปนผลบวกลวงออกมานนคอมประสทธภาพไมดทสด ดงนนการวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนจะตองเปรยบเทยบคาผลสะทอนกลบและคาผลสะทอนกลบทนอยกวาจะมความหมายวามประสทธภาพดกวา (Zimmermann et al., 2005)
87
บทท 3 ระเบยบวธวจย………
3.1 บทน า
ในบทนจะกลาวถงระเบยบวธวจยซงประกอบดวยการอธบายแผนแบบการทดลอง (Experimental Design) การทดสอบสมมตฐาน การท างานของเครองมอทดสอบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบตางๆ ทงานวจยก าหนด รวมทงวธการพฒนาเครองมอทดสอบประสทธภาพของการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว ประเดนความนาเชอถอได (Reliability) ความถกตอง (Validity) และกรอบการวเคราะหขอมล (Data Analysis Framework) ดงรายละเอยดตอไปน
3.2 แผนแบบการทดลอง
งานวจยนมวตถประสงคในการทดลองเพอศกษาเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมน (Support-Confidence Model) ดงเดมกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) ในสถานการณของการใหค าแนะน านกพฒนาตางๆกน 3 สถานการณไดแก 1) สถานการณการน าทาง (Navigation) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหนงแลว ระบบจะใหค าแนะน ากบนกพฒนาใหแกไขเอนทตใดตอไปไดถกตองหรอไม 2) สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหลายๆเอนทต ตอเนองกนแตยงขาดการเปลยนแปลงแกไขเอนทตอกหนงเอนทตจงจะสมบรณ ระบบจะใหค าแนะน ากบนกพฒนาใหแกไขเอนทตทเหลอนนไดถกตองหรอไม 3) สถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure) คอ สถานการณทนกพฒนามการเปลยนแปลงแกไขทเอนทตหลายๆเอนทตตอเนองกนจนสมบรณแลว ระบบจะใหค าแนะน าทเปนผลบวกลวง (False Positive) ออกมาแกนกพฒนาหรอไม
88
จากวตถประสงคงานวจยทกลาวขางตน ผ วจยจงเลอกใชแผนแบบการทดลองแบบการเปรยบเทยบกลมสถต (Static Group Comparison) ซงเปนแผนแบบการทดลองทเหมาะสมกบการทดลองทตองการวดคาตวแปรตามของกลมควบคมและกลมทดลองหลงจากท าการทดสอบมคาแตกตางกนอยางไร นนคอ การวดคาประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนดงเดม (กลมควบคม) กบคาประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) (กลมทดสอบ) หลงจากการทดสอบวามคาแตกตางกนอยางไร โดยก าหนดใหมตวแปรในการทดลองเปรยบเทยบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทตองการทดสอบ ดงตอไปน
3.2.1 ตวแปรตน
งานวจยนสนใจวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) สามารถเพมประสทธภาพของระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรของไอดอ (IDE: Integrated Development Environment) ไดหรอไม ดงนนตวแปรตนของการศกษาครงนคอตวแบบของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธทงหมด 2 ตวแบบ ดงน
1) การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมน (Support-Confidence Model)
2) การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Support-New Confidence Model) (Liu et al., 2008)
จากการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบขางตน ผ วจยจะเรยกการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมน ดวยค าวา “การคนหากฎความสมพนธดวยตวแบบท 1” สวนการท าเหมองขอมลดวยเทคนคการคนหากฎ
89
ความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) จะเรยกวา “การคนหากฎความสมพนธดวยตวแบบท 2”
3.2.2 ตวแปรตาม
เนองจากงานวจยนสนใจเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว 2 ตวแบบดงกลาวขางตน ดงนนการเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวจะพจารณาจากความถกตองแมนย าในการท านายและใหค าแนะน ากบนกพฒนาในระหวางการพฒนาซอฟตแวรมากนอยเพยงใด โดยการวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในแตละสถานการณมวธการในการประเมนทแตกตางกนออกไปดงน
ในสถานการณ การน าทาง (Navigation) สามารถประเมนประสทธภาพจากคาเอฟเมสเชอร (F-measure) ทค านวณมาจากคาความถกตอง (Precision) และคาเรยกคน (Recall) ซงรายละเอยดและวธการค านวณคาเอฟเมสเชอร คาความถกตองและคาเ รยกคนส าหรบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวนนไดกลาวเอาไวในบทท 2
ในสถานการณ การปองกนการเกดขอผดพลาด (Error Prevention) สามารถประเมนประสทธภาพจากคาเอฟเมสเชอร (F-measure) ทค านวณมาจากคาความถกตอง (Precision) และคาเรยกคน (Recall) ซงรายละเอยดและวธการค านวณคาเอฟเมสเชอร คาความถกตองและคาเรยกคนส าหรบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวนนไดกลาวเอาไวในบทท 2
ในสถานการณ การเปลยนแปลงแกไขทสมบรณแลว (Closure) สามารถประเมนประสทธภาพจากคาผลสะทอนกลบ (Feedback) ซงรายละเอยดและวธการค านวณคาผลสะทอนกลบส าหรบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวนนไดกลาวเอาไวในบทท 2
90
3.3 สมมตฐานงานวจย
จากวตถประสงคของงานวจย ผ วจยตองการทดสอบวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) สามารถเพมประสทธภาพของระบบใหค าแนะน านกพฒนาในสถานการณตางๆกน 3 สถานการณคอ สถานการณการน าทาง (Navigation) สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) และสถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure) ไดหรอไม ดงนนงานวจยนจงตองการศกษาประสทธภาพของการใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรทไดมาจากการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบตามทก าหนดไวในหวขอตวแปรตน โดยผวจยจะตงสมมตฐานในแตละสถานการณจะทท าการทดสอบไวดงน
1) วเคราะหเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบในสถานการณการน าทาง วามความแตกตางกนหรอไม
ก าหนดให คอ คาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง
คอ คาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการน าทาง
ผ วจยตองการทราบวาคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบใดทมคามากกวากน ดงนนผ วจยจงเปรยบเทยบคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 กบคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ผ วจยเหนวาการคนหากฎความสมพนธดวยตวแบบท 1 นนสามารถใหเกดผลลพธของการท าเหมองขอมลทเปนผลบวกลวง (False Positive) เปนจ านวนมากโดยเฉพาะอยางยงกบขอมลซอฟตแวรอารไคฟว (Li et al., 2005) ซงนาจะเปนผลมาจากการคนหากฎความสมพนธดวยตวแบบท 1 นนจะใหผลลพธทไมสอดคลองกบสหสมพนธ (Correlation) แตการคนหากฎความสมพนธดวยตวแบบท 2 นนใหผลลพธของการท าเหมองขอมลทสอดคลองกบสหสมพนธดวย (Liu et al., 2008) ดงนนผวจยจงคาดวาการ
91
คนหากฎความสมพนธดวยตวแบบท 2 นนมประสทธภาพทดกวาการการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง จงตงสมมตฐานไว ดงน
H0 : ≤
H1 : >
การยอมรบ H0 หมายถง การคนหากฎความสมพนธดวยตวแบบท 1 นนมประสทธภาพทดกวาการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการน าทาง
การปฏเสธ H0 หมายถง การคนหากฎความสมพนธดวยตวแบบท 2 นนมประสทธภาพทดกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง
2) วเคราะหเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
ก าหนดให คอ คาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด
คอ คาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด
ผ วจยตองการทราบวาคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบใดทมคามากกวากน ดงนนผ วจยจงเปรยบเทยบคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 กบคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ผ วจยเหนวาการคนหากฎความสมพนธดวยตวแบบท 1 นนสามารถใหเกดผลลพธของการท าเหมองขอมลทเปนผลบวกลวง (False Positive) เปนจ านวนมากโดยเฉพาะอยางยงกบขอมลซอฟตแวรอารไคฟว (Li et al., 2005) ซงนาจะเปนผลมาจากการคนหากฎความสมพนธดวยตวแบบท 1 นนจะใหผลลพธทไมสอดคลองกบสหสมพนธ (Correlation) แตการคนหากฎความสมพนธดวยตวแบบท 2 นนใหผลลพธของการท า
92
เหมองขอมลทสอดคลองกบสหสมพนธดวย (Liu et al., 2008) ดงนนผวจยจงคาดวาการคนหากฎความสมพนธดวยตวแบบท 2 นนมประสทธภาพทดกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด จงตงสมมตฐานไว ดงน
H0 : ≤
H1 : >
การยอมรบ H0 หมายถง การคนหากฎความสมพนธดวยตวแบบท 1 นนมประสทธภาพทดกวาการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด
การปฏเสธ H0 หมายถง การคนหากฎความสมพนธดวยตวแบบท 2 นนมประสทธภาพทดกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด
3) วเคราะหเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบในสถานการณการเปลยนแปลงแกไขทสมบรณแลว วามความแตกตางกนหรอไม
ก าหนดให คอ คาผลสะทอนกลบของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
คอ คาผลสะทอนกลบของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
ผวจยตองการทราบวาคาผลสะทอนกลบของการคนหากฎความสมพนธดวยตวแบบใดทมคามากกวากน ดงนนผวจยจงเปรยบเทยบคาผลสะทอนกลบของการคนหากฎความสมพนธดวยตวแบบท 1 กบคาผลสะทอนกลบของการคนหากฎความสมพนธดวยตวแบบท 2 ผ วจยเหนวาการคนหากฎความสมพนธดวยตวแบบท 1 นนสามารถใหเกดผลลพธของการท าเหมองขอมลทเปนผลบวกลวง (False Positive) เปนจ านวนมากโดยเฉพาะอยางยงกบขอมลซอฟตแวรอารไคฟว (Li et al., 2005) ซงนาจะเปนผลมาจาก
93
การคนหากฎความสมพนธดวยตวแบบท 1 นนจะใหผลลพธทไมสอดคลองกบสหสมพนธ (Correlation) แตการคนหากฎความสมพนธดวยตวแบบท 2 นนใหผลลพธของการท าเหมองขอมลทสอดคลองกบสหสมพนธดวย (Liu et al., 2008) ดงนนผวจยจงคาดวาการคนหากฎความสมพนธดวยตวแบบท 2 นนจะใหคาผลสะทอนกลบทนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว จงตงสมมตฐานไว ดงน
H0 : ≥
H1 : <
การยอมรบ H0 หมายถง การคนหากฎความสมพนธดวยตวแบบท 1 นนมประสทธภาพทดกวาการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
การปฏเสธ H0 หมายถง การคนหากฎความสมพนธดวยตวแบบท 2 นนมประสทธภาพทดกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
3.4 ประชากรและหนวยตวอยาง
ส าหรบงานวจยนขอมลซอฟตแวรอารไคฟวทไดจากระบบคอนเคอเรนทเวอรชนนนเปนประชากรของการทดลองในงานวจยน ซงผ วจยหวงวาจะทดสอบระบบกบ ขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรทงหมด แตในทางปฎบตนนผ วจยไม สามารถน าขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรทพฒนาขนในเชงพาณชยได ดงนนผ วจยจงเลอกใชขอมลซอฟตแวรอารไคฟวจากระบบคอนเคอเรนทเวอรชนในโครงการพฒนาซอฟตแวรทเปนโครงการโอเพนซอรส (Open Source Project) จ านวน 1 โครงการคอโครงการพฒนาซอฟตแวรทางการบญชชอเคมายมนน (KMyMoney) มาเพอเปนหนวยตวอยางของงานวจยน รายละเอยดของซอฟตแวรนแสดงดงตารางตอไปน
94
ตารางท 3-1 แสดงรายละเอยดของซอฟตแวรทางการบญชชอเคมายมนน (KMyMoney) เกบขอมลในวนท 10 มกราคม พ.ศ. 2553
ขอมลทวไป ประเภทซอฟตแวร การบญช การจดท าและการพยากรณงบประมาณ ผบ ารงรกษา โทมส โบมการท และ มเชล เอดเวรด ประเภทลขสทธ จพแอล (GPL) ผใชเปาหมาย ผใชทวไป องคกรไมแสวงหาผลประโยชน ขนาดซอฟตแวร 14.2 เมกะไบต จ านวนการถกบรรจลง (ครง) 223,889
ขอมลดานเทคนค ภาษาทใชในการพฒนา ซพลสพลส (C++)
แพลตฟอรมทรองรบ ลนกซ (Linux) ยนกซ (Unix) และฟรบเอสด (FreeBSD)
สวนตดตอผใช เคดอ (KDE), ควท (Qt)
ฐานขอมลทสนบสนน มายเอสควแอล (MySQL) โพสตเกรสเอสควแอล (PostgreSQL) และ เอสควแอลไลท (SQLite)
ขอมลจากระบบคอนเคอเรนทเวอรชน (CVS) วนทเรมตนโครงการ 16/04/2000 วนทปรบปรงลาสด 28/12/2009 ระยะเวลา (ป) 9.7 จ านวนนกพฒนา (คน) 10 จ านวนทรานแซคชน (ทรานแซคชน) 28261 จ านวนแทก (แทก) 30777 จ านวนแฟมขอมล (แฟม) 2583 จ านวนไดเรกทอร 118 จ านวนเอนทต (เอนทต) 21660 จ านวนเอนทตตอแฟมขอมลโดยเฉลย (เอนทต/แฟมขอมล)
8.4
95
จ านวนกงกาน (กง) 636 ขอมลโครงสรางของซอฟตแวร
จ านวนเนมสเปส (เนมสเปส) 7 จ านวนคลาส อนเตอรเฟส สตรคท และยเนยน (คอมโพเนนท)
543
จ านวนฟงกชน (ฟงกชน) 4472 จ านวนตวแปร (ตวแปร) 2896 จ านวนไทพดฟ (ไทพดฟ) 27 จ านวนอนมมเรชน (อนมมเรชน) 112 จ านวนอนมมเรเตอร (อนมมเรเตอร)
962
จ านวนพรอพเพอรต (พรอพเพอรต) 10
ซอฟ ตแว ร เ คมายมน น (KMyMoney) ค อ ซอฟตแว รจดการการ เ ง น (Finance Management Software) ทสามารถรองรบการใชงานในระดบบคคลและระดบองคกรขนาดเลกได ถกพฒนาขนมาดวยภาษาซพลสพลส (C++) บนเครองมอทชอวาควท (Qt) ท าใหเปนโปรแกรมประยกตทพฒนาขนคร งเดยวแตท างานไดบนระบบปฏบตการตระกลยนกซเกอบทกรน ซอฟตแวรเคมายมนนแบงกลมของการจดการขอมลออกเปน 10 สวนดงน
1. สถาบนทางการเงน (Institutions) คอ สวนทผ ใชสามารถบรหารจดการบญชของผ ใชโดยแบงแยกตามสถาบนทางการเงนหรอธนาคารของแตและบญชทมอย ในสวนนผ ใชสามารถสราง แกไข ลบ หรอเปดดขอมลการเงนของแตละบญชในสถาบนทางการเงนหรอธนาคารไดตามตองการ
2. บญช (Accounts) คอ สวนทผ ใชสามารถบรหารจดการบญชของผ ใชโดยแบงแยกตามประเภทของแตและบญชทมอย เชน บญชทรพยสน บญชหนสน เปนตน ในสวนนผ ใชสามารถสราง แกไข ลบ หรอเปดดขอมลการเงนของแตละบญชไดตามตองการ
3. ตารางเวลา (Schedules) คอ สวนทผ ใชสามารถสรางและจดการตารางเวลาการท าธรกรรมทางการเงนได ผ ใชสามารถสรางตารางเวลาลวงหนา ตงตารางเวลา
96
แบบซ าเปนรอบวน รอบสปดาห หรอรอบเดอน ชวยใหผ ใชไมลมและสามารถท าธรกรรมไดตรงตามเวลา นอกจากนนผ ใชสามารถก าหนดใหธรกรรมทอยบนตารางเวลานนไปปรากฏบนบญชแยกประเภท (Ledgers) ไดดวย
4. หมวดการท าธรกรรม (Categories) คอ สวนทผ ใชสามารถ แกไข หรอลบหมวดของการท าธรกรรม เชน หมวดธรกรรมดานศกษา หมวดธรกรรมทวไป เปนตน ผใชสามารถดงขอมลธรกรรมทจดท าไวในสวนอนๆมาจดหมวดหมในสวนน
5. ผ รวมท าธรกรรม (Payees) คอ สวนทผ ใชสามารถจดการขอมลของบคคล กลมบคคล หรอองคกร ทผ ใชไปท าธรกรรมดวย ในสวนนผ ใชสามารถเรยกดรายการท าธรกรรมทงหมดโดยแบงแยกตามบคคล กลมบคคล หรอองคกร ทผ ใชไปท าธรกรรมดวยได
6. บญชแยกประเภท (Ledgers) คอ สวนทผ ใชสามารถจดการรายการธรกรรมของผ ใช ลกษณะเดยวกบโปรแกรมไมโครซอฟตมนน (Microsoft Money) นอกจากนนยงมความสามารถพเศษทชอวาเลคเจอะเลนส (ledger lens) ใชส าหรบเลอกรายการธรกรรมตงแตหนงถงสามรายการเพอขยายดรายละเอยดภายในของรายการธรกรรมนนๆ ขอมลรายการธรกรรมทงหมดสามารถเลอกใหเรยงล าดบรายการตามคอลมภทตองการได
7. การลงทน (Investments) คอ สวนทผ ใชสามารถตดตามการลงทนพนฐานตางๆได เชนการตดตามราคาหน ราคาทองค า อตราแลกเปลยนเงนตราตางประเทศ และกองทนตางๆ ผใชสามารถเลอกเพม แกไขหรอลบรายการการลงทนทตองการตดตามได
8. รายงานทางการเงน (Reports) คอ สวนทผ ใชสามารถจดท าเอกสารรายงานทางการเงนตางๆได โดยทผใชสามารถเลอกก าหนดคาองคประกอบตางๆไดอยางอสระ ในเวอรชนปจจบนผ ใ ชสามารถสรางกราฟ แผนภาพแบบตางๆในเอกสารรายงานไดดวย
9. งบประมาณ (Budgets) คอ สวนทผ ใชสามารถจดการหมวดหมของรายการรายไดและคาใชจายทคาดหวงไวในภายในชวงของเวลาทก าหนด ผ ใชสามารถก าหนดชวงของเวลาได 3 แบบคอ รายป รายเดอน หรอระยะเวลาเฉพาะทก าหนดเอง นอกจากนนระบบยงสามารถสรางรายงานแสดงการเปรยบเทยบรายไดและรายจายจรงกบและรายไดและรายจายทคาดหวงไวได
97
10. การพยากรณทางการเงน (Forecast) คอ สวนทผ ใชสามารถเรยกดการพยากรณทางการเงนของแตละบญชทผใชมอยได การพยากรณทางการเงนในทนหมายถงการคาดการณยอดเงนคงเหลอของแตละบญชในจดเวลาอนาคต การพยากรณของระบบเกดขนมาจากขอมลทบนทกในสวนตารางเวลาและสวนบญชแยกประเภทปจจบน รวมถงการรวบรวมธรกรรมทเคยเกดขนในอดตมาพจารณาดวย
จากตารางแสดงรายละเอยดดานตางๆและหนาทการท างานทอธบายไปในขางตนของซอฟตแวรชอเคมายมนน ผวจยเหนวาซอฟตแวรชอเคมายมนนมขนาดใหญ มความซบซอนมากในระดบหนง มนกพฒนาผ รวมโครงการเปนจ านวนมาก และมโอกาสทจะมนกพฒนาใหมเขารวมโครงการไดเสมอ นอกจากนนซอฟตแวรชอเคมายมนนนนพฒนาขนมาดวยภาษาซพลสพลส (C++) ซงเปนภาษาเชงวตถ (Object Oriented Programming Language) ผวจยจงหวงวาซอรสโคดของโครงการพฒนาซอฟตแวรชอเคมายมนน (KMyMoney) จะสามารถเปนตวแทนทดของซอฟตแวรขนาดใหญทถกพฒนาดวยภาษาเชงวตถ และมนกพฒนาผ รวมโครงการเปนจ านวนมากได ดงนนผ วจยจงเลอกขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรชอเคมายมนนน เปนขอมลทใชในการทดสอบของงานวจยน
สาเหตทงานวจยนเลอกตวอยางขอมลซอฟตแวรอารไคฟวเพยงตวอยางเดยว เนองจากงานวจยนตองการวจยเพอหาขอมลเบองตน (Exploratory Research) เพอประโยชนในการวจยในอนาคตเทานน ไมไดตองการสรปผลใหครอบคลมการน าไปประยกตกบกรณทวไป
3.5 แนวทางการท าวจย
งานวจยนเปนงานวจยเชงทดลอง (Experimental Research) เนองจากเปนการทดลองเพอเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบ 2 ตวแบบใน 3 สถานการณ ส าหรบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนตวแบบทมประสทธภาพดกวาคอตวแบบทใหคาเอฟเมสเชอรทสงกวา และส าหรบในสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนตวแบบทมประสทธภาพดกวาคอตวแบบทใหคาผลสะทอนกลบทนอยกวา โดยในงานวจยนสนใจวาการคนหากฎความสมพนธดวยตวแบบท 2 หรอการใชตวแบบคาสนบสนน-คาความเชอมนใหม
98
ของ Liu และคณะ (Liu et al., 2008) ในการท าเหมองขอมลนนจะสามารถชวยเพมประสทธภาพใหกบระบบใหค าแนะน านกพฒนาระหวางการพฒนาซอฟตแวรทไดมาจากผลของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวได ในงานวจยเชงทดลองนจะควบคมตวแปรอนๆ ใหเหมอนกนหมดนนคอ ขอมลซอฟตแวรอารไคฟว ขอสอบถาม ความถกตองระหวางขอมลซอฟตแวรอารไคฟวและขอสอบถาม และเครองมอทใชในการจดเตรยมขอมลเพอการท าเหมองขอมล (Data preprocessing tool) และเครองมอในการท าเหมองขอมล (Data Mining tool) เพอใหตวแปรควบคมทก าหนดนนมผลกระทบกบตวแปรตามนอยทสดและผลของงานวจยจะไดเปนผลทเกดจากการเปลยนแปลงตวแปรตนอยางแทจรง นนคองานวจยจะทดลองวาผลลพธของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวจะมประสทธภาพเปลยนแปลงไปอยางไรเมอใชตวแบบในการท าเหมองขอมลแตกตางกนส าหรบสถานการณตางๆ โดยไดสรางเครองมอเพอทดสอบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว ดงน
1) การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมน
2) การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008)
งานวจยนไดพฒนาระบบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวออกเปน 2 ตวแบบดงกลาว เนองจากผวจยสนใจวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะนนสามารถเพมประสทธภาพของระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรของไอดอไดหรอไม ดงนนในการทดลองจงตองพฒนาระบบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนดงเดมไวเปนกลมควบคม เพอเปนกลมเปรยบเทยบกบระบบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะซงเปนกลมทดสอบ ส าหรบสถานการณทง 3 สถานการณ
99
3.6 ขนตอนทดสอบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว
1 2 3
Source CodeFile
CVS logFile
1
2
3
1
2
3
1 2
1
2
1 1
1 2
1 3
2 1
2 2
2 3
1
2
3
1 1
1 2
1 3
2 1
2 2
2 3
รปท 3-1 แสดงขนตอนการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว
100
การออกแบบการทดสอบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวของงานวจยนมขนตอนการท างานทงหมดแสดงดงรปท
3-1 ซงการทดสอบในครงนจะแบงขนตอนในการทดสอบออกเปน 6 ขนตอน คอ
1) การจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว 2) การสรางขอสอบถามส าหรบการทดสอบ 3 สถานการณ 3) การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวร
อารไคฟวทง 2 ตวแบบส าหรบ 3 สถานการณ 4) การสรางเซตของค าแนะน าส าหรบเหตการณ 5) การประเมนผลการทดสอบ 6) การทดสอบสมมตฐาน
รายละเอยดขอมลเขา กระบวนการท างานและขอมลออกของแตละขนตอนการทดสอบอธบายดงตอไปน
3.6.1 การจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว
การจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว คอ สวนทท าหนาทในการดงแฟมขอมลซอรสโคดและแฟมขอมลบนทกจากรพอสโทรของระบบคอนเคอเรนทเวอรชนแลวน าแฟมขอมลเหลานนมาผานกระบวนการ 4 กระบวนการเพอใหไดขอมลทรานแซคชนของการเปลยนแปลงแกไข ดงน
1) การสกดขอมล (Data Extraction)
2) การซอมแซมทรานแซคชน (Restoring Transactions)
3) การระบการเปลยนแปลงแกไขในระดบเอนทต (Mapping Changes to Entities)
4) การก าจดสงแปลกปลอม (Data Cleaning)
ขนตอนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว 4 กระบวนการขางตนถกเสนอขนมาโดย Zimmermann และคณะ ในป 2004 (Zimmermann et al., 2004) และเปนขนตอนวธทมงานวจยทเกยวของกบการท าเหมองขอมลกบขอมลซอฟตแวรอาร
101
ไคฟวหลายงายวจย (Zimmermann et al., 2005; Livshits et al., 2005; Williams et al., 2005; Breu et al., 2006; Weißgerber et al, 2006) น าไปใช งานวจยนน าขนตอนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวทง 4 กระบวนการมาใชเชนกน และก าหนดรายละเอยดตางๆของแตละกระบวนการเหมอนกบท Zimmermann และคณะไดเสนอไว (Zimmermann et al., 2004) ผวจยจะอธบายกระบวนการท างานพรอมกบยกตวอยางบางสวนประกอบการอธบาย เพอเพมความเขาใจในการท างานของแตละกระบวนการมากขนดวย
การสกดขอมล (Data Extraction)
การสกดขอมลจากแฟมขอมลบนทกของระบบคอนเคอเรนทเวอรชนเรมตนจากการเรยกใชค าสง CVS log จากไดเรคทอรราก (root directory) ของโครงการพฒนาซอฟตแวรทตองการ ผลลพธทสงกลบคนมากคอขอมลแฟมขอมลซอรสโคดและแฟมขอมลบนทก (Log File) ทบนทกอยบนรพอสโทรของระบบคอนเคอเรนทเวอรชนนน แฟมขอมลบนทกทไดมาจะถกน ามาวเคราะหรปแบบไวยากรณ (Parse) และถกน าไปบนทกลงฐานขอมล (Zimmermann et al., 2004)
ขอมลเขา คอ แฟมขอมลบนทกของระบบคอนเคอเรนทเวอรชน (CVS Log File)
ขอมลออก คอ ทรานแซคชนของการเปลยนแปลงแกไข (ฐานขอมลทประกอบดวยตาราง 6 ตาราง คอตารางชอ Files ตารางชอ Directories ตารางชอ Tags ตารางชอ Branches ตารางชอ Revisions และตารางชอ Transactions)
กระบวนการท างาน สามารถอธบายไดโดยแผนภาพตอไปน (Zimmermann et al., 2004)
102
รปท 3-2 แสดงตวอยางแฟมขอมลบนทกของระบบคอนเคอเรนทเวอรชน
รปแบบไวยากรณ แอททรบวต และความหมายของแตละแอททรบวต อธบายไวในบทท 2 รายละเอยดของขอมลทงหมดทจะถกบนทกเอาไวจากขนตอนการสกดขอมลสามารถอธบายไดดงตอไปน
- แอททรบวต RCS file ของแตละสวน (Sections) ในแฟมขอมลบนทกสามารถสกดขอมลออกมาเปนรายชอและรายละเอยดของแฟมขอมล (Files) และไดเรคทอร (Directories) ทงหมดของโครงการ จากตวอยางแฟมขอมลบนทกขางตนจะท าใหเกดระเบยน (Record) ใหมขนมาในตารางชอ Files และ Directories ดงน
ตวอยางระเบยนของตารางชอ Directories
DirectoryID DirectoryName Depth 1 /org.eclipse.jdt.core/Model/org/elipse/jdt/core/ 6
ตวอยางระเบยนของตารางชอ Files
FileID FileName DirectoryID FileExtension Depth NumberOfRevisions 1 IBuffer.java 1 .java 7 0
103
- แอททรบวต description ประกอบดวยสวนยอยหลายสวนแตละสวนแสดงถงการเปลยนแปลงแกไขแตละครงทเกดขน ขอมลในแตละสวนยอยนสามารถสกดขอมลออกมาเปนรายการการเปลยนแปลงแกไขแฟมขอมล (Revisions) ได จากตวอยางแฟมขอมลบนทกขางตนจะท าใหเกดระเบยนใหมขนมาในตารางชอ Revisions ดงน
ตวอยางระเบยนของตารางชอ Revisions
FileID RevisionID TransactionID CheckinTime Plus Minus State BranchPrefix 1 1.17 1 2004-01-13
15:48:42 1 1 Exp NULL
- รายการการเปลยนแปลงแกไขแฟมขอมลทไดมาขางตนจะถกน ามาพจารณาวารายการใดบางทเกดขนในเวลาเดยวกนและเกดขนโดยนกพฒนาคนเดยวกนจะถกรวมกนไวเปนทรานแซคชนของการเปลยนแปลงแกไข (Transactions) เดยวกน จากตวอยางแฟมขอมลบนทกขางตนจะท าใหเกดระเบยนใหมขนมาในตารางชอ Transactions ดงน
ตวอยางระเบยนของตารางชอ Transactions
TransactionID Author Message MessageMD5 BeginTime EndTime IsNoise 1 jlanneluc Updated
copyrights to 2004
817397A1A 8F94C3C8 1AF1C5DB E9F37F7
2004-01-13 15:48:42
2004-01-13 15:48:42
N
- แอททรบวต symbolic name แตละสวนยอยของแอททรบวต description ในแฟมขอมลบนทกสามารถสกดขอมลออกมาเปนรายชอของแทก (Tags) ทนกพฒนาตงไวใหกบการเปลยนแปลงแกไขนนๆได จากตวอยางแฟมขอมลบนทกขางตนจะท าใหเกดระเบยนใหมขนมาในตารางชอ Tags ดงน
104
ตวอยางระเบยนของตารางชอ Tags
FileID TagName RevisionID 1 1.16 v_396a
- ตารางชอ Branches ในฐานขอมลนนจะบนทกจดตอกง (Branch Points) และชอของการตอกง (Branch Names) ขอมลทง 2 ขอมลนถกเกบมาจาก 2 สวนของขอมลทไดจากการเรยกค าสง CVS log โดยทชอของการตอกงกคอชอทเปนสญลกษณทมหมายเลขปรากฎอยดวย ตวอยางเชน JDK_1_5 มหมายเลขเวอรชนเปน 1.15.0.2 จะไดชอของการตอกงน เปน 1.15.2 สวนจดตอกงนนไดมาจากตารางแฮช (Hash Map) ทใชชอของการตอกงเปนคย
ตวอยางระเบยนของตารางชอ Branches
FileID BranchPrefix OriginRevision BranchName InternalRevision 1 1.15.2 1.15 JDK_1_5 1.15.0.2
การซอมแซมทรานแซคชน (Restoring Transactions)
การเขาไปอานขอมลทถกบนทกเอาไวในแฟมขอมลบนทก (Log File) ตางๆบนเครองแมขายของระบบคอนเคอเรนทเวอรชนวามขอความบนทก (Log Message) ใดบางทระบการเปลยนแปลงแกไขทงหมดทเกดจากนกพฒนาคนเดยวกนและเกดขนในเวลาเดยวกน ขอมลการเปลยนแปลงแกไขทเกดจากนกพฒนาคนเดยวกนและเกดขนในเวลาเดยวกนจะถกน ามาแปลงเปนทรานแซคชน 1 ทรานแซคชนแลวบนทกลงในตาราง Transactions บนฐานขอมล ค าวา ในเวลาเดยวกน ในทนนนหมายรวมถงในเวลาทใกลเคยงกนดวย เนองจากการคอมมทในแตละครงอาจใชเวลาในการด าเนนการหลายวนาทหรอหลายนาท โดยเฉพาะอยางยงการคอมมททละหลายๆแฟมขอมล (Zimmermann et al., 2004) ดงนนในทางปฏบตแลวนอกจากการพจารณาทการคอมมทในเวลาเดยวกนแลวยงตองมวธการพจารณาทการคอมมทระหวางชวงของเวลา (Time Interval) เดยวกนดวย วธการพจารณาการเปลยนแปลงแกไขระหวางชวงของเวลานนม 2 วธคอวธ
105
ก าหนดกรอบเวลาทแนนอน (Fixed Time Windows) และวธเลอนกรอบเวลา (Sliding Time Windows) ตามทไดอธบายอยางละเอยดในบทท 2 (Zimmermann et al., 2004)
ขอมลเขา คอ ทรานแซคชนของการเปลยนแปลงแกไขและขอมลทเ กยวของอนๆ (ฐานขอมลทง 6 ตาราง คอตารางชอ Files ตารางชอ Directories ตารางชอ Tags ตารางชอ Branches ตารางชอ Revisions และตารางชอ Transactions)
ขอมลออก คอ ทรานแซคชนของการเปลยนแปลงแกไข (เฉพาะตารางชอ Transactions ทถกปรบปรงขอมลใหม)
กระบวนการท างาน ส าหรบในการทดสอบครงนผวจยเลอกใชวธเลอนกรอบเวลา (Sliding Time Windows) แบบเดยวกบทงานวจยในอดตหลายๆงานวจยเลอกใช (Zimmermann et al., 2004; Ying et al., 2004; Livshits et al., 2005; Weißgerber et al., 2005; Zimmermann et al., 2005; Kim et al., 2005; Breu et al 2006) หลกการของวธการน คอ การก าหนดชองวางระหวางการเปลยนแปลงแกไข (Revision, Change) 2 ครงทมากทสด จดเรมตนของกรอบของชวงเวลาจะถกเลอนไปทการเปลยนแปลงแกไขครงตอไปเสมอตราบใดทการเปลยนแปลงแกไขครงตอไปนนมจดเรมตนอยภายในกรอบเวลาของการเปลยนแปลงแกไขครงกอนหนา
จากขอมลของการเปลยนแปลงแกไขทบนทกไวในตารางชอ Revisions และขอมลทรานแซคชนทอยในตารางชอ Transactions จะตองถกดงขนมาพจารณาระบทรานแซคชนทถกตองใหมทงหมดตามวธเลอนกรอบเวลาขางตนโดยทในการทดสอบครงนผ วจยก าหนดใหความกวางของกรอบเวลาทพจารณาอยท 200 วนาท เชนเดยวกบงานวจยอนๆในอดต (Zimmermann et al., 2004; Ying et al., 2004; Livshits et al., 2005; Weißgerber et al., 2005; Zimmermann et al., 2005; Kim et al., 2005; Breu et al 2006) ส าหรบทกการเปลยนแปลงแกไข α1, α2, …, αk (เรยงตามล าดบเวลาทบนทก (time(αi)) ) ทเปนสวนหนงของทรานแซคชน T เดยวกนนน จะตองอยภายใตเงอนไข
{ }
นอกจากนนการเปลยนแปลงแกไขของแตละแฟมขอมลจะปรากฏอยบน 1 ทรานแซคชนไดเพยงครง เดยว เ นองจากระบบคอนเคอเรนทเวอรชน ไมอนญาตใหมการคอมมทการ
106
เปลยนแปลงเวอรชนของแฟมขอมลเดยวกน 2 ครงในเวลาเดยวกนได ดงนนจงมเงอนไขเพมมาอก 1 ขอดงน
เมอพจารณาทรานแซคชนทงหมดเรยบรอยแลวการท าการแกไขระเบยนภายในตารางชอ Transactions ใหมใหถกตอง
ตวอยางการท างานของวธเลอนกรอบเวลา แสดงไดดงตอไปน (Zimmermann et al., 2004)
รปท 3-3 แสดงตวอยางการพจารณาการเปลยนแปลงแกไขเวอรชนระหวางชวงของเวลาดวยวธเลอนกรอบเวลา
รปท 3-3 แสดงการพจารณาดวยวธเลอนกรอบเวลา โดยเรมตนกรอบเวลาทมชวงแนนอนเรมตนทจดของการเปลยนแปลงแกไขทแฟมขอมล IBuffer.java เวอรชนท 1.16 และกรอบเวลาถกเลอนไปเรอยๆ จนสนสดดงรป ดงนนการเปลยนแปลงแกไขทแฟมขอมล IBuffer.java เวอรชนท 1.16 แฟมขอมล Product.java เวอรชนท 1.1 แฟมขอมล Sale.java เวอรชนท 1.27 แฟมขอมล Shop.java เวอรชนท 1.12 และ แฟมขอมล Customer.java เวอรชนท 1.01 จะถกพจารณาวาเกดขนพรอมกนและอยภายในทรานแซคชนเดยวกน
การระบการเปลยนแปลงแกไขในระดบเอนทต (Mapping Changes to Entities)
ขอมลทถกจดเกบไวในรพอสโทรของระบบคอนเคอเรนทเวอรชนนนมเพยงขอมลแฟมขอมลทกแฟมขอมลในโครงการและขอมลการเปลยนแปลงแกไขในระดบแฟมขอมล (File) หรอคลาส (Class) ทเกบอยในรปของแฟมขอมลบนทก (Log File) เทานน แตไมมบนทกวาการ
107
เปลยนแปลงแกไขทเกดขนนนเกดขนกบฟงกชน (Function) หรอ เมธอด (Method) ใดบาง มตวแปร (Variable) ใดถกเพมเขามา แกไข หรอถกลบออกไปบาง วธการทมความแมนย าสงกวาแตกมคาใชจายในการค านวณสงวธหนง คอการก าหนดเอนทต (ตวแปร ฟงกชนหรอเมธอด) ทงหมดภายในแฟมขอมลทง 2 เวอรชนโดยการน าไปผานตววเคราะหไวยากรณ (Parser) จากนนกท าการเปรยบเทยบซอรสโคดของเอนทตเดยวกนใน 2 เวอรชน หรอกลาวคอเปนการประยกตใชฟงกชนดฟฟ (diff) (Miller et al., 1985) ในระดบของเอนทตนนเอง (Zimmermann et al., 2004)
ขอมลเขา คอ แฟมขอมลบนทกของระบบคอนเคอเรนทเวอรชน (CVS Log File) แฟมขอมลซอรสโคดทกเวอรชนของโครงการ และฐานขอมลตารางชอ Files ตารางชอ Directories ตารางชอ Tags ตารางชอ Branches ตารางชอ Revisions และตารางชอ Transactions
ขอมลออก คอ ทรานแซคชนของการเปลยนแปลงแกไข (เฉพาะตารางชอ Transactions และตารางชอ Revisions ทถกเพมระเบยบใหมเขาไป หรอถกปรบปรงขอมลใหม)
กระบวนการท างาน สามารถด าเนนการไดดงตอไปน (Zimmermann et al., 2004)
1) ก าหนดเซต E1 คอเซตของเอนทตทมอยทงหมดในเวอรชน r1 ของแฟมขอมล และก าหนดเซต E2 คอเซตของเอนทตทมอยทงหมดในเวอรชน r2 ของแฟมขอมลเดยวกน
2) เอนทตทถกเพมเขามาใหมสามารถหาไดจาก E2 - E1 3) เอนทตทถกลบออกไปสามารถหาไดจาก E1 - E2 4) ทกๆ เอนทตทอยในเซต E1 E2 อาจจะเปนเอนทตทมการเปลยนแปลงภายใน การ
ตดสนวาเอนทตใดบางทมการเปลยนแปลงแกไขสามารถท าไดโดยการประยกตใชฟงกชนดฟฟ (diff) กบซอรสโคดของเอนทตนนๆของทง 2 เวอรชน
ภายในแพลตฟอรม (Platform) ของอคลพซ (Eclipse) นนมการจดเตรยมโครงราง (Framework) ส าหรบการเปรยบเทยบความแตกตางระหวาง 2 ซอรสโคดใดๆทมประสทธภาพสงและสามารถน าไปประยกตเพมเตมไดทงหมด 2 โครงรางไดแกโครงรางเรนจดฟเฟอรเรนเซอร (Range Differencer) และโครงรางสตรคเชอรเมรจววเวอร (Structure Merge Viewer) ซงไดกลาวไปแลวในบทท 2 วธการเปรยบเทยบซอรสโคดของเอนทตเดยวกนใน 2 เวอรชนของงานวจยชนนผวจยเลอกใชโครงรางเรนจดฟเฟอรเรนเซอร (Zimmermann et al., 2004)
108
ตวอยางของการระบการเปลยนแปลงแกไขในระดบเอนทตตงแตขนตอนการระบเอนทต ของทง 2 เวอรชนของแฟมขอมลจนถงขนตอนวธการเปรยบเทยบความแตกตางของซอรสโคดของเอนทตเดยวกนใน 2 เวอรชน ดงตอไปน
IBuffer.java : 1.15
IBuffer.java : 1.16
Class IBuffer {
private String buffer = ‘’;
public IBuffer(){
...
}
public String getString(){
return buffer;
}
}
1
2
3
.
7
8
9
10
11
12
IBuffer.IBuffer()
line 2-7
IBuffer.getString()
line 8-10
Class IBuffer
line 1-11
Class IBuffer {
private String buffer = ‘’;
public IBuffer(){
...
}
public String getString(){
return buffer+‘.’;
}
public void splite(){
...
}
public void merge(){
...
}
}
1
2
3
.
7
8
9
10
11
.
34
35
.
52
53
IBuffer.IBuffer()
line 2-7
IBuffer.getString()
line 8-10Class IBuffer
line 1-53
IBuffer.getString()
line 11-34
IBuffer.getString()
line 35-52
(a)
(b)
รปท 3-4 แสดงตวอยางการระบเอนทตภายในซอรสโคด 2 เวอรชนของแฟมขอมล IBuffer.java
จากรปท 3-4 (a) แสดงซอรสโคดของแฟมขอมล IBuffer.java ในเวอรชนท 1.15 และรปท
3-4 (b) แสดงซอรสโคดของแฟมขอมล IBuffer.java ในเวอรชนท 1.16 เมอน าซอรสโคดทง 2 เวอรชนขางตนไปผานการวเคราะหไวยากรณ (Parse) โดยตววเคราะหไวยากรณ (Parser) ท าใหไดเซต E1 คอเซตของเอนทตทมอยทงหมดในเวอรชน 1.15 ของแฟมขอมล IBuffer.java และไดเซต E2 คอเซตของเอนทตทมอยทงหมดในเวอรชน 1.16 ของแฟมขอมลเดยวกน ดงน
E1 = { (variable, buffer, (Class, IBuffer, (file, IBuffer.java, …))),
(method, IBuffer(), (Class, IBuffer, (file, IBuffer.java, …))),
(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
(Class, IBuffer, (file, IBuffer.java, …)),
109
(file, IBuffer.java, …)
}
E2 = { (variable, buffer, (Class, IBuffer, (file, IBuffer.java, …))),
(method, IBuffer(), (Class, IBuffer, (file, IBuffer.java, …))),
(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
(method, splite(), (Class, IBuffer, (file, IBuffer.java, …))),
(method, Merge(), (Class, IBuffer, (file, IBuffer.java, …))),
(Class, IBuffer, (file, IBuffer.java, …)),
(file, IBuffer.java, …)
}
เอนทตทถกเพมเขามาใหมสามารถหาไดจาก E2 - E1 ดงน
E2 - E1 = { (method, splite(), (Class, IBuffer, (file, IBuffer.java, …))),
(method, Merge(), (Class, IBuffer, (file, IBuffer.java, …)))
}
จากเซต E2 - E1 ขางตนท าใหทราบวามการเพมเอนทตประเภทเมธอดชอ splite() และ Merge() เขาสเอนทตประเภทคลาสชอ IBuffer นนคอเกดเซตของการเปลยนแปลงแกไขดงน
{ add_to(Class, IBuffer, (file, IBuffer.java, …)),
add_to(Class, IBuffer, (file, IBuffer.java, …))
}
เอนทตทถกลบออกไปสามารถหาไดจาก E1 - E2 ดงน
110
E1 - E2 = { }
จากเซต E1 - E2 ขางตนเปนเซตวางดงนนท าใหเกดเซตของการเปลยนแปลงแกไขทเปนเซตวางเชนกน
เอนทตทอาจจะถกเปลยนแปลงแกไขภายในสามารถหาไดจาก E1 E2 ดงน
E1 E2 = { (variable, buffer, (Class, IBuffer, (file, IBuffer.java, …))),
(method, IBuffer(), (Class, IBuffer, (file, IBuffer.java, …))),
(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
(Class, IBuffer, (file, IBuffer.java, …)),
(file, IBuffer.java, …)
}
การตดสนวาเอนทตใดบางทมการเปลยนแปลงแกไขภายในจรงๆสามารถท าไดโดยการประยกตใชโครงรางเรนจดฟเฟอรเรนเซอร (Range Differencer) ส าหรบการเปรยบเทยบความแตกตางระหวาง 2 ซอรสโคดใดๆ ผลของการเปรยบเทยบคอมการเปลยนแปลงภายในเพยงเอนทตเดยวคอเอนทตประเภทเมธอดชอ getString() จาก return buffer; ในเวอรชน 1.15 เปน return buffer+’.’; ในเวอรชน 1.16 นนคอมเซตของการเปลยนแปลงแกไขดงน
{ alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))) }
ดงนนเซตของการเปลยนแปลงแกไขทงหมดทเกดขนจากเวอรชน 1.15 ไปเปนเวอรชน 1.16 ของแฟมขอมล IBuffer.java คอ
{ add_to(Class, IBuffer, (file, IBuffer.java, …)),
add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …)))
}
111
ด าเนนการขนตอนทงหมดนซ ากบแฟมขอมล Product.java จากเวอรชน 1.07 ไปเปนเวอรชนท 1.1 แฟมขอมล Sale.java จากเวอรชน 1.26 ไปเปนเวอรชนท 1.27 แฟมขอมล Shop.java จากเวอรชน 1.11 ไปเปนเวอรชนท 1.12 และ แฟมขอมล Customer.java จากเวอรชน 1.0 ไปเปนเวอรชนท 1.01 เมอไดเซตของการเปลยนแปลงแกไขทงหมดมาแลวใหน าการเปลยนแปลงแกไขเหลานนมารวมกนเปนเซตเดยวแลวเรยกเซตนนวาเซตทรานแซคชน 1 ทรานแซคชน เพอความสะดวกผวจยจงสมมตเซตของการเปลยนแปลงแกไขของแฟมขอมลทงหมดทไดหลงจากท าขนตอนขางตนเรยบรอยแลว ดงน
เซตของการเปลยนแปลงแกไขทงหมดทเกดขนจากเวอรชน 1.07 ไปเปนเวอรชน 1.1 ของแฟมขอมล Product.java คอ
{ alter(method, getPrice(), (Class, Product, (file, Product.java, …))),
alter(method, getDetail(), (Class, Product, (file, Product.java, …))),
del_from(Class, Product, (file, Product.java, …))
}
เซตของการเปลยนแปลงแกไขทงหมดทเกดขนจากเวอรชน 1.26 ไปเปนเวอรชน 1.27 ของแฟมขอมล Sale.java คอ
{ alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(Class, Sale, (file, Sale.java, …)))
}
เซตของการเปลยนแปลงแกไขทงหมดทเกดขนจากเวอรชน 1.11 ไปเปนเวอรชน 1.12 ของแฟมขอมล Shop.java คอ
{ alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
112
alter(Class, Shop, (file, Shop.java, …)))
}
เซตของการเปลยนแปลงแกไขทงหมดทเกดขนจากเวอรชน 1.0 ไปเปนเวอรชน 1.01 ของแฟมขอมล Customer.java คอ
{ alter(method, add(), (Class, Customer, (file, Customer.java, …))),
alter(method, getID(), (Class, Customer, (file, Customer.java, …))),
alter(Class, Customer, (file, Customer.java, …)),
del_from(Class, Customer, (file, Customer.java, …)))
}
ส าหรบงานวจยนผวจยสนใจทรานแซคชนของการเปลยนแปลงแกไขเฉพาะในระดบของแฟมขอมล (file) และคลาส (Class) เทานน แตอยางไรกตามขนตอนการระบการเปลยนแปลงแกไขในระดบเอนทตนกยงคงจ าเปนส าหรบงานวจยนเนองจากในภาษาซพลสพลส (C++) นนอนญาตใหใน 1 แฟมขอมลสามารถมคลาสไดมากกวา 1 คลาส ดงนนขนตอนการระบการเปลยนแปลงแกไขในระดบเอนทตนจะชวยในการระบเอนทตระดบคลาสของกรณดงกลาวได
การก าจดสงแปลกปลอม (Data Cleaning)
ขนตอนการก าจดสงแปลกปลอม (Data Cleaning) เปนขนตอนทเขาไปตรวจสอบขอมลทงหมดเพอคนหาสงแปลกปลอมและก าจดสงแปลกปลอมเหลานนออกไป ลกษณะของขอมลทรานแซคชนทจะถกระบวาเปนสงแปลกปลอมมอย 2 ลกษณะคอ 1) ทรานแซคชนขนาดใหญ (Large Transactions) และ 2) ทรานแซคชนการผสานกง (Merge Transactions) ตามทไดอธบายรายละเอยดไวในบทท 2
ขอมลเขา คอ ทรานแซคชนของการเปลยนแปลงแกไข (เฉพาะตารางชอ Transactions และตารางชอ Revisions)
113
ขอมลออก คอ ทรานแซคชนของการเปลยนแปลงแกไข (ฐานขอมลเฉพาะตารางชอ Transactions และตารางชอ Revisions ทถกปรบปรงขอมลใหม)
กระบวนการท างาน คอ พจารณาทรานแซคชนทไดมาจากขอมลออกของขนตอนการระบการเปลยนแปลงแกไขในระดบเอนทตขางตนวามทรานแซคชนใดมลกษณะเขาขายทจะเปนสงแปลกปลอมทง 2 ลกษณะหรอไม ถาพบทรานแซคชนทเขาขายดงกลาวจะท าการลบทรานแซคชนเหลานนออกไป
จากตวอยางของเซตรายการการเปลยนแปลงแกไขทไดมาจากขนตอนการระบการเปลยนแปลงแกไขในระดบเอนทตในขางนนมทรานแซคชนทมลกษณะเปนทรานแซคชนการผสานกงตามเงอนไขทไดกลาวไปในบทท 2 จงท าใหผลลพธหลงจากผานขนตอนการก าจดสงแปลกปลอมเหลอเซตรายการการเปลยนแปลงแกไข 3 เซต ดงน
{ add_to(Class, IBuffer, (file, IBuffer.java, …)),
add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …)))
}
{ alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(Class, Sale, (file, Sale.java, …))),
}
{ alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
alter(Class, Shop, (file, Shop.java, …)))
}
114
เซตของการเปลยนแปลงแกไขเหลานจะถกน ามารวมกนและตดรายการการเปลยนแปลงแกไขทซ าซอนกนออกแลวเรยกเซตนวาทรานแซคชน กลาวคอจากตวอยางทยกมาขางตนนนเมอน ามาผานสวนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวทง 4 ขนตอนแลวท าใหเกดทรานแซคชนขน 1 ทรานแซคชนทมรายการของการเปลยนแปลงแกไข 7 รายการดงน
T = { add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
alter(Class, Shop, (file, Shop.java, …)))
}
ขอมลทรานแซคชนทงหมดทไดจากสวนนคอขอมลทรานแซคชนของการเปลยนแปลงแกไขทจะน าไปใชในการสรางกฎความสมพนธในสวนท 3 นอกจากนนทรานแซคชนเหลานจะถกน าไปวเคราะหเพอคดเลอกขนมาสรางเปนขอสอบถามส าหรบการทดสอบทง 3 สถานการณในสวนท 2 ดวย
3.6.2 การสรางขอสอบถาม
การสรางขอสอบถาม คอ สวนทน าทรานแซคชนของการเปลยนแปลงแกไขทงหมดทมาจากสวนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวมาคดเลอก ทรานแซคชนจ านวนหนงทมความหมายทางสถต เรยกวาทรานแซคชนชดทดสอบ (Test set) เพอ
115
น าทรานแซคชนเหลานนมาใชในการทดสอบ หลงจากนนจงน าทรานแซคชน ทคดเลอกไวไปสรางเปนขอสอบถาม (Query) ส าหรบการทดสอบสถานการณ 3 สถานการณ คอ 1) ขอสอบถามส าหรบการทดสอบสถานการณการน าทาง 2) ขอสอบถามส าหรบการทดสอบสถานการณการปองกนการเกดขอผดพลาด และ 3) ขอสอบถามส าหรบการทดสอบสถานการณการเปลยนแปลงแกไขทสมบรณแลว ตามขอก าหนดทก าหนดไวในหวขอตวแปรควบคม
ขอมลเขา คอ ทรานแซคชนของการเปลยนแปลงแกไข (เฉพาะตารางชอ Revisions และตารางชอ Transactions)
ขอมลออก คอ ขอสอบถามส าหรบการทดสอบสถานการณการน าทาง ขอสอบถามส าหรบการทดสอบสถานการณการปองกนการเกดขอผดพลาด และขอสอบถามส าหรบการทดสอบสถานการณการเปลยนแปลงแกไขทสมบรณแลว (ตารางชอ Queries)
กระบวนการท างานของการสรางขอสอบถามส าหรบแตละสถานการณมขอก าหนดในการสรางทแตกตางกนออกไป ขอก าหนดในการสรางขอสอบส าหรบทง 3 สถานการณสามารถแบงออกเปน 2 ขนตอนยอยดงน
1) การเลอกทรานแซคชนชดทดสอบ 2) การสรางขอสอบถามแตละสถานการณ
การเลอกทรานแซคชนชดทดสอบ
ขอมลซอฟตแวรอารไคฟวทน ามาใชในการวจยนคอขอมลซอฟตแวรอารไคฟวจากโครงการพฒนาซอฟตแวรทางการบญชชอเคมายมนน (KMyMoney) ทม Thomas Baumgart และ Michael Edwardes เปนผกอตงโครงการและปจจบนมนกพฒนาในโครงการนทงหมด 10 คน ชองทางการตดตอสอสารระหวางนกพฒนาภายในโครงการคอการใชระบบไออารซ (IRC Channel) ทตองเขาสระบบโดยใชรหสผใช (Username) และรหสผาน (Password) ของนกพฒนาซงตองรองขอและไดรบอนมตในการรองขอเพอเขารวมเปนนกพฒนาของโครงการ นอกจากนนในกลมนกพฒนาทงหมดมเพยง Thomas Baumgart และ Martin Preuss ทเปดเผยขอมลสวนตว ดวยเหตนท าใหผ วจยมขอจ ากดในการสรางขอสอบถาม (Query) ทไดรบการประเมนชดทดสอบจากผ เชยวชาญ (ในกรณน ผ เชยวชาญคอนกพฒนาทอยในโครงการน) ผ วจยจงใชวธการเลอก
116
ทรานแซคชนตวแทนทมความหมายทางสถตมาจ านวนหนงเพอน าทรานแซคชนเหลานนมาสรางเปนขอสอบถามทใชในการวจยครงน
ทรานแซคชนชดทดสอบทผ วจยเลอกมาเปนตวแทนเพอสรางขอสอบถามส าหรบการทดสอบนหรอทเรยกวา ทรานแซคชนชดทดสอบ (Test set) ผ วจยก าหนดใหมทรานแซคชนชดทดสอบทงหมด 60 ทรานแซคชน ซงถอวาเพยงพอส าหรบขอสอบถามในงานวจยทางดานการคนคนขอมล (Information Retrieval) เนองจากขอสอบถามในงานวจยทางดานการคนคนขอมลควรมอยางนอย 30 หนวยทดสอบ (Baeza-Yates and Riberio-Neto, 1999) จากขอจ ากดทกลาวไปขางตนการสรางขอสอบถามจงตองเลอกจากทรานแซคชนในฐานขอมลทมความหมายทางสถต โดยเลอกทรานแซคชนชดดทดสอบ 60 ทรานแซคชนเปนตวแทนของทรานแซคชนทมขนาดสน กลาง ยาวและแบงเปนทรานแซคชนทพบบอยและพบไมบอยดวย ดงนนทรานแซคชนชดทดสอบทจะเลอกมาจะแบงไดเปน 6 กลมคอ 1) ทรานแซคชนขนาดสนและพบบอย 2) ทรานแซคชนขนาดสนและพบไมบอย 3) ทรานแซคชนขนาดกลางและพบบอย 4) ทรานแซคชนขนาดกลางและพบไมบอย 5) ทรานแซคชนขนาดยาวและพบบอย และ 6) ทรานแซคชนขนาดยาวและพบไมบอย ผวจยเลอกก าหนดใหแตละกลมมจ านวนทเทากนคอกลมละ 10 ทรานแซคชน หรอสามารถแสดงไดดงตารางตอไปน
ตารางท 3-2 แสดงจ านวนของทรานแซคชนในแตละกลมทจะเลอกขนมาสรางเปนขอสอบถาม
การปรากฏ \ ขนาด สน กลาง ยาว พบบอย 10 10 10 พบไมบอย 10 10 10
ขนาดของทรานแซคชนนนนบจากจ านวนของการเปลยนแปลงแกไขทงหมดในทรานแซคชน สวนวธการนบจ านวนการปรากฎของรปแบบทรานแซคชนจะนบจากทรานแซคชนทเปนซเปอรเซตของรปแบบทรานแซคชนนนได
รายละเอยดของการเลอกทรานแซคชนชดทดสอบทเฉพาะเจาะจงกบโครงการพฒนาซอฟตแวรเคมายมนน (KMyMoney) นนอธบายไวในภาคผนวก ก และน าทรานแซคชนทไดมาท าการสรางขอสอบถามของแตละสถานการณดวยวธการสรางขอสอบถามทอธบายในหวขอถดไป
การสรางขอสอบถามแตละสถานการณ
117
ขอสอบถาม (Query) ส าหรบงานวจยน คอ เซตทประกอบไปดวยเซตเหตการณการเปลยนแปลงแกไขและเซตผลลพธทคาดไว โดยจะมขอสอบถามทงหมด 3 แบบส าหรบ 3 สถานการณทแตกตางกนคอสถานการณการน าทาง สถานการณการปองกนขอผดพลาด และสถานการณการเปลยนแปลงแกไขทสมบรณแลว และถกเขยนในรปแบบ q = (Q, E) เชนเดยวกบงานวจยของ Zimmermann และคณะในปค.ศ. 2005 (Zimmermann et al., 2005) และงานวจยของ Methanias และคณะในปค.ศ. 2009 (Methanias et al., 2009) ทท าการทดสอบประสทธภาพของการคนหากฎความสมพนธบนขอมลซอฟตแวรอารไคฟวส าหรบระบบใหค าแนะน านกพฒนาระหวางการพฒนาซอฟตแวร ขนตอนของการสรางขอสอบถามในแตละสถานการณอธบายพอมยกตวอยางไดดงตอไปน (Zimmermann et al., 2005; Methanias et al., 2009)
ก าหนดให ขอสอบถาม (Query) q ใดๆ ถกเขยนในรปแบบ q = (Q, E)
โดยท เซต Q คอเซตเหตการณ (Situation) ซงเปนเซตยอยของเซตทรานแซคชน T
เซต E คอเซตผลลพธทคาดไว (Expected Result) ซงเปนเซตยอยของเซตทรานแซคชน T
และเทากบเซต T - Q
เซต T คอทรานแซคชนทประกอบดวยรายการของการเปลยนแปลงแกไขจ านวน |T| รายการ
สถานการณการน าทาง (Navigation)
ขอสอบถามส าหรบสถานการณการน าทาง ก าหนดใหมขอสอบถามทงหมด |T| ขอสอบถามตอ 1 ทรานแซคชน โดยทในแตละขอสอบถามนนมสมาชกในเซตเหตการณ Q เพยง 1 รายการคอรายการ e โดยทรายการ e เปนสมาชกของ ทรานแซคชน T และสมาชกในเซตผลลพธทคาดไว E กคอรายการอก |T| - 1 รายการทเหลอทไมใชรายการ e (Zimmermann et al., 2005)
ส าหรบทรานแซคชนชดทดสอบนนประกอบดวยรายการการเปลยนแปลงแกไขทงหมด 7 รายการท าใหไดขอสอบถามส าหรบทรานแซคชนชดทดสอบทงหมด 7 ขอสอบถาม โดยทในแตละ
118
ขอสอบถามนนมเซตเหตการณ Q ทมสมาชกเพยง 1 รายการคอ e โดยท e เปนสมาชกของทรานแซคชน T ขอสอบถามส าหรบการทดสอบสถานการณการน าทางจากทรานแซคชนชดทดสอบแสดงดงตอไปน
ก าหนดให qni คอ ขอสอบถามส าหรบการทดสอบสถานการณการน าทางขอสอบถามท i
ในรป qni = (Q, E)
qn1 = ( { add_to(Class, IBuffer, (file, IBuffer.java, …)) } ,
{ alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))) ,
alter(method, add(), (Class, Sale, (file, Sale.java, …))) ,
alter(method, remove(), (Class, Sale, (file, Sale.java, …))) ,
alter(Class, Sale, (file, Sale.java, …)) ,
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))) ,
alter(Class, Shop, (file, Shop.java, …))) }
)
qn2 = ({ alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …)))},
{ add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
alter(Class, Shop, (file, Shop.java, …))) } )
qn3 = ({ alter(method, add(), (Class, Sale, (file, Sale.java, …)))},
เซตเหตการณ
เซตผลลพธทคาดไว
119
{ alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
alter(Class, Shop, (file, Shop.java, …))) } )
qn4 = ({ alter(method, remove(), (Class, Sale, (file, Sale.java, …)))},
{ alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(Class, Sale, (file, Sale.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
alter(Class, Shop, (file, Shop.java, …))) } )
qn5 = ({ alter(Class, Sale, (file, Sale.java, …))},
{ alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
alter(Class, Shop, (file, Shop.java, …))) } )
120
qn6 = ({ alter(method, getDescription(), (Class, Shop, (file, Shop.java, …)))},
{ alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(Class, Shop, (file, Shop.java, …))) } )
qn7 = ({ alter(Class, Shop, (file, Shop.java, …)))},
{ alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
add_to(Class, IBuffer, (file, IBuffer.java, …)) } )
ตวอยางระเบยนของตารางชอ Queries ในการบนทกขอสอบถาม qn1
QueryID QueryType QAntcSet (Ref:RevisionID) QConqSet (Ref:RevisionID) 1 Navgation 11 34, 37, 46, 47, 51, 52
สถานการณการปองกนการเกดขอผดพลาด (Error Prevention)
ขอสอบถามส าหรบสถานการณการปองกนการเกดขอผดพลาด ก าหนดใหมขอสอบถามทงหมด |T| ขอสอบถามตอ 1 ทรานแซคชน โดยทในแตละขอสอบถามนนมสมาชกใน เซต
121
เหตการณ Q เทากบ |T| - 1 รายการนนคอ สมาชกในเซตเหตการณ Q คอสมาชกในทรานแซคชน T ทกรายการยกเวนรายการ e โดยทรายการ e เปนสมาชกของทรานแซคชน T และสมาชกในเซตผลลพธทคาดไว E ม 1 รายการคอรายการ e นนเอง (Zimmermann et al., 2005)
ส าหรบทรานแซคชนชดทดสอบนนท าใหไดขอสอบถามทงหมด 7 ขอสอบถาม โดยทในแตละขอสอบถามนนมเซตเหตการณ Q ทมจ านวนสมาชกเทากบ 6 รายการนนคอ สมาชกในเซตเหตการณ Q คอสมาชกในทรานแซคชน T ทกรายการยกเวน e โดยท e เปนสมาชกของทรานแซคชน T ขอสอบถามส าหรบการทดสอบสถานการณการน าทางจากทรานแซคชนชดทดสอบแสดงดงตอไปน
ก าหนดให qpi คอ ขอสอบถามส าหรบการทดสอบสถานการณการปองกนการเกด
ขอผดพลาดขอสอบถามท i ในรป qpi = (Q, E)
qp1 = ( { add_to(Class, IBuffer, (file, IBuffer.java, …)) ,
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))) ,
alter(method, add(), (Class, Sale, (file, Sale.java, …))) ,
alter(method, remove(), (Class, Sale, (file, Sale.java, …))) ,
alter(Class, Sale, (file, Sale.java, …)) ,
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))) } ,
{ alter(Class, Shop, (file, Shop.java, …))) }
)
qp2 = ({ add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
เซตเหตการณ
เซตผลลพธทคาดไว
122
alter(Class, Sale, (file, Sale.java, …)),
alter(Class, Shop, (file, Shop.java, …))) },
{ alter(method, getDescription(), (Class, Shop, (file, Shop.java, …)))} )
qp3 = ({ add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Shop, (file, Shop.java, …))),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))) },
{ alter(Class, Sale, (file, Sale.java, …))} )
qp4 = ({ add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Shop, (file, Shop.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))) },
{ alter(method, remove(), (Class, Sale, (file, Sale.java, …)))} )
qp5 = ({ add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(Class, Shop, (file, Shop.java, …))),
123
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))) },
{ alter(method, add(), (Class, Sale, (file, Sale.java, …)))} )
qp6 = ({ add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(Class, Shop, (file, Shop.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))) },
{ alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …)))} )
qp7 = ({ alter(Class, Shop, (file, Shop.java, …))),
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))) },
{ add_to(Class, IBuffer, (file, IBuffer.java, …))} )
124
ตวอยางระเบยนของตารางชอ Queries ในการบนทกขอสอบถาม qp1
QueryID QueryType QAntcSet (Ref:RevisionID) QConqSet (Ref:RevisionID) 35 Prevention 34, 37, 46, 47, 51, 52 11
สถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure)
ขอสอบถามส าหรบสถานการณการเปลยนแปลงแกไขทสมบรณแลว ก าหนดใหมขอสอบถามทงหมด 1 ขอสอบถามตอ 1 ทรานแซคชน โดยทในแตละขอสอบถามนนมสมาชกในเซตเหตการณ Q เทากบ |T| รายการนนคอ สมาชกในเซตเหตการณ Q คอสมาชกทกรายการในทรานแซคชน T และเซตผลลพธทคาดไว E เปนเซตวาง (Zimmermann et al., 2005)
ส าหรบทรานแซคชนชดทดสอบนนท าใหไดขอสอบถามทงหมด 1 ขอสอบถาม โดยทในแตละขอสอบถามนนมเซตเหตการณ Q ทมจ านวนสมาชกเทากบ 7 รายการนนคอ สมาชกในเซตเหตการณ Q คอสมาชกทกรายการในทรานแซคชน T ขอสอบถามส าหรบการทดสอบสถานการณการเปลยนแปลงแกไขทสมบรณแลวจากทรานแซคชนชดทดสอบแสดงดงตอไปน
ก าหนดให qci คอ ขอสอบถามส าหรบการทดสอบสถานการณการเปลยนแปลงแกไขท
สมบรณแลวขอสอบถามท i
qc1 = ( { add_to(Class, IBuffer, (file, IBuffer.java, …)) ,
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, add(), (Class, Sale, (file, Sale.java, …))) ,
alter(method, remove(), (Class, Sale, (file, Sale.java, …))) ,
alter(Class, Sale, (file, Sale.java, …)) ,
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
alter(Class, Shop, (file, Shop.java, …))) } ,
เซตเหตการณ
เซตผลลพธทคาดไว
125
)
ตวอยางระเบยนของตารางชอ Queries ในการบนทกขอสอบถาม qp1
QueryID QueryType QAntcSet (Ref:RevisionID) QConqSet (Ref:RevisionID) 41 Prevention 11, 34, 37, 46, 47, 51, 52 null
ขอสอบถามทงหมดทไดมานนแบงออกเปน 3 ชด ตามสถานการณตางกน 3 สถานการณเพอน าไปใชในการทดสอบของแตละสถานการณในสวนท 4 (หวขอ 3.6.4)
3.6.3 การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ
การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ คอ ขนตอนทน าทรานแซคชนของการเปลยนแปลงแกไขทงหมดมาท าเหมองขอมลเพอคนหากฎความสมพนธของการเปลยนแปลงแกไข โดยใชขนตอนวธของ Zimmermann และคณะ (Zimmermann et al., 2005) ทอธบายอยางละเอยดไวในบทท 2 หวขอ 2.8.2 มาประยกตใชส าหรบการคนหากฎความสมพนธทง 2 ตวแบบ
ขอมลเขา คอ ทรานแซคชนของการเปลยนแปลงแกไข (เฉพาะตารางชอ Revisions และตารางชอ Transactions)
ขอมลออก คอ กฎความสมพนธทไดจากการท าเหมองขอมลทง 2 ตวแบบรวมถงคาสนบสนนคาความเชอมน/คาความเชอมนใหมของกฎความสมพนธนนๆ (ตารางชอ Rules)
กระบวนการท างานของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ นนคอการน าขนตอนวธในการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธทชอวา ขนตอนวธอพรโอร (Apriori algorithm) ทถกน าเสนอโดย Agrawal และ Srikant (Agrawal and Srikant, 1994)
เนองจากงานวจยนสนใจศกษาวาการคนหากฎความสมพนธดวยตวแบบท 2 หรอการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหม
126
ของ Liu และคณะ (Liu et al., 2008) สามารถเพมประสทธภาพของระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรของไอดอ (IDE: integrated development environment) ไดหรอไม ดงนนในขนตอนการระบความนาสนใจของกฎความสมพนธแตละกฎในทง 2 ตวแบบของการคนหากฎความสมพนธจงแตกตางกนดงน
การคนหากฎความสมพนธดวยตวแบบท 1 ก าหนดใหใชการค านวณคาสนบสนนนบ (Support Count) และคาความเชอมน (Confidence) ในการระบความนาสนใจของกฎความสมพนธ ส าหรบการทดสอบนผวจยก าหนดใหคาสนบสนนนบขนต า (Minimum Support Count) เทากบ 3 และคาความเชอมนขนต า (Minimum Confidence) เทากบ 0.1
การคนหากฎความสมพนธดวยตวแบบท 2 ก าหนดใหใชการค านวณคาสนบสนนนบและคาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) ในการระบความนาสนใจของกฎความสมพนธ ส าหรบการทดสอบนผ วจยก าหนดใหคาสนบสนนนบขนต าเทากบ 3 และคาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) ขนต าเทากบ 0.1
ส าหรบตวอยางของการท าเหมองขอมลดวยเทคนคคนหากฎความสมพนธทง 2 ตวแบบนน เนองจากผ วจยไมสามารถสมมตทรานแซคชนทงหมดออกมาไดได ผ วจยจงสมมตกฎความสมพนธจากการคนหากฎความสมพนธ ทเปนผลลพธทไดมาจากกระบวนการขางตน เพอประโยชนในการอางองถงในสวนตอไป ดงน
ก าหนดให R คอ เซตของกฎความสมพนธทแตละรายการอยในรปแบบ Q -> {x} s;c
Q คอ เซตเหตการณทประกอบดวยรายการการเปลยนแปลงแกไขตงแต 1 รายการขนไป
x คอ รายการการเปลยนแปลงแกไขใดๆ
s คอ คาสนบสนนนบของกฎความสมพนธ Q -> {x}
c คอ คาความเชอมนของกฎความสมพนธ Q -> {x}
R = { alter(method, add(), ...) -> alter(method, getString(), ...) 6:0.5,
127
alter(method, add(), ...) -> alter(Class, Shop, ...) 5:0.71,
alter(method, getString(), ...) -> alter(method, getString(), ...) 5:0.63,
alter(method, add(), ...) -> alter(method, remove(), ...) 3:0.5,
alter(method, remove(), ...) -> alter(Class, Shop, ...) 2:0.29,
alter(Class, Sale, ...) -> alter(method, remove(), ...) 2:0.5,
alter(method, getDescription(), ...) -> alter(method, getString(), ...)1:0.14
}
ตวอยางระเบยนของตารางชอ Rules ในการบนทกกฎความสมพนธแรกในเซตขางตน
RuleID Model RAntcSet
(Ref:RevisionID) RConqSet
(Ref:RevisionID) Support Confidence
1 1 11 34 6 0.5
3.6.4 การสรางเซตของค าแนะน าส าหรบเหตการณ
การสรางเซตของค าแนะน าส าหรบเหตการณ คอ การน าเซตของกฎความสมพนธ R ส าหรบเหตการณ Q มาสรางเปนเซตของค าแนะน า (Suggestions) น าเสนอใหกบนกพฒนาเมอนกพฒนาไดท าใหเกดเหตการณ Q ใดๆขนมา เซตของค าแนะน าส าหรบเหตการณ Q สามารถนยามใหอยในรปของการยเนยน (Union) ของเซตรายการทตามมาของกฎความสมพนธ R ทมเซตรายการทมากอน ตรงกบเซตเหตการณ Q ได ดงตอไปน (Zimmermann et al., 2005)
⋃ { }
ในงานวจยของ Zimmermann และคณะ (Zimmermann et al., 2005) ไดตงขอสนนษฐานไววา การใหค าแนะน าในการเปลยนแปลงแกไขกบนกพฒนานน ค าแนะน าทจะไดรบความสนใจกคอค าแนะน าทอยใน 10 อนดบแรก ดงนนในการสรางเซตของค าแนะน าจงควรใหความสนใจกฎความสมพนธทอยใน 10 อนดบแรกโดยเรยงจากคาสนบสนนนบและคาความ
128
เชอมนเทานน ดงนนผ วจยจงก าหนดสมการในการสรางเซตของค าแนะน าดงแสดงในสมการตอไปน
ก าหนดให q คอ ขอสอบถาม (Query) ทประกอบดวยเซตเหตการณ (Situation) Q และเซตผลลพธทคาดไว (Expected Result) E และเขยนใหอยในรป q = (Q, E)
R คอ เซตของกฎความสมพนธทอยในรปแบบ Q{x} โดยท x คอรายการการเปลยนแปลงแกไข และก าหนดให R10 คอเซตของกฎความสมพนธทมระดบความนาสนใจสงสด 10 กฎแรกซงเรยงล าดบดวยคาความเชอมน โดยท R10 R
Aq คอ เซตของรายการการเปลยนแปลงแกไข x ทไดจากกฎความสมพนธในเซต R10 ทสอดคลองกบเซตเหตการณ Q ของขอสอบถาม q ซงสามารถเขยนในรป Aq =
Aq =
ขอมลเขา คอ เซตของกฎความสมพนธ และเซตเหตการณของขอสอบถามชดทดสอบ (ตารางชอ Rules และตารางชอ Queries)
ขอมลออก คอ เซตของค าแนะน าส าหรบเหตการณทน ามาทดสอบ (ตารางชอ Suggestions)
กระบวนการท างานของการสรางเซตของค าแนะน าส าหรบเหตการณ มขนตอนวธดงตอไปน
1) เลอกเหตการณ Q ทตองการน ามาหาค าแนะน า 2) คนหากฎความสมพนธทมเซตรายการทมากอนตรงกบเซตเหตการณ Q มาจากเซต
ของกฎความสมพนธทงหมด 3) น าเซตรายการทตามมาของกฎความสมพนธทไดจากขอท 2 มารวมกน (Union) เปน
เซตใหมใหชอวา เซตของค าแนะน าส าหรบเหตการณ Q โดยทแตละรายการของเซต
129
ค าแนะน าน จะเ รยงล าดบตามคาสนบสนนนบและคาความเ ชอมนของกฎความสมพนธนนๆ
จากเซตของกฎความสมพนธทไดมาจากขนตอนทแลว ตวอยางของการสรางเซตของค าแนะน าส าหรบเหตการณ alter(method, add(), (Class, Sale, (file, Sale.java, …))) แสดงไดดงตอไปน
1) เหตการณทเกดขนคอ เหตการณ alter(method, add(), (Class, Sale, (file, Sale.java, …)))
2) จากเซตของกฎความสมพนธทไดมาจากขนตอนทแลวมกฎความสมพนธทมเซตรายการทมากอน เปน alter(method, add(), (Class, Sale, (file, Sale.java, …))) อยทงหมด 3 กฎความสมพนธดงน
alter(method, add(), ...) -> alter(method, getString(), ...) 6:0.5
alter(method, add(), ...) -> alter(Class, Shop, ...) 5:0.71
alter(method, add(), ...) -> alter(method, remove(), ...) 3:0.5
3) น าเซตรายการทตามมาของกฎความสมพนธทง 3 กฎความสมพนธขางตนมารวมกนเปนเซตของค าแนะน าเมอเกดเหนการ เหตการณ alter(method, add(), (Class, Sale, (file, Sale.java, …))) ไดดงตอไปน
Aq = { alter(method, getString(), ...),
alter(Class, Shop, ...),
alter(method, remove(), ...)
}
ตวอยางระเบยนของตารางชอ Suggestions ในการบนทกเซตของค าแนะน าขางตน
SuggestionID ForSituation
(Ref:RevisionID) SuggestionSet
(Ref:RevisionID)
1 11 34, 46, 47
130
3.6.5 การประเมนผลการทดสอบ
เมอไดท าการทดสอบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวเสรจสนแลว ขนตอนตอไปนกคอการประเมนผลการทดสอบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว จดมงหมายหลกของการทดสอบของงานวจยนคอ การเปรยบเทยบคาประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบท 1 กบตวแบบท 2 ในสถานการณทตางกน 3 สถานการณ ดงนนหลงจากการทดสอบเสรจสนผวจยจงตองน าผลการทดสอบเหลานนมาค านวณหาคาประสทธภาพ ซงงานวจยนจะใชคาเอฟเมสเชอร (F-measure) มาเปนคาแสดงประสทธภาพของสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด และคาผลสะทอนกลบ (Feedback) มาเปนคาแสดงประสทธภาพของสถานการณการเปลยนแปลงแกไขทสมบรณแลว
ขอมลเขา คอ เซตของค าแนะน าส าหรบเหตการณของการทดสอบทง 6 การทดสอบ (ตารางชอ Suggestions)
ขอมลออก คอ คาประสทธภาพของการทดสอบทง 6 การทดสอบ (แฟมขอมลประเภทขอความทบนทกคาประสทธภาพของการทดสอบทงหมดแยกตามการทดสอบ)
หลงจากขนตอนการสรางเซตของค าแนะน าส าหรบเหตการณแลว ผ วจยจะไดเซตของค าแนะน าส าหรบเหตการณใดๆ ทสรางมาจากกฎความสมพนธของทรานแซคชนทงหมด เซตของค าแนะน านนจะถกน าไปเปรยบเทยบกบเซตผลลพธทคาดไวของชดทดสอบ ส าหรบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดจะน ามาค านวณคาความถกตอง (Precision) คาเรยกคน (Recall) และคาเอฟเมสเชอร (F-measure)
ในป 2005 งานวจยของ Zimmermann และคณะ (Zimmermann et al., 2005) ) ท าการเปรยบเทยบประสทธภาพของการท าเหมองขอมลบนขอมลซอฟตแวรอารไคฟวกบโครงการพฒนาระบบปฏบตการคอมพวเตอรตางๆ (Operating System) และกลาววา จดมงหมายของการทดสอบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรคอคาความถกตองทสง (คาใกลเคยง 1) และคาเรยกคนทสง (คาใกลเคยง 1) นนคอตองการใหระบบสามารถแนะน าค าแนะน าทงหมด (คาเรยกคนเทากบ 1) และแตละค าแนะน านนถกตองหรอตรงกบเซตผลลพธทคาดไวทงหมด (คาความถกตองเทากบ 1) ดงนนงานวจยของ Zimmermann และคณะจงใช
131
คาเฉลยฮารโมนนคของคาความถกตองและคาเรยกคน (Harmonic mean of Precision and Recall) หรอคาเอฟเมสเชอรทใหน าหนกของคาความถกตองและคาเรยกคนอยางสมดล เปนคาประเมนประสทธภาพของการท าเหมองขอมล (Zimmermann et al., 2005)
ตอมาในป 2009 งานวจยของ Methanias และคณะ (Methanias et al., 2009) ท าการเปรยบเทยบประสทธภาพของการท าเหมองขอมลบนขอมลซอฟตแวรอารไคฟวของโครงการซอฟตแวรสงแวดลอมอตสาหกรรม (Industrial Environment) ใน 3 สถานการณเชนเดยวกน และแนะน าใหใชคาเอฟเมสเชอรทใหน าหนกของคาความถกตองและคาเรยกคนอยางสมดลส าหรบการประเมนประสทธภาพในสถานการณการน าทางและสถานการณการปองกนขอผดพลาด (Methanias et al., 2009)
ดงนนงานวจยนจงใชคาเอฟเมสเชอรท β = 1 หรอคาเอฟเมสเชอรทใหน าหนกของคาความถกตองและคาเรยกคนอยางสมดลมาใชในการวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด คาเอฟเมสเชอร (F-measure) ทถวงน าหนกคาความถกตองแตคาเรยกคนอยางสมดล แสดงดงสมการตอไปน
ก าหนดให F1 คาเอฟเมสเชอร (F-measure) ทถวงน าหนกคาความถกตองแตคาเรยกคนอยางสมดล
Precision คาความถกตอง Recall คาเรยกคน
q คอ ขอสอบถาม (Query) ทประกอบดวยเซตเหตการณ (Situation) Q และเซตผลลพธทคาดไว (Expected Result) E และเขยนใหอยในรป q = (Q, E)
R คอ เซตของกฎความสมพนธทอยในรปแบบ Q{x} โดยท x คอรายการการเปลยนแปลงแกไข และก าหนดให R10 คอเซตของกฎความสมพนธทมระดบความนาสนใจสงสด 10 กฎแรกซงเรยงล าดบดวยคาความเชอมน โดยท R10 R
Aq คอ เซตของรายการการเปลยนแปลงแกไข x ทไดจากกฎความสมพนธในเซต R10 ทสอดคลองกบเซตเหตการณ Q ของขอสอบถาม q ซงสามารถเขยนในรป Aq =
เสมอ หรอเรยกวา เซตของค าแนะน า
132
|Aq E| คอ จ านวนรายการการเปลยนแปลงแกไขในเซตค าแนะน าทตรงกบรายการการเปลยนแปลงแกไขทอยในเซตผลลพธทคาดไว
|Aq| คอ จ านวนรายการการเปลยนแปลงแกไขทอยในเซตของค าแนะน า |E| คอ จ านวนรายการการเปลยนแปลงแกไขทอยในเซตผลลพธทคาดไว
,
และ
เนองจากคาเอฟเมสเชอรนนจะอยในชวง 0 ถง 1 คาเอฟเมสเชอรทมคาเปน 0 ในงานวจยนจะหมายถงประสทธภาพของการคนหากฎความสมพนธต าหรอรายการการเปลยนแปลงแกไขทถกดงขนมาไมตรงกบรายการการเปลยนแปลงแกไขใดๆในเซตผลลพธทคาดไวของขอสอบถามเลย และคาเอฟเมสเชอรทมคาเทากบ 1 ในงานวจยนจะหมายถงประสทธภาพของการคนหากฎความสมพนธสงหรอรายการการเปลยนแปลงแกไขทถกดงขนมาตรงกบเซตผลลพธทคาดไวของขอสอบถามทกรายการ
ตวอยางเชน สมมตขอมลสอบถามชดทดสอบส าหรบสถานการณการน าทาง 1 ขอสอบถาม และเซตของค าแนะน าส าหรบเหตการณ alter(method, add(), (Class, Sale, (file, Sale.java, …))) ดงน
ก าหนดให qn คอ ขอสอบถามชดทดสอบส าหรบสถานการณการน าทาง ในรป qn = (Q, E)
Aq คอ เซตของค าแนะน าส าหรบเหตการณ alter(method, add(), (Class, Sale, (file, Sale.java, …)))
qn = ({ alter(method, add(), (Class, Sale, (file, Sale.java, …))) },
{ add_to(Class, IBuffer, (file, IBuffer.java, …)),
alter(method, getString(), (Class, IBuffer, (file, IBuffer.java, …))),
alter(method, remove(), (Class, Sale, (file, Sale.java, …))),
alter(Class, Sale, (file, Sale.java, …)),
133
alter(method, getDescription(), (Class, Shop, (file, Shop.java, …))),
alter(Class, Shop, (file, Shop.java, …))) } )
Aq = { alter(method, getString(), ...),
alter(Class, Shop, ...),
del_from(Class, Product, …),
alter(method, remove(), ...)
}
จากขอสอบถามชดทดสอบและเซตของค าแนะน าขางตน น ามาค านวณคาความถกตอง (Precision) คาเรยกคน (Recall) และคาเอฟเมสเชอร (F-measure) ไดดงน
=
= 0.75
=
= 0.5
=
= 0.6
คาเอฟเมสเชอรทค านวณมาไดนนถามคาใกลเคยง 1 มากกหมายความวายงมประสทธภาพมาก
ส าหรบสถานการณการเปลยนแปลงแกไขทสมบรณแลว เซตของค าแนะน านนถกน าไปเปรยบเทยบกบเซตผลลพธทคาดไวของชดทดสอบและคาค านวณผลสะทอนกลบ (Feedback) ตามสมการตอไปน
ก าหนดให |Z*| คอ จ านวนขอสอบถามทอยในเซตของขอสอบถามทมเซตของค าแนะน าทไมเปนเซตวาง (|Aq| ≠ 0)
|Z| คอ จ านวนขอสอบถามทงหมด
134
เมอน าคาผลสะทอนกลบมาใชวดในสถานการณการเปลยนแปลงแกไขทสมบรณแลวจะสามารถแสดงใหเหนถงรอยละของการเกดการแจงเตอนทผด (False alarm) หรอการใหค าแนะน าทเปนผลบวกลวง (False Positive) นนเอง เนองจากคาผลสะทอนกลบมพสยอยระหวาง 0 กบ 1 คาผลสะทอนกลบทมคาเทากบ 0 หมายถงไมมขอสอบถามใดเลยทใหค าแนะน าทเปนผลบวกลวงออกมาในสถานการณนนนคอมประสทธภาพดทสด และคาผลสะทอนกลบทมคาเทากบ 1 หมายถงขอสอบถามทงหมดใหค าแนะน าทเปนผลบวกลวงออกมานนคอมประสทธภาพไมดทสด ดงนนการวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนจะตองเปรยบเทยบคาผลสะทอนกลบและคาผลสะทอนกลบทนอยกวาจะมความหมายวามประสทธภาพดกวา
ตวอยางเชน สมมตใหมขอสอบถามในชดทดสอบมทงหมด 100 ขอสอบถาม และสมมตใหมขอสอบถามทไดเซตของค าแนะน าไมเปนเซตวางทงหมด 66 ขอสอบถาม จะสามารถค านวณคาค านวณผลสะทอนกลบ (Feedback) ไดดงน
=
= 0.66
การพจารณาประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว ส าหรบสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนสามารถท าไดโดยการน าคาเอฟเมสเชอรทค านวณไดมาเปรยบเทยบโดยใชกราฟในรปแบบทเหมาะสม เพองายตอการพจารณาเปรยบเทยบคาเอฟเมสเชอรของการท าเหมองขอมลดวยรปแบบทง 2 ตวแบบ ส าหรบสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนสามารถท าไดโดยการน าคาค านวณผลสะทอนกลบทค านวณไดมาเปรยบเทยบคากนไดโดยตรง
3.6.6 การทดสอบสมมตฐาน
ส าหรบกรณของการทดสอบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนใชคาเอฟเมสเชอรเปนคาทแสดงถงประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว เมอการทดสอบประสทธภาพเสรจสนแลว ท าใหไดคาเอฟเมสเชอรออกมาเทาจ านวนของขอสอบถามชดทดสอบทสรางขนในขนตอนการสรางขอสอบถาม จากนนในขนตอนแรกจะตรวจสอบการแจกแจงของคาประสทธภาพทไดมาวามการแจกแจงปกตหรอไม ดวยการใชสถตทดสอบ Kolmogorov-Smirnov เพอเลอกทางเลอกในการทดสอบสมมตฐานไดวาจะใหการทดสอบสมมตฐานแบบใชพารามเตอร (Parametric Test)
135
หรอแบบไมองกบพารามเตอร (Non Parametric Test) ถาผลการทดสอบพบวาประชากรมการแจกแจงแบบปกต จงใชการวเคราะหโดยสถตทดสอบท (t-test) เพอทดสอบสมมตฐานของผลตางระหวางคาเฉลยของคาเอฟเมสเชอรของหนวยทดลอง 2 กลม ถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถตทมากกวา 0 จงจะสามารถปฏเสธ H0 ได แตถาผลการแจกแจงประชากรพบวามการแจกแจงไมปกต ตองใชว ธการทดสอบสมมตฐานแบบไมองกบพารามเตอร (Non Parametric Test) ตอไป โดยในทนคอการวเคราะหโดยสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) เพอทดสอบสมมตฐานของผลตางระหวางคาเฉลยของคาเอฟเมสเชอรของหนวยทดลอง 2 กลม ถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถตซมากกวา 0 ในกรณทผลการวเคราะหตงอยบนพนฐานทางบวก (Based on positive ranks) จงจะสามารถปฏเสธ H0 ได
ส าหรบการทดสอบในสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนใชคาผลสะทอนกลบ เปนคาทแสดงถงประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว เมอการทดสอบประสทธภาพเสรจสนแลว ท าใหไดคาผลสะทอนกลบออกมาหนงคาตอหนงการทดสอบ คาผลสะทอนกลบทไดมานนแสดงใหเหนถงรอยละของการเกดการแจงเตอนทผด (False Alarm) หรอการใหค าแนะน าทเปนผลบวกลวง (False Positive) นนเอง ดงนนการวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนคาผลสะทอนกลบทนอยกวาจะมความหมายวามประสทธภาพมากกวา นนคอถาคาผลสะทอนกลบของการคนหากฎความสมพนธดวยตวแบบท 1 มากกวาการคนหากฎความสมพนธดวยตวแบบท 2 แลวจงสามารถปฏเสธ H0 ได
136
3.7 เครองมอทใชในงานวจย
ตามทไดกลาวมาในหวขอแนวทางการท าวจยแลววาผวจยไดพฒนาเครองมอทดสอบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบใน 3 สถานการณ ผวจยเลอกใชโปรแกรมประยกตอโรส (eROSE) (Zimmermann et al., 2005) รวมกบสครปท (Srcript) ทผ วจยสรางขนมาเองดวยภาษาพเอชพ (PHP) และระบบจดการฐานขอมลชอพเอชพมายแอดมน (PHPMyAdmin Database Management System) ซงเปนฐานขอมลแบบเปดสามารถน ามาใชงานไดโดยไมเสยคาใชจายและเขากนไดดกบภาษาพเอชพ (PHP) ผวจยออกแบบเครองมอทดสอบตามขนตอนในหวขอ 3.6 และแผนภาพในรป 3-1 ภาพรวมของเครองมอการทดสอบทงหมดแบงออกเปน 5 สวนดงน
137
(CVS log file)
(eROSE)
1
2
3
2
1
1 1
1 2
1 3
2 1
2 2
2 3
1
1
1
2
1
3
2
1
2
2
2
3
1 2
3
1
4
2
3
1
2
34
5
5
6
67
n n
5
1
2
3
1 1
1 2 1 3 2 1 2 2 2 3
1 1
1 2 1 3 2 1 2 2 2 3
8
รปท 3-5 แสดงภาพรวมของเครองมอทใชในการทดสอบทดสอบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว
การออกแบบฐานขอมลทใชในงานวจยน ออกแบบตามฐานขอมลของโปรแกรมประยกตอโรส (eROSE) (Zimmermann et al., 2005) เนองจากผวจยใชบางสวนของโปรแกรมประยกต อโรสมาใชในขนตอนแรกของการวจย ฐานขอมลประกอบดวยตารางทงหมด 9 ตาราง คอ ตารางชอ Directories ตารางชอ Files ตารางชอ Revisions ตารางชอ Transactions ตารางชอ Branches ตารางชอ Tags ตารางชอ Queries ตารางชอ Rules และตารางชอ Suggestions ตวอยางระเบยนของแตละตารางแสดงในหวขอ 3.6 ความสมพนธของแตละตารางแสดงดงแผนภาพตอไปน
138
Directories
PK DirectoryID
DirectoryName
Depth
Files
PK FileID
FileName
FK1 DirectoryID
FileExtension
Depth
NumberOfRevision
FK2 BranchNamesRevisions
PK RevisionID
FileID
FK1 TransactionID
CheckinTime
Plus
Minus
State
Branch
Prefix
Transactions
PK TransactionID
Author
Message
MessageMD5
BeginTime
EndTime
IsNoise
Branches
PK BranchNames
FileID
BranchPrefix
OriginRevision
InternalRevision
Queries
PK QueryID
QueryType
QAntcSet
QConqSet
Rules
PK RuleID
Model
RAntcSet
RConqSet
Support
Confidence
Suggestions
PK SuggestionID
ForSituation
SuggestionSet
Tags
PK TagName
FK2 FileID
FK1 RevisionID
FK1
FK2
FK1
FK2FK1
FK2
รปท 3-6 แสดงแผนภาพออาร (ER Diagram) ฐานขอมลของเครองมอทใชในการทดสอบ
รายละเอยดของเครองมอทง 5 เครองมอ แสดงดงตอไปน
สวนของการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว
ขนตอนแรกของการทดสอบคอการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (Preparing Data for Mining in Software Archives) ของโครงการพฒนาซอฟตแวรชอเคมายมนน (KMyMoney) ทพฒนาดวยภาษาซพลสพลส (C++) ในสวนนผ วจยเลอกใชสวนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวซงเปนสวนหนงโปรแกรมประยกตอโรส (eROSE) (Zimmermann et al., 2005) เนองจากโปรแกรมประยกตอโรสสามารถรบรองการจดเตรยมขอมลเพอการท าเหมองขอมลของโครงการพฒนาซอฟตแวรทพฒนาดวยภาษาซพลสพลส (C++) และยงเปนเครองมอทถกน าไปใชงานวจยทเกยวของกบการวเคราะหขอมลซอฟตแวรอารไคฟวเชน งานวจยของ Zimmermann และคณะในป 2005 (Zimmermann et al., 2005) และในงานวจยของ Methanias และคณะในป 2009 (Methanias et al., 2009)
139
ขนตอนวธส าหรบสวนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวของโปรแกรมประยกตอโรสประกอบดวย 4 ขนตอนคอ 1) การสกดขอมล (Data Extraction) 2) การซอมแซมทรานแซคชน (Restoring Transactions) 3) การระบการเปลยนแปลงแกไขในระดบเอนทต (Mapping Changes to Entities) และ 4) การก าจดสงแปลกปลอม (Data Cleaning) อธบายไวอยางละเอยดหวขอท 3.6.1 เ มอไดทรานแซคชนทสมบรณแลวเกบลงฐานขอมลของงานวจยเพอจดเตรยมขอมลไวกอนจะน าขอมลเหลานไปท าการทดสอบในสวนการสรางขอสอบถามส าหรบการทดสอบส าหรบ 3 สถานการณตอไป
ขอมลเขา คอ ขอมลซอฟตแวรอารไคฟวซงประกอบดวย แฟมขอมลซอรสโคดทงโครงการทกเวอรชน และแฟมขอมลบนทกของระบบคอนเคอเรนทเวอรชน (CVS Log File) ตวอยางของขอมลเขาแสดงดงรป 3-2 ภายใตหวขอ 3.6.1
ขอมลออก คอ ทรานแซคชนของการเปลยนแปลงแกไข ทประกอบดวยตาราง 6 ตาราง คอตารางชอ Files ตารางชอ Directories ตารางชอ Tags ตารางชอ Branches ตารางชอ Revisions และตารางชอ Transactions ตวอยางของขอมลออกแสดงในหวขอ 3.6.1
สวนของการสรางขอสอบถามส าหรบการทดสอบส าหรบ 3 สถานการณ
สวนท 2 คอสวนของการสรางขอสอบถามส าหรบการทดสอบส าหรบแตละสถานการณทง 3 สถานการณ การท างานของสวนนประกอบดวยสวนยอย 2 สวนคอ 1) สวนการเลอกทรานแซคชนชดทดสอบ และ 2) สวนการสรางขอสอบถามแตละสถานการณ
ในสวนยอยท 1 ผวจยตองวเคราะหสถตเชงพรรณาและสมเลอกทรานแซคชนชดทดสอบโดยใชโปรแกรมตารางค านวณไมโครซอฟตเอกซเซล (Microsoft Excel) ทงหมดไมไดพฒนาเครองมอส าหรบสวนน ขนตอนวธในการวเคราะหและเลอกทรานแซคชนชดทดสอบจากโครงการพฒนาซอฟตแวรชอเคมายมนน (KMyMoney) ทอธบายไวในหวขอ 3.6.2 และภาคผนวก ก
ในสวนยอยท 2 เปนสวนทผ วจยพฒนาเครองมอขนมาเองและเรยกวาเครองมอนวาเครองมอสรางขอสอบถามส าหรบ 3 สถานการณ โดยพฒนาขนมาในลกษณะของสครปทดวยภาษาพเอชพ (PHP) ผวจยท าการทดสอบความถกตองของเครองมอนโดยการตรวจสอบแบบเดนผาน (Walkthrough) กบผลลพธทงหมดของเครองมอน นนกคอขอสอบถามส าหรบ 3 สถานการณรายละเอยดแสดงในภาคผนวก ข
140
ขนตอนวธในสวนยอยท 2 การสรางขอสอบถามทอธบายไวอยางละเอยดในหวขอ 3.6.2
ขอมลเขา คอ ทรานแซคชนของการเปลยนแปลงแกไข (เฉพาะตารางชอ Revisions และตารางชอ Transactions) ตวอยางของขอมลเขาแสดงในหวขอ 3.6.1
ขอมลออก คอ ขอสอบถามส าหรบสถานการณน าทาง ขอสอบถามส าหรบสถานการณปองกนการเกดขอผดพลาด และขอสอบถามส าหรบสถานการณการเปลยนแปลงแกไขทสมบรณแลว (ตารางชอ Queries) ตวอยางของขอมลออกแสดงในหวขอ 3.6.2
สวนของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว
สวนท 3 คอสวนการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ นนคอ การคนหากฎความสมพนธดวยตวแบบท 1 และการคนหากฎความสมพนธดวยตวแบบท 2 เครองมอทผ วจยพฒนาขนมาส าหรบสวนนเรยกวาเครองมอคนหากฎความสมพนธดวยตวแบบท 1 และเครองมอคนหากฎความสมพนธดวยตวแบบท 2 โดยพฒนาเครองมอทง 2 นในลกษณะของสครปทดวยภาษาพเอชพ (PHP)
ขนตอนวธการคนหากฎความสมพนธดวยตวแบบท 1 และการคนหากฎความสมพนธดวยตวแบบท 2 ใชขนตอนวธทชอวา วธอพรโอร (Apriori algorithm) อธบายในหวขอ 2.8.2 และก าหนดคาองคประกอบตางๆตามทระบไวในหวขอ 3.6.3 เชนเดยวกบงานวจยของ Zimmermann และคณะในป ค.ศ. 2004 และ 2005 (Zimmermann et al., 2004; Zimmermann et al., 2005) และงานวจยของ Michail ในป ค.ศ. 2000 (Michail, 2000) ผวจยท าการทดสอบความถกตองของเครองมอนโดยการสมตรวจผลลพธหรอกฎความสมพนธทไดมาจากเครองมอทง 2 เครองมอรายละเอยดแสดงในภาคผนวก ข
ขอมลเขาของเครองมอคนหากฎความสมพนธดวยตวแบบท 1 และเครองมอคนหากฎความสมพนธดวยตวแบบท 2 คอ ทรานแซคชนทงหมดในฐานขอมล (เฉพาะเฉพาะตารางชอ Revisions และตารางชอ Transactions ทงหมด) ตวอยางของขอมลเขาแสดงในหวขอ 3.6.2
ขอมลออกของเครองมอคนหากฎความสมพนธดวยตวแบบท 1 คอ กฎความสมพนธดวยตวแบบท 1 รวมถงคาสนบสนนคาความเชอมนของกฎความสมพนธ (ตารางชอ Rules) ขอมลออกของเครองมอคนหากฎความสมพนธดวยตวแบบท 2 คอ กฎความสมพนธดวยตวแบบท 2 รวมถง
141
คาสนบสนนคาความเชอมนของกฎความสมพนธ (ตารางชอ Rules) ตวอยางของขอมลออกแสดงในหวขอ 3.6.3
สวนของการสรางเซตของค าแนะน าส าหรบเหตการณในขอสอบถาม
สวนท 4 ของการทดสอบคอสวนของการสรางเซตของค าแนะน าส าหรบเหตการณในขอสอบถามชดทดสอบ ในสวนนผ วจยพฒนาเครองมอขนมาเองและใหชอวาเครองมอสรางค าแนะน าส าหรบเหตการณ ผวจยพฒนาขนมาในลกษณะของสครปทดวยภาษาพเอชพ (PHP)
ขนตอนวธการสรางเซตของค าแนะน าส าหรบเหตการณในขอสอบถามอธบายไวในหวขอ 3.6.4 ซงเปนขนตอนวธเดยวกนกบทใชในงานวจยของ Zimmermann และคณะในป 2005 (Zimmermann et al., 2005) และในงานวจยของ Methanias และคณะในป 2009 (Methanias et al., 2009) ผวจยท าการทดสอบความถกตองของเครองมอนโดยการสมตรวจผลลพธหรอเซตของค าแนะน าส าหรบเหตการณทไดมาจากการใชเครองมอน รายละเอยดแสดงในภาคผนวก ข
ขอมลเขา คอ เซตเหตการณในขอสอบถาม (ตารางชอ Queries) และกฎความสมพนธดวยตวแบบท 1 และกฎความสมพนธดวยตวแบบท 2 (ตารางชอ Rules) ตวอยางของขอมลเขาแสดงในหวขอ 3.6.2 และหวขอ 3.6.3 ตามล าดบ
ขอมลออก คอ เซตของค าแนะน าของการทดสอบทง 6 การทดสอบ (ตารางชอ Suggestions) ตวอยางของขอมลออกแสดงในหวขอ 3.6.4
สวนของการประเมนผลการทดสอบ
สวนสดทายของการทดสอบคอสวนของการประเมนผลการทดสอบเปนสวนทน าเซตของค าแนะน าส าหรบเหตการณทไดมาจากการทดสอบทง 6 การทดสอบมาค านวณหาคาประสทธภาพของการท าเหมองขอมล ในสวนนผ วจยพฒนาเครองมอขนมาเองและใหชอวาเครองมอประเมนผลการทดสอบ โดยการทดสอบททดสอบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนจะค านวณคาเอฟเมสเชอร สวนการทดสอบททดสอบในสถานการณการเปลยนแปลงแกไขทสมบรณแลวจะค านวณคาสะทอนกลบ เชนเดยวกบงานวจยของ Zimmermann และคณะในป 2005 (Zimmermann et al., 2005) และในงานวจยของ Methanias และคณะในป 2009 (Methanias et al., 2009) ผวจยพฒนาขนมาในลกษณะของสครปทดวยภาษาพเอชพ (PHP) ตามขนตอนวธในการประเมนผลการทดสอบแตละ
142
การทดสอบอธบายอยางละเอยดในหวขอ 3.6.5 ผวจยท าการทดสอบความถกตองของเครองมอน โดยการสมตรวจผลลพธหรอคาประสทธภาพของแตละขอสอบถามในแตละการทดสอบทไดมาจากการใชเครองมอน รายละเอยดแสดงในภาคผนวก ข
ขอมลเขา คอ เซตของค าแนะน าส าหรบเหตการณของการทดสอบทง 6 การทดสอบ (ตารางชอ Suggestions) และขอสอบถามของแตละสถานการณ
ขอมลออก คอ คาประสทธภาพของการทดสอบทง 6 การทดสอบทอยในรปแบบ (format) ของแฟมขอมลตวอกษร (Text file)
ผ วจยจะน าขอมลออกทไดจากเครองมอประเมนผลการทดสอบไปเขาสขนตอนการทดสอบสมมตฐานซงเปนขนตอนสดทายของการวจยน ผวจยตองใชการวเคราะหและเลอกสถตทดสอบทเหมาะสมตามขอก าหนดทอธบายในหวขอ 3.6.6 และน าไปวเคราะหดวยโปรแกรมสถตเอสพเอสเอสตอไป
3.8 ความถกตอง (Validity) และคาความนาเชอถอ (Reliability) ของขอมลทเกบ
การตอบวตถประสงคของขอมลงานวจยใหเชอถอได (Reliability) และถกตอง (Validity) จ าเปนตองควบคมปจจยทเกยวของอนไดแก การเลอกโครงการพฒนาซอฟตแวร การสรางขอสอบถามและการทดสอบประสทธภาพของการท าเหมองขอมล ดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว
เนองจากงานวจยนมวตถประสงคในการทดลองเพอศกษาผลกระทบจากตวแปรตน คอ การท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบตางๆ กน ซงตวแปรตนนเปนปจจยทตองเปลยนคาไปตามแบบแผนการทดลองเพอดความแตกตางอนเกดขนจากการทดลอง นอกจากนนยงตองสามารถควบคมปจจยในดานตางๆ ใหมความเหมอนกนหรอมความคงทภายใตสภาวะเดยวกน เพอผลการทดลองทสะทอนเปนคาของตวแปรตนของทงกลมควบคมและกลมทดสอบ นนคอ การคนหากฎความสมพนธดวยตวแบบท 1 และการคนหากฎความสมพนธดวยตวแบบท 2 เทานน โดยในการทดลองมปจจยทตองควบคมดงน
143
1) การเลอกโครงการพฒนาซอฟตแวรทน ามาใชในการทดสอบ ผ วจยก าหนดใหขอมลซอฟตแวรอารไคฟวและขอสอบถามทจะทดสอบนนเปนขอมลทมาจากโครงการพฒนาซอฟตแวรโครงการเดยวกนเพอใหคาประสทธภาพทวดออกมาน นเปนประสทธภาพทเกดมาจากตวแบบของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทแตกตางกนอยางแทจรง
2) โครงการพฒนาซอฟตแวรทน ามาใชในงานวจยนเปนโครงการพฒนาซอฟตแวรชอเคมายมนน (KMyMoney) ซงเปนซอฟตแวรทางการบญช ซงเรมตนการเผยแพรโครงการตงแตป ค.ศ. 2000 มทรานแซคชนของการเปลยนแปลงแกไขกวา 28261 ทรานแซคชน ท าใหขอมลซอฟตแวรอารไคฟวของโครงการนสามารถเปนตวแทนของขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรทมความหลากหลายได
3) การก าหนดเซตเหตการณและเซตผลลพธทคาดไวของขอสอบถามทงหมดถกก าหนดมาจากขอมลซอฟตแวรอารไคฟวทน ามาทดสอบเอง จงสามารถแนใจไดวาผลลพธทจะไดออกมานนมาจากเหตการณทเคยเกดขนมาแลวจรงๆในอดต ซงท าใหกระบวนการพจารณาผลลพธทระบบแสดงออกมาในขนตอนการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบในงานวจยนจะสามารถเชอถอความถกตองของผลลพธซงเปนเซตของค าแนะน าส าหรบเหตการณนนๆได
4) การทดสอบประสทธภาพของการท าเหมองขอมล ดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในงานวจยนจะใชคาเอฟเมสเชอร (F-measure) ทเปนการค านวณรวมกนระหวางคาความถกตอง (Precision) และคาเรยกคน (Recall) เปนมาตรวดทนยมใชในการทดลองในงานวจยดานการคนคนสารสนเทศ (Baeza-Yates and Riberio-Neto, 1999) โดยจะเปนการวดวาระบบสามารถใหผลลพธของการคนคนออกมาไดถกตองหรอไม
5) เครองมอทใชในการทดสอบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบเปนเครองมอเดยวกนทงหมด ตางกนเพยงเครองในการคนหากฎความสมพนธทใชตวแบบในการระบความนาสนใจของกฎความสมพนธ (ตวแปรตน) เทานน
6) เครองมอทใชในการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟวคอเครองมอทเปนสวนหนงโปรแกรมประยกตอโรส (eROSE) (Zimmermann et
144
al., 2005) ทไดรบการยอมรบและถกน าไปใชงานวจยทเกยวของกบการวเคราะหขอมลซอฟตแวรอารไคฟวเชน งานวจยของ Zimmermann และคณะในป 2005 (Zimmermann et al., 2005) และในงานวจยของ Methanias และคณะในป 2009 (Methanias et al., 2009)
7) เครองมอทผ วจยพฒนาขนมาเองไดแก เครองมอสรางขอสอบถามส าหรบ 3 สถานการณ เครองมอคนหากฎความสมพนธดวยตวแบบท 1 และตวแบบท 2 เครองมอสรางค าแนะน าส าหรบเหตการณ และเครองมอประเมนผลการทดสอบ ผวจยไดท าการทดสอบความถกตองของเครองมอทงดวยวธการสมตรวจความถกตองของผลลพธทเปนตวแทนของผลลพธทงหมด
3.9 กรอบการวเคราะหขอมล (Data Analysis Framework)
ส าหรบกรณของการทดสอบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนใชคาเอฟเมสเชอรเปนคาทแสดงถงประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว เมอการทดสอบประสทธภาพเสรจสนแลว ท าใหไดคาเอฟเมสเชอรออกมาเทาจ านวนของขอสอบถามชดทดสอบทสรางขนในขนตอนการสรางขอสอบถาม จากนนในขนตอนแรกจะตรวจสอบการแจกแจงของคาประสทธภาพทไดมาวามการแจกแจงปกตหรอไม ดวยการใชสถตทดสอบ Kolmogorov-Smirnov เพอเลอกทางเลอกในการทดสอบสมมตฐานไดวาจะใหการทดสอบสมมตฐานแบบใชพารามเตอร (Parametric Test) หรอแบบไมองกบพารามเตอร (Non Parametric Test) ถาผลการทดสอบพบวาประชากรมการแจกแจงแบบปกต จงใชการวเคราะหโดยสถตทดสอบท (t-test) เพอทดสอบสมมตฐานของผลตางระหวางคาเฉลยของคาเอฟเมสเชอรของหนวยทดลอง 2 กลม ถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถตทมากกวา 0 จงจะสามารถปฏเสธ H0 ได แตถาผลการแจกแจงประชากรพบวามการแจกแจงไมปกต ตองใชว ธการทดสอบสมมตฐานแบบไมองกบพารามเตอร (Non Parametric Test) ตอไป โดยในทนคอการวเคราะหโดยสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) เพอทดสอบสมมตฐานของผลตางระหวางคาเฉลยของคาเอฟเมสเชอรของหนวยทดลอง 2 กลม ถาคา Sig. (Significance) ทค านวณไดนอย
145
กวา 0.05 และคาสถตซมากกวา 0 ในกรณทผลการวเคราะหตงอยบนพนฐานทางบวก (Based on positive ranks) จงจะสามารถปฏเสธ H0 ได
ส าหรบการทดสอบในสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนใชคาผลสะทอนกลบ เปนคาทแสดงถงประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว เมอการทดสอบประสทธภาพเสรจสนแลว ท าใหไดคาผลสะทอนกลบออกมาหนงคาตอหนงการทดสอบ คาผลสะทอนกลบทไดมานนแสดงใหเหนถงรอยละของการเกดการแจงเตอนทผด (False Alarm) หรอการใหค าแนะน าทเปนผลบวกลวง (False Positive) นนเอง ดงนนการวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนคาผลสะทอนกลบทนอยกวาจะมความหมายวามประสทธภาพมากกวา นนคอถาคาผลสะทอนกลบของการคนหากฎความสมพนธดวยตวแบบท 1 มากกวาการคนหากฎความสมพนธดวยตวแบบท 2 แลวจงสามารถปฏเสธ H0 ได
146
บทท 4 ผลการวเคราะหขอมล…….
4.1 บทน า
ในบทนจะแสดงผลและวเคราะหเปรยบเทยบทดสอบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบ เพอน ามาตอบวตถประสงคของงานวจยทกลาวไปในบทท 3 ซงไดแก 1) เปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบในสถานการณการน าทาง 2) เปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบในสถานการณการปองกนการเกดขอผดพลาด และ 3) เปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบในสถานการณการเปลยนแปลงแกไขทสมบรณแลว และในสวนทายของบทนเปนการศกษาและวเคราะหขอมลเพมเตม
4.2 ผลการทดลอง
การทดลองนมวตถประสงคเพอวดประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวของตวแบบ 2 ตวแบบในสถานการณของการพฒนาซอฟตแวรทตางกน 3 สถานการณ โดยใชคาเอฟเมสเชอรเปนคาประเมนประสทธภาพของการท าเหมองขอมลบนขอมลซอฟตแวรอารไคฟวในสถานการณการน าทาง และสถานการณการปองกนขอผดพลาด และใชคาผลสะทอนกลบเปนคาประเมนประสทธภาพของการท าเหมองขอมลบนขอมลซอฟตแวรอารไคฟวในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
ทรานแซคชนชดทดสอบจ านวน 60 ทรานแซคชนทเปนตวแทนของทรานแซคชนการเปลยนแปลงแกไขจากโครงการพฒนาซอฟตแวรทางการบญชชอเคมายมนน (KMyMoney) ทเลอกมาตามขนตอนยอยภายในขนตอนการสรางขอสอบถามหวขอท 3.6.2 และภาคผนวก ก สามารถน ามาสรางเปนขอสอบถามไดทงหมด 962 ขอสอบถาม ประกอบดวย ขอสอบถามส าหรบทดสอบในสถานการณการน าทางทงหมด 451 ขอสอบถาม ขอสอบถามส าหรบทดสอบใน
147
สถานการณการปองกนการเกดขอผดพลาดทงหมด 451 ขอสอบถาม และขอสอบถามส าหรบทดสอบในสถานการณการเปลยนแปลงแกไขทสมบรณแลวทงหมด 60 ขอสอบถาม คาเอฟเมสเชอรทไดจากการทดสอบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบส าหรบสถานการณการน าทางทงหมด 451 คาและส าหรบสถานการณการปองกนการเกดขอผดพลาดทงหมด 451 คาแสดงในตารางท ข-1 และตารางท ข-2 ตามล าดบ คาผลสะทอนกลบทไดจากการทดสอบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบส าหรบสถานการณการเปลยนแปลงแกไขทสมบรณแลวทงหมด 60 คาแสดงในตารางท ข-3
จากการทดสอบประสทธภาพของการท าเหมองขอมล ดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบคอ การคนหากฎความสมพนธดวยตวแบบท 1 และ การคนหากฎความสมพนธดวยตวแบบท 2 นน ในสถานการณของการพฒนาซอฟตแวรทตางกน 3 สถานการณคอ สถานการณการน าทาง สถานการณการปองกนการเกดขอผดพลาด และสถานการณการเปลยนแปลงแกไขทสมบรณแลว สามารถสรปไดดงน
การทดสอบสถานการณการน าทาง - ขอสอบถามทไดเซตของค าแนะน าทใหคาประสทธภาพของการคนหากฎ
ความสมพนธดวยตวแบบท 2 มากกวาคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 มจ านวน 192 ขอสอบถาม
- ขอสอบถามทไดเซตของค าแนะน าทใหคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 เทากบคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 มจ านวน 111 ขอสอบถาม
- ขอสอบถามทไดเซตของค าแนะน าทใหคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 นอยกวาคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 มจ านวน 148 ขอสอบถาม
การทดสอบสถานการณการปองกนการเกดขอผดพลาด - ขอสอบถามทไดเซตของค าแนะน าทใหคาประสทธภาพของการคนหากฎ
ความสมพนธดวยตวแบบท 2 มากกวาคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 มจ านวน 46 ขอสอบถาม
148
- ขอสอบถามทไดเซตของค าแนะน าทใหคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 เทากบคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 มจ านวน 279 ขอสอบถาม
- ขอสอบถามทไดเซตของค าแนะน าทใหคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 นอยกวาคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 มจ านวน 126 ขอสอบถาม
การทดสอบสถานการณการเปลยนแปลงแกไขทสมบรณแลว - ขอสอบถามทไดเซตของค าแนะน าเปนเซตวาง มจ านวน 19 ขอสอบถาม - ขอสอบถามทไดเซตของค าแนะน าไมเปนเซตวาง มจ านวน 41 ขอสอบถาม
จากผลการทดสอบคาเอฟเมสเชอรของสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ในตารางท ข-1 และ ข-2 ตามล าดบ ผวจยสามารถแสดงกราฟเพอเปรยบเทยบประสทธภาพของการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบโดยใชกราฟแทง (Column Chart) ทแสดงผลตางคาเอฟเมสเชอรของการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบของสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดดงรปท 4.1 และ 4.2 ตามล าดบ และตารางท 4-1 แสดงตารางสรปผลการทดสอบของทง 3 สถานการณ
รปท 4-1 แสดงกราฟผลตางคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 กบการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง
-0.4000
-0.3000
-0.2000
-0.1000
0.0000
0.1000
0.2000
0.3000
0.4000
0.5000
0.6000
1
17
33
49
65
81
97
11
3
12
9
14
5
16
1
17
7
19
3
20
9
22
5
24
1
25
7
27
3
28
9
30
5
32
1
33
7
35
3
36
9
38
5
40
1
41
7
43
3
44
9
ขอสอบถาม
ผลตางของคาเอฟเมสเชอร
149
รปท 4-2 แสดงกราฟผลตางคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 กบการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด
ตารางท 4-1 แสดงตารางผลการทดสอบทง 3 สถานการณ
สถานการณการน าทาง (คาเฉลยของคาเอฟเมสเชอร)
สถานการณการปองกนการเกดขอผดพลาด
(คาเฉลยของคาเอฟเมสเชอร)
สถานการณการเปลยนแปลงแกไขทสมบรณแลว (คาผลสะทอนกลบ)
ตวแบบท 1 ตวแบบท 2 ตวแบบท 1 ตวแบบท 2 ตวแบบท 1 ตวแบบท 2 0.3013 0.3245 0.1353 0.1135
จากตารางสรปขางตนแสดงใหเหนวาคาประสทธภาพของสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนมคาแตกตางกน คาประสทธภาพของสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนไมมความแตกตางกน แตไมสามารถสรปไดวาประสทธภาพของการคนหากฎความสมพนธในสถานการณตางๆนนแตกตางกนอยางมนยส าคญ ผวจยจงจ าเปนตองวเคราะหผลการทดสอบความแตกตางกนอยางมนยส าคญ ดงรายละเอยดในหวขอตอไป
4.3 ผลการวเคราะหขอมล
ส าหรบสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด การตรวจสอบเงอนไขพนฐานขนแรก ผ วจยตองตรวจสอบการแจกแจงของประชากรวาการแจกแจง
-0.5000
-0.4000
-0.3000
-0.2000
-0.1000
0.0000
0.1000
0.2000
0.3000
0.4000
1
17
33
49
65
81
97
11
3
12
9
14
5
16
1
17
7
19
3
20
9
22
5
24
1
25
7
27
3
28
9
30
5
32
1
33
7
35
3
36
9
38
5
40
1
41
7
43
3
44
9
ผลตางของคาเอฟเมสเชอร
ขอสอบถาม
150
ปกตหรอไม เพอเลอกทางเลอกในการทดสอบสมมตฐานวาจะใชวธการทดสอบสมมตฐานแบบองพารามเตอร (Parametric Test) หรอแบบไมองพารามเตอร (Non Parametric Test) ถาผลการทดสอบพบวาประชากรมการแจกแจงแบบปกต จงใชการวเคราะหโดยสถตทดสอบท (t-test) เพอทดสอบสมมตฐานของผลตางระหวางคาเฉลยของคาเอฟเมสเชอรของหนวยทดลอง 2 กลม ถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถตทมากกวา 0 จงจะสามารถปฏเสธ H0 ได แตถาผลการแจกแจงประชากรพบวามการแจกแจงไมปกต จงใชการวเคราะหโดยสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) เพอทดสอบสมมตฐานของผลตางระหวางคาเฉลยของคาเอฟเมสเชอรของหนวยทดลอง 2 กลม ถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถตซมากกวา 0 ในกรณทผลการวเคราะหตงอยบนพนฐานทางบวก (Based on positive ranks) จงจะสามารถปฏเสธ H0 ได
4.3.1 การวเคราะหการแจกแจงขอมล
ในงานวจยนผวจยสนใจตวแปร คอประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวของตวแบบ 2 ตวแบบ ดงนนจงตรวจสอบการแจกแจงของขอมลทไดจากหนวยทดลอง นนคอคาประสทธภาพของการคนหากฎความสมพนธ ซงไดแกคาเอฟเมสเชอรทไดมาจากผลการทดสอบ 451 ขอสอบถาม ส าหรบสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ดงนนผวจยจะตรวจสอบวาคาเอฟเมสเชอรทงหมด 451 คาของทง 2 สถานการณมการแจกแจงแบบปกตหรอไม โดยตงสมมตฐานของการทดสอบคาประสทธภาพแตละสถานการณมการแจกแจงแบบปกตหรอไมภายใตสมมตฐานทางสถต ดงน
1) ทดสอบการแจกแจงของขอมลคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 1 สถานการณการน าทาง
H0: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 1 สถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 1 สถานการณการน าทาง ไมแจกแจงแบบปกต
2) ทดสอบการแจกแจงของขอมลคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 สถานการณการน าทาง
151
H0: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 2 สถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 2 สถานการณการน าทาง ไมแจกแจงแบบปกต
3) ทดสอบการแจกแจงของขอมลคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 1 สถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 1 สถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 1 สถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
4) ทดสอบการแจกแจงของขอมลคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 สถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 2 สถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 2 สถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
ผวจยเลอกใชสถตทดสอบ Kolmogorov-Sminov เนองจากมขนาดตวอยางมากกวา 50 หนวย โดยจะยอมรบสมมตฐาน H0 เมอคา Sig. มคามากกวาคา α ซงก าหนดใหเทากบ 0.05 ดงตารางตอไปน
152
ตารางท 4-2 แสดงคาสถตทดสอบการแจกแจงปกต (Normality Test) ของคาประสทธภาพของการคนกฎความสมพนธทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
สถานการณ ตวแบบท Kolmogorov-Smirnov
Statistic df Sig.
สถานการณการน าทาง 1 0.070 451 0.000 2 0.075 451 0.000
สถานการณการปองกนการเกดขอผดพลาด
1 0.313 451 0.000 2 0.326 451 0.000
ผลการทดสอบในตารางท 4-2 ขางตนพบวาคา Sig. ของตวแปรคาประสทธภาพการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดเปนดงน
1) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 1 มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
2) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 2 มคา Sig. เทากบ 0. 000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
3) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 1 มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
4) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 2 มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
ดงนนสรปไดวาการแจกแจงของตวแปรคาประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบส าหรบ 2 สถานการณนนไมเปนแบบปกต
153
4.3.2 การวเคราะหเปรยบเทยบประสทธภาพการคนหากฎความสมพนธทง 2 ตวแบบ
จากการวเคราะหการแจกแจงขอมลขางตนพบวาคาประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดไมแจกแจงแบบปกต ดงนนผวจยจงเลอกใชสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) กบการทดสอบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด โดยทจะปฏเสธสมมตฐาน H0 ไดเมอถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถต Z มากกวา 0 โดยทผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) และผ วจยเลอกใชการทดสอบอตราสวน 2 กลมดวยสถตทดสอบ Z (Two Proportion Z Tests) กบการทดสอบในสถานการณการเปลยนแปลงแกไขทสมบรณแลว โดยทจะปฏเสธสมมตฐาน H0 ไดเมอถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05
การวเคราะหเปรยบเทยบนเปนการวเคราะหเปรยบเทยบประสทธภาพระหวางการคนหากฎความสมพนธดวยตวแบบท 1 กบการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณ 3 สถานการณคอ สถานการณการน าทาง สถานการณการปองกนการเกดขอผดพลาด สถานการณการเปลยนแปลงแกไขทสมบรณแลว ซงสามารถตงสมมตฐานไดดงน
1) วเคราะหเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบในสถานการณการน าทาง วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง
คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการน าทาง
H0 : ≤
H1 : >
154
2) วเคราะหเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด
คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด
H0 : ≤
H1 : >
3) วเคราะหเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบในสถานการณการเปลยนแปลงแกไขทสมบรณแลว วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
H0 : ≤
H1 : >
การทดสอบสมมตฐานขอ 1 และ 2 ดวยสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) แสดงดงตารางท 4-3 ส าหรบสถานการณการเปลยนแปลงแกไขทสมบรณแลว การทดสอบสมมตฐานขอ 3 ดวยสถตทดสอบ Z (Two Proportion Z Tests) แสดงดงตารางท 4-4
155
ตารางท 4-3 แสดงคาสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบคของคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 เทยบกบตวแบบท 1 ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
คาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 - คาประสทธภาพของการคนหากฎความสมพนธตวแบบท1
สถานการณการน าทาง สถานการณการปองกนการ
เกดขอผดพลาด Z -4.374a -6.055b Asymp. Sig. (2 tailed) .000 .000 a. Based on negative ranks. b. Based on positive ranks.
จากตารางท 4-3 การวเคราะหเปรยบเทยบประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการน าทาง ไดสถตทดสอบคา Z เทากบ -4.374 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 เนองจากผลการวเคราะหทออกมาตงบนพนฐานทางลบ (Based on negative ranks) ดงนนจงสามารถปฏเสธสมมตฐาน H0 ได นนคอคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 มากกวาคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง ทระดบนยส าคญ 0.05 และส าหรบการวเคราะหเปรยบเทยบประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการปองกนการเกดขอผดพลาด ไดสถตทดสอบคา Z เทากบ -6.055 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 เนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมตฐาน H0 ได นนคอคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาดทระดบนยส าคญ 0.05
156
ตารางท 4-4 แสดงการทดสอบอตราสวน 2 กลมดวยสถตทดสอบ Z ของคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 เทยบกบตวแบบท 1 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
Value df
Asymp. Sig. (2-sided)
Exact Sig. (2-sided)
Exact Sig. (1-sided)
Pearson Chi-Square .000a 1 1.000
Continuity Correctionb .000 1 1.000
Likelihood Ratio .000 1 1.000
Fisher's Exact Test 1.000 .578
N of Valid Cases 120
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 19.00.
จากตารางท 4.4 คาสถต Z เทากบรากทสองของคา Pearson Chi-Square นนคา 0.000
และมเครองหมายเดยวกบผลตางของอตราสวนท 2 กบอตราสวนท 1 (
–
= 0.000) นนคา
เครองหมายบวก และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 1.000 / 2 = 0.500 ซงมากกวาคา α = 0.05 ดงนนจงไมสามารถปฏเสธสมมตฐาน H0 ได นนคอคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกบคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลวทระดบนยส าคญ 0.05
4.3.3 สรปผลการวเคราะหขอมล
จากการวเคราะหผลการทดสอบประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด โดยใชคาเอฟเมสเชอร และสถานการณการเปลยนแปลงแกไขทสมบรณแลว โดยใชคาผลสะทอนกลบ ผ วจยสามารถสรปไดวาการคนหากฎความสมพนธดวยตวแบบท 2 มประสทธภาพมากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 2 มประสทธภาพไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด และสถานการณการเปลยนแปลงแกไขทสมบรณแลว
157
การคนหากฎความสมพนธดวยตวแบบท 2 มประสทธภาพไมตางกบการคนหากฎความสมพนธดวยตวแบบท 1
จากผลสรปดงกลาวแสดงใหเหนวา การใชตวแบบคาสนบสนน-คาความเชอมนใหมในการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธบนขอมลซอฟตแวรอารไคฟวแสดงประสทธภาพทดกวาการใชตวแบบคาสนบสนน-คาความเชอมนเพยงแคในสถานการณการน าทางเทานน
4.4 ผลการศกษาเพมเตม
จากผลทดสอบการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนและตวแบบคาสนบสนน-คาความเชอมนใหมขางตน ผวจยมความตองการทดสอบเพมเตมเพออธบายสาเหตทการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมแสดงประสทธภาพทดกวาเฉพาะในสถานการณของการน าทาง แตใหประสทธภาพทไมตางกนหรอนอยกวาในสถานการณการปองกนการเกดขอผดพลาดและสถานการณการเปลยนแปลงแกไขทสมบรณแลว จากการด าเนนการทดสอบขางตนผ วจยมขอสงเกตหลายประการ เชน การคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนใหมนนมกจะใหเซตของค าแนะน าทใหญกวาการคนหากฎความสมพนธดวยตวแบบสนบสนน-คาความเชอมน เนองจากกฎความสมพนธ 10 อนดบแรกทไดจากการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนนนมกจะเปนกฎความสมพนธทมเซตรายการทตามมาขนาด 1 รายการเทานน ในขณะทกฎความสมพนธ 10 อนดบแรกทไดจากการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนใหมมกจะเปนกฎความสมพนธทมเซตรายการทตามมาขนาดมากกวา 1 รายการ เปนตน จากขอสงเกตดงกลาวผ วจยคดวาเซตของค าแนะน าทมขนาดใหญอาจเปนสาเหตทท าใหคาความถกตอง (Precision) ของการใชตวแบบคาสนบสนน-คาความเชอมนใหมมคานอยและสงผลใหคาเอฟเมเชอรมคานอยตามมาดวย
เ นองจากขนตอนว ธในการทดสอบของงานวจยม ขอแตกตางจากขนตอนว ธ ท Zimmermann และคณะกบ Methanias และคณะ (Zimmermann et al., 2005; Methanias et
158
al., 2009) ใชอยขนตอนหนง คอนกวจยทง 2 คณะนนมการปรบปรงขนตอนวธอพรโอร 2 ประการเพอใหสามารถคนหากฎความสมพนธทรวดเรวขนตามทอธบายไวในบทท 2 คอ 1) การก าหนดใหคนหากฎความสมพนธเฉพาะกฎทมเซตรายการทมากอนทตองการเทานน และ 2) การก าหนดใหทกกฎความสมพนธทคนหามเซตรายการทตามมาเพยง 1 รายการเทานน จากขอก าหนดขอท 2 นนท าใหเซตของค าแนะน าทจะไดมานนจะมขนาดนอยกวาหรอเทากบ 10 รายการเสมอ แตในงานวจยนผ วจยไมไดปรบปรงขนตอนวธอพรโอรดวยขอก าหนดดงกลาว ขนาดของเซตของค าแนะน าจงมความหลากหลายแตกตางกนออกไป โดยทเซตของค าแนะน าทไดจากการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนนนจะมขนาดนอยกวาหรอเทากบ 10 รายการเสมอเนองจากกฎความสมพนธ 10 อนดบแรกมกจะมเซตรายการทตามมาขนาด 1 รายการหรอเซตรายการทตามมาขนาดมากกวา 1 รายการแตมสมาชกทซ ากบเซตรายการทตามมาของกฎความสมพนธทอยอนดบทสงกวา แตส าหรบเซตของค าแนะน าทไดจากการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนใหมนนมกมขนาดมากกวา 10 เสมอเนองจากเนองจากกฎความสมพนธ 10 อนดบแรกมกจะมเซตรายการทตามมาขนาดมากกวา 1 รายการและสมาชกของเซตรายการทตามมาของแตละกฎความสมพนธใน 10 อนดบแรกมกจะไมซ ากนดวย
ดวยเหตนผ วจยจงมความตองการทจะทดสอบเพมเตมเพออธบายสาเหตของผลการทดสอบขางตน โดยทการทดสอบเพมเตมนผ วจยท าการปรบปรงขนตอนวธในการสรางเซตของค าแนะน าใหม จากคณลกษณะของกฎความสมพนธทอยใน 10 อนดบของการคนหากฎความสมพนธดวยตวแบบทง 2 นน ผ วจยเหนวาไมสามารถน าเซตรายการทตามมาของกฎความสมพนธทง 10 อนดบแรกมาสรางเปนเซตของค าแนะน าไดโดยตรง และผ วจยกเหนวาไมสามารถก าหนดใหพจารณาเฉพาะกฎความสมพนธทคนหามเซตรายการทตามมา 1 รายการเทานนเชนเดยวกบ Zimmermann และคณะกบ Methanias และคณะ (Zimmermann et al., 2005; Methanias et al., 2009) ดวย ผ วจยเหนวาการสรางเซตของค าแนะน าทไดมาจากการคนหากฎความสมพนธทง 2 ตวแบบเพอวตถประสงคในการทดสอบเปรยบเทยบควรจะตองสรางเซตของค าแนะน ามาจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก ตวอยางเชน ตารางดานลางนเปนตารางแสดงกฎความสมพนธ 10 อนดบแรกทไดจากการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนใหมเรยงล าดบตามคาความเชอมนใหมของกฎความสมพนธทมเซตรายการทมากอนคอ {15}
159
ตารางท 4-5 แสดงตวอยางการสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก
กฎความสมพนธ คาสนบสนน คาความเชอมนใหม 1 15 -> 29, 189 25 0.52 2 15 -> 365, 520, 521 16 0.51 3 15 -> 798 42 0.48 4 15 -> 646, 798, 799 16 0.46 5 15 -> 179, 465, 466 15 0.45 6 15 -> 646, 798, 804 15 0.45 7 15 -> 29, 678 22 0.43 8 15 -> 798, 799 22 0.43 9 15 -> 189 39 0.43 10 15 -> 225 56 0.41 เซตของค าแนะน า คอ {29, 179, 189, 365, 465, 520, 521, 646, 798, 799 }
ในตารางขางตนแสดงตวอยางของกฎความสมพนธ คาสนบสนน และคาความเชอมนใหมโดยในหลก (column) ของกฎความสมพนธนนใชตวเลขตางๆ แสดงแทนการเปลยนแปลงแกไขตางๆ เพอความสะดวกในการท าความเขาใจ
ดงนนผ วจยจงมความตองการท าการทดสอบเพมเตม โดยเรมจาก การเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ตอดวยการเปรยบเทยบคาประสทธภาพ คาความถกตอง และคาเรยกคน ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก ตามล าดบ เพอตอบขอสงเกตทวาคาความ
160
ถกตองของการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนใหมมคานอยกวาแตคาเรยกคนมคามากกวาการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมน
4.4.1 การเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
ผลการทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบในการทดสอบขางตนนนเปนการเปรยบประสทธภาพจากการใชคาเอฟเมเชอร (F-measure) เทานน ผวจยจงมความตองการศกษาเพมเตมโดยการทดสอบเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ผลการทดสอบแสดงดงตารางตอไปน
ตารางท 4-6 แสดงตารางคาความถกตองและคาเรยกคนของการทดสอบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
สถานการณการน าทาง สถานการณการปองกนการเกดขอผดพลาด ตวแบบท 1 ตวแบบท 2 ตวแบบท 1 ตวแบบท 2 Pµ Rµ Pµ Rµ Pµ Rµ Pµ Rµ
0.4750 0.2955 0.4554 0.3530 0.4758 0.5188 0.4620 0.4922
จากตารางสรปขางตนแสดงใหเหนวาคาเฉลยของคาความถกตอง (Precision) หรอ Pµ และคาเฉลยของคาเรยกคน (Recall) หรอ Rµ ของการทดสอบขางตนนนมคาแตกตางกนทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด แตไมสามารถสรปไดวาคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนหากฎความสมพนธของตวแบบทง 2 ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนแตกตางกนอยางมนยส าคญ ผ วจยจงจ าเปนตองวเคราะหผลการทดสอบความแตกตางกนอยางมนยส าคญ ดงรายละเอยดตอไปน
161
การวเคราะหการแจกแจงปกต
เนองจากผวจยตองการเปรยบเทยบคาความถกตอง (Precision) หรอคาเรยกคน (Recall) ของการคนหากฎความสมพนธของ 2 ตวแบบส าหรบสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ดงนนผวจยจะตรวจสอบวาคาความถกตอง (Precision) และคาเรยกคน (Recall) ทงหมดของทง 2 สถานการณมการแจกแจงแบบปกตหรอไม โดยตงสมมตฐานของการทดสอบคาความถกตอง (Precision) และคาเรยกคน (Recall) แตละสถานการณมการแจกแจงแบบปกตหรอไมภายใตสมมตฐานทางสถต ดงน
1) ทดสอบการแจกแจงของขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการน าทาง
H0: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการน าทาง ไมแจกแจงแบบปกต
2) ทดสอบการแจกแจงของขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการน าทาง
H0: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการน าทาง ไมแจกแจงแบบปกต
3) ทดสอบการแจกแจงของขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
4) ทดสอบการแจกแจงของขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด
162
H0: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
5) ทดสอบการแจกแจงของขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการน าทาง
H0: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการน าทาง ไมแจกแจงแบบปกต
6) ทดสอบการแจกแจงของขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการน าทาง
H0: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการน าทาง ไมแจกแจงแบบปกต
7) ทดสอบการแจกแจงของขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
8) ทดสอบการแจกแจงของขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
163
ในการตรวจสอบการแจกแจงของขอมลวาเปนแบบปกตโดยใชสถตทดสอบนน มสถตทดสอบทใชคอ Kolmogorov-Sminov ส าหรบหนวยทดลองมากกวา 50 หนวย และ Shapiro-Wilk ส าหรบหนวยทดลองนอยกวา 50 หนวย โดยจะยอมรบสมมตฐาน H0 เมอคา Sig. มคามากกวาคา α ซงก าหนดใหเทากบ 0.05 ผลการทดสอบแสดงดงตารางตอไปน
ตารางท 4-7 แสดงคาสถตทดสอบการแจกแจงปกต (Normality Test) ของคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนกฎความสมพนธทง 2 ตวแบบ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
ตวแบบท
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
สถานการณ การน าทาง
Pµ 1 0.088 451 0.000 0.951 451 0.000 2 0.097 451 0.000 0.945 451 0.000
Rµ 1 0.171 451 0.000 0.852 451 0.000 2 0.115 451 0.000 0.901 451 0.000
สถานการณการปองกน การเกดขอผดพลาด
Pµ 1 0.296 451 0.000 0.708 451 0.000 2 0.314 451 0.000 0.699 451 0.000
Rµ 1 0.351 451 0.000 0.636 451 0.000 2 0.345 451 0.000 0.636 451 0.000
ผลการทดสอบในตารางท 4-7 ขางตนพบวาคา Sig. ของตวแปรคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนหากฎความสมพนธทง 2 ตวแบบ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดเปนดงน
1) ส าหรบสถานการณการน าทาง คาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 1 มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
164
2) ส าหรบสถานการณการน าทาง คาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
3) ส าหรบสถานการณการน าทาง คาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 1 มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
4) ส าหรบสถานการณการน าทาง คาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
5) ส าหรบสถานการณการปองกนการเกดขอผดพลาด คาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 1 มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
6) ส าหรบสถานการณการปองกนการเกดขอผดพลาด คาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 มคา Sig. เทากบ 0.000 ซงมคามากกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
7) ส าหรบสถานการณการปองกนการเกดขอผดพลาด คาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 1 มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
8) ส าหรบสถานการณการปองกนการเกดขอผดพลาด คาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 มคา Sig. เทากบ 0.000 ซงมคามากกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
ดงนนสรปไดวาการแจกแจงของตวแปรคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนหากฎความสมพนธทง 2 ตวแบบ ใน 2 สถานการณนนไมแจกแจงแบบปกต
165
ผลการทดสอบ
จากการวเคราะหการแจกแจงขอมลขางตนพบวาคาความถกตองของการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดไมมการแจกแจงแบบปกต ดงนนผ วจยจงเลอกใชการทดสอบสมมตฐานแบบไมองพารามเตอร (Non Parametic Test) นนคอสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) กบการทดสอบตอ ไป น โดย ทจะปฏ เสธสมมตฐาน H0 ไ ด เ ม อ ถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถต Z มากกวา 0 โดยทผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks)
การวเคราะหเปรยบเทยบนเปนการวเคราะหเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ระหวางการคนหากฎความสมพนธดวยตวแบบท 1 กบการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการน าทาง และสถานการณการปองกนการเกดขอผดพลาด ซงสามารถตงสมมตฐานไดดงน
1) วเคราะหเปรยบเทยบคาความถกตองของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ ในสถานการณการน าทาง วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง
คอ คามธยฐานของคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการน าทาง
H0 : ≤
H1 : >
2) วเคราะหเปรยบเทยบคาเรยกคนของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาเรยกคนของการคนหากฎความสมพนธดวยตว
166
แบบท 1 ในสถานการณการน าทาง คอ คามธยฐานของคาเรยกคนของการคนหากฎความสมพนธดวยตว
แบบท 2 ในสถานการณการน าทาง H0 : ≤
H1 : >
3) วเคราะหเปรยบเทยบคาความถกตองของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ ในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด
คอ คามธยฐานของคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด
H0 : ≤
H1 : >
4) วเคราะหเปรยบเทยบคาเรยกคนของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ ในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด
คอ คามธยฐานของคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด
H0 : ≤
H1 : >
167
ผวจยใชการทดสอบสมมตฐานโดยสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) กบการทดสอบตอไปน ผลการทดสอบแสดงดงตารางตอไปน
ตารางท 4-8 แสดงสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบคของคาความถกตองและคาเรยกคนของการคนหากฎความสมพนธตวแบบท 2 เทยบกบตวแบบท 1 ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
คาความถกตองของการคนหากฎความสมพนธตวแบบท 2 -
คาเรยกคนของการคนหากฎความสมพนธตวแบบท 2 -
คาความถกตองของการคนหากฎความสมพนธตวแบบท 1
คาเรยกคนของการคนหากฎความสมพนธตวแบบท 1
สถานการณ การน าทาง
สถานการณการปองกน
การเกดขอผดพลาด
สถานการณ การน าทาง
สถานการณการปองกน
การเกดขอผดพลาด
Z -2.669a -6.054a -9.234b -2.000a Asymp. Sig. (2-tailed)
0.008 0.000 0.000 0.046
a. Based on positive ranks.
b. Based on negative ranks.
จากตารางท 4-8 ไดผลทดสอบดงน
1) การเปรยบเทยบคาความถกตองในสถานการณการน าทาง ไดสถตทดสอบคา Z เทากบ -2.669 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.008 / 2 = 0.004 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมต H0 ได นนคอคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง ทระดบนยส าคญ 0.05
168
2) การเปรยบเทยบคาความถกตองในสถานการณการปองกนการเกดขอผดพลาด ไดสถตทดสอบคา Z เทากบ -6.054 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมต H0
ได นนคอคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาดทระดบนยส าคญ 0.05
3) การเปรยบเทยบคาเรยกคนในสถานการณการน าทาง ไดสถตทดสอบคา Z เทากบ -9.234 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางลบ (Based on negative ranks) ดงนนจงสามารถปฏเสธสมมต H0 ได นนคอคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 มากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง ทระดบนยส าคญ 0.05
4) การเปรยบเทยบคาเรยกคนในสถานการณการปองกนการเกดขอผดพลาด ไดสถตทดสอบคา Z เทากบ -2.000 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมต H0
ได นนคอคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาดทระดบนยส าคญ 0.05
สรปผลการทดสอบ
จากการวเคราะหผลการเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนหากฎความสมพนธทง 2 ตวแบบ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ผ วจยสามารถสรปไดวาในสถานการณการน าทางการคนหากฎความสมพนธดวยตวแบบท 2 ใหคาเรยกคน (Recall) มากกวาแตใหคาความถกตอง (Precision) ทนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ส าหรบสถานการณการปองกนการเกด
169
ขอผดพลาดการคนหากฎความสมพนธดวยตวแบบท 2 ใหคาความถกตอง (Precision) และคาเรยกคน (Recall) ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1
4.4.2 การเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยเปลยนขอก าหนดของการสรางเซตของค าแนะน า
การเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก ผวจยก าหนดใหวธการสรางเซตของค าแนะน าดงกลาวเรยกวา “การสรางเซตของค าแนะน าแบบใหม” ผลการทดสอบดงกลาวแสดงดงตอไปน
ตารางท 4-9 แสดงตารางผลการทดสอบเพมเตมทง 3 สถานการณ
สถานการณการน าทาง (คาเฉลยของคาเอฟเมสเชอร)
สถานการณการปองกนการเกดขอผดพลาด
(คาเฉลยของคาเอฟเมสเชอร)
สถานการณการเปลยนแปลงแกไขทสมบรณแลว (คาผลสะทอนกลบ)
ตวแบบท 1 ตวแบบท 2 ตวแบบท 1 ตวแบบท 2 ตวแบบท 1 ตวแบบท 2 0.3195 0.3335 0.1152 0.1057
จากตารางสรปขางตนแสดงใหเหนวาคาประสทธภาพของสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนมคาแตกตางกน คาประสทธภาพของสถานการณการเปลยนแปลงแกไขทสมบรณแลวนนไมมความแตกตางกน แตไมสามารถสรปไดวาประสทธภาพของการคนหากฎความสมพนธในสถานการณตางๆนนแตกตางกนอยางมนยส าคญ ผ วจยจงจ าเปนตองวเคราะหผลการทดสอบความแตกตางกนอยางมนยส าคญ ดงรายละเอยดตอไปน
การวเคราะหการแจกแจงขอมล
เนองจากผ วจยตองการเปรยบเทยบประสทธภาพของการคนหากฎความสมพนธของ 2 ตวแบบส าหรบสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด โดยการ
170
สรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก ดงนนผ วจยจะตรวจสอบวาคาเอฟเมเชอรทงหมดมการแจกแจงแบบปกตหรอไม เฉพาะในส าหรบสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด โดยตงสมมตฐานของการทดสอบคาเอฟเมเชอรแตละการทดสอบมการแจกแจงแบบปกตหรอไมภายใตสมมตฐานทางสถต ดงน
1) ทดสอบการแจกแจงของขอมลคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
H0: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง ไมแจกแจงแบบปกต
2) ทดสอบการแจกแจงของขอมลคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
H0: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง ไมแจกแจงแบบปกต
3) ทดสอบการแจกแจงของขอมลคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
4) ทดสอบการแจกแจงของขอมลคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
171
H0: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาประสทธภาพของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
ในการตรวจสอบการแจกแจงของขอมลวาเปนแบบปกตโดยใชสถตทดสอบนน มสถตทดสอบทใชคอ Kolmogorov-Sminov ส าหรบหนวยทดลองมากกวา 50 หนวย และ Shapiro-Wilk ส าหรบหนวยทดลองนอยกวา 50 หนวย โดยจะยอมรบสมมตฐาน H0 เมอคา Sig. มคามากกวาคา α ซงก าหนดใหเทากบ 0.05 ผลการทดสอบแสดงดงตารางตอไปน
ตารางท 4-10 แสดงคาสถตทดสอบการแจกแจงปกต (Normality Test) ของคาประสทธภาพของการคนกฎความสมพนธทง 2 ตวแบบ โดยการสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
สถานการณ ตวแบบท Kolmogorov-Smirnov
Statistic df Sig.
สถานการณการน าทาง 1 0.071 451 0.000 2 0.070 451 0.000
สถานการณการปองกนการเกดขอผดพลาด
1 0.296 451 0.000 2 0.325 451 0.000
ผลการทดสอบในตารางท 4-10 ขางตนพบวาคา Sig. ของตวแปรคาประสทธภาพการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดเปนดงน
1) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
172
2) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0. 000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
3) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
4) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
ดงนนสรปไดวาการแจกแจงของตวแปรคาประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบส าหรบ 2 สถานการณนนไมเปนแบบปกต
การวเคราะหเปรยบเทยบประสทธภาพการคนหากฎความสมพนธทง 2 ตวแบบ
จากการวเคราะหการแจกแจงขอมลขางตนพบวาคาประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดโดยการสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก ไมแจกแจงแบบปกต ดงนนผ วจยจงเลอกใชสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) กบการทดสอบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด โดยทจะปฏเสธสมมตฐาน H0 ไดเมอถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถต Z มากกวา 0 โดยทผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) และผ วจยเลอกใชการทดสอบอตราสวน 2 กลมดวยสถตทดสอบ Z (Two Proportion Z Tests) กบการทดสอบในสถานการณการเปลยนแปลงแกไขทสมบรณแลว โดยทจะปฏเสธสมมตฐาน H0 ไดเมอถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05
การวเคราะหเปรยบเทยบนเปนการวเคราะหเปรยบเทยบประสทธภาพระหวางการคนหากฎความสมพนธดวยตวแบบท 1 กบการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการท
173
ตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ในสถานการณ 3 สถานการณคอ สถานการณการน าทาง สถานการณการปองกนการเกดขอผดพลาด สถานการณการเปลยนแปลงแกไขทสมบรณแลว ซงสามารถตงสมมตฐานไดดงน
1) วเคราะหเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง
คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการน าทาง
H0 : ≤
H1 : >
2) วเคราะหเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด
คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการปองกนการเกดขอผดพลาด
H0 : ≤
H1 : >
3) วเคราะหเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบโดยการสรางเซตของ
174
ค าแนะน าแบบใหม ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
คอ คามธยฐานของคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
H0 : ≤
H1 : >
ผวจยทดสอบสมมตฐานขอ 1 และ 2 ดวยสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) แสดงดงตารางท 4-11 ส าหรบสมมตฐานขอ 3 ผ วจยเลอกใชการทดสอบอตราสวน 2 กลมดวยสถตทดสอบ Z (Two Proportion Z Tests) แสดงดงตารางท 4-12
ตารางท 4-11 แสดงคาสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบคของคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 เทยบกบตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
คาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 - คาประสทธภาพของการคนหากฎความสมพนธตวแบบท1
สถานการณการน าทาง สถานการณการปองกนการ
เกดขอผดพลาด Z -3.159a -3.878b Asymp. Sig. (2 tailed) .000 .000 a. Based on negative ranks. b. Based on positive ranks.
175
จากตารางท 4-11 การวเคราะหเปรยบเทยบประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการน าทาง ไดสถตทดสอบคา Z เทากบ -3.159 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 เนองจากผลการวเคราะหทออกมาตงบนพนฐานทางลบ (Based on negative ranks) ดงนนจงสามารถปฏเสธสมมตฐาน H0 ได นนคอคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 มากกวาคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง ทระดบนยส าคญ 0.05 และส าหรบการวเคราะหเปรยบเทยบประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการปองกนการเกดขอผดพลาด ไดสถตทดสอบคา Z เทากบ -3.878 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 เนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมตฐาน H0 ได นนคอคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาดทระดบนยส าคญ 0.05
ตารางท 4-12 แสดงการทดสอบอตราสวน 2 กลมดวยสถตทดสอบ Z ของคาประสทธภาพของการคนหากฎความสมพนธตวแบบท 2 เทยบกบตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
Value df
Asymp. Sig. (2-sided)
Exact Sig. (2-sided)
Exact Sig. (1-sided)
Pearson Chi-Square .000a 1 1.000
Continuity Correctionb .000 1 1.000
Likelihood Ratio .000 1 1.000
Fisher's Exact Test 1.000 .578
N of Valid Cases 120
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 19.00.
176
จากตารางท 4-12 คาสถต Z เทากบรากทสองของคา Pearson Chi-Square นนคา 0.000
และมเครองหมายเดยวกบผลตางของอตราสวนท 2 กบอตราสวนท 1 (
–
= 0.000) นนคา
เครองหมายบวก และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 1.000 / 2 = 0.500 ซงมากกวาคา α = 0.05 ดงนนจงไมสามารถปฏเสธสมมตฐาน H0 ได นนคอคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกบคาประสทธภาพของการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการเปลยนแปลงแกไขทสมบรณแลวทระดบนยส าคญ 0.05
สรปผลการวเคราะหขอมล
จากการวเคราะหผลการทดสอบประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบโดยการสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด โดยใชคาเอฟเมสเชอร และสถานการณการเปลยนแปลงแกไขทสมบรณแลว โดยใชคาผลสะทอนกลบ ผวจยสามารถสรปไดวาการคนหากฎความสมพนธดวยตวแบบท 2 มประสทธภาพมากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 2 มประสทธภาพไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาด และสถานการณการเปลยนแปลงแกไขทสมบรณแลวการคนหากฎความสมพนธดวยตวแบบท 2 มประสทธภาพไมตางกบการคนหากฎความสมพนธดวยตวแบบท 1
ผลสรปดงกลาวไมไดแสดงใหเหนวา การก าหนดการสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรกนนสามารถเพมคาความถกตอง (Precision) ใหกบการคนหากฎความสมพนธดวยตวแบบท 2 อยางทผ วจยไดตงขอสงเกตไวหรอไม ดงนนผวจยจงมความตองการศกษาเพมเตมคอ การเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนหากฎความสมพนธดวยตวแบบทง 2 ตวแบบ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด เพอทดสอบวาก าหนดการสรางเซตของ
177
ค าแนะน าดงกลาวสามารถเพมคาความถกตอง (Precision) หรอคาเรยกคน (Recall) ในสถานการณทง 2 ไดหรอไม การทดสอบดงกลาวแสดงในหวตอไปน
4.4.3 การเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยเปลยนขอก าหนดของการสรางเซตของค าแนะน า ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
ผลการทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยการสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรกหรอการสรางเซตของค าแนะน าแบบใหมในการทดสอบทแลวนนเปนการเปรยบประสทธภาพจากการใชคาเอฟเมเชอร (F-measure) เทานน ผ วจยจงมความตองการศกษาเพมเตมโดยการทดสอบเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ผลการทดสอบแสดงดงตารางตอไปน
ตารางท 4-13 แสดงตารางคาความถกตองและคาเรยกคนของการทดสอบเพมเตมโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
สถานการณการน าทาง สถานการณการปองกนการเกดขอผดพลาด ตวแบบท 1 ตวแบบท 2 ตวแบบท 1 ตวแบบท 2 Pµ Rµ Pµ Rµ Pµ Rµ Pµ Rµ
0.4034 0.3856 0.4191 0.3985 0.4621 0.5477 0.4568 0.4945
จากตารางสรปขางตนแสดงใหเหนวาคาเฉลยของคาความถกตอง (Precision) หรอ Pµ และคาเฉลยของคาเรยกคน (Recall) หรอ Rµ ของการทดสอบขางตนนนมคาแตกตางกนทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด แตไมสามารถสรปไดวาคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนหากฎความสมพนธของตว
178
แบบทง 2 ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนแตกตางกนอยางมนยส าคญ ผ วจยจงจ าเปนตองวเคราะหผลการทดสอบความแตกตางกนอยางมนยส าคญ ดงรายละเอยดตอไปน
การวเคราะหการแจกแจงปกต
เนองจากผวจยตองการเปรยบเทยบคาความถกตอง (Precision) หรอคาเรยกคน (Recall) ของการคนหากฎความสมพนธของ 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ส าหรบสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ดงนนผวจยจะตรวจสอบวาคาความถกตอง (Precision) และคาเรยกคน (Recall) ทงหมดของทง 2 สถานการณมการแจกแจงแบบปกตหรอไม โดยตงสมมตฐานของการทดสอบคาความถกตอง (Precision) และคาเรยกคน (Recall) แตละสถานการณมการแจกแจงแบบปกตหรอไมภายใตสมมตฐานทางสถต ดงน
1) ทดสอบการแจกแจงของขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
H0: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง ไมแจกแจงแบบปกต
2) ทดสอบการแจกแจงของขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
H0: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง ไมแจกแจงแบบปกต
3) ทดสอบการแจกแจงของขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต
179
H1: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
4) ทดสอบการแจกแจงของขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาความถกตองของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
5) ทดสอบการแจกแจงของขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
H0: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง ไมแจกแจงแบบปกต
6) ทดสอบการแจกแจงของขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
H0: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง ไมแจกแจงแบบปกต
7) ทดสอบการแจกแจงของขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต
180
H1: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
8) ทดสอบการแจกแจงของขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาเรยกคนของการคนกฎความสมพนธตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด ไมแจกแจงแบบปกต
ในการตรวจสอบการแจกแจงของขอมลวาเปนแบบปกตโดยใชสถตทดสอบนน มสถตทดสอบทใชคอ Kolmogorov-Sminov ส าหรบหนวยทดลองมากกวา 50 หนวย และ Shapiro-Wilk ส าหรบหนวยทดลองนอยกวา 50 หนวย โดยจะยอมรบสมมตฐาน H0 เมอคา Sig. มคามากกวาคา α ซงก าหนดใหเทากบ 0.05 ผลการทดสอบแสดงดงตารางตอไปน
ตารางท 4-14 แสดงคาสถตทดสอบการแจกแจงปกต (Normality Test) ของคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนกฎความสมพนธทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
ตวแบบท
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
สถานการณ การน าทาง
Pµ 1 0.112 451 0.000 0.955 451 0.000
2 0.111 451 0.000 0.949 451 0.000
Rµ 1 0.113 451 0.000 0.906 451 0.000
2 0.09 451 0.000 0.927 451 0.000
สถานการณ การปองกน
การเกดขอผดพลาด
Pµ 1 0.339 451 0.000 0.673 451 0.000
2 0.333 451 0.000 0.683 451 0.000
Rµ 1 0.366 451 0.000 0.633 451 0.000
2 0.344 451 0.000 0.636 451 0.000
181
ผลการทดสอบในตารางท 4-14 ขางตนพบวาคา Sig. ของตวแปรคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนหากฎความสมพนธทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดเปนดงน
1) ส าหรบสถานการณการน าทาง คาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
2) ส าหรบสถานการณการน าทาง คาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
3) ส าหรบสถานการณการน าทาง คาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
4) ส าหรบสถานการณการน าทาง คาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
5) ส าหรบสถานการณการปองกนการเกดขอผดพลาด คาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
6) ส าหรบสถานการณการปองกนการเกดขอผดพลาด คาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคามากกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
182
7) ส าหรบสถานการณการปองกนการเกดขอผดพลาด คาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
8) ส าหรบสถานการณการปองกนการเกดขอผดพลาด คาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม มคา Sig. เทากบ 0.000 ซงมคามากกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
ดงนนสรปไดวาการแจกแจงของตวแปรคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนหากฎความสมพนธทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในทง 2 สถานการณนนไมแจกแจงแบบปกต
ผลการทดสอบ
จากการวเคราะหการแจกแจงขอมลขางตนพบวาคาความถกตองของการคนหากฎความสมพนธทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดไมมการแจกแจงแบบปกต ดงนนผวจยจงเลอกใชการทดสอบสมมตฐานแบบไมองพารามเตอร (Non Parametic Test) นนคอสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) กบการทดสอบตอไปน โดยทจะปฏเสธสมมตฐาน H0 ไดเมอถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถต Z มากกวา 0 โดยทผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks)
การวเคราะหเปรยบเทยบนเปนการวเคราะหเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ระหวางการคนหากฎความสมพนธดวยตวแบบท 1 กบการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง และสถานการณการปองกนการเกดขอผดพลาด ซงสามารถตงสมมตฐานไดดงน
1) วเคราะหเปรยบเทยบคาความถกตองของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง วามความแตกตางกนหรอไม
183
ก าหนดให คอ คามธยฐานของคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
คอ คามธยฐานของคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
H0 : ≤
H1 : >
2) วเคราะหเปรยบเทยบคาเรยกคนของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
คอ คามธยฐานของคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทาง
H0 : ≤
H1 : >
3) วเคราะหเปรยบเทยบคาความถกตองของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
184
คอ คามธยฐานของคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
H0 : ≤
H1 : >
4) วเคราะหเปรยบเทยบคาเรยกคนของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
คอ คามธยฐานของคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการปองกนการเกดขอผดพลาด
H0 : ≤
H1 : >
ผวจยจงใชการทดสอบสมมตฐานแบบไมองพารามเตอร (Non Parametic Test) นนคอสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) กบการทดสอบตอไปน โดยทผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ผลการทดสอบแสดงดงตารางตอไปน
185
ตารางท 4-15 แสดงสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบคของคาความถกตองและคาเรยกคนของการคนหากฎความสมพนธตวแบบท 2 เทยบกบตวแบบท 1 โดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
คาความถกตองของการคนหากฎความสมพนธตวแบบท 2 - คาเรยกคนของการคนหากฎความสมพนธตวแบบท 2 -
คาความถกตองของการคนหากฎความสมพนธตวแบบท 1 คาเรยกคนของการคนหากฎความสมพนธตวแบบท 1
สถานการณการน าทาง สถานการณการปองกน การเกดขอผดพลาด
สถานการณการน าทาง สถานการณการปองกน การเกดขอผดพลาด
Z -3.342a -3.878b -3.290a -4.116b
Asymp. Sig. (2-tailed)
0.001 0.000 0.001 0.000
a. Based on negative ranks.
b. Based on positive ranks.
จากตารางท 4-15 ไดผลทดสอบดงน
1) การเปรยบเทยบคาความถกตองในสถานการณการน าทาง ไดสถตทดสอบคา Z เทากบ -3.342 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.001 / 2 = 0.0005 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางลบ (Based on negative ranks) ดงนนจงสามารถปฏเสธสมมต H0 ได นนคอคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 มากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง ทระดบนยส าคญ 0.05
2) การเปรยบเทยบคาความถกตองในสถานการณการปองกนการเกดขอผดพลาด ไดสถตทดสอบคา Z เทากบ -3.878 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมต H0
ได นนคอคาความถกตองของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาดทระดบนยส าคญ 0.05
186
3) การเปรยบเทยบคาเรยกคนในสถานการณการน าทาง ไดสถตทดสอบคา Z เทากบ -3.290 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.001 / 2 = 0.0005 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางลบ (Based on negative ranks) ดงนนจงสามารถปฏเสธสมมต H0 ได นนคอคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 มากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการน าทาง ทระดบนยส าคญ 0.05
4) การเปรยบเทยบคาเรยกคนในสถานการณการปองกนการเกดขอผดพลาด ไดสถตทดสอบคา Z เทากบ -4.116 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมต H0
ได นนคอคาเรยกคนของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในสถานการณการปองกนการเกดขอผดพลาดทระดบนยส าคญ 0.05
สรปผลการทดสอบ
จากการวเคราะหผลการเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการคนหากฎความสมพนธทง 2 ตวแบบโดยการสรางเซตของค าแนะน าแบบใหม ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ผวจยสามารถสรปไดวาในสถานการณการน าทางการคนหากฎความสมพนธดวยตวแบบท 2 ใหคาความถกตอง (Precision) และคาเรยกคน (Recall) มากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ส าหรบสถานการณการปองกนการเกดขอผดพลาดการคนหากฎความสมพนธดวยตวแบบท 2 ใหคาความถกตอง (Precision) และคาเรยกคน (Recall) ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1
จากผลการทดสอบนและผลการทดสอบในหวขอ 4.4.1 แสดงใหเหนวาการก าหนดการสรางเซตของค าแนะน าแบบใหมหรอการสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรกนน ท าใหคาความถกตอง (Precision) ของการคนหากฎความสมพนธดวยตวแบบท 2 ในสถานการณการน าทางเพมขนไดตามทผ วจยไดตงขอสงเกตไว แตส าหรบใน
187
สถานการณการปองกนการเกดขอผดพลาดนนการก าหนดการสรางเซตของค าแนะน าแบบใหมไมไดท าใหคาความถกตอง (Precision) ของการคนหากฎความสมพนธดวยตวแบบท 2 ดขน ดวยเหตนผ วจยจงตงขอสงเกตตอไปวาสาเหตทท าใหผลการทดสอบออกมาเปนเชนนนเพราะในสถานการณการน าทางกฎความสมพนธทไดการคนหากฎความสมพนธดวยตวแบบท 1 ในอนดบตนๆนนมกฎความสมพนธทเปนผลบวกลวงปะปนอยมากในขณะทกฎความสมพนธทไดการคนหากฎความสมพนธดวยตวแบบท 2 ในอนดบตนๆนนมกฎความสมพนธทเปนผลบวกลวงนอยกวา แตในสถานการณการปองกนการเกดขอผดพลาดนน กฎความสมพนธทไดการคนหากฎความสมพนธดวยตวแบบท 1 ในอนดบตนๆนนมกฎความสมพนธทเปนผลบวกลวงปะปนอยนอยในขณะทกฎความสมพนธทไดการคนหากฎความสมพนธดวยตวแบบท 2 ในอนดบตนๆนนมกฎความสมพนธทเปนผลบวกลวงมากกวา
ดวยเหตนผ วจยจงมความตองการทจะทดสอบเพมเตมตามขอสงเกตขางตนเพออธบายสาเหตของผลการทดสอบหลกของงานวจยน ผ วจยก าหนดการทดสอบเพมเตมโดยการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปน 7 อนดบแรก 5 อนดบแรก และ 3 อนดบแรก ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ตามล าดบ
4.4.4 การเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน า
ผ วจยยงตงขอสงเกตอกวากฎความสมพนธทง 10 อนดบแรกทไดจากการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนนน กฎความสมพนธทตรงกบเซตของผลลพธทคาดไวมกจะไมใชกฎความสมพนธทอยในอนดบแรกๆ แตส าหรบการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนใหมนน กฎความสมพนธทตรงกบเซตของผลลพธทคาดไวมกจะเปนกฎความสมพนธทอยในอนดบแรกๆ เหตผลทเปนเชนนนผ วจยคดวาอาจเปนไปไดวากฎความสมพนธทไดจากการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนในอนดบแรกๆมกเปนผลบวกลวง ผ วจยจงสนใจวเคราะหเปรยบเทยบประสทธภาพ
188
ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบในสถานการณน าทางและสถานการณการปองกนการเกดขอผดพลาด โดยทดลองปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ คอ 1) สรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก 2) สรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก และ 3) สรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ผลการทดสอบแสดงดงตารางตอไปน
ตารางท 4-16 แสดงตารางคาเฉลยของคาเอฟเมสเชอรของการทดสอบการปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
ตวแบบท
คาเฉลยของคาเอฟเมสเชอร
10 อนดบแรก 7 อนดบแรก 5 อนดบแรก 3 อนดบแรก
สถานการณการน าทาง 1 0.3013 0.2820 0.2522 0.2105 2 0.3245 0.3058 0.2936 0.2511
สถานการณการปองกน การเกดขอผดพลาด
1 0.1353 0.1673 0.1857 0.2472 2 0.1135 0.1207 0.1267 0.1316
จากตารางท 4-16 ขางบนสามารถน ามาแสดงในรปแบบขางกราฟเสนเพอใหเหนแนวโนมคาเฉลยของคาเอฟเมสเชอรของการคนหากฎความสมพนธทง 2 ตวแบบ เมอปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ไดดงน
189
รปท 4-3 แสดงกราฟเสนคาเฉลยของคาเอฟเมสเชอรของการคนหากฎความสมพนธทง 2 ตวแบบเมอปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ใน
สถานการณการน าทาง
รปท 4-4 แสดงกราฟเสนคาเฉลยของคาเอฟเมสเชอรของการคนหากฎความสมพนธทง 2 ตวแบบเมอปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ใน
สถานการณการปองกนการเกดขอผดพลาด
จากรปท 4-3 จะเหนวาคาเฉลยของคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 มคามากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ในทกๆ การปรบจ านวนของกฎ
0.0000
0.0500
0.1000
0.1500
0.2000
0.2500
0.3000
0.3500
1 2 3 4
ตวแบบท 1 ตวแบบท 2
จ ำนวนอนดบ
คำเอฟเมเชอร
10 7 5 3
0.0000
0.0500
0.1000
0.1500
0.2000
0.2500
0.3000
1 2 3 4 จ ำนวนอนดบ
คำเอฟเมเชอร
ตวแบบท 1 ตวแบบท 2
10 7 5 3
190
ความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในสถานการณการน าทาง นอกจากนนจะเหนวาคาเฉลยของคาเอฟเมสเชอรของการคนหากฎความสมพนธทง 2 ตวแบบมแนวโนมลดลงเรอยๆเมอมการปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาทนอยลง แสดงใหเหนวาการคนหากฎความสมพนธในสถานการณการน าทางนน กฎความสมพนธทถกตองจรงๆนนมนจะเปนกฎความสมพนธ ทอยในอนดบ ทายๆ และกฎความสมพนธทอยในอนดบตนๆนนเปนผลบวกลวงในทง 2 ตวแบบ
จากรปท 4-4 จะเหนวาคาเฉลยของคาเอฟเมสเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 มคามากกวาการคนหากฎความสมพนธดวยตวแบบท 2 ในทกๆ การปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ นอกจากนนจะเหนวาคาเฉลยของคาเอฟเมสเชอรของการคนหากฎความสมพนธทง 2 ตวแบบมแนวโนมสงขนเรอยๆเมอมการปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาทนอยลง สาเหตมาจากคาเรยกคนทยงคงทเสมอในขณะทคาความถกตองมคามากขนเรอยๆ (ขนาดเซตของค าแนะน าทลดลงท าใหคาความถกตองสงขน ในขณะทมกฎความสมพนธทถกตองเทาเดมหรอไมลดลงจงท าใหคาเรยกคนเทาเดม) แสดงใหเหนวาการคนหากฎความสมพนธในสถานการณการปองกนการเกดขอผดพลาดนน กฎความสมพนธทถกตองจรงๆนนมนจะเปนกฎความสมพนธทอยในอนดบตนๆในทง 2 ตวแบบ
จากตารางและกราฟขางตนแสดงใหเหนวาคาเอฟเมสเชอรหรอคาประสทธภาพของการทดสอบขางตนนนมคาแตกตางกนทง 2 ตวแบบเมอปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด แตไมสามารถสรปไดวาประสทธภาพของการคนหากฎความสมพนธของตวแบบทง 2 เมอปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดนนแตกตางกนอยางมนยส าคญ ผ วจยจงจ าเปนตองวเคราะหผลการทดสอบความแตกตางกนอยางมนยส าคญ ดงรายละเอยดตอไปน
191
การวเคราะหการแจกแจงปกต
เนองจากผ วจยตองการเปรยบเทยบประสทธภาพของการคนหากฎความสมพนธของ 2 ตวแบบส าหรบสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด โดยทดลองปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ดงนนผวจยจะตรวจสอบวาคาเอฟเมเชอรทงหมดมการแจกแจงแบบปกตหรอไม โดยตงสมมตฐานของการทดสอบคาเอฟเมเชอรแตละการทดสอบมการแจกแจงแบบปกตหรอไมภายใตสมมตฐานทางสถต ดงน
1) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง ไมมการแจกแจงแบบปกต
2) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง ไมมการแจกแจงแบบปกต
3) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการน าทาง
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการน าทาง มการแจกแจงแบบปกต
192
H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการน าทาง ไมมการแจกแจงแบบปกต
4) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการน าทาง
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการน าทาง ไมมการแจกแจงแบบปกต
5) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการน าทาง
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการน าทาง ไมมการแจกแจงแบบปกต
6) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการน าทาง
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการน าทาง มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการน าทาง ไมมการแจกแจงแบบปกต
193
7) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด ไมมการแจกแจงแบบปกต
8) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด ไมมการแจกแจงแบบปกต
9) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด ไมมการแจกแจงแบบปกต
194
10) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด ไมมการแจกแจงแบบปกต
11) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 1 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด ไมมการแจกแจงแบบปกต
12) ทดสอบการแจกแจงของขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
H0: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด มการแจกแจงแบบปกต H1: ขอมลคาเอฟเมเชอรของการคนกฎความสมพนธตวแบบท 2 โดยสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด ไมมการแจกแจงแบบปกต
195
ในการตรวจสอบการแจกแจงของขอมลวาเปนแบบปกตโดยใชสถตทดสอบนน มสถตทดสอบทใชคอ Kolmogorov-Sminov ส าหรบหนวยทดลองมากกวา 50 หนวย และ Shapiro-Wilk ส าหรบหนวยทดลองนอยกวา 50 หนวย โดยจะยอมรบสมมตฐาน H0 เมอคา Sig. มคามากกวาคา α ซงก าหนดใหเทากบ 0.05 ผลการทดสอบแสดงดงตารางตอไปน
ตารางท 4-17 แสดงคาสถตทดสอบการแจกแจงปกต (Normality Test) ของคาเอฟเมเชอรของการคนกฎความสมพนธทง 2 ตวแบบ โดยปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
สถานการณ
จน.กฎความสมพนธ ทน ามาสรางเปนเซตของค าแนะน า
ตว แบบ ท
Kolmogorov-Smirnov Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
สถานการณ การน าทาง
3 1 .127 451 .000 .886 451 .000 2 .130 451 .000 .929 451 .000
5 1 .087 451 .000 .952 451 .000 2 .085 451 .000 .957 451 .000
7 1 .073 451 .000 .960 451 .000 2 .081 451 .000 .960 451 .000
สถานการณ การปองกน ขอผดพลาด
3 1 .372 451 .000 .700 451 .000 2 .409 451 .000 .674 451 .000
5 1 .350 451 .000 .732 451 .000 2 .361 451 .000 .752 451 .000
7 1 .311 451 .000 .798 451 .000 2 .340 451 .000 .779 451 .000
ผลการทดสอบในตารางท 4-17 ขางตนพบวาคา Sig. ของตวแปรคาเอฟเมเชอรของการคนหากฎความสมพนธทง 2 ตวแบบ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดเปนดงน
196
1) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
2) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
3) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
4) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
5) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
6) ส าหรบสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
7) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
8) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคามากกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
9) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก มคา Sig.
197
เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
10) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคามากกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
11) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคานอยกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
12) ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก มคา Sig. เทากบ 0.000 ซงมคามากกวาคาระดบนยส าคญ α = 0.05 ดงนนจงปฏเสธสมมตฐาน H0
ดงนนสรปไดวาการแจกแจงของตวแปรคาประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบโดยปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในทง 2 สถานการณนนไมเปนแบบปกต
198
ผลการทดสอบ
จากการวเคราะหการแจกแจงขอมลขางตนพบวาคาเอฟเมเชอรของการคนหากฎความสมพนธทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดไมมการแจกแจงแบบปกต ดงนนผ วจยจงเลอกใชการทดสอบสมมตฐานแบบไมองพารามเตอร (Non Parametic Test) นนคอสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) กบการทดสอบตอ ไป น โดย ทจะปฏ เสธสมมตฐาน H0 ไ ด เ ม อ ถาคา Sig. (Significance) ทค านวณไดนอยกวา 0.05 และคาสถต Z มากกวา 0 โดยทผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks)
การวเคราะหเปรยบเทยบนเปนการวเคราะหเปรยบเทยบคาเอฟเมเชอรระหวางการคนหากฎความสมพนธดวยตวแบบท 1 กบการคนหากฎความสมพนธดวยตวแบบท 2 โดยปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ในสถานการณการน าทาง และสถานการณการปองกนการเกดขอผดพลาด ซงสามารถตงสมมตฐานไดดงน
1) วเคราะหเปรยบเทยบคาเอฟเมเชอรของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง
คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง
H0 : ≤
H1 : >
199
2) วเคราะหเปรยบเทยบคาเอฟเมเชอรของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการน าทาง วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการน าทาง
คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง
H0 : ≤
H1 : >
3) วเคราะหเปรยบเทยบคาเอฟเมเชอรของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการน าทาง วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง
คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการน าทาง
H0 : ≤
H1 : >
4) วเคราะหเปรยบเทยบคาเอฟเมเชอรของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ ทสรางเซตของค าแนะน า
200
จากกฎความสมพนธ 7 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
H0 : ≤
H1 : >
5) วเคราะหเปรยบเทยบคาเอฟเมเชอรของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
ก าหนดให คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
H0 : ≤
H1 : >
6) วเคราะหเปรยบเทยบคาเอฟเมเชอรของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทง 2 ตวแบบ ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด วามความแตกตางกนหรอไม
201
ก าหนดให
คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
คอ คามธยฐานของคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ในสถานการณการปองกนการเกดขอผดพลาด
H0 : ≤
H1 : >
ผวจยใชการทดสอบสมมตฐานโดยสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) กบการทดสอบตอไปน ผลการทดสอบแสดงดงตารางตอไปน
ตารางท 4-18 แสดงสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบคของคาเอฟเมเชอรของการคนหากฎความสมพนธทง 2 ตวแบบ โดยปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ
คาเอฟเมเชอรของการคนหากฎความสมพนธตวแบบท 2 - คาเอฟเมเชอรของการคนหากฎความสมพนธตวแบบท 1
สถานการณการน าทาง สถานการณการปองกนขอผดพลาด
จน.กฎความสมพนธทน ามาสรางเปนเซตของค าแนะน า 3 5 7 3 5 7
Z -4.795a -5.815a -3.973a -8.766b -8.280b -9.852b
Asymp. Sig. (2-tailed) 0.000 0.000 0.000 0.000 0.000 0.000
a. Based on negative ranks. b. Based on positive ranks. จากตารางท 4-18 ไดผลทดสอบดงน
1) ในสถานการณการน าทาง ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ไดสถตทดสอบคา Z เทากบ -4.795 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางลบ (Based on negative ranks) ดงนนจงสามารถปฏเสธ
202
สมมต H0 ได นนคอคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 มากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรกในสถานการณการน าทาง ทระดบนยส าคญ 0.05
2) ในสถานการณการน าทาง ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ไดสถตทดสอบคา Z เทากบ -5.815 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางลบ (Based on negative ranks) ดงนนจงสามารถปฏเสธสมมต H0 ได นนคอคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 มากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรกในสถานการณการน าทาง ทระดบนยส าคญ 0.05
3) ในสถานการณการน าทาง ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ไดสถตทดสอบคา Z เทากบ -3.973 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางลบ (Based on negative ranks) ดงนนจงสามารถปฏเสธสมมต H0 ได นนคอคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 มากกวาการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรกในสถานการณการน าทาง ทระดบนยส าคญ 0.05
4) ในสถานการณการปองกนการเกดขอผดพลาด ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรก ไดสถตทดสอบคา Z เทากบ -8.766 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมต H0 ได นนคอคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 7 อนดบแรกในสถานการณการปองกนการเกดขอผดพลาดทระดบนยส าคญ 0.05
5) ในสถานการณการปองกนการเกดขอผดพลาด ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก ไดสถตทดสอบคา Z เทากบ -8.280 ซงนอยกวา 0 และจากการ
203
ตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมต H0 ได นนคอคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรกในสถานการณการปองกนการเกดขอผดพลาดทระดบนยส าคญ 0.05
6) ในสถานการณการปองกนการเกดขอผดพลาด ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก ไดสถตทดสอบคา Z เทากบ -9.852 ซงนอยกวา 0 และจากการตงสมมตฐานเปนแบบทางเดยวดงนนคา Sig. จงเทากบ 0.000 / 2 = 0.000 ซงนอยกวาคา α = 0.05 และเนองจากผลการวเคราะหทออกมาตงบนพนฐานทางบวก (Based on positive ranks) ดงนนจงไมสามารถปฏเสธสมมต H0 ได นนคอคาเอฟเมเชอรของการคนหากฎความสมพนธดวยตวแบบท 2 ไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ทสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรกในสถานการณการปองกนการเกดขอผดพลาดทระดบนยส าคญ 0.05
สรปผลการทดสอบ
จากการวเคราะหผลการเปรยบเทยบคาเอฟเมเชอรหรอประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบ ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด ของผลการทดสอบนและผลการทดสอบหลกในหวขอ 4.3 ผวจยสามารถสรปไดวา ในสถานการณการน าทาง การคนหากฎความสมพนธดวยตวแบบท 2 มคาเอฟเมเชอรเฉลยสงกวาการคนหากฎความสมพนธดวยตวแบบท 1 ไมวาจะก าหนดจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเทาใดกตาม โดยการสรางเซตของค าแนะน าจากกฎความสมพนธจ านวนตางๆกนทใหผลตางคาเอฟเมเชอรหรอประสทธภาพของการคนหากฎความสมพนธทง 2 ตวแบบสงทสดในสถานการณการน าทางคอ การสรางเซตของค าแนะน าจากกฎความสมพนธ 5 อนดบแรก 3 อนดบแรก 10 อนดบแรก และ 7 อนดบแรก ตามล าดบ ส าหรบสถานการณการปองกนการเกดขอผดพลาด การคนหากฎความสมพนธดวยตวแบบท 2 มคาเอฟเมเชอรเฉลยไมตางกนหรอนอยกวาการคนหากฎความสมพนธดวยตวแบบท 1 ไมวาจะก าหนดจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเทาไรกตาม โดยการสรางเซตของค าแนะน าจากกฎความสมพนธจ านวนตางๆกนทใหผลตางคาเอฟเมเชอรหรอประสทธภาพของการคนหากฎ
204
ความสมพนธทง 2 ตวแบบมากทสดในสถานการณการปองกนการเกดขอผดพลาดคอ การสรางเซตของค าแนะน าจากกฎความสมพนธ 3 อนดบแรก 5 อนดบแรก 7 อนดบแรก และ 10 อนดบแรก ตามล าดบ
สรปผลการทดลองขางตนสามารถตอบขอสงเกตของผ วจยทตงไวไดคอ ในสถานการณการน าทาง การคนหากฎความสมพนธทง 2 ตวแบบมกฎความสมพนธทเปนผลบวกลวงปะปนอยในอนดบตนๆทงค แตกฎความสมพนธทไดการคนหากฎความสมพนธดวยตวแบบท 1 ในอนดบตนๆนนมกฎความสมพนธทเปนผลบวกลวงปะปนอยมากกวากฎความสมพนธทไดการคนหากฎความสมพนธดวยตวแบบท 2 ในอนดบตนๆ แตส าหรบในสถานการณการปองกนการเกดขอผดพลาดนน การคนหากฎความสมพนธทง 2 ตวแบบมกฎความสมพนธทเปนผลบวกลวงปะปนอยในอนดบตนๆในปรมาณทนอยทงค โดยทกฎความสมพนธ ทไดการคนหากฎความสมพนธดวยตวแบบท 1 ในอนดบตนๆนนมกฎความสมพนธทเปนผลบวกลวงปะปนอยนอยกวากฎความสมพนธทไดการคนหากฎความสมพนธดวยตวแบบท 2 ในอนดบตนๆนนมกฎความสมพนธทเปนผลบวกลวง
ผวจยสงเกตเหนวาในสถานการณการน าทางนน มกจะเกดกฎความสมพนธทเปนผลบวกลวงขนในอนดบตนๆเสมอไมวาใชตวแบบท 1 หรอตวแบบท 2 แตส าหรบในสถานการณการปองกนการเกดขอผดพลาดนน กฎความสมพนธในอนดบตนๆนนคอนขางถกตองแมนย าและมกฎความสมพนธทเปนผลบวกลวงปะปนอยนอยไมวาใชตวแบบท 1 หรอตวแบบท 2 ดวยเหตนผวจยจงสนใจทจะวเคราะหขอสงเกตดงกลาวในหวขอถดไป
4.4.5 การวเคราะหคาประเมนระดบความนาสนใจของกฎความสมพนธในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
จากการทดสอบเพมเตมในหวขอท 4.4.4 ท าใหผวจยทราบวาในสถานการณการน าทางนน มกจะเกดกฎความสมพนธทเปนผลบวกลวงขนในอนดบตนๆเสมอไมวาใชตวแบบท 1 หรอตวแบบท 2 แตส าหรบในสถานการณการปองกนการเกดขอผดพลาดนน กฎความสมพนธในอนดบตนๆนนคอนขางถกตองแมนย าและมกฎความสมพนธทเปนผลบวกลวงปะปนอยในอนดบตนๆนอยไมวาจะใชตวแบบท 1 หรอตวแบบท 2 ผวจยเหนวาสาเหตทเปนเชนนนเพราะการค านวณคาความเชอมนใหมนนแตกตางจากการค านวณคาความเชอมนใหมตรงทคาความเชอมนใหมมการ
205
น าเอาคาความนาจะเปนในการไมพบเซตรายการทตามมาเขามาพจารณาดวย นอกจากนนผวจยเหนวาสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดมลกษณะเฉพาะตวทแตกตางกนทท าใหผลของการน าเอาคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนแตไมมเซตรายการทตามมาเขามาพจารณามผลแตกตางกน ผวจยจงสนใจทจะวเคราะหการค านวณคาประเมนระดบความนาสนใจของกฎความสมพนธทง 2 คา รวมถงการวเคราะหลกษณะเฉพาะของสถานการณทง 2 สถานการณดวย
ตารางท 4-19 แสดงการเปรยบเทยบสตรค านวณและพสยของคาความเชอมนและคาความเชอมนใหม
คาความเชอมน คาความเชอมนใหม
สตรค านวณ Conf(X Y) =
NConf(X Y) =
–
พสย [0,1] [-1,1]
จากตารางขางบนแสดงใหเหนวาความแตกตางของคาความเชอมนกบคาความเชอมนใหมคอการน าเอาคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนแตไมมเซตรายการทตามมาเขามาพจารณาดวย ในสตรค านวณของคาความเชอมนใหมจะเหนวาถาพจนหลงของสตรมคามากจะท าใหคาความเชอมนใหมมคานอย นนคอถาคาความนาจะเปนในการพบเซตรายการทมากอนในทรานแซคชนทไมมเซตรายการทตามมาอยมากคามากแลวกฎความสมพนธนนจะมคาความเชอมนใหมนอย ในขณะทสตรค านวณของคาความเชอมนไมไดน าเอาคาความนาจะเปนในการไมพบเซตรายการทตามมาเขามาพจารณาดวย แตกฎความสมพนธทมคาความเชอมนมากอาจจะมคาความนาจะเปนในการพบเซตรายการทมากอนในทรานแซคชนทไมมเซตรายการทตามมาอยทมากกเปนไปได ซงถาเปนเชนนนกฎความสมพนธดงกลาวกคอกฎความสมพนธทถกแนะน าเปนอนดบตนๆแตจรงๆแลวเปนผลบวกลวงนนเอง (Liu et al., 2008)
206
ตารางท 4-20 แสดงการเปรยบเทยบขนาดของเซตรายการทมากอนและเซตรายการทตามมาของกฎความสมพนธขนาด n ในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด
สถานการณการน าทาง
สถานการณการปองกน การเกดขอผดพลาด
ขนาดของเซตรายการทมากอน 1 n-1 ขนาดของเซตรายการทตามมา n-1 1
จากตารางขางบนแสดงใหเหนวาความแตกตางของกฎความสมพนธสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดกคอ ในสถานการณการน าทางขนาดของเซตรายการทตามมาจะมขนาดใหญขนเปนเชงเสนเมอขนาดของกฎความสมพนธใหญขนโดยทมขนาดของเซตรายการทมากอนเปน 1 เสมอ ส าหรบสถานการณการปองกนการเกดขอผดพลาดขนาดของเซตรายการทตามมาเปน 1 เสมอโดยทมขนาดของเซตรายการทมากอนจะมขนาดใหญขนเปนเชงเสนเมอขนาดของกฎความสมพนธใหญขน
ในปค.ศ. 2004 Lenca และคณะ (Lenca et al, 2004) กเสนอคณสมบต 5 ขอทคาประเมนความนาสนใจของกฎความสมพนธควรจะม หลงจากนนในป ค.ศ. 2007 Lenca และคณะไดปรบปรงคณสมบตทง 5 ขอนนเลกนอยเพอใหมความยดหยนมากขน (Lenca et al, 2007) คณสมบตทง 5 ขอของ Lenca และคณะนนไดแกคณสมบต Q1 Q2 Q3 Q4 และ Q5 ทอธบายไวในบทท 2 คณสมบต Q1 นนกลาวไววา กฎความสมพนธนนมความนาสนใจสงทสด เมอคาความนาจะเปนในการพบทรานแซคชนทม เซตรายการทมากอนแตไมมเซตรายการทตามมาในฐานขอมลเทากบ 0 และคาประเมนความนาสนใจของกฎความสมพนธควรจะเปนคาคงทคาใดคาหนงหรอเปนคาอนนตเพอสอความหมายอยางชดเจนวากฎความสมพนธนนนาสนใจสงทสดดวย
จากคณสมบตนจะเหนวาการประเมนวากฎความสมพนธใดมความนาสนใจสงนน ไมสามารถพจารณาเพยงแคคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนและเซตรายการทตามมาเทานน แตจะตองพจารณาทคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนแตไมมเซตรายการทตามมาควบคดวย หรอเพยงพจารณาทคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนแตไมมเซตรายการทตามมาเปนหลก สาเหตท
207
เปนเชนนนกเพราะในบางกรณทกฎความสมพนธมคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนและเซตรายการทตามมามคาสง แตคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนแตไมมเซตรายการทตามมามคาสงกวา หรอกลาวคอในทรานแซคชนทมเซตรายการทมากอนอยมกจะไมมเซตรายการทตามมาเปนสวนใหญ แตในทรานแซคชนทมเซตรายการทตามมาอยมกจะมเซตรายการทมากอนเปนสวนใหญ ตามรปดานลางน
รปท 4-5 แสดงทกฎความสมพนธมคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนและเซตรายการทตามมามคาสง แตคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการ
ทมากอนแตไมมเซตรายการทตามมามคาสงกวา
กฎความสมพนธทพบวา ทรานแซคชนสวนใหญนนทมเซตรายการทมากอนอยมกจะไมมเซตรายการทตามมา สามารถกลาวไดวาเปนกฎความสมพนธเซตรายการทมากอนกบเซตรายการทตามมามความสมพนธเชงลบตอกน ถากฎความสมพนธนถกจดอนดบวามความนาสนใจในอนดบตนๆ กฎความสมพนธนกคอผลบวกลวงนนเอง (Liu et al., 2008) ดงนนการใชคาประเมนความนาสนใจทขนกบคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนและเซตรายการทตามมาเปนหลกเพยงอยางเดยว อยางเชน คาสนบสนน คาความเชอมน คาลฟท เปนตน จงมโอกาสทจะท าใหเกดกฎความสมพนธทเปนผลบวกลวงไดงาย
กรณทคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนและเซตรายการทตามมามคาสง แตคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนแตไมมเซตรายการทตามมามคาสงกวาดงรปดานบนนน จะมโอกาสเกดขนไดงายเมอพบวาคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนมสงมากๆ ในขณะทคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทตามมามนอยกวามากๆ เมอพจารณาทรปแบบกฎความสมพนธ
208
ในสถานการณการน าทาง จะเหนวาเซตรายการทมากอนทมขนาดเทากบ 1 เสมอนนมโอกาสสงทคาความนาเปนในการพบทรานแซคชนทมเซตรายการทมากอนมคาสงมากๆ ในขณะทเซตรายการทตามมามขนาดเพมขนเปนเชงเสนตามขนาดของกฎความสมพนธนนมโอกาสสงทคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทตามมาจะมนอยมากๆ ดวยเหตนกฎความสมพนธในสถานการณการน าทางทใชคาประเมนความนาสนใจของกฎความสมพนธทขนกบคาความนาจะเปนในการพบทรานแซคชนทมเซตรายการทมากอนและเซตรายการทตามมาเปนหลกเพยงอยางเดยวจงมโอกาสเกดผลบวกลวงไดสง
เมอโอกาสเกดกฎความสมพนธทเปนผลบวกลวงในสถานการณการน าทางมมาก การน าเอาคาความนาจะเปนในการไมพบเซตรายการทตามมาเขามาพจารณาดวยของคาความเชอมนใหมจงสามารถลดระดบความนาสนใจของกฎความสมพนธทเปนผลบวกลวงไดมากเชนกน ส าหรบในสถานการณการปองกนการเกดขอผดพลาด คาความนาจะเปนในการไมพบเซตรายการทตามมาทนอยสงผลกฎความสมพนธทมคาความเชอมนหรอคาเชอมนใหมสงมกฎความสมพนธทเปนผลบวกลวงปะปนอยนอย การน าเอาคาความนาจะเปนในการไมพบเซตรายการทตามมาเขามาพจารณาดวยของคาความเชอมนใหมจงสามารถชวยลดระดบความนาสนใจของกฎความสมพนธทเปนผลบวกลวงไดนอยดวย
4.4.6 สรปผลการศกษาเพมเตม
การทดสอบการเปรยบเทยบคาประสทธภาพหรอคาเอฟเมเชอร (F-measure) คาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาดโดยการสรางเซตของค าแนะน าแบบปกตกบการสรางเซตของค าแนะน าจากการยเนยน (Union) ของรายการการเปลยนแปลงแกไขทอยในเซตรายการทตามมาของกฎความสมพนธอนดบสงสดจ านวน 10 รายการแรก ท าใหผวจยทราบวาการคนหากฎความสมพนธดวยตวแบบท 2 มประสทธภาพเพมขนเมอพจารณาเพยงกฎความสมพนธทอยในอนดบตนๆ ผ วจยจงศกษาเพมเตมโดยการทดสอบการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบโดยปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆคอ 7 อนดบแรก 5 อนดบแรกและ 3 อนดบแรก จากการทดสอบนท าใหผ วจยทราบถงแนวโนมการลดลงหรอเพมของประสทธภาพของการคนหากฎความสมพนธของตวแบบทง 2 ทแตกตางกนในสถานการณการน าทางและสถานการณการ
209
ปองกนการเกดขอผดพลาดเมอมการปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ผวจยจงวเคราะหสาเหตของแนวโนมทแตกตางกนใน 2 สถานการณนน
การทดสอบเพมทงหมดนเพอศกษาหาสาเหตของผลการทดสอบหลงของงานวจยนนนคอ การเปรยบเทยบประสทธภาพของการประยกตเทคนคการคนหากฎความสมพนธบนขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนและตวแบบคาสนบสนน-คาความเชอมนใหม ผลการทดสอบแสดงใหเหนวาตวแบบคาสนบสนน -คาความเชอมนใหมชวยเพมประสทธภาพใหกบการประยกตเทคนคการคนหากฎความสมพนธบนขอมลซอฟตแวรอารไคฟวไดเฉพาะในสถานการณการน าทางเทานน และผลการทดสอบเพมแสดงใหเหนวาสาเหตทตวแบบคาสนบสนน-คาความเชอมนใหมชวยเพมประสทธภาพในสถานการณการน าทางเนองมาจากการใชตวแบบคาสนบสนน-คาความเชอมนนนสามารถท าใหเกดกฎความสมพนธทเปนผลบวกลวงไดมาก แตการใชตวแบบคาสนบสนน-คาความเชอมนใหมสามารถลดการเกดผลบวกลวงเหลานนได แตส าหรบในสถานการณการปองกนการเกดขอผดพลาดนนการใชตวแบบทง 2 ใหกฎความสมพนธทเปนผลบวกลวงคอนขางนอย และการใชตวแบบคาสนบสนน-คาความเชอมนใหคาความถกตองและคาเรยกคนทดกวาการใชตวแบบคาสนบสนน-คาความเชอมนใหมจงท าใหประสทธภาพของการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนดกวาการคนหากฎความสมพนธดวยตวแบบคาสนบสนน-คาความเชอมนใหม
210
บทท 5 สรปผลการวจย………
5.1 บทน า
บทนจะแสดงการสรปผลของงานวจยและปญหาทเกดขนในการวจย สดทายเปนขอเสนอแนะของงานวจย เพอปรบเปลยนรปแบบของงานวจยหรอพฒนาการทดลองใหมประสทธภาพยงขน
5.2 การออกแบบการวจยและลกษณะของขอมลทน ามาใช
งานวจยนเปนการวจยเชงทดลอง (Experimental Research) โดยใชทรานแซคชนของการเปลยนแปลงแกไขและขอสอบถามทสรางมาจากขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรทางการบญชชอเคมายมนน (KMyMoney) มาทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนและประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) ซงมทรานแซคชนของการเปลยนแปลงแกไขทงหมด 5458 ทรานแซคชนและเลอกทรานแซคชนชดทดสอบทงหมด 60 ทรานแซคชน (ทรานแซคชนชดทดสอบแสดงอยในภาคผนวก ก) ซงท าใหไดขอสอบถามทใชในการทดสอบทงหมด 962 ขอสอบถาม
การทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวในงานวจยนเปนการทดสอบประสทธภาพในแงของการประยกตการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวร โดยใชวธการทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวทเสนอโดย Zimmermann และคณะในป 2005 (Zimmermann et al., 2005) ซงแบงการทดสอบประสทธภาพออกเปน 3 สถานการณของการพฒนาซอฟตแวรไดแก 1) สถานการณการน าทาง (Navigation) 2) สถานการณการปองกนการเกดขอผดพลาด (Error Prevention) และ 3) สถานการณการเปลยนแปลงแกไขทสมบรณแลว (Closure)
211
5.3 สรปผลการวจย
งานวจยนมวตถประสงคเพอเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) โดยแบงการทดสอบเปรยบเทยบประสทธภาพของตวแบบทง 2 ตวแบบเปน 3 สถานการณดงน
1) เปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบตวแบบคาสนบสนน-คาความเชอมนใหม ในสถานการณการน าทาง
2) เปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบตวแบบคาสนบสนน-คาความเชอมนใหม ในสถานการณการปองกนการเกดขอผดพลาด
3) เปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบตวแบบคาสนบสนน-คาความเชอมนใหม ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
การทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว ผ วจยใชขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรทางการบญชชอเคมายมนน (KMyMoney) กบเครองมอทดสอบทผ วจยพฒนาขนมา โดยประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธในงานวจยนใชคา เอฟเมเชอรส าหรบการทดสอบในสถานการณการน าทางและสถานการณการปองกนการเกดขอผดพลาด และใชคาผลสะทอนกลบส าหรบการทดสอบในสถานการณการเปลยนแปลงแกไขทสมบรณแลว ผลการทดสอบประสทธภาพและการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว 2 ตวแบบใน 3 สถานการณ แสดงไวในภาคผนวก ค สามารถสรปไดดงน
212
5.3.1 ผลการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบตวแบบคาสนบสนน-คาความเชอมนใหม ในสถานการณการน าทาง
การทดสอบในสถานการณการน าทางนใชขอสอบถามทงหมด 451 ขอสอบถาม ผลการทดสอบผ วจยพบวาคาประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมมากกวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมน และผลการทดสอบความแตกตางคาประสทธภาพของทง 2 กลมดวยสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) สรปไดวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมมประสทธภาพทดกวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว ดวยตวแบบคาสนบสนน -คาความเชอมนในสถานการณการน าทาง กลาวคอการน าตวแบบคาสนบสนน -คาความเชอมนใหมมาประยกตสามารถเพมประสทธภาพใหกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวส าหรบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรในสถานการณการน าทางไดอยางมนยส าคญ
ผวจยไดทดสอบเพมเตมเพอเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบ ผลการทดสอบผ วจยพบวาการใชตวแบบคาสนบสนน-คาความเชอมนใหมใหคาความถกตองเฉลย (Average Precision) ทต ากวาและใหคาเรยกคนเฉลย (Average Recall) ทสงกวาการใชตวแบบคาสนบสนน-คาความเชอมนอยางมนยส าคญดวย เนองจากผ วจยสงเกตเหนวาขนาดเซตของค าแนะน าทไดมาจากการใชตวแบบคาสนบสนน-คาความเชอมนใหมทมขนาดใหญกวาเซตของค าแนะน าทไดมาจากการใชตวแบบคาสนบสนน -คาความเชอมนเสมอ (คาความถกตองแปรผกผนกบขนาดเซตของค าแนะน า) กฎความสมพนธทไดมาจากการใชตวแบบคาสนบสนน-คาความเชอมนทอยในอนดบตนๆจะเปนกฎความสมพนธทมเซตรายการทตามมาเพยง 1 รายการเสมอ (คาความเชอมนของกฎความสมพนธแปรผนตรงกบคาสนบสนนของกฎความสมพนธ และกฎความสมพนธทมเซตรายการทตามมาเพยง 1 รายการมกจะท าใหคาสนบสนนของกฎ
213
ความสมพนธมคามากกวากฎความสมพนธทมเซตรายการทตามมาหลายรายการ) ส าหรบกฎความสมพนธทไดมาจากการใชตวแบบคาสนบสนน-คาความเชอมนใหมทมกจะมเซตรายการทตามมขนาดใหญนน ผ วจยเหนวาอาจเปนเพราะขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรเคมายมนน (KMyMoney) นนแตละแฟมขอมลในโครงการมความสมพนธเชอมโยงกนมาก จงท าใหเกดกฎความสมพนธทไดมาจากการใชตวแบบคาสนบสนน-คาความเชอมนใหม 10 อนดบแรกมความหลากหลาย
นอกจากนนผวจยยงไดทดสอบเพมเตมโดยการปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ผลการทดสอบซงพบวาการใชตวแบบคาสนบสนน-คาความเชอมนใหมใหประสทธภาพทดกวาการใชตวแบบคาสนบสนน -คาความเชอมนเสมอในสถานการณการน าทาง ไมวาจะปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาใดๆกตาม
5.3.2 ผลการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบตวแบบคาสนบสนน -คาความเชอมนใหม ในสถานการณการปองกนการเกดขอผดพลาด
การทดสอบในสถานการณการปองกนการเกดขอผดพลาดนใชขอสอบถามทงหมด 451 ขอสอบถาม ผลการทดสอบผวจยพบวาคาประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมต ากวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมน และผลการทดสอบความแตกตางคาประสทธภาพของทง 2 กลมดวยสถตทดสอบเครองหมายล าดบทของวลคอกซนส าหรบการทดสอบแบบจบค (The Wilcoxon Signed Rank Sum Test for the Matched Paired Difference) สรปไดวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมมประสทธภาพทดอยกวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนในสถานการณการปองกนการเกดขอผดพลาด กลาวคอการน าตวแบบคาสนบสนน-คาความเชอมนใหมมาประยกตใชไมสามารถเพมประสทธภาพใหกบการท าเหมองขอมลดวยเทคนคการคนหากฎ
214
ความสมพนธกบขอมลซอฟตแวรอารไคฟวส าหรบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรในสถานการณการปองกนการเกดขอผดพลาดได
ผวจยไดทดสอบเพมเตมเพอเปรยบเทยบคาความถกตอง (Precision) และคาเรยกคน (Recall) ของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธของทง 2 ตวแบบ ผลการทดสอบแสดงใหเหนวาการใชตวแบบคาสนบสนน -คาความเชอมนใหมใหคาความถกตอง (Precision) และคาเรยกคน (Recall) ทต ากวาการใชตวแบบคาสนบสนน-คาความเชอมนอยางมนยส าคญดวย โดยสาเหตของผลการทดสอบนเปนเชนเดยวกบทไดกลาวไปในหวขอทแลว
นอกจากนนผ วจยยงไดทดสอบเพมเตมโดยการปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาตางๆ ผลการทดสอบผ วจยพบวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมใหประสทธภาพทดอยกวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนเสมอในสถานการณการปองกนการเกดขอผดพลาด ไมวาจะปรบจ านวนของกฎความสมพนธทน ามาสรางเปนเซตของค าแนะน าเปนคาใดๆกตาม
5.3.3 ผลการเปรยบเทยบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนกบตวแบบคาสนบสนน-คาความเชอมนใหม ในสถานการณการเปลยนแปลงแกไขทสมบรณแลว
การทดสอบในสถานการณการเปลยนแปลงแกไขทสมบรณแลวนใชขอสอบถามทงหมด 60 ขอสอบถาม ผลการทดสอบผวจยพบวาคาประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมเทากบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมน และผลการทดสอบอตราสวน 2 กลมดวยสถตทดสอบ Z (Two Proportion Z Tests) สรปไดวาการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนใหมมประสทธภาพทไมตางกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนในสถานการณการเปลยนแปลงแกไขทสมบรณแลว กลาวคอการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมล
215
ซอฟตแวรอารไคฟวส าหรบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรในสถานการณการเปลยนแปลงแกไขทสมบรณแลวสามารถน าตวแบบคาสนบสนน-คาความเชอมนหรอตวแบบคาสนบสนน-คาความเชอมนใหมไปประยกตใชไดโดยใหประสทธภาพทไมตางกน
ผลการทดสอบประสทธภาพการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวขางตนเปนผลทเกดจากการใชขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรทางการบญชชอเคมายมนน (KMyMoney) ทเปนโครงการพฒนาซอฟตแวรแบบเปด (Open Source) และมรายละเอยดของโครงการตามทอธบายไวในหวขอท 3.4 จากการทดสอบเพมเตมในหวขอ 4.4.1 ถง 4.4.4 และการวเคราะหเพมเตมในหวขอ 4.4.5 ผวจยสงเกตวาลกษณะของการเปลยนแปลงแกไขทเกดขนของนกพฒนาในโครงการน มลกษณะไมคอยมการแบงกลมแฟมขอมลทแตละคนแกไขอยางชดเจน แสดงใหเหนวานกพฒนาภายในโครงการนอาจไมมการแบงหนาทการท างานของนกพฒนาแตละคน ซงกเปนลกษณะทสามารถเกดขนไดทวไปในโครงการพฒนาซอฟตแวรแบบเปด ลกษณะดงกลาว นอาจแตกตางจากโครงการพฒนาซอฟตแวรเชงพาณชยทมการแบงหนาทการท างานทชดเจน ผวจยจงเหนวาลกษณะทแตกตางกนดงกลาวสามารถสงผลกระทบตอประสทธภาพของระบบใหค าแนะน านกพฒนาไดและเปนประเดนทนาสนใจส าหรบการศกษาในอนาคต
5.4 การน างานวจยไปประยกตใช
ในงานวจยนสามารถใชเปนแนวทางในการศกษาตอไปหรอน าไปประยกตใชในการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลประเภทอนๆ โดยผวจยแบงขอเสนอไวดงตอไปน
5.4.1 การน างานวจยไปใชในเชงทฤษฎ
งานวจยในอดตมการทดสอบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบคาสนบสนน-คาความเชอมนส าหรบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวร ใ หผลประสท ธภาพท ด (Zimmermann et al., 2005; Methanias et al., 2009) ดงนนผวจยจงสนใจเพมประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดงกลาว
216
ดวยการน าตวแบบคาสนบสนน-คาความเชอมนใหมของ Liu และคณะ (Liu et al., 2008) มาประยกตใช เนองจากตวแบบนมคณสมบตทดกวาตวแบบคาสนบสนน-คาความเชอมนเดมและยงมคณสมบตทนาสนใจคอสามารถลดจ านวนของกฎความสมพนธทเปนผลบวกลวงลงได งานวจยนจงสามารถเปนแนวทางใหกบนกพฒนาทสนใจเพมประสทธภาพใหกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวส าหรบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรตอไปได ตวอยางเชน การน าว ธการทดสอบประสทธภาพของงานวจยไปเปนแนวทางในทดสอบเปรยบเทยบประสทธภาพกบตวแบบของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธตวแบบอนๆตอไป เปนตน
เนองจากงานวจยนมขอจ ากดในการเลอกโครงการพฒนาซอฟตแวรทน ามาทดสอบ จงจ าเปนตองใชโครงการพฒนาซอฟตแวรทเปนแบบเปด (Open source) ผวจยเหนวาโครงการพฒนาซอฟตแวรทเปนแบบเปดอาจมลกษณะหลายๆอยางทแตกตางจากโครงการพฒนาซอฟตแวรเชงพาณชยซงอาจมผลตอประสทธภาพของระบบใหค าแนะน านกพฒนาได งานวจยน จงสามารถเปนแนวทางกบงานวจยทสนใจทดสอบประสทธภาพกบโครงการพฒนาซอฟตแวรเชงพาณชยได รวมถงงานวจยทสนใจเปรยบเทยบความแตกตางของการทดสอบประสทธภาพกบโครงการพฒนาซอฟตแวรทเปนแบบเปดและโครงการพฒนาซอฟตแวรเชงพาณชยดวย
5.4.2 การน างานวจยไปใชในเชงประยกต
จากผลการทดสอบเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบ ในสถานการณการน าทางทใชคาเอฟเมเชอรเปนคาประสทธภาพนนแสดงใหเหนวาตวแบบคาสนบสนน -คาความเชอมนใหมใหประสทธภาพทดกวา ดงนนถาผ ใชใหความส าคญกบค าแนะน าในสถานการณการน าทางมากทสด ผ ใชสามารถน าตวแบบคาสนบสนน-คาความเชอมนใหมไปประยกตใชกบระบบใหค าแนะน านกพฒนาระหวางการพฒนาซอฟตแวร ส าหรบในสถานการณการปองกนการเกดขอผดพลาดทใชคาเอฟเมเชอรเปนคาประสทธภาพเชนกนนนแสดงใหเหนวาตวแบบคาสนบสนน -คาความเชอมนใหประสทธภาพทดกวา ดงนนถาผ ใชใหความส าคญกบค าแนะน าในสถานการณการปองกนการเกดขอผดพลาด ผ ใชควรน าตวแบบคาสนบสนน-คาความเชอมนไปประยกตใชกบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวร และส าหรบในสถานการณการเปลยนแปลงแกไขทสมบรณแลวทใชคาผลสะทอนกลบเปนคาประสทธภาพนนแสดงใหเหนวาตวแบบคาสนบสนน-คาความเชอมนและตวแบบคาสนบสนน-คาความเชอมนใหมใหประสทธภาพท
217
ไมตางกน ถาผใชใหความส าคญกบค าแนะน าในสถานการณการเปลยนแปลงแกไขทสมบรณแลว ผ ใชสามารถเลอกน าตวแบบคาสนบสนน -คาความเชอมนหรอตวแบบคาสนบสนน-คาความเชอมนใหมไปประยกตใชกบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวรได
นอกจากนน จากผลการทดสอบเพมเตม แสดงใหเหนวาการใชตวแบบคาสนบสนน-คาความเชอมนใหคาความถกตอง (Precision) ทสงกวาการใชตวแบบคาสนบสนน-คาความเชอมนใหมแตการใชตวแบบคาสนบสนน-คาความเชอมนใหเรยกคน (Recall) ทต ากวาการใชตวแบบคาสนบสนน-คาความเชอมนใหม ถาผ ใชใหความส าคญกบคาความถกตองมากกวาคาเรยกคน ผ ใชควรเลอกน าตวแบบคาสนบสนน-คาความเชอมนไปประยกตใชกบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวร แตถาผ ใชใหความส าคญกบคาเรยกคนมากกวาคาความถกตอง ผ ใชควรเลอกน าตวแบบคาสนบสนน-คาความเชอมนใหมไปประยกตใชกบระบบใหค าแนะน านกพฒนาในระหวางการพฒนาซอฟตแวร
เนองจากผลของงานวจยนเปนผลมาจากการทดสอบกบโครงการพฒนาซอฟตแวรแบบเปด (Open source) ดงนนการน างานวจยไปใชในเชงประยกตจงตองใสใจในประเดนของลกษณะของโครงการทน าไปประยกตใชดวย ผ วจยเหนวาผ ใชสามารถน าค าแนะน าในการประยกตใชทกลาวในขางตนไปใชกบโครงการพฒนาซอฟตแวรแบบเปดและโครงการพฒนาซอฟตแวรเชงพาณชยแตอยภายใตเงอนไขของทมพฒนายอยทมขนาดของทมไมมากนกและมความอสระภายในทมสง
5.5 ขอจ ากดของงานวจย
จากการทดสอบเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบในงานวจยน มขอจ ากดบางประการดงน
1) ผลการทดสอบเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบในงานวจยน เปนผลจากการทดสอบกบขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรเคมายมนน (KMyMoney) เทานน ส าหรบการทดสอบเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมล
218
ซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบดวยขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรอนๆ ทมคณลกษณะแตกตางไปจากโครงการพฒนาซอฟตแวรเคมายมนน (KMyMoney) เชน ขนาด อตราการเปลยนแปลงแกไข ภาษาทใชในการพฒนา รวมถงลกษณะของโครงการพฒนาซอฟตแวรแบบเปด (Open Souce) หรอโครงการพฒนาซอฟตแวรเชงพาณชย (Commercial) อาจใหผลทแตกตางกนออกไป
2) การทดสอบเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบในงานวจยน เปนผลจากการทดสอบทผวจยก าหนดคาตางๆ ในเครองมอทใชในการทดสอบดงน
คาสนบสนนนบขนต า (Minimum Support Count) เทากบ 3
คาความ เ ช อมน ข น ต า /คาความ เ ช อมน ใหม ข น ต า (Mimimum Confidence / New Confidence) เทากบ 0.1
การก าหนดคาน าหนกของคาเอฟเมอรแบบสมดล กลาวคอใหน าหนกกบคาความถกตอง (Precision) และคาเรยกคน (Recall) อยางละ 0.5 เทากน
การก าหนดคาตางๆ ในเครองมอทใชในการทดสอบทแตกตางกนออกไปน อาจท าใหไดผลทแตกตางออกไปดงน
การก าหนดคาสนบสนนนบขนต า (Minimum Support Count) มากกวาหรอนอยกวา 3 อาจท าใหเซตของค าแนะน าทไดแตกตางออกไป ซงมผลใหท าใหคาความถกตอง คาเรยกคนและคาเอฟเมเชอรแตกตางออกไปได
การก าหนดคาความเชอมนขนต า/คาความเชอมนใหมขนต า (Mimimum Confidence / New Confidence) ทมากกวา 0.1 อาจท าใหเซตของค าแนะน าทไดแตกตางออกไป ซงมผลใหท าใหคาความถกตอง คาเรยกคนและคาเอฟเมเชอรแตกตางออกไปได
การก าหนดคาน าหนกของคาเอฟเมอรแบบสมดล กลาวคอใหน าหนกกบคาความถกตอง (Precision) และคาเรยกคน (Recall) อยางละ 0.5 เทากน
219
5.6 แนวทางการศกษาตอเนอง
จากขอจ ากดของงานวจย ผ ทสนใจศกษาตอเนองอาจใชเปนแนวทางดงตอไปนในการศกษาได
1) ผ ทสนใจสามารถทดสอบกบขอมลซอฟตแวรและขอสอบถามชดอนทนอกเหนอจากขอมลซอฟตแวรอารไคฟวของโครงการพฒนาซอฟตแวรเคมายมนน (KMyMoney) เพอใหผลการทดสอบครอบคลมโครงการพฒนาซอฟตแวรทกๆคณลกษณะ
2) ผ ทสนใจสามารถทดสอบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวโดยก าหนดคาตางๆของเครองมอทดสอบทเหมาะสม ไดแก คาสนบสนนนบขนต า (Minimum Support Count) คาความเชอมนขนต า / คาความเชอมนใหมขนต า (Mimimum Confidence / New Confidence) และก าหนดคาน าหนกของคาเอฟเมอร
3) ผสนใจการทดสอบเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟวดวยตวแบบทง 2 ตวแบบในงานวจย สามารถเปลยนการวดประสทธภาพจากการใชคาเอฟเมเชอรไปเปนการวดคาอนๆแทน เชน การวดประสทธภาพจากนบจ านวนของกฎความสมพนธทเปนผลบวกลวง
4) ผ สนใจสามารถน าตวแบบประเมนระดบความนาสนใจของกฎความสมพนธอนๆมาประยกตใชกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว เชน คาลฟท (Lift) คาเลฟเวอเรจ (Leverage) คาคฟเวอเรจ (Coverage) คาสหสมพนธ (Correlation) และ คาอตราสวนออดส (Odds Ratio) เปนตน
5) ผสนใจการทดสอบเปรยบเทยบประสทธภาพของการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธดวยตวแบบทง 2 ตวแบบสามารถทดลองกบขอมลซอฟตแวร อารไคฟวของโครงการพฒนาซอฟตแวรเชงพาณชยหรอโครงการพฒนาซอฟตแวรแบบเปดทมกฎระเบยบทเครงครด
6) ผสนใจสามารถประยกตใชตวแบบคาสนบสนน-คาความเชอมนใหมกบการท าเหมองขอมลดวยเทคนคการคนหากฎความสมพนธกบขอมลซอฟตแวรอารไคฟว เ พอวตถประสงคอนๆได เชน การประยกตใชกฎความสมพนธปฏเสธ (Nagative Association Rule) กบการสรางระบบแจงเตอนนกพฒนาวา ไมควรแกไขแฟมขอมลนตอจากแฟมขอมลทแกไขไปกอนหนา เปนตน
220
รายการอางอง
Agrawal, R., Imielinski T., and Swami A. 1993. Mining Association Rules between sets of items in large databases. In Proceedings of the ACM SIGMOD Conference on Management of Data : 207-216.
Agrawal, R., and Srikant, R. 1994. Fast Algorithms for Mining Association Rules. Proc. 20th Very Large Data Bases Conf. (VLDB) : 487-499.
Agrawal, R., and Srikant, R. 1995. Mining Sequential Patterns. In Proc. of the 11th Int'l Conference on Data Engineering.
Agrawal, R., Arning, A., Bollinger, T., Mehta, M., Shafer, J., and Srikant, R. 1996. The quest Data Mining system. In Proceedings of KDD'96 : 244-249.
Ambriola, V., Bendix, L., and Ciancarini, P. 1990. The Evolution of configuration management and version control. Software Engineering Journal. 5, 6: 303-310.
Baeza-Yates, R., and Ribeiro-Neto, B. 1999. Modern Information Retrieval, first ed. Addison-Wesley-Longman.
Ball, T., Kim, J.-M., Porter, A.A., and Siy, H.P. 1997. If Your Version Control System Could Talk. Proc. ICSE Workshop Process Modelling and Empirical Studies of Software Eng.
Baudis, P. 2009. Current Concepts in Version Control Systems.
Beil, F., Ester, M. and Xu, X. 2002. Frequent Term-Based Text Clustering. Proc. Eighth Int’l Conf. Knowledge Discovery and Data Mining (KDD 2002).: 436-442.
Bieman, J.M., Andrews, A.A., and Yang, H.J. 2003. Understanding Change-Proneness In OO Software through Visualization. Proc. 11th Int’l Workshop Program Comprehension. : 44-53.
221
Bird, C., Gourley, A., Devanbu, P.T., Gertz, M., and Swaminathan, A. 2006. Mining email social networks. In Proceedings of Int. Workshop on Mining Software Repositories MSR.
Breu, S., and Zimmermann, T. 2006. Mining Aspects from Version History. Proceedings of the 21st IEEE/ACM International Conference on Automated Software Engineering.: 221-230.
Brin, S., Motwani, R., Ullman J. 1997. Dynamic Itemsets Counting and implication rules for market basket data. In proc. of 997 ACM-SIGMOD Int. Conf. on Management of Data.
Burch, M., Diehl, S., and Weißgerber, P. Visual Data Mining in Software Archives. In Proc. ACM Symposium on Software Visualization SOFTVIS, St. Louis, Missouri, USA, May 2005.
Cederqvist, P. 2006. Version Management with CVS. Network Theory Ltd.
Chadd, W., Jaime, S. 2008. Branching and merging in the repository. Proceedings of the 2008 international working conference on Mining software repositories.
CMMI Product Team. 2006. CMMI for Development, Version 1.2. Software Engineering Institute, Carnegie Mellon University.: CMU/SEI-2006-TR-008.
Conradi, R., Westfechtel B. 1998. Version Models for software configuration management. ACM Computing Surveys (CSUR). 30, 2: 232-282.
Freitas, A. 1999. On rule interestingness measures. Knowledge-Based Systems journal.: 309–315.
Gall, H., Hajek, K., and Jazayeri, M. 1998. Detection of Logical Coupling Based on Product Release History. In Proceedings of the 26th International Conference on Software Maintenance (ICSM ’98). : 190-198.
222
Gall, H., Jazayeri, M., and Krajewski, J. 2003. CVS release history data for detecting logical Couplings. In IWPSE 2003.
Geng. L., Hamilton, HJ. 2006. Interestingness measures for Data Mining - a survey. ACM Comput Surveys 2006. 38(3), article 9
Geyer-Schulz, A., and Hahsler, M. 2002. Evaluation of recommender algorithms for an internet information broker based on simple Association Rules and on the repeat-buying theory. Proceedings of Fourth WebKDD Workshop: Web Mining for Usage Patterns & User Profiles.: 100–114.
Grune, D., Berliner, B. 2006. CVS [On-Line]. Available from: http://www.nongnu.org/cvs/
Hahsler, M. 2009. A Comparison of Commonly Used Interest Measures for Association Rules. Available from: http://www.ai.wu-wien.ac.at/~hahsler/research/association_rules/measures.html
Heravi, M.J. 2009. A study on Interestingness Measures for Associative Classifiers. Master’s Thesis, Department of Computing Science, Faculty of Science, University of Alberta.
Huzefa, K., Michael, C., Jonathan, M. 2007. Comparing Approaches to Mining Source Code for Call-Usage Patterns. Proceedings of the Fourth International Workshop on Mining Software Repositories. :20.
Junqueira, D., Bittar, T., Fortes, R. 2008. A fine-grained and flexible version control for software. SIGDOC’08.
Kim, M., Sazawal, V., Notkin, D., Murphy, G. 2005. An empirical study of code clone genealogies. Proceedings of the 10th European software engineering conference held jointly with 13th ACM SIGSOFT international symposium on Foundations of software engineering.
223
Kotsiantis, S., Kanellopoulos, D. 2006. Association Rules Mining: A Recent Overview. GESTS International Transactions on Computer Science and Engineering. 32, 1: 71-82.
Lenca, P., Meyer, P., Vaillant, B., and Lallich, S. 2004. A multicriteria decision aid for interestingness measure selection. Technical Report LUSSI-TR-2004-01-EN, LUSSI Department, GET/ENST, Bretagne, France.
Lenca, P., Vaillant, B., Meyer P., and Lallich, S. 2007. Association Rule interestingness measures: Experimental and theoretical studies. In Quality Measures in Data Mining.: pages 51–76.
Li, H., Duo, Z., Jian, H., Hua-Jun, Z., Zheng, C. 2007. Finding keyword from online broadcasting content for targeted advertising. Proceedings of the 1st international workshop on Data Mining and audience intelligence for advertising. : 55-62.
Li, Z., and Zhou, Y. 2005. PR-Miner: Automatically Extracting Implicit Programming Rules and Detecting Violations in Large Software Code. In Proceedings of 13th International Symposium on Foundations of Software Engineering (ESEC/FSE'05).
Liguo, Yu. 2007. Understanding component co-Evolution with a study on Linux. Empirical Software Engineering. 12, 2: 123-141.
Liu, J., Xiaoping, F., Zhihua, Q. 2008. A New Interestingness Measure of Association Rules. Genetic and Evolutionary Computing 2008. WGEC '08. Second International Conference. :393-397.
Livshits, B., and Zimmermann, T. 2005. DyanMine: Finding Common Error Patterns by Mining Software Revision Histories. In Proceedings of 13th International Symposium on Foundations of Software Engineering (ESEC/FSE'05).
224
Löh, A., Swierstra, W. Leijen D. 2007. A Principled Approach to Version Control [On-Line]. Available from: http://people.cs.uu.nl/andres/VersionControl.html
Lucian, V., Alex, T., Jarke, W. 2005. CVSscan: visualization of code Evolution. Proceedings of the 2005 ACM symposium on Software visualization.
Lucian, V., Alexandru, T. 2006. An open framework for CVS repository Querying, analysis and visualization. Proceedings of the 2006 international workshop on Mining software repositories.
Major, J.A., and Mangano, J.J. 1995. Selecting among rules induced from a hurricane database. Journal of Intelligent Information systems.: 4:39–52.
Mcgarry, K. 2005. A survey of interestingness measures for knowledge discovery. Knowl. Eng. Review 20, 1, 39–61.
Methanias C.J., Manoel M., Francisco R.. 2009. Mining software change history in an industrial environment. XXIII Brazilian Symposium on Software Engineering.
Michael Fischer, Martin Pinzger, Harald Gall. 2003. Populating a Release History Database from Version Control and Bug Tracking Systems. Proceedings of the International Conference on Software Maintenance. : 23
Michail, A. 1999. Data Mining Library Reuse Patterns in Userselected Applications. In 14th IEEE International Conference on Automated Software Engineering. : 24–33.
Michail, A. 2000. Data Mining Library Reuse Patterns Using Generalized Association Rules. In Proceedings of 22nd International Conference on Software Engineering (ICSE'00). : 167-176.
Miller, W., and Myers, E.W. 1985. A file comparison program. Software Practice and Experience. 15, 11: 1025–1040.
225
Nayyeri, A., and Oroumchian, F. 2006. Fufair: a fuzzy farsi information retrieval system. in proceedings of the 4th ACS/IEEE International Conference on Computer Systems and Applications (AICCSA-06).
Object Technology International. Eclipse Platform Technical Overview, Feb. 2003. Available at www.eclipse.org
Olivier, C., Vincent, D., Tienté, H. Engelbert Mephu Nguifo. 2008. Optimizing Occlusion Appearances In 3D Association Rules Visualization. Intelligent Systems 2008. 2: 15-42-15-49.
O’Sullivan, B. 2009. Making Sense of Revision-control Systems. ACM Queue.
Pei, J., Han, J., Mortazavi-Asl, B., Wang, J., Pinto, H., Chen, Q., Dayal U., and Hsu, M. 2004. Mining Sequential Patterns by Pattern-Growth: The PrefixSpan Approach. IEEE Transaction on Knowledge and Data Engineering. 16: 10.
Piatetsky-Shapiro, G., 1991. Discovery Analysis and Presentation of strong rules. in: Knowledge Discovery in Databases, AAAI/MIT Press. : p. 229-248.
Rijsbergen, C.J. 1979. Information Retrieval. London: Butterworth
Rochkind, M.J. 1975. The Source Code Control System. IEEE Transactions on Software Engineering. SE-1: 4364-370.
Sheikh, L.m., Tanveer, B., Hamdani, M.A. 2004. Interesting measures for Mining Association Rules, 8th International Multitopic Conference.
Sheykh E.K., Abolhassani, H., Neshati M., Behrangi, E., Rostami, A., Mohammadi, M. 2007. Mahak: A Test Collection for Evaluation of Farsi Information Retrieval Systems. IEEE/ACS International Conference on Computer Systems and Applications.
226
Srikant, R. and Agrawal, R. 1995. Mining Sequential Patterns: Generalizations and Per-formance Improvements. Research Report RJ 9994, IBM Almaden Research Center.
Srikant, R., Vu, Q., and Agrawal, R. 1997. Mining Association Rules with Item Constraints. Proc. Third Int’l Conf. KDD and Data Mining (KDD ’97).
Tan, P.n., Kumar, V. 2002. Selecting the Right Interestingness Measure for Association, In Proceedings of the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data.
Tan, P., Kumar, V., and Srivastava, J. 2002. Selecting the right interestingness measure for association patterns. In Proceedings of the 8th International Conference on Knowledge Discovery and Data Mining (KDD 2002). Edmonton, Canada.: 32–41.
Tichy, W. 1985. RCS: A system for version control. Software-Practice and Experience. 15, 7: 637-654.
Tichy, W.F. 1982. Design, implementation, and evaluation of a revision control system. In ICSE '82: Proceedings of the 6th international conference on Software engineering. : 58-67.
Tsunenori I. 2003. Evaluation of Criteria for Information Retrieval. International Conference on Web Intelligence. IEEE Computer Society.
Ubranic´, D.Cˇ., and Murphy, G.C. 2003. Hipikat: Recommending pertinent software development artifacts. In Proc. 25th International Conference on Software Engineering (ICSE). : 408–418.
Williams, C.C., and Hollingsworth, J.K. 2005. Automatic Mining of Source Code Repositories to Improve Bug Finding Techniques. IEEE Trans. Software Eng.: vol. 31, no. 6, pp. 466-480.
227
Williams, C.C., and Hollingsworth J.K. 2005. Recovering System Specific Rules from Software Repositories. In Proceedings of 2nd International Workshop on Mining Software Repositories (MSR'05). : 7-11
Weißgerber, P., Leo, K., Burch, M., Diehl, M. 2005. Exploring Evolutionary Coupling in Eclipse. Proceedings of the 2005 OOPSLA workshop on Eclipse technology eXchange. : 31-34.
Weißgerber, P., and Diehl, S. 2006. Identifying Refactorings from Source-Code Changes. Proceedings of the 21st IEEE International Conference on Automated Software Engineering (ASE'06).: p.231-240.
Weissgerber, P., Mathias, P., Michael, B. 2007. Visual Data Mining in Software Archives to Detect How Developers Work Together. Proceedings of the Fourth International Workshop on Mining Software Repositories, : 9.
Ying, A., Murphy, G., Raymond N., Chu-Carroll, M. 2004. Predicting Source Code Changes by Mining Change History. IEEE Transactions on Software Engineering, 30, 9: 574-586.
Zimmermann, T., Diehl, S., and Zeller Andreas. 2003. How history justifies system architecture (or not). In IWPSE 2003.
Zimmermann, T., Weißgerber, P.. 2004. Preprocessing CVS Data For Fine-Grained Analysis. Proc. Mining Software Repositories. : 2-6.
Zimmermann, T., Weisgerber, P., Diehl, S., Zeller, A. 2005. Mining Version Histories to Guide Software Changes. Proceedings of the 26th International Conference on Software Engineering. : 563-572.
228
ภาคผนวก
229
ภาคผนวก ก การเลอกทรานแซคชนชดทดสอบ…………..
ขนตอนการเลอกทรานแซคชนชดทดสอบน เปนขนตอนยอยขนตอนหนงภายในขนตอนการสรางขอสอบถามทอธบายอยางละเอยดในหวขอ 3.6.2 แตอธบายในภาคผนวกเนองจากเปนการเลอกทรานแซคชนชดทดสอบทเฉพาะเจาะจงกบโครงการเคมายมนน (KMyMoney) เทานน
เรมตนผ วจยตองก าหนดวาทรานแซคชนขนาดสน กลางและยาวนนมขนาดอย ชวงไหนบาง ผ วจยน าขอมลขนาดของทรานแซคชนทงหมดในฐานขอมลมาค านวณหาคาทางสถตเชงพรรณนา รวมถงน าไปสรางเปนแผนภมแทงแจกแจงความถของขนาดทรานแซคชน โดยใชโปรแกรมตารางค านวณไมโครซอฟตเอกซเซล (Microsoft Excel) มขอมลเขาเปนขนาดของแตละทรานแซคชนทงหมด 5,458 ทรานแซคชน ไดขอมลออกเปนตารางคาทางสถตเชงพรรณนาของขนาดทรานแซคชนและแผนภมแทงแจกแจงความถของขนาดทรานแซคชน ดงตารางและรปดานลางน
ตารางท ก-1 แสดงคาทางสถตเชงพรรณนาของขนาดทรานแซคชนในฐานขอมลซอฟตแวรอารไควฟโครงการเคมายมนน (KMyMoney)
คาเฉลยเลขคณตของขนาดทรานแซคชน 3.91 สวนเบยงเบนมาตรฐานของขนาดทรานแซคชน 9.81 พสยของขนาดทรานแซคชน 300 ขนาดของทรานแซคชนต าสด 1 ขนาดของทรานแซคชนสงสด 301 จ านวนทรานแซคชนทงหมด (ทรานแซคชน) 5,458 จ านวนการเปลยนแปลงแกไขทงหมด (รายการ) 21,358
ขอมล ทแสดงอย ในตาราง ขาง ตนน เ ปน ขอมลทางส ถตของ ขอมลซอฟตแว ร อารไควฟโครงการเคมายมนน (KMyMoney) ภายหลงจากผานขนตอนการจดเตรยมขอมลเพอการท าเหมองขอมลกบขอมลซอฟตแวรอารไคฟว (หวขอ 3.6.1) เรยบรอยแลว
230
รปท ก-1 แสดงแผนภมแทงแจกแจงความถตามขนาดทรานแซคชนในฐานขอมลซอฟตแวร อารไควฟโครงการเคมายมนน (KMyMoney)
เนองจากทรานแซคชนชดทดสอบทจะเลอกขนมาจะตองถกน าไปใชสรางขอสอบถามส าหรบทกสถานการณของการทดสอบ ดงนนทรานแซคชนชดทดสอบทจะเลอกขนมาจะตองเปนไปตามขอก าหนดของการสรางขอสอบถามทง 3 สถานการณนนคอ ตองเปนทรานแซคชนทมขนาดมากกวาหรอเทากบ 2 รายการ จากตารางท ก-1 แสดงคาทางสถตเชงพรรณนาท าใหทราบวาขนาดโดยเฉลยของทรานแซคชนคอ 4 รายการตอ 1 ทรานแซคชน ผ วจยจงเลอกใหทรานแซคชนทมขนาด 2 รายการเพยงขนาดเดยวเปนทรานแซคชนทอยในกลมขนาดสน เนองจากเปนกลมทมขนาดสนกวาคาเฉลยและเปนกลมทมปรมาณเยอะมากจากแผนภมแทง ในรปท ก-1 ขางตน และผ วจยเลอกใหทรานแซคชนทมขนาดมากกวา 12 รายการเปนทรานแซคชนทอยในกลมขนาดยาว เนองจากเปนกลมทมขนาดยาวกวาคาเฉลยและเปนกลมทแยกจากกลมทรานแซคชนทมขนาดอยระหวาง 3 - 11 รายการทผ ใชก าหนดใหเปนกลมขนาดกลางอยางชดเจน (กลมทรานแซคชนทมขนาดอยระหวาง 3 - 11 รายการมแนวโนมลดลงเรอยๆจนถงทรานแซคชนทมขนาด 12 รายการซงเปนจดเปลยนของแนวโนม ดงแสดงในแผนภมแทงในรปท ก-1 ขางตน)
หลงจากทไดชวงขนาดของทรานแซคชนในแตละกลมแลว ตอไปผวจยจะตองก าหนดวาการพบทรานแซคชนรปแบบหนงจ านวนกครงจงจะอยในกลมพบบอย และจ านวนกครงจงจะอยในกลมพบไมบอย โดยผ วจยไดท าการสรางรปแบบทเปนไปไดทงหมดของทรานแซคชนทมขนาดตางๆออกมาแลวท าการนบจ านวนการปรากฎของรปแบบทเปนไปไดเหลานนในฐานขอมลทงหมด
0
500
1000
1500
2000
25001 5 9
13
17
21
25
29
33
37
41
45
49
53
57
61
65
69
73
77
81
85
89
93
97
Fre
qu
en
cy
Bin
Histogram
231
เนองจากฐานขอมลซอฟตแวรอารไคฟวทน ามาใชมจ านวนของการเปลยนแปลงแกไขทงหมด 21,358 รายการ (นบมาจากการเปลยนแปลงแกไขทเกดขนจรงทงหมด ดงนนการเปลยนแปลงแกไขทเคยเกดขนมากกวา 1 ครงจะถกนบซ าดวย) ในการเปลยนแปลงแกไขเหลานนมการเปลยนแปลงแกไขทแตกตางกนทงหมด 3,162 รายการ การเปลยนแปลงแกไขทง 3,162 รายการน จะถกน าไปสรางเปนรปแบบทรานแซคชนทเปนไปไดทงหมดในทกขนาดตางๆกน (ตวอยางเชน
การสรางทรานแซคชนขนาด 2 รายการทเปนไปไดทงหมดจะได
= 4,997,541 รปแบบ
ทรานแซคชน เปนตน) แลวนบจ านวนวาแตละรปแบบมจ านวนการพบในฐานขอมลทงหมดกครง รปแบบทรานแซคชนทไมเคยปรากฎเลยในฐานขอมล (รปแบบทรานแซคชนทมจ านวนการพบเทากบ 0 ครง) จะถกตดออก การนบจ านวนการพบหรอการปรากฎของรปแบบทรานแซคชนตางๆในแตละขนาดแสดงดงตารางตอไปน
232
ตารางท ก-2 แสดงจ านวนของรปแบบของทรานแซคชนในขนาดตางๆและจ านวนการปรากฎตางๆ
จ านวนครงทปรากฏ
3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
ขนาดของทรานแซคชน
2 2884 1419 844 486 299 191 162 115 83 52 50 40 24 29 25 19 13 17 12 19 12 11 7 6 9 5 8 7
3 18712 5653 2214 1001 514 291 193 125 99 71 48 41 25 18 19 8 10 7 6 3 4 2 6 5 6 7 2 1
4 65434 11085 2853 1082 447 207 134 87 61 37 18 11 6 6 3 1 0 2 0 0 0 2 2 3 2 2 0 0
5 161263 14374 2238 728 205 91 57 29 11 10 4 2 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
6 381140 18030 1271 322 52 26 13 1 2 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
7 980881 16243 502 85 5 4 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
8 1332620 4932 131 10 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
9 1204311 2002 19 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
10 898238 595 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
11 226510 123 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
12 71633 16 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
13 60521 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
14 30201 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
15 5630 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
16 639 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
17 217 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
18 98 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
19 45 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
20 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
232
233
ตารางขางตนแสดงจ านวนของรปแบบของทรานแซคชนในขนาดตางๆตงแตขนาด 2 จนถงขนาด 20 รายการและจ านวนการปรากฎตางๆตงแต 3 ครงจนถง 30 ครงซงเปนเพยงสวนหนงของการสรางและนบจ านวนรปแบบทรานแซคชนทเปนไปได แถวของตารางแสดงขนาดของรปแบบทรานแซคชน หลกของตารางแสดงจ านวนครงทปรากฎ จ านวนทปรากฎภายในตารางคอจ านวนของรปแบบทมขนาดเทากบขนาดของแถวนนและปรากฎในฐานขอมลเทากบจ านวนของหลกนน สาเหตทตารางเรมทจ านวนการปรากฏ 3 ครงเนองจากการปรากฏ 1 ครงเปนการปรากฎขนต าอยแลว สวนการปรากฏ 2 ครงนนมจ านวนมากในหลกหมน แสนและลานผวจยจงไมน ามาแสดง
จากจ านวนทแสดงในตารางขางตนท าใหผ วจยสามารถก าหนดขอบบนใหกบทรานแซคชนชดทดสอบกลมทมขนาดยาวได ขอบบนนนคอขนาด 19 รายการ เนองจากในขนาด 20 รายการนนมการปรากฎมากทสดแคเพยง 2 ครง ถาน ามาแย