16
การใชซอฟตแวร Open Source (AlphaMiner) เพื่อ วิเคราะหตะกราสินคา (Market Basket Analysis) และ วิเคราะหลักษณะลูกคาเปาหมาย (Customer Profiling) หัวเรื่อง 1) การใชงานซอฟตแวร AlphaMiner เพื่อวิเคราะหตะกราสินคา (Market Basket Analysis) 2) การใชงานซอฟตแวร AlphaMiner เพื่อการวิเคราะหลักษณะลูกคาเปาหมาย (Customer Profiling) แนวคิด 1) การวิเคราะหตะกราสินคา คือการวิเคราะหขอมูลการซื้อสินคาของลูกคา เพื่อระบุวาตัวสินคาหรือ บริการใดมีความสัมพันธตอกันในการซื้อสินคาแตละครั้ง เพื่อสรุปเปนกฎความสัมพันธ ของสินตางๆ โดยทั่วไป กฎความสัมพันธ จะสรุปผลการวิเคราะหออกเปน 3 สวนใหญๆ คือ โอกาสของสินคาหรือ บริการใดบางที่จะถูกซื้อในล าดับถัดไป โอกาสของสินคาหรือบริการใดบางที่จะถูกซื้อไปพรอมๆ กัน และระดับความนาสนใจในกฎความสัมพันธ 2) ฐานขอมูลที่จะนํามาใชในการวิเคราะหตะกราสินคานั้น มั กจะเปนขอมูลธุรกรรมที่บันทึกรายการการ ซื้อสินคาแตละครั้ง ที่สรุปมาในชวงระยะเวลาหนึ่งๆ เชน รายเดือน หรือ รายป เปนตน โดยการ วิเคราะหตะกราสินคาจะวิเคราะหหาความสัมพันธของสินคาและความถี่ในการปรากฏของ ความสัมพันธนั้นๆ แลวแสดงออกมาเปนกฎความสัมพันธ พรอมดวยความนาจะเปนของเหตุการณ นั้นที่จะเกิดขึ้นในรูปของตัวเลข 3) AlphaMiner เปนฟรีซอฟตแวรที่ใชในการวิเคราะหขั้นตอนการทําเหมืองขอมูล มีความหลากหลาย ของฟงกชั่นสําหรับผูใชเพื่อดําเนินการขั้นตอนการทําเหมืองขอมูล วัตถุประสงค รายงานฉบับนี้มีวัตถุประสงคเพื่อ 1) สามารถใชงานซอฟตแวร AlphaMiner เพื่อวิเคราะหตะกราสินคา (Market Basket Analysis) ได 2) สามารถใชงานซอฟตแวร AlphaMiner เพื่อการวิเคราะหลักษณะลูกคาเปาหมาย (Customer Profiling)

การใช้ซอฟต์แวร์ Open source (alpha miner) วิเคราะห์ลักษณะลูกค้าเป้าหมาย (customer profiling)

Embed Size (px)

Citation preview

การใชซอฟตแวร Open Source (AlphaMiner) เพื่อ วิเคราะหตะกราสินคา (Market

Basket Analysis) และ วิเคราะหลักษณะลูกคาเปาหมาย (Customer Profiling)

หัวเรื่อง

1) การใชงานซอฟตแวร AlphaMiner เพื่อวิเคราะหตะกราสินคา (Market Basket Analysis)

2) การใชงานซอฟตแวร AlphaMiner เพื่อการวิเคราะหลักษณะลูกคาเปาหมาย (Customer Profiling)

แนวคิด

1) การวิเคราะหตะกราสินคา คือการวิเคราะหขอมูลการซื้อสินคาของลูกคา เพื่อระบุวาตัวสินคาหรือ

บริการใดมีความสัมพันธตอกันในการซื้อสินคาแตละครั้ง เพื่อสรุปเปนกฎความสัมพันธ ของสินตางๆ

โดยทั่วไป กฎความสัมพันธ จะสรุปผลการวิเคราะหออกเปน 3 สวนใหญๆ คือ โอกาสของสินคาหรือ

บริการใดบางที่จะถูกซื้อในล าดับถัดไป โอกาสของสินคาหรือบริการใดบางที่จะถูกซื้อไปพรอมๆ กัน

และระดับความนาสนใจในกฎความสัมพันธ

2) ฐานขอมูลที่จะนํามาใชในการวิเคราะหตะกราสินคานั้น มั กจะเปนขอมูลธุรกรรมที่บันทึกรายการการ

ซื้อสินคาแตละครั้ง ที่สรุปมาในชวงระยะเวลาหนึ่งๆ เชน รายเดือน หรือ รายป เปนตน โดยการ

วิเคราะหตะกราสินคาจะวิเคราะหหาความสัมพันธของสินคาและความถี่ในการปรากฏของ

ความสัมพันธนั้นๆ แลวแสดงออกมาเปนกฎความสัมพันธ พรอมดวยความนาจะเปนของเหตุการณ

นั้นที่จะเกิดขึ้นในรูปของตัวเลข

3) AlphaMiner เปนฟรีซอฟตแวรที่ใชในการวิเคราะหข้ันตอนการทําเหมืองขอมูล มีความหลากหลาย

ของฟงกชั่นสําหรับผูใชเพื่อดําเนินการขั้นตอนการทําเหมืองขอมูล

วัตถุประสงค

รายงานฉบับนี้มีวัตถุประสงคเพื่อ

1) สามารถใชงานซอฟตแวร AlphaMiner เพื่อวิเคราะหตะกราสินคา (Market Basket Analysis) ได

2) สามารถใชงานซอฟตแวร AlphaMiner เพื่อการวิเคราะหลักษณะลูกคาเปาหมาย (Customer

Profiling)

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 1

กิจกรรม และการจัดทํารายงาน ประกอบดวย

1) การใชงานซอฟตแวร AlphaMiner เพื่อการวิเคราะหลักษณะลูกคาเปาหมาย (Customer

Profiling) โดยจับภาพหนาจอของแตละข้ันตอนการทํางานมาแสดงในรายงาน พรอมบรรยาย

ประกอบ และนําเสนอผลการวิเคราะห ที่เปนประเด็นสําคัญมาอยางนอย 3 ประเด็น จากมุมมอง

Tree View, Graph View, และ/หรือ Rules View พรอมแปลผลมาพอสังเขป

1.การใชงานซอฟตแวร AlphaMiner เพื่อการวิเคราะหลักษณะลูกคาเปาหมาย (Customer Profiling) โดย

จับภาพหนาจอของแตละข้ันตอนการทํางานมาแสดงในรายงาน พรอมบรรยายประกอบ และนําเสนอผลการ

วิเคราะห ที่เปนประเด็นสําคัญมาอยางนอย 3 ประเด็น จากมุมมอง Tree View, Graph View, และ/หรือ

Rules View พรอมแปลผลมาพอสังเขป

(เนื่องจากรายละเอียดโปรแกรมบางสวนไดอธิบายไปในขอ 1 แลว ขอนี้จึงไมขอกลาวรายละเอียดปลีกยอย

มากนัก)

การวิเคราะหลักษณะลูกคาเปาหมาย (Customer Profiling) ในกรณีนี้ จะใช Case Study ที่อยูใน Case

list ที่ชื่อวา Telecommunication, Case Name ชื่อ Customer profiling จากนั้นเลือกท่ี Vuew Case

ตามรูปที่ 2.1

รูปที่ 2. 1 การเลือก Case Study ชื่อ Telecommunication

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 2

เมื่อทําการ Click ที่ View Case จะไดรูปโมเดลตามภาพที่ 2.2 ตามดานลางนี้

รูปที่ 2. 2 แสดงหนาโมเดล Customer profiling

โดยในการวิเคราะหครั้งนี้เราจะทําเพียง 3 ขั้นตอนเทานั้นก็จะไดคําตอบในการวิเคราะหลักษณะลูกคา

เปาหมาย (Customer Profiling) 3 ขั้นตอนที่วาคือ

ขั้นตอนที่ 1 เริ่มจากโหนด Input เพื่อเตรียมและนําเขาขอมูล

ขั้นตอนที่ 2 ที่โหนด Set Attributes เพื่อเลือก Attribute ที่ตองการใหประมวลผล

ขั้นตอนที่ 3 ที่โหนดตนไมการตัดสินใจ Decision Tree เพื่อกําหนดคุณสมบัติโครงสรางตนไมในการ

ประมวลผล

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 3

เริ่มขั้นตอนการวิเคราะหลักษณะลูกคาเปาหมาย (Customer Profiling)

1.ขั้นตอนแรก ดําเนินการกําหนดขอมูลเขา โดยไปท่ีโหนด Input File แลวคลิกขวาเลือก Open เพื่อระบุ

ตําแหนงไฟลขอมูลที่เรานํามาวิเคราะห ตามรูปที่ 2.3

รูปที่ 2. 3 การเปดโหนด Input File เพื่อระบุที่อยูไฟลที่เรานํามาวิเคราะห

โดยหัวขอตางๆ หมายถึง

- File Type ไดแก ชนิดของไฟล

- File Name ไดแก ชื่อและตําแหนงของไฟลที่เตรียมไว ในที่นี้ไดแก Excel File ชื่อ

“customer_train_2005”

- Excel Option: Worksheet ไดแก ระบุ Worksheet ที่ตองการ

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 4

เมื่อระบุเสร็จสิ้นแลวในกด Apply และกด Close เพื่อปดหนาตาง จากนั้นดําเนินการขั้นตอนตอไป

โดยคลิกขวาที่โหนด Input File และเลือก Run เมื่อประมวลผลเสร็จสิ้นและสมบูรณที่ปรากฎกรอบสีเขียว

รอบโหนด (สีเหลืองจะหมายถึง กําลังดําเนินการ และถาเปนสีแดง จะหมายถึงไฟลขอมูลผิดพลาด หรือไม

สามารถอานได ตองไปแกไขใหม)

หลังจากนั้นเราสามารถเรียกดูผลการประมวลผลสามารถคลิกขวาที่ โหนด Input File และเลือก

View Result จะสามารถเรียกดูคาตัวแปร Variables และ ขอมูล Data ดังรูปที่ 2.4

รูปที่ 2. 4 การ Run โหนด Input File และการดูผล View Result

จะสามารถเรียกดูคาตัวแปร Variables และ ขอมูล Data ไดดังรูปที่ 2.5 และ 2.6 ตามลําดับ

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 5

รูปที่ 2. 5 แสดงผลลัพธ Variables

รูปที่ 2. 6 แสดงคาผลลัพธ Data

โดยการอธิบายผลลัพธตางๆ ก็คลายกับตัวอยางในขอที่ 1 เพียงแตเปนขอมูลเกี่ยวกับลูกคาผูใชบริการโทรศัพท

จึงขอเวนไวเพื่อความรวดเร็ว

2. ขั้นตอนที่ 2 ที่โหนด Set Attributes เพื่อเลือก Attribute ที่ตองการใหประมวลผล โดยไปที่โหนด Set

Attribute ใหคลิกขวาแลวเลือก Open ตามรูปที่ 2.7 โดย

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 6

รูปที่ 2. 7 แสดงการตั้งคาทีโ่หนด Set Attributes

โดยถา Attribute ใดที่ไมตองการนํามาประมวลผล เราสามารถระบุเปนคา Not Use ไดโดยนําเมาสไปที่

คอลัมน Role จากนั้นคลิกขวา แลวเลือก “Set to Not User” ในที่นี้จะไมเลือก Attribute ‘id’ และ ‘idd’

จึงเลือกคาเปน Not Use

กรณีตองการให Attribute ใดเปน Attribute เปาหมาย โดยนําเมาสไปที่คอลัมน Role คลิกขวา แลวเลือก

Target ในตัวอยางนี้กําหนด “Spending_group” เปน Target เมื่อดําเนินการปรับปรุงหรือแกไขใด ๆ แลว

เสร็จใหกด Apply และ Close เมื่อเสร็จสิ้น

เหมือนตามขอ 1 หลังจากนั้นที่โหนด Set Attributes ใหคลิกขวา เลือก Run เพื่อดําเนินการ

ประมวลผล หากเสร็จสิ้นสมบูรณจะแสดงกรอบสีเขียวรอบโหนด สามารถตรวจสอบคาที่ประมวลเสร็จ โดย

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 7

คลิกขวาที่โหนด Set Attributes และเลือก View Result ตามรูปที่ 2.8

รูปที่ 2. 8 แสดงผลลัพธ Variable

กรณีระบุคา Attribute ที่ไมตองการเปน Not Use ตามข้ันตน เราไมเอาคา “id” และ “idd” คาตัว

แปรในแทป Variables จึงไมแสดงรายการในการ View Result

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 8

จากนั้นมาดูที่แถบ Data ตามรูปที่ 2.9

รูปที่ 2. 9 แสดงผลลัพธ Data

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 9

3. ขั้นตอนที่ 3 ที่โหนดตนไมการตัดสินใจ Decision Tree เพื่อกําหนดคุณสมบัติโครงสรางตนไมในการ

ประมวลผล ซึ่งจะทําการจําแนกหรือแบงกลุมลูกคา Customer Segmentation ที่โหนด Decision Treeโดย

ให click ขวา และเลือก Open ตามรูปที่ 2.10

รูปที่ 2. 10 แสดงเปดตั้งคา Decision tree

ในสวนของ Tree Settings และ Model Selection เปนการกําหนดรูปแบบของอัลกอริทึมที่จะใช

และรูปแบบโครงสรางตนไมการตัดสินใจที่ตองการ ซึ่งในที่นี้จะใชคาเริ่มตน default โดยไมตองแกไขจากนั้น

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 10

กด Close เพื่อปดหนาตาง ตามรูปที่ 2.11

รูปที่ 2. 11 Tree Settings และ Model Selection

หลังจากนั้นที่โหนด Decision Tree ใหคลิกขวา แลวเลือก Run เมื่อเสร็จสมบูรณจะแสดงกรอบสี

เขียวรอบโหนด จึงเสร็จสิ้นขั้นตอนการประมวลผลขอมูล ขั้นตอนตอไปจะเรียกแสดงผลลัพธการหาคา

ประมวลผลการวิเคราะหลูกคาเปาหมาย (Customer Profiling) โดยที่โหนด Decision Tree ใหคลิกขวา แลว

เลือก View Result จะแสดงหนาจอ Decision Tree Result

4. ผลการวิเคราะหจากมุมมองมุมมองตางๆ

4.1 ผลการวิเคราะหจากมุมมองมุมมอง Tree View

ในแทปแรกของ result จะเปนรูปแบบแสดงผลมุมมองแบบ Tree View ตามรูปที่ 2.12 โดยสามารถ

อธิบายคาผลลัพธจากมุมมอง Tree View ที่ไดนั้น จะถูกแบงเปนกลุมขอมูลแยกตามประเภทบริการ

service_plan ไดแก Basic, Deluxe, Regular ในที่นี้จะขอยกตัวอยางขอมูลในประเภทบริการ Basic โดย

มีรายละเอียดดังนี้

4.1.1 กลุมบริการ Basic มีจํานวนลูกคาทั้งสิ้น 350 คน เปนกลุมผูใชที่จายคาโทรสูง High จํานวน 88

คน คิดเปน 25.143% เปนกลุมผูใชที่จายคาโทรต่ํา Low จํานวน 140 คน คิดเปน 40% เปนกลุมจายคา

โทรปานกลาง Medium 113 คน คิดเปน 32.286% และเปนกลุมผูใชที่จายคาโทร สูงพิเศษ Ultra High 9

คน คิดเปน 2.571%

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 11

4.1.2 กลุม Basic มีผูใชงานที่อายุ นอยกวาหรือเทากับ 25 ซึ่งจะเปนขนาดกลาง Medium และจะ

แบงอายุมากกวา 25 ซึ่งจะไปแยกยอยอีกครั้งหนึ่งวา นอยกวาหรือเทากับ 47 ปเทาไร และมากกวา 47 ป

เทาไร ซึ่งและยังมีรายละเอียดอื่นๆ ซึ่งสามารถดูไดตามรูปที่ 2.12

รูปที่ 2. 12 แสดงผลมุมมองแบบ Tree View

4.2 ผลการวิเคราะหจากมุมมองมุมมอง Graph View

จากมุมมองมุมมอง Graph View จะแสดงขอมูลเปนลักษณะ โครงสรางตนไมซึ่งตอนแรกจะแสดงเปน

ภาพรวม จะทําใหดูยาก ใหเราคลิ้กขวาที่พื้นที่วาง จากนั้นเลือก “Auto Scale” ตามรูปที่ 2.13

ตัวแปร สวนที่เปนสีเขียว คือ ตัวแปรตางๆ

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 12

ตัวแปร สวนที่เปนสีสม คือตัวแปรตามหรือ Target ที่เรากําหนดไว

รูปที่ 2. 13 มุมมอง Graph View

เมื่อเราไดขยายแลว ตอนนี้มาดูผลวาคาผลลัพธจากมุมมอง Graph View ที่ไดนั้นจะถูกแบงเปนกลุมขอมูลแยก

ตามประเภทบริการ service_plan ไดแก

- Basic

- Deluxe

- Regular

จากรูปที่ 2.14 ยกตัวอยางประเภทบริการเทากับ Deluxe จะยังตอบคําถามไมได โดยจะตองทําการ

ตรวจสอบอายุ “ age” วา

4.2.1 มีชวงอาย ุ >59 หรือ <= 59

4.2.2 กรณีเปนลูกคาอายุ > 59 จะตรวจสอบยอยอีกวา > 62 หรือ <= 62 ถานอยกวาเปนจะไดผลลัพธวา

เปนผูใชที่จายคาโทรอยูในกลุมปานกลาง Medium หากอายุมากวา 62 จะเปนกลุมผูใชที่จายคาโทรอยูใน

กลุมที่จาย สูงพิเศษ Ultra High

4.2.3 กรณีอายุ <= 59 จะตรวจสอบยอยอีกวา > 40 หรือ <= 40 ถานอยกวาหรือเทากับ จะไดผลลัพธวา

เปนผูใชที่จายคาโทรอยูในกลุมสูงพิเศษ Ultra High

4.2.4 แตหากอายุมากกวา 40 จะแบยอยตรวจสอบอีกวา เปนเพศหญิง F หรือเพศชาย M ถาหากเปนเพศชาย

จะเปนกลุมผูใชในกลุมสูงพิเศษ Ultra High แตถาเปนเพศหญิง จะเปนกลุมผูใชในกลุมสูง High เปนตน

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 13

รูปที่ 2. 14 แสดงประเภทบริการเทากับ Deluxe

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 14

4.3 ผลการวิเคราะหจากมุมมองมุมมอง Rules

ในมุมมอง Rules View ตามรูปที่ 2.15 จะเปนการพิจารณาคาตามกฎที่ระบุออกมาเปนตัวหนังสือ

เลย เชนใน Rule No. 1 มีกฎ service_plan=Basic And age <=25 หมายถึง ใชบริการประเภท Basic

และมีอายุนอยกวาหรือเทากับ 25 Class Name จะแบงเปนกลุมผูใชงานที่โทรในระดับปานกลาง Medium

มีคาเปอรเซ็นตความเชื่อมั่นโดยตรง Confidence (ความนาจะเปน) เทากับ 57.377% และมี Supporting

Record คือจํานวนผูใชงานที่พบในกฎขอนี้ มีทั้งสิ้น 61 ราย ซึ่งในกรณีอื่นๆ เราก็ตองใชหลักเกณฑหลายๆ

อยางเพื่อใชในการวิเคราะห และนําขอมูลนั้นๆไปใช เพื่อกําหนดกลยุทธสําหรับธุรกิจของเราตอไป

รูปที่ 2. 15 ผลการวิเคราะหจากมุมมองมุมมอง Rules

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 15

อางอิง

VDO สาธิต บรรยายโดย อาจารยวิทยา พรพัชรพงศ ดังนี้

1) สาธิตการติดตั้งโปรแกรม Alpha Miner

2) ตัวอยางการทํา Market Basket Analysis

3) ตัวอยางการทํา Customer Profiling