Abstract:
การวิจัยในครั้งนี้ มีวัตถุประสงค์เพื่อเปรียบเทียบประสิทธิภาพของเทคนิคการลดมิติข้อมูลเข้า(input data) ระหว่างเทคนิคการวิเคราะห์องค์ประกอบหลัก(Principle Component Analysis, PCA) วิธีกำลังสองน้อยสุดเชิงส่วน (Partial Least Squares, PLS)และSliced Average Variance Estimator (SAVE) สำหรับการพยากรณ์ด้วยซัพพอร์ตเวกเตอร์แมชชีน กรณีที่แบ่งตัวแปรตามออกเป็น 2 กลุ่ม ซึ่งดำเนินการภายใต้ขอบเขตของจำนวนตัวแปรอิสระที่ทำการศึกษาคือ 5, 10, 20 และ 40 ตัว โดยทำการจำลองข้อมูลและวิเคราะห์ผลด้วยโปรแกรม R 2.15.3 ทั้งนี้จะใช้ Receiver Operating Characteristic (ROC) เป็นเครื่องมือวัดประสิทธิภาพความแม่นยำในการพยากรณ์จำแนกประเภทของข้อมูล โดยใช้พื้นที่ใต้โค้ง ROC (Area Under ROC Curve : AUC) และใช้อัตราความผิดพลาดในการจำแนกประเภทข้อมูล (Misclassification Rate : MCR)
การศึกษาภายใต้ขอบเขตดังกล่าวผลปรากฏว่ากรณีที่จำนวนตัวแปรอิสระเท่ากับ 5 เมื่อขนาดตัวอย่างของทั้งสองกลุ่มเท่ากับ 30 และจำนวนตัวแปรอิสระเท่ากับ 10 เมื่อขนาดตัวอย่างทั้งหมดไม่เกิน 120 ให้ผลเหมือนกัน การลดข้อมูลด้วยวิธี PLS ให้ประสิทธิภาพความแม่นยำในการพยากรณ์จำแนกประเภทของข้อมูลดีที่สุด แต่เมื่อเพิ่มขนาดตัวอย่างการลดข้อมูลด้วยวิธี SAVE จะให้ประสิทธิภาพความแม่นยำในการพยากรณ์จำแนกประเภทของข้อมูลดีกว่าวิธี PLS และ PCA และเมื่อเพิ่มจำนวนตัวแปรอิสระเป็น 20 และ 40 การลดข้อมูลด้วยวิธี PLS ให้ประสิทธิภาพความแม่นยำในการพยากรณ์จำแนกประเภทของข้อมูลดีที่สุด