Abstract:
การวิจัยในครั้งนี้ มีวัตถุประสงค์เพื่อเปรียบเทียบประสิทธิภาพการจัดกลุ่มข้อมูลโดยใช้อัลกอริทึมการจัดกลุ่มข้อมูลแบบ 2 ขั้นตอน 4 วิธีด้วยกัน ได้แก่ วิธีที่ 1 SOM ร่วมกับ K-Means วิธีที่ 2 SOM ร่วมกับ Fuzzy C-Means วิธีที่ 3 Ward ร่วมกับ K-Means และวิธีที่ 4 Ward ร่วมกับ Fuzzy C-means โดยทำการศึกษาสำหรับข้อมูลที่มีการแจกแจงแบบปกติหลายตัวแปร (Multivariate Normal Distribution) จำนวนตัวแปรที่ใช้ในการศึกษาครั้งนี้ คือ 2, 4 และ 6 ตัวแปร ลักษณะความสัมพันธ์ของตัวแปร ศึกษาทั้งในกรณีตัวแปรอิสระกัน และ ตัวแปรมีความสัมพันธ์กัน ข้อมูลที่ใช้ในการศึกษามาจากการจำลองข้อมูลโดยมีขนาดตัวอย่าง 25, 100 และ 300 จำนวนกลุ่มที่จำลอง คือ 2, 4 และ 6 กลุ่มสำหรับแต่ละขนาดตัวอย่าง โดยพิจารณาทั้งข้อมูลแต่ละกลุ่มไม่มีการซ้อนทับกัน (Nonoverlapping Clusters) และ ข้อมูลแต่ละกลุ่มมีการซ้อนทับกัน 40% (40% Overlapping Clusters) จากผลการศึกษาโดยเปรียบเทียบค่า Wilk’ s Lambda, ค่าความแตกต่างของข้อมูลภายในกลุ่ม (RMSSTD) และค่า Misclassification Rate พบว่า การจัดกลุ่มแบบ 2 ขั้นตอนด้วยวิธี SOM ร่วมกับ Fuzzy C-Means และวิธี Ward ร่วมกับ Fuzzy C-Means ให้ประสิทธิภาพการจัดกลุ่มดีกว่าวิธี SOM ร่วมกับ K-Means และ Ward ร่วมกับ K-Means