Abstract:
งานวิจัยฉบับนี้มีวัตถุประสงค์เพื่อศึกษากระบวนการจำแนกกลุ่มข้อมูลโดยอัลกอริทึม CHAID สำหรับข้อมูลระหว่างตัวแปร 2 ตัวแปรที่มีการแจกแจงแบบพหุนามและอยู่ในตารางการณ์จรสองทาง โดยพิจารณาความสามารถในการควบคุมความน่าจะเป็นของความผิดพลาดประเภทที่ 1 การแยก การรวม อำนาจการทดสอบ และร้อยละความถูกต้องของการจำแนกกลุ่มข้อมูลเป็นเกณฑ์ในการพิจารณาว่าอัลกอริทึมมีประสิทธิภาพในการจำแนกกลุ่มได้ดีหรือไม่ โดยข้อมูลที่ใช้ในการศึกษาจะจำลองภายใต้จำนวนกลุ่มของตัวแปร 2, 3, 4 และ 5, ขนาดข้อมูลเท่ากับ 200, 400 และ 1,200, ระดับความสัมพันธ์ของข้อมูลเท่ากับ 0, 0.05, 0.1 และ 0.3 และ ระดับนัยสำคัญเท่ากับ 0.05 และ 0.1 และสามารถสรุปผลการศึกษาได้ดังนี้ 1) อัลกอริทึม CHAID สามารถควบคุมความน่าจะเป็นของความผิดประเภทที่ 1 ได้ทุกกรณีเมื่อระดับความสัมพันธ์ของข้อมูลเท่ากับ 0 2) เมื่อพิจารณาที่ระดับความสัมพันธ์ของข้อมูลและระดับนัยสำคัญเท่ากัน เมื่อขนาดข้อมูลเพิ่มขึ้น อำนาจการทดสอบและการแยกจะมีแนวโน้มเพิ่มขึ้น ส่วนการรวมมีแนวโน้มลดลง 3) เมื่อพิจารณาที่ระดับความสัมพันธ์ของข้อมูลและขนาดข้อมูลเท่ากัน เมื่อระดับนัยสำคัญเพิ่มขึ้น อำนาจการทดสอบและการแยกจะมีแนวโน้มเพิ่มขึ้น ส่วนการรวมมีแนวโน้มลดลง 4) เมื่อพิจารณาที่ขนาดข้อมูลและระดับนัยสำคัญเท่ากัน เมื่อระดับความสัมพันธ์ของข้อมูลเพิ่มขึ้น อำนาจการทดสอบ การแยก และร้อยละความถูกต้องของการจำแนกกลุ่มข้อมูลจะมีแนวโน้มเพิ่มขึ้น ส่วนการรวมมีแนวโน้มลดลง นอกจากนี้อำนาจการทดสอบมีแนวโน้มลดลงเมื่อความแตกต่างระหว่างแถวกับหลักเพิ่มขึ้น และร้อยละความถูกต้องของการจำแนกกลุ่มข้อมูลมีแนวโน้มลดลงเมื่อจำนวนกลุ่มของตัวแปรตามเพิ่มขึ้น