Abstract:
การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อหาจุดแบ่งที่เหมาะสมที่สุดสำหรับตัวแบบถดถอยโลจิสติกแบบ 2 ประเภทสำหรับการจำแนกข้อมูลโดยใช้ฟังก์ชันโพรบิตเป็นฟังก์ชันเชื่อมโยง โดยปัจจัยที่สนใจศึกษาในงานการวิจัยครั้งนี้คือจำนวนตัวแปรอิสระเป็น 1, 2, 3, 4 และ 5 ขนาดตัวอย่างเป็น 50, 100, 150, 200 และ 250 สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจเป็น 0.1, 0.5 และ 0.9 และระดับความสัมพันธ์ระหว่างตัวแปรอิสระเป็น 3 ระดับคือความสัมพันธ์กันในระดับตํ่า(0 < 0.30) ระดับปานกลาง (0.30 < 0.60) และระดับสูง ( 0.60 < 0.90) ซึ่งข้อมูลทั้งหมดจำลองโดยเทคนิคมอนติคาร์โล ด้วยโปรแกรม R การหาค่าจุดแบ่งจะใช้ทฤษฎีของHadjicostas P. (2006) ผลการวิจัยสรุปได้ดังนี้ กรณีที่จำนวนตัวแปรอิสระเปลี่ยนแปลง แต่ปัจจัยอื่นๆ คงที่พบว่าที่สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจเท่ากับ 0.5 ค่าเฉลี่ยของจุดแบ่งมีค่าขึ้นๆ ลงๆ และลู่เข้าสู่ค่า 0.5แต่ค่าเฉลี่ยจะมีค่าต่ำกว่าค่า0.5 เมื่อระดับความสัมพันธ์สูงและขนาดตัวอย่างใหญ่ และที่สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจอื่นๆ ส่วนใหญ่ค่าเฉลี่ยของจุดแบ่งมีค่าขึ้นๆ ลงๆ และลู่เข้าสู่ค่า0.5กรณีที่ขนาดตัวอย่างเปลี่ยนแปลง แต่ปัจจัยอื่นๆ คงที่พบว่าที่สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจเท่ากับ 0.5 ค่าเฉลี่ยของจุดแบ่งมีค่าขึ้นๆ ลงๆ และลู่เข้าสู่ค่า 0.5และที่สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจอื่นๆ ส่วนใหญ่ค่าเฉลี่ยของจุดแบ่งมีค่าขึ้นๆ ลงๆ และลู่เข้าสู่ค่า 0.5กรณีที่สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจเปลี่ยนแปลง แต่ปัจจัยอื่นๆ คงที่พบว่า ส่วนใหญ่ค่าเฉลี่ยของจุดแบ่งมีค่าขึ้นๆ ลงๆ และลู่เข้าสู่ค่า 0.5 กรณีที่ระดับความสัมพันธ์ระหว่างตัวแปรอิสระเปลี่ยนแปลงไปแต่ปัจจัยอื่นๆคงที่พบว่า ส่วนใหญ่ค่าเฉลี่ยของจุดแบ่งมีค่าขึ้นๆ ลงๆ และลู่เข้าสู่ค่า 0.5