Abstract:
งานวิจัยนี้มีวัตถุประสงค์เพื่อเปรียบเทียบการประมาณค่าจากตัวแบบการถดถอย สำหรับข้อมูลที่มีการแจกแจงแบบล็อกนอร์มอล ที่ถูกตัดปลายทางขวาแบบสุ่มที่มีการแจกแจงแบบเบตา ด้วยวิธีการประมาณค่าแบบกำลังสองต่ำสุด (OLS) วิธีของแชตเทอร์จีและแมคลีช (CM) วิธีภาวะน่าจะเป็นสูงสุดด้วยขั้นตอนวิธีอีเอ็ม (MLE_EM) วิธีภาวะน่าจะเป็นสูงสุดด้วยขั้นตอนอีเอ็ม เมื่อมีการปรับค่าข้อมูลก่อนคำนวณด้วยค่าเฉลี่ย (MLE_EM_MEAN) และวิธีภาวะน่าจะเป็นสูงสุดด้วยขั้นตอนอีเอ็ม เมื่อมีการปรับค่าข้อมูลก่อนคำนวณด้วยค่ามัธยฐาน (MLE_EM_MED) เปรียบเทียบจากค่าประสิทธิภาพสัมพัทธ์ของค่าเฉลี่ยของค่าคลาดเคลื่อนกำลังสอง โดยจำลองข้อมูลทั้งหมด 2187 สถานการณ์
จากการศึกษาพบว่า 1) เมื่อข้อมูลมีขนาดเล็กหรือปานกลาง (n=30,50) และมีเปอร์เซ็นต์ในการถูกตัดปลายทางขวาน้อย (r1=10) วิธี OLS และ CM เป็นวิธีที่มีประสิทธิภาพสูงสุด แตกต่างกันตามลักษณะการกระจายตัวของตัวแปรอิสระและความคลาดเคลื่อน 2) วิธีในกลุ่ม MLE_EM มีประสิทธิภาพสูงสุด เมื่อตัวอย่างขนาดปานกลาง (n=50) ถูกตัดปลายทางขวาปานกลางหรือมาก (r1=20,30) และตัวอย่างขนาดใหญ่ (n=100) โดยแบ่งตามช่วงการเข้ามาของข้อมูล เมื่อข้อมูลเข้ามาในช่วงต้นของการเปิดรับ วิธี MLE_EM_MED มีประสิทธิภาพสูงสุด ในขณะที่เมื่อข้อมูลเข้ามาในช่วงกลางของการเปิดรับ วิธีในกลุ่ม MLE_EM จะมีประสิทธิภาพสูงสุด และเมื่อข้อมูลเข้ามาในช่วงท้ายของการเปิดรับ วิธี MLE_EM และ MLE_EM_MEAN เป็นวิธีที่มีประสิทธิภาพสูงสุด 3) ทุกวิธีมีประสิทธิภาพมากขึ้นเมื่อตัวอย่างมีขนาดใหญ่ขึ้น หรือข้อมูลถูกตัดปลายทางขวาน้อยลง หรือสัดส่วนของช่วงเวลาที่เปิดรับข้อมูลเข้ามาเพื่อศึกษาต่อช่วงเวลาที่ศึกษาข้อมูลลดลง หรือความคลาดเคลื่อนกระจายตัวน้อยกว่าตัวแปรอิสระ