Abstract:
ศึกษาเปรียบเทียบความสามารถของวิธีการตรวจสอบค่าผิดปกติ ในการวิเคราะห์การถดถอยเชิงเส้น เมื่อค่าผิดปกติเกิดที่ตัวแปรตาม ซึ่งศึกษาวิธีการตรวจสอบค่าผิดปกติ 4 วิธีคือ การทดสอบของ Kianifard and Swallow ได้แก่ Sequential Recursive Method (SRM) และ Modified Recursive Method (MRM) การทดสอบของ S.R. Paul & Karen Y. Fung (PK) และการทดสอบของ Daniel Pena & Victor Yohai (PY) โดยกระทำภายใต้เงื่อนไขของการแจกแจงของความคลาดเคลื่อนสุ่ม 2 กรณีคือ กรณีไม่มีค่าผิดปกติซึ่งความคลาดเคลื่อนมีการแจกแจงปกติ และกรณีมีค่าผิดปกติเกิดขึ้นซึ่งความคลาดเคลื่อนมีการแจกแจงปกติปลอมปน (โดยศึกษาการแจกแจงปกติปลอมปนในตำแหน่งและการแจกแจงปกติปลอมปนในสเกล) ที่สัดส่วนการปลอมปนของความคลาดเคลื่อน 3 ระดับ คือ 0.05, 0.10 และ 0.15 ระดับค่าผิดปกติ 3 ระดับ คือ ระดับเล็กน้อย ระดับปานกลางและระดับรุนแรง จำนวนตัวแปรอิสระเท่ากับ 1 และ 3 ระดับขนาดตัวอย่าง 7 ระดับ คือ 20, 30, 40, 50, 60, 80 และ 100 ที่ระดับนัยสำคัญ 3 ระดับ คือ 0.01, 0.05 และ 0.10 ข้อมูลที่ใช้ในการวิจัยครั้งนี้ ได้จากการจำลองด้วยวิธีมอนติคาร์โล และกระทำซ้ำๆ กัน 500 ครั้ง ในแต่ละสถานการณ์ที่กำหนด ซึ่งการเปรียบเทียบจะใช้ค่าความน่าจะเป็นของความถูกต้องของการตรวจสอบ เป็นเครื่องมือวัดหรือมาตรวัด ดังนี้ ความน่าจะเป็นที่ตรวจถูกต้อง เมื่อข้อมูลไม่มีค่าผิดปกติ (P1) ความน่าจะเป็นที่ตรวจผิดพลาด เมื่อข้อมูลไม่มีค่าผิดปกติ (P2) ความน่าจะเป็นที่ตรวจถูกต้อง เมื่อข้อมูลมีค่าผิดปกติ (P3) ความน่าจะเป็นที่ตรวจผิดพลาด เมื่อข้อมูลมีค่าผิดปกติ (P4) และค่าเปอร์เซ็นต์รวมของการตรวจสอบถูกต้อง (TP%) ผลการวิจัยสรุปได้ดังนี้ พิจารณาค่าเปอร์เซ็นต์รวมของการตรวจสอบถูกต้อง (TP%) ซึ่งได้มาจากการคำนวณค่า P1, P2, P3 และ P4 จากการศึกษาทดลองในสถานการณ์ต่างๆ สรุปได้ 2 กรณีดังนี้ 1) กรณีความคลาดเคลื่อนมีการแจกแจงปกติปลอมปนในตำแหน่ง สรุปได้ดังนี้ กรณีสัดส่วนการปลอมปนระดับต่ำ (0.05) ตัวสถิติทดสอบ MRM มีค่า TP% สูงสุด ที่ขนาดตัวอย่างเท่ากับ 20 ทุกจำนวนตัวแปรอิสระและทุกระดับนัยสำคัญ รองลงมาคือ SRM, PK และ PY ตามลำดับ เมื่อจำนวนขนาดตัวอย่างเพิ่มขึ้นตัวสถิติทดสอบ SRM จะมีค่า TP% สูงสุด รองลงมาคือ PK, PY และ MRM ตามลำดับ กรณีสัดส่วนการปลอมปนระดับปานกลางถึงสูง (0.10-0.15) ตัวสถิติทดสอบ PY มีค่า TP% สูงสุด ที่ทุกระดับขนาดตัวอย่าง ทุกจำนวนตัวแปรอิสระและทุกระดับนัยสำคัญ รองลงมาคือ SRM, PK และ MRM ตามลำดับ 2) กรณีความคลาดเคลื่อนมีการแจกแจงปกติปลอมปนในสเกล สรุปได้ดังนี้ กรณีสัดส่วนการปลอมปนระดับต่ำ (0.05) เหมือนผลสรุปใน กรณีความคลาดเคลื่อนมีการแจกแจงปกติปลอมปนในตำแหน่ง ที่สัดส่วนการปลอมปนเท่ากับ 0.05 กรณีสัดส่วนการปลอมปนระดับปานกลางถึงสูง (0.10-0.15) ตัวสถิติทดสอบ SRM มีค่า TP% สูงสุดที่ทุกระดับขนาดตัวอย่าง ทุกจำนวนตัวแปรอิสระและทุกระดับนัยสำคัญ รองลงมาคือ PK, PY และ MRM ตามลำดับ