Abstract:
ศึกษาและเปรียบเทียบรูปแบบการแปลงข้อมูลที่การแจกแจงไม่ปกติหลายตัวแปร ให้มีการลู่เข้าสู่การแจกแจงปกติหลายตัวแปร โดยพิจารณาการแปลงข้อมูลทั้งหมด 5 วิธีคือ วิธีการแปลงข้อมูลแบบ โฟล์ด เอกโพเนนเชียล (Folded exponential transformations) วิธีการแปลงข้อมูลแบบ โฟล์ด พาวเวอร์ (Folded power transformations) วิธีการแปลงข้อมูลแบบ Guerrero-Johnson (Guerrero-Johnson transformations) วิธีการแปลงข้อมูลแบบ Aranda-Ordaz (Aranda-Ordaz transformations) และวิธีการแปลงข้อมูลแบบ สเกล แองกูลา (Scaled angular transformations) โดยพิจารณาจากเปอร์เซนต์สูงสุดของการยอมรับการแปลงข้อมูลว่า ได้มีการแจกแจงแบบปกติหลายตัวแปรจากการทดสอบสมมติฐาน (ข้อมูลมีการแจกแจงแบบปกติหลายตัวแปร) เพื่อให้ทราบว่ารูปแบบการแปลงข้อมูลแบบใดเหมาะสมกับข้อมูลชุดนั้นๆ มากที่สุด ภายใต้สถานการณ์ที่กำหนดคือ ประชากรมีการแจกแจงแบบไวบูลล์ การแจกแจงแบบแกมมา และการแจกแจงแบบเบตา ซึ่งกำหนดให้มีลักษณะโด่งเบ้ต่างๆ กัน ขนาดตัวอย่างคือ 20, 30, 50 และ 100 ณ ระดับนัยสำคัญของการทดสอบเทียบความกลมกลืน 0.05 ในการวิจัยครั้งนี้จำลองสถานการณ์การทดลองด้วยเทคนิคมอนติคาร์โล ซึ่งทดลองซ้ำในแต่ละรอบจนกว่าผลต่างระหว่าง เวกเตอร์ค่าเฉี่ยของตัวอย่าง ในรอบที่ i+1 กับรอบที่ i มีค่าน้อยมากจนถือว่าไม่แตกต่างกัน โดยมีเกณฑ์ว่า (เวกเตอร์ค่าเฉี่ยของตัวอย่าง i+1 - เวกเตอร์ค่าเฉี่ยของตัวอย่าง 1) ≤ 0.0001 (โดยที่ i = 1,2,…,k และ i คือจำนวนรอบในการทดลอง) จึงหยุดการทดลอง การวิจัยครั้งนี้สรุปได้ว่า สำหรับทุกการแจกแจงในทุกระดับของความเบ้ ส่วนใหญ่วิธีการแปลงข้อมูลแบบ Aranda-Ordaz ให้เปอร์เซนต์การยอมรับสมมติฐานสูงที่สุด