Abstract:
งานวิจัยนี้ได้ศึกษาตัวประมาณเมตริกซ์สหสัมพันธ์ด้วยวิธีเบส์ เมื่อข้อมูลเกิดการสูญหายแบบเท่ากันโดยมีจุดประสงค์เพื่อแก้ปัญหาการขาดคุณสมบัติไม่เป็นลบแน่นอน (Positive Semi-Definite) ของค่าประมาณเมตริกซ์สหสัมพันธ์ ซึ่งตัวประมาณเมตริกซ์สหสัมพันธ์ด้วยวิธีเบส์ในงานวิจัยนี้ แบ่งออกเป็น 2 แบบตามการกำหนดการแจกแจงเริ่มแรก (Prior Distribution) คือ การแจกแจงแบบสม่ำเสมอร่วม (Joint Uniform Distribution) และการแจกแจงแบบสม่ำเสมอส่วนริม (Marginal Uniform Distribution) โดยในแต่ละแบบจะอาศัยเทคนิคการจำลองจากวิธีมาร์คอฟ เชน มอนติ คาร์โล (Markov Chain Monte Carlo: MCMC) ด้วยอัลกอริธึมของเมโทรโปลิส-เฮสติ้ง (Metropolis-Hasting Algorithm: MH) ซึ่งจะแบ่งวิธีการจำลองออกเป็น 2 วิธี ตามประเภทของการแจกแจงพรอพโพซอลซอล (Proposal Distribution) คือ อินดิเพนเด็น เชน (Independence Chain) และ บอล วอล์ค (Ball Walk) โดยในงานวิจัยนี้จะศึกษาในกรณีที่ข้อมูลมี 3 มิติ และสมมติให้ข้อมูลมีการแจกแจงปกติหลายตัวแปร ด้วยเวกเตอร์ค่าเฉลี่ย µ=0 และเมตริกซ์ความแปรปรวนร่วม ∑ ขนาด 3x3 ที่มีคุณสมบัติไม่เป็นลบแน่นอนและสมมาตร เมื่อ ∑=R ... โดยกำหนดให้เวกเตอร์ขององค์ประกอบเหนือเส้นทแยงมุมของเมตริกซ์สหสัมพันธ์จริง (r) เป็น 0.0, 0.1, 0.5 และ 0.9 ตามลำดับ และกำหนดให้ขนาดตัวอย่างที่ใช้ในการประมาณองค์ประกอบเมตริกซ์สหสัมพันธ์ ( m) เป็น 3, 10, 30 และ 100 ตามลำดับจากผลการวิจัย เมื่อใช้ระยะทางยูคลีเดียน (Euclidean Distance) เทียบกับเมตริกซ์สหสัมพันธ์จริง เป็นเกณฑ์ในการเปรียบเทียบ สามารถสรุปได้ว่า ค่าประมาณเมตริกซ์สหสัมพันธ์ด้วยวิธีเบส์ เมื่อกำหนดการแจกแจงเริ่มแรกเป็นการแจกแจงแบบสม่ำเสมอร่วมจะประมาณค่าได้ดี เมื่อข้อมูลมีความสัมพันธ์กันในระดับสูงๆ ส่วนค่าประมาณเมตริกซ์สหสัมพันธ์ด้วยวิธีเบส์ เมื่อกำหนดให้การแจกแจงเริ่มแรกเป็นการแจกแจงแบบสม่ำเสมอส่วนริม นั้นจะประมาณค่าได้ดี เมื่อข้อมูลไม่มีความสัมพันธ์กันหรือมีความสัมพันธ์กันน้อยๆ ส่วนการเปรียบเทียบความเร็วในการจำลองจากวิธีมาร์คอฟ เชน มอนติ คาร์โล ด้วยอัลกอริธึมของเมโทรโปลิส-เฮสติ้ง เมื่อกำหนดประเภทของการแจกแจงพรอพโพซอลต่างกันนั้น พบว่าการกำหนดประเภทการแจกแจงพรอพโพซอลเป็นแบบอินดิเพนเด็น เชน และกำหนดการแจกแจงพรอพโพซอลเป็นการแจกแจงแบบสม่ำเสมอในขอบเขตของเมตริกซ์สหสัมพันธ์ที่มีคุณสมบัติไม่เป็นลบแน่นอนจะจำลองได้เร็ว เมื่อขนาดตัวอย่างที่ใช้ในการประมาณองค์ประกอบเมตริกซ์สหสัมพันธ์ มีจำนวนน้อยๆ (วิถีการเคลื่อนที่ตัวอย่างจะกว้าง) ส่วนเมื่อกำหนดประเภทการแจกแจงพรอพโพซอลเป็นแบบบอล วอล์ค และกำหนดการแจกแจงพรอพโพซอลเป็นการแจกแจงแบบสม่ำเสมอในบอล จะจำลองได้เร็ว เมื่อขนาดตัวอย่างที่ใช้ในการประมาณองค์ประกอบเมตริกซ์สหสัมพันธ์ มีจำนวนมากๆ (วิถีการเคลื่อนที่ตัวอย่างจะแคบ).