Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/15211
Title: การประมาณแบบเบส์สำหรับเมตริกซ์สหสัมพันธ์เมื่อข้อมูลเกิดการสูญหายแบบเท่ากัน และการแจกแจงเริ่มแรกเป็นแบบสม่ำเสมอ
Other Titles: Bayes' estimation for a correlation matrix with equal loss data and uniform prior
Authors: ศิริลักษณ์ ชัยโชณิชย์
Advisors: เสกสรร เกียรติสุไพบูลย์
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี
Advisor's Email: fcomskp@acc.chula.ac.th
Subjects: ทฤษฎีการตัดสินใจทางสถิติของเบส์
สหสัมพันธ์ (สถิติ)
การแจกแจง (ทฤษฎีความน่าจะเป็น)
Issue Date: 2549
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: งานวิจัยนี้ได้ศึกษาตัวประมาณเมตริกซ์สหสัมพันธ์ด้วยวิธีเบส์ เมื่อข้อมูลเกิดการสูญหายแบบเท่ากันโดยมีจุดประสงค์เพื่อแก้ปัญหาการขาดคุณสมบัติไม่เป็นลบแน่นอน (Positive Semi-Definite) ของค่าประมาณเมตริกซ์สหสัมพันธ์ ซึ่งตัวประมาณเมตริกซ์สหสัมพันธ์ด้วยวิธีเบส์ในงานวิจัยนี้ แบ่งออกเป็น 2 แบบตามการกำหนดการแจกแจงเริ่มแรก (Prior Distribution) คือ การแจกแจงแบบสม่ำเสมอร่วม (Joint Uniform Distribution) และการแจกแจงแบบสม่ำเสมอส่วนริม (Marginal Uniform Distribution) โดยในแต่ละแบบจะอาศัยเทคนิคการจำลองจากวิธีมาร์คอฟ เชน มอนติ คาร์โล (Markov Chain Monte Carlo: MCMC) ด้วยอัลกอริธึมของเมโทรโปลิส-เฮสติ้ง (Metropolis-Hasting Algorithm: MH) ซึ่งจะแบ่งวิธีการจำลองออกเป็น 2 วิธี ตามประเภทของการแจกแจงพรอพโพซอลซอล (Proposal Distribution) คือ อินดิเพนเด็น เชน (Independence Chain) และ บอล วอล์ค (Ball Walk) โดยในงานวิจัยนี้จะศึกษาในกรณีที่ข้อมูลมี 3 มิติ และสมมติให้ข้อมูลมีการแจกแจงปกติหลายตัวแปร ด้วยเวกเตอร์ค่าเฉลี่ย µ=0 และเมตริกซ์ความแปรปรวนร่วม ∑ ขนาด 3x3 ที่มีคุณสมบัติไม่เป็นลบแน่นอนและสมมาตร เมื่อ ∑=R ... โดยกำหนดให้เวกเตอร์ขององค์ประกอบเหนือเส้นทแยงมุมของเมตริกซ์สหสัมพันธ์จริง (r) เป็น 0.0, 0.1, 0.5 และ 0.9 ตามลำดับ และกำหนดให้ขนาดตัวอย่างที่ใช้ในการประมาณองค์ประกอบเมตริกซ์สหสัมพันธ์ ( m) เป็น 3, 10, 30 และ 100 ตามลำดับจากผลการวิจัย เมื่อใช้ระยะทางยูคลีเดียน (Euclidean Distance) เทียบกับเมตริกซ์สหสัมพันธ์จริง เป็นเกณฑ์ในการเปรียบเทียบ สามารถสรุปได้ว่า ค่าประมาณเมตริกซ์สหสัมพันธ์ด้วยวิธีเบส์ เมื่อกำหนดการแจกแจงเริ่มแรกเป็นการแจกแจงแบบสม่ำเสมอร่วมจะประมาณค่าได้ดี เมื่อข้อมูลมีความสัมพันธ์กันในระดับสูงๆ ส่วนค่าประมาณเมตริกซ์สหสัมพันธ์ด้วยวิธีเบส์ เมื่อกำหนดให้การแจกแจงเริ่มแรกเป็นการแจกแจงแบบสม่ำเสมอส่วนริม นั้นจะประมาณค่าได้ดี เมื่อข้อมูลไม่มีความสัมพันธ์กันหรือมีความสัมพันธ์กันน้อยๆ ส่วนการเปรียบเทียบความเร็วในการจำลองจากวิธีมาร์คอฟ เชน มอนติ คาร์โล ด้วยอัลกอริธึมของเมโทรโปลิส-เฮสติ้ง เมื่อกำหนดประเภทของการแจกแจงพรอพโพซอลต่างกันนั้น พบว่าการกำหนดประเภทการแจกแจงพรอพโพซอลเป็นแบบอินดิเพนเด็น เชน และกำหนดการแจกแจงพรอพโพซอลเป็นการแจกแจงแบบสม่ำเสมอในขอบเขตของเมตริกซ์สหสัมพันธ์ที่มีคุณสมบัติไม่เป็นลบแน่นอนจะจำลองได้เร็ว เมื่อขนาดตัวอย่างที่ใช้ในการประมาณองค์ประกอบเมตริกซ์สหสัมพันธ์ มีจำนวนน้อยๆ (วิถีการเคลื่อนที่ตัวอย่างจะกว้าง) ส่วนเมื่อกำหนดประเภทการแจกแจงพรอพโพซอลเป็นแบบบอล วอล์ค และกำหนดการแจกแจงพรอพโพซอลเป็นการแจกแจงแบบสม่ำเสมอในบอล จะจำลองได้เร็ว เมื่อขนาดตัวอย่างที่ใช้ในการประมาณองค์ประกอบเมตริกซ์สหสัมพันธ์ มีจำนวนมากๆ (วิถีการเคลื่อนที่ตัวอย่างจะแคบ).
Other Abstract: This research studied Bayes’ estimation for a correlation matrix with equal loss data. The main objective of this study was to handle lack of the positive semi-definite property of correlation matrices. The correlation matrices under this study were classified into two types according to their prior distribution, namely a joint uniform distribution and a marginal uniform distribution.The Markov Chain Monte Carlo (MCMC) simulation with Metropolis-Hasting algorithm (MH) was used and was classified into two methods according to the types of proposal distribution, namely independence chain and Ball Walk. This research specifically studied the case where the data are three dimensional and are a multivariate normal distribution with mean vector µ=0 and variance covariance matrix ∑, which is a 3x3 symmetric and positive semi-definite, where ∑=R=... . We let upper-diagonal elements vector of true correlation matrix (r) be 0.0, 0.1, 0.5 and 0.9 respectively. The sample size used to estimate for each elements of correlation matrix (m ) were 3, 10, 30 and 100 respectively.The result of this study can be summarized as follows. Taking Euclidean distance form the true correlation matrix as performance measure, a Bayes’ estimate form the joint uniform prior gives a better estimate than that form the marginal uniform prior when the data are highly correlated. On the contrary, a Bayes’ estimate form the marginal uniform prior gives a better estimate than that form the joint uniform prior when the data are uncorrelated or weakly correlated.The result of the comparison between the two types of proposal distribution by MCMC simulation with MH algorithm shows that a Bayes’ estimate from independence chain ,that is assumed uniform on sets of symmetric positive semi-definite correction matrices, is faster of the simulation than Ball Walk when small sample size are estimated each elements of correlation matrix (wide sample path). On the contrary, a Bayes’ estimate from Ball Walk ,that is assumed uniform on ball, is faster of the simulation than independence chain when large sample size (narrow sample path).
Description: วิทยานิพนธ์ (สต.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2549
Degree Name: สถิติศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: สถิติ
URI: http://cuir.car.chula.ac.th/handle/123456789/15211
URI: http://doi.org/10.14457/CU.the.2006.518
metadata.dc.identifier.DOI: 10.14457/CU.the.2006.518
Type: Thesis
Appears in Collections:Acctn - Theses

Files in This Item:
File Description SizeFormat 
sirilak.pdf1.8 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.