Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/71011
Title: การเปรียบเทียบการประมาณค่าสัมประสิทธิ์ในการถดถอยเชิงเส้นพหุคูณ เมื่อเกิดพหุสัมพันธ์
Other Titles: A comparison of coefficient estimation in multiple linear regression with multicollinearity
Authors: อัชฌา อระวีพร
Advisors: ธีระพร วีระถาวร
Other author: จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย
Advisor's Email: Theeraporn.V@Chula.ac.th
Subjects: วิธีกำลังสองน้อยที่สุด
การวิเคราะห์การถดถอย
การถดถอยริดจ์
สหสัมพันธ์ (สถิติ)
Least squares
Regression analysis
Ridge regression (Statistics)
Correlation (Statistics)
Issue Date: 2541
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อเปรียบเทียบการประมาณค่าสัมประสิทธิ์การถดถอยเชิงเส้นพหุคูณเมื่อเกิด พหุสัมพันธ์ระหว่างตัวแปรอิสระ โดยทำการเปรียบเทียบวิธีกำลังสองน้อยสุด (OLS) วิธีที่ได้จากสมการการทดถอยริดจ์ โดยใช้วิธีของบรีแมน (RID) และวิธีของสมการถดถอยเชิงเส้นการ์ล็อต (GAR) เกณฑ์การเปรียบเทียบที่ใช้คืออัตราส่วน ของค่าเฉลี่ยความคลาดเคลื่อนกำลังสอง โดยที่การแจกแจงของค่าความคลาดเคลื่อนที่ศึกษาคือ การแจกแจงแบบปกติซึ่งมีค่าเฉลี่ยเท่ากับ 1 ส่วนเบี่ยงเบนมาตรฐานเท่ากับ 0.05 และ 0.15 การแจกแจงแบบปกติปลอมปนซึ่งมีสเกลแฟคเตอร์ เท่ากับ 3 และ 10 เปอร์เซ็นต์การปลอมปนเท่ากับ 5 และ 10 การแจกแจงแบบไวบูลล์ซึ่งมีพารามิเตอร์มาตราส่วนเท่ากับ 1 และพารามิเตอร์สัณฐานเท่ากับ 1, 2 และ 5 ตามลำดับ และการแจกแจงแบบลอกนอร์มอลซึ่งมีค่าเฉลี่ยเท่ากับ 0 และ ส่วนเบี่ยงเบนมาตรฐานเท่ากับ 0.22, 0.55 และ 0.84 ตามลำดับ โดยกำหนดขนาดตัวอย่างเท่ากับ 10, 30, 50 และ 100 ตามลำดับ จำนวนตัวแปรอิสระเท่ากับ 3 และ 5 และระดับความสัมพันธ์ระหว่างตัวแปรอิสระเท่ากับ 0.1 และ 0.3 (ระดับต่ำ), 0.5 (ระดับปานกลาง), 0.7 และ 0.9 (ระดับสูง) และ 0.99 (ระดับสูงมาก) ตามลำดับ ในการวิจัยครั้งนี้ได้ทำการจำลองเหตุการณ์ต่าง ๆ ด้วยเครื่องคอมพิวเตอร์โดยใช้เทคนิคมอนติคาร์โลและกระทำซ้ำ 500 ครั้งในแต่ละกรณี ผลการเปรียบเทียบค่าเฉลี่ยความคลาดเคลื่อนกำลังสอง มีดังนี้ กระดับความสัมพันธ์วิธี RID จะให้ผลดีเกือบทุกกรณี ยกเว้นกรณีที่ระดับความสัมพันธ์สูงมาก ในกรณีที่ระดับความสัมพันธ์สูงมากและความคลาดเคลื่อนมีการแจกแจงแบบปกติและปกติปลอมปน วิธี GAR จะให้ผลดีเมื่อจำนวนตัวแปรอิสระเท่ากับ 3 (ขนาดตัวอย่าง = 30, 50) และเมื่อจำนวนตัวแปรอิสระเท่ากับ 5 ส่วนเบี่ยงเบนมาตรฐานเท่ากับ 0.05 (ขนาดตัวอย่าง = 30, 50) ส่วนวิธี OLS จะให้ผลดีเมื่อจำนวนตัวแปรอิสระเท่ากับ 5 ส่วนเบี่ยงเบนมาตรฐานเท่ากับ 0.05 (ขนาดตัวอย่าง = 10) ส่วนกรณีที่ระดับความสัมพันธ์สูงมากและความคลาดเคลื่อนมีการแจกแจงแบบไวบูลล์ วิธี GAR จะให้ผลดี เมื่อจำนวนตัวแปรอิสระเท่ากับ 3 พารามิเตอร์สัณฐานเท่ากับ 5 (ขนาดตัวอย่าง = 50) ค่าเฉลี่ยความคลาดเคลื่อนกำลังสองจะแปรผันตามปัจจัยต่อไปนี้ ระดับความสัมพันธ์ ส่วนเบี่ยงเบนมาตร- ฐาน จำนวนตัวแปรอิสระ สเกลแฟคเตอร์ และเปอร์เซ็นต์การปลอมปน โดยเรียงลำดับจากมากไปน้อย แต่แปรผกผันกับ ขนาดตัวอย่าง
Other Abstract: The objective of this research is to compare multiple linear regression coefficient estimating methods under multicollinearity conditions by comparing Ordinary Least Square method (OLS), Ridge Regression by Breiman method (RID) and Garrote Linear Regression method (GAR). The criterion of comparison is the ratio of average values of the mean square errors. This study examines the residual distribution from a normal distribution with mean of 1.0, standard deviation of 0.05 and 0.15; contaminated - normal distribution with scale factors of 3 and 10 each with percent contaminations of 5 and 10; Weibull distribution with scale parameter of 1, with shape parameter of 1, 2 and 5; and lognormal distribution with mean of 0, and standard deviations of 0.22, 0.55 and 0.84, respectively. This study uses sample sizes of 10, 30, 50 and 100, respectively. The levels of correlation among independent variables are equal to 0.1 and 0.3 (low), 0.5 (middle), 0.7 and 0.9 (high), and 0.99 (very high), respectively, for the number of independent variables of 3 and 5. The data are obtained through simulation using a Monte Carlo technique with 500 reptitions for each case. The results for comparing the average value of mean square error are as follows: For every level of correlation, the RID method generally gives the best results, except in die cases when the level of correlation is very high. In the case of level of correlation is very high and the residuals have normal and contaminated-normal distribution, the GAR method gives the best results with 3 independent variables (sample sizes = 30, 50) and 5 independent variables, with standard deviation of 0.05 (sample sizes = 30, 50). The OLS method gives the best result with 5 independent variables, and a standard deviation of 0.05 (sample size = 10). The case of level of correlation is very high and the residuals have a Weibull distribution, the GAR method gives the best result with 3 independent variables, and a shape parameter of 5 (sample size = 50). The average value of mean square error varies with (in descending order): levels of correlation, standard deviation, the number of independent variables, scale factor, and percent contamination. The average value of mean square error varies conversly to sample sizes.
Description: วิทยานิพนธ์ (สต.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2541
Degree Name: สถิติศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: สถิติ
URI: http://cuir.car.chula.ac.th/handle/123456789/71011
ISBN: 9743319778
Type: Thesis
Appears in Collections:Grad - Theses

Files in This Item:
File Description SizeFormat 
Autcha_ar_front_p.pdfหน้าปก และบทคัดย่อ1.18 MBAdobe PDFView/Open
Autcha_ar_ch1_p.pdfบทที่ 1996.48 kBAdobe PDFView/Open
Autcha_ar_ch2_p.pdfบทที่ 21.07 MBAdobe PDFView/Open
Autcha_ar_ch3_p.pdfบทที่ 31.19 MBAdobe PDFView/Open
Autcha_ar_ch4_p.pdfบทที่ 49.76 MBAdobe PDFView/Open
Autcha_ar_ch5_p.pdfบทที่ 51.11 MBAdobe PDFView/Open
Autcha_ar_back_p.pdfบรรณานุกรม และภาคผนวก1.52 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.