Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/19258
Title: | การเปรียบเทียบวิธีการรวมตัวแบบการถดถอยเชิงเส้นพหุคูณ |
Other Titles: | A comparison of model combining methods for multiple linear regression models |
Authors: | ธนาพันธ์ อัครเดชากร |
Advisors: | มานพ วราภักดิ์ |
Other author: | จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตรและการบัญชี |
Advisor's Email: | fcommva@acc.chula.ac.th |
Subjects: | การวิเคราะห์การถดถอย คณิตศาสตร์สถิติ |
Issue Date: | 2550 |
Publisher: | จุฬาลงกรณ์มหาวิทยาลัย |
Abstract: | การวิจัยครั้งนี้ มีวัตถุประสงค์เพื่อเปรียบเทียบวิธีหาค่าพยากรณ์ร่วมของตัวแบบการถดถอยเชิงเส้นพหุคูณ 3 วิธี ได้แก่ วิธีค่าสัมบูรณ์ต่ำสุด (LAE) วิธีบูตสแตรป (BO) และวิธี adaptive regression by mixing (ARM) โดยตัวแบบที่นำมาหาค่าพยากรณ์ร่วมได้แก่ ตัวแบบที่ได้จากวิธีพิจารณาการถดถอยทุกรูปแบบ วิธีคัดเลือกตัวแปรแบบไปข้างหน้า วิธีกำจัดตัวแปรแบบถอยหลัง และวิธีการถดถอยขั้นบันได ซึ่งเกณฑ์ที่ใช้ในการตัดสินใจ คือ เกณฑ์ร้อยละของความคลาดเคลื่อนเฉลี่ยสัมบูรณ์ (MAPE) จำนวนตัวแปรอิสระที่ศึกษาคือ 3, 5 และ 7 ตัว เมื่อจำนวนตัวแปรอิสระเท่ากับ 3 กำหนดระดับความสัมพันธ์ระหว่างตัวแปรอิสระ x[subscript 1] กับ x[subscript 2] เท่ากับ 0.3, 0.5 และ 0.8 โดยศึกษาเมื่อขนาดตัวอย่างเท่ากับ 14, 20, 30, 40 และ 50 เมื่อจำนวนตัวแปรอิสระเท่ากับ 5 กำหนดระดับความสัมพันธ์ระหว่าง x[subscript 1] กับ x[subscript 2] และ x[subscript 4] กับ x[subscript 5] เท่ากับ (0.3, 0.3), (0.4, 0.6) และ (0.7, 0.9) โดยศึกษาเมื่อขนาดตัวอย่างเท่ากับ 20, 30, 40 และ 50 เมื่อจำนวนตัวแปรอิสระเท่ากับ 7 กำหนดระดับความสัมพันธ์ระหว่าง x[subscript 1] กับ x[subscript 2], x[subscript 4] กับ x[subscript 5] และ x[subscript 6] กับ x[subscript 7] เท่ากับ (0.3, 0.3, 0.3), (0.4, 0.5, 0.6) และ (0.7, 0.8, 0.9) โดยศึกษาเมื่อขนาดตัวอย่างเท่ากับ 30, 40 และ 50 ความคลาดเคลื่อนมีการแจกแจงปกติที่มีค่าเฉลี่ยเท่ากับ 0 และส่วนเบี่ยงเบนมาตรฐานเท่ากับ 5 วิธีการวิจัยใช้การจำลองด้วยเทคนิคมอนติคาร์โลซึ่งกระทำซ้ำ 1,000 รอบในแต่ละสถานการณ์ ผลการวิจัยปรากฏว่าปัจจัยที่มีผลต่อค่าเฉลี่ยของ MAPE ของทุกวิธี คือ ระดับความสัมพันธ์ระหว่างตัวแปรอิสระและขนาดตัวอย่าง โดยค่าเฉลี่ยของ MAPE จะมีแนวโน้มเพิ่มขึ้นเมื่อระดับความสัมพันธ์สูงขึ้น และมีแนวโน้มลดลงเมื่อขนาดตัวอย่างเพิ่มขึ้น จากการเปรียบเทียบค่าเฉลี่ยของ MAPE ของการหาค่าพยากรณ์ร่วม 3 วิธี พบว่า วิธี BO มีประสิทธิภาพมากที่สุดในทุกกรณีที่ศึกษา และโดยทั่วไปวิธีพยากรณ์เดี่ยวที่ได้รับน้ำหนักมากที่สุดจะขึ้นอยู่กับระดับพหุสัมพันธ์ระหว่างตัวแปรอิสระ ดังนี้ กรณีที่พหุสัมพันธ์ระหว่างตัวแปรอิสระอยู่ในระดับต่ำ วิธีพิจารณาการถดถอยทุกรูปแบบจะได้รับน้ำหนักมากที่สุด กรณีที่พหุสัมพันธ์ระหว่างตัวแปรอิสระอยู่ในระดับปานกลาง วิธีกำจัดตัวแปรแบบถอยหลังจะได้รับน้ำหนักมากที่สุด กรณีที่พหุสัมพันธ์ระหว่างตัวแปรอิสระอยู่ในระดับสูง วิธีการถดถอยขั้นบันไดจะได้รับน้ำหนักมากที่สุด |
Other Abstract: | The objective of this research is to compare model-combining methods for multiple linear regression models. Three combining methods are studied: least absolute errors (LAE), combination by bootstrap (BO) and adaptive regression by mixing (ARM). The models used in combining are built by the following procedures: all possible regressions, forward selection, backward elimination and stepwise regression. The mean absolute percentage error (MAPE) is used as the criterion in deciding which combining method is best. The number of independent variables are 3, 5 and 7. In 3-variable case, the correlations between independent variables x[subscript 1] and x[subscript 2] are 0.3, 0.5 and 0.8; the sample sizes are 14, 20, 30, 40 and 50. In 5-variable case, the correlations between x[subscript 1] and x[subscript 2], and between x[subscript 4] and x[subscript 5] are (0.3, 0.3), (0.4, 0.6) and (0.7, 0.9); the sample sizes are 20, 30, 40 and 50. In 7-variable case, the correlations between x[subscript 1] and x[subscript 2], between x[subscript 4] and x[subscript 5], and between x[subscript 6] and x[subscript 7] are (0.3, 0.3, 0.3), (0.4, 0.5, 0.6) and (0.7, 0.8, 0.9); the sample sizes are 30, 40 and 50. The random errors are normally distributed with mean 0 and standard deviation 5. This research used the Monte Carlo simulation, repeated 1,000 times in each situation. The results of this research show that factors affecting the average of MAPE for all combining methods are correlations among the independent variables and sample sizes. The average of MAPE tends to increase when the correlation increases, and to fall when the sample size increases. By comparing the average of MAPE for the three combining methods, the researcher concludes that BO method is the best in every case. Generally, the model-building procedure which receives the maximum weight depends on the degree of multicollinearity among the independent variables. When multicollinearity is low, all possible regression receives the maximum weight. When multicollinearity is medium, backward elimination receives the maximum weight. When multicollinearity is high, stepwise regression receives the maximum weight |
Description: | วิทยานิพนธ์ (สต.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2550 |
Degree Name: | สถิติศาสตรมหาบัณฑิต |
Degree Level: | ปริญญาโท |
Degree Discipline: | สถิติ |
URI: | http://cuir.car.chula.ac.th/handle/123456789/19258 |
URI: | http://doi.org/10.14457/CU.the.2007.1225 |
metadata.dc.identifier.DOI: | 10.14457/CU.the.2007.1225 |
Type: | Thesis |
Appears in Collections: | Acctn - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Thanaphan_ak.pdf | 1.18 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.