Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/24429
Title: การเปรียบเทียบเกณฑ์การคัดเลือกตัวแบบถดถอยแบบไม่ติดกลุ่ม
Other Titles: A comparison on the model selection criteria for nonnested regression models
Authors: บุญจิรา มากอ้น
Advisors: สุพล ดุรงค์วัฒนา
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี
Issue Date: 2545
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: การวิจัยครั้งนี้มีวัตถุประสงค์ เพื่อเปรียบเทียบความถูกต้องของเกณฑ์การคัดเลือกตัวแบบการถดถอยเชิงเส้นแบบไม่ติดกลุ่ม ซึ่งมีตัวแบบทั่วไปดังนี้ Y = X{u1D6C3} + {u1D6C6} เมื่อ Y แทน เวกเตอร์ของตัวแปรตามขนาด (n x 1) X แทน เมทริกซ์ของตัวแปรอิสระที่ควบคุมให้คงที่ขนาด (n x p) {u1D6C3} แทน เวกเตอร์ของพารามิเตอร์ของสัมประสิทธิ์การถดถอยขนาด (p x 1) {u1D6C6} แทน เวกเตอร์ของความคลาดเคลื่อนขนาด (n x 1) โดย {u1D6C6}~N(0, σ²I) σ²I แทน เมทริกซ์ความแปรปรวนร่วมขนาด (n x n) n แทน ขนาดตัวอย่าง p แทน จำนวนพารามิเตอร์ของสัมประสิทธิ์การถดถอย เกณฑ์การคัดเลือกตัวแบบสำหรับการวิจัยครั้งนี้ คือ เกณฑ์การคัดเลือกตัวแบบโดยข้อสนเทศของอาไคเคะ (Akaike's Information Criterion : AIC) กำหนดอยู่ในรูปสมการ AIC = nlog(σ²) + 2p และเกณฑ์การคัดเลือกตัวแบบโดยข้อสนเทศของเบส์ (Bayesian Information Criterion : BIC) กำหนดอยู่ในรูปสมการ BIC = nlog(σ²) + log(n)p เมื่อ σ² = SSE/n โดย SSE แทน ผลรวมค่าคลาดเคลื่อนกำลังสอง การคัดเลือกตัวแบบของเกณฑ์ AIC(BIC) คือ ตัวแบบที่ให้ค่า AIC(BIC) ต่ำสุด จะเป็นตัวแบบที่เหมาะสมที่สุด สำหรับการคัดเลือกตัวแบบแต่ละครั้งเกณฑ์ AIC(BIC) จะคัดเลือกตัวแบบได้ถูกต้องถ้าตัวแบบที่ได้มีค่า MSE ต่ำสุด การวิจัยครั้งนี้ทำการจำลองแบบโดยเทคนิคมอนติคาร์โลด้วยโปรแกรม S-PLUS 2000 โดยใช้ตัวแปรอิสระเริ่มต้นเป็น 2 3 และ 4 ตัว ค่าความคลาดเคลื่อนมีการแจกแจงแบบปกติมีค่าเฉลี่ยเป็น 0 และส่วนเบี่ยงเบนมาตรฐาน เป็น 1 5 10 และ 15 ขนาดตัวอย่างเป็น 25 50 75 และ 100 ระดับความสัมพันธ์ของตัวแปรอิสระคือ 0 0.5 และ 0.99 ค่าสัดส่วนของการเลือกผิดที่กำหนดขึ้นเป็น 1% 5% และ 10% ระดับนัยสำคัญที่ใช้คือ 0.01 และ 0.05 เกณฑ์ที่นำมาใช้ในการเปรียบเทียบคือ ค่าสัดส่วนของการคัดเลือกตัวแบบผิด และผลการทดสอบสมมติฐาน ผลการวิจัยสรุปได้ดังนี้ 1. เมื่อจำนวนตัวแปรอิสระเริ่มต้นเป็น 2 ตัวแปร เกณฑ์การคัดเลือกตัวแบบโดยข้อสนเทศของอาไคเคะ (AIC) และเกณฑ์การคัดเลือกตัวแบบโดยข้อสนเทศของเบส์ (BIC) มีค่าสัดส่วนของการคัดเลือกตัวแบบผิดเป็น 0 เท่ากัน ทุกระดับความสัมพันธ์ของตัวแปรอิสระ ขนาดตัวอย่าง และส่วนเบี่ยงเบนมาตรฐาน 2. เมื่อจำนวนตัวแปรอิสระเริ่มต้นเป็น 3 และ 4 ตัวแปร เกณฑ์การคัดเลือกตัวแบบโดยข้อสนเทศของอาไคเคะ (AIC) มีค่าสัดส่วนของการเลือกผิดต่ำกว่าเกณฑ์การคัดเลือกตัวแบบโดยข้อสนเทศของเบส์ (BIC) สำหรับทุกสถานการณ์ โดยเกณฑ์การคัดเลือกตัวแบบโดยข้อสนเทศของอาไคเคะ (AIC) และเกณฑ์การคัดเลือกตัวแบบโดยข้อสนเทศของเบส์ (BIC) จะมีค่าสัดส่วนของการเลือกผิดสูงขึ้น เมื่อจำนวนตัวแปรอิสระมีจำนวนมากขึ้น และจะมีค่าลดลงเมื่อขนาดตัวอย่างมีจำนวนมากขึ้น
Other Abstract: The objective of this study is to compare the accuracy of model selection criteria for non-nested linear regression model. The general linear regression model is shown as follow : Y = X{u1D6C3} + {u1D6C6} where Y is an (n x 1) vector of dependent variables, X is an (n x p) matrix of independent variables, {u1D6C3} is a (p x 1) vector of the regression coefficient, {u1D6C6} is an (n x 1) vector of errors, where {u1D6C6}~N(0, σ²I) ; σ²I is an (n x n) matrix of variance-covariance, n is a sample sizes and p is the number of unknown parametric regression coefficients. Model selection criteria for this research are Akaike's Information Criterion(AIC) which is defined by equation AIC = nlog(σ²) + 2p and Bayesian Information Criterion(BIC) which is defined by equation BIC = nlog(σ²) + log(n)p, where σ² = SSE/n, SSE is sum square error. The model which has minimum (AIC)BIC is the preferred model. For each selection, AIC(BIC) can select accurate model if the model has minimum MSE value. In this study, the datas are simulatd by S-PLUS 2000 package using Monte Carlo technique. The numbers of independent variables are 2, 3 and 4. The errors are normal distribution with mean 0 and standard deviations are 1, 5, 10 and 15. The sample sizes are 25, 50, 75 and 100. The levels of correlation among independent variables are 0, 0.5 and 0.99. Given proportion of miss selection values are 1%, 5% and 10%. Significance levels are 0.01 and 0.05. Proportion of miss selection values and result of testing hypothesis are used to compare the accuracy of two model selection criteria. The results of this study can be summarized as follow : 1. When the number of independent variables is 2, AIC and BIC give proportion of miss selection values are 0 for every levels of correlation among independent variables, sample size and standard deviations. 2. When the numbers of independent variables are 3 and 4, AIC give proportion of miss selection values less than BIC for all cases of this research. AIC and BIC give proportion of miss selection values increase when the number of independent variables increase and decrease when sample sizes increase.
Description: วิทยานิพนธ์ (สถ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2545
Degree Name: สถิติศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: สถิติ
URI: http://cuir.car.chula.ac.th/handle/123456789/24429
ISBN: 9741717342
Type: Thesis
Appears in Collections:Acctn - Theses

Files in This Item:
File Description SizeFormat 
Bunjira_ma_front.pdf3.45 MBAdobe PDFView/Open
Bunjira_ma_ch1.pdf3.76 MBAdobe PDFView/Open
Bunjira_ma_ch2.pdf2.91 MBAdobe PDFView/Open
Bunjira_ma_ch3.pdf2.3 MBAdobe PDFView/Open
Bunjira_ma_ch4.pdf9.77 MBAdobe PDFView/Open
Bunjira_ma_ch5.pdf2 MBAdobe PDFView/Open
Bunjira_ma_back.pdf3.65 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.