Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/11532
Title: การเปรียบเทียบวิธีประมาณค่าพารามิเตอร์ ในการวิเคราะห์ความถดถอยพหุคูณ ด้วยวิธีกำลังสองน้อยสุด วิธีริดจ์รีเกรสชันที่ใช้ข้อสนเทศโดยหลักเกณฑ์ และวิธีลิวคีเจียนทั่วไป เมื่อเกิดพหุสัมพันธ์ระหว่างตัวแปรอิสระ
Other Titles: A comparison of parameters estimating methods in multiple regression analysis by least square method, ridge regression with prior information method, and generalized liu kejian method when existing multicollinearity among independent variables
Authors: สมพล จารุธนศักดิ์กูร
Email: Theeraporn.V@Chula.ac.th
Advisors: ธีระพร วีระถาวร
Other author: จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย
Subjects: การประมาณค่าพารามิเตอร์
การวิเคราะห์การถดถอย
พหุสัมพันธ์
Issue Date: 2539
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: เปรียบเทียบวิธีประมาณค่าสัมประสิทธิ์การถดถอยพหุคูณเมื่อเกิดพหุสัมพันธ์ ระหว่างตัวแปรอิสระ โดยการเปรียบเทียบวิธีกำลังสองน้อยสุด (LS) วิธีริดจ์รีเกรสชันที่ใช้ข้อสนเทศโดยหลักเกณฑ์ (RP) และวิธีลิว คีเจียนทั่วไป (LK) ซึ่งเกณฑ์การเปรียบเทียบคืออัตราส่วนของค่าเฉลี่ยความคลาดเคลื่อนกำลังสอง ขนาดตัวอย่างที่ใช้ในการวิจัยเท่ากับ 12, 30, 50 และ 100 ความคลาดเคลื่อนเป็นกลุ่มตัวอย่างที่สุ่มจากประชากรที่มีการแจกแจงแบบปกติ ซึ่งมีค่าเฉลี่ยเท่ากับ 1 ส่วนเบี่ยงเบนมาตรฐานเท่ากับ 0.05, 0.10, 0.15 ตามลำดับ การแจกแจงแบบปกติปลอมปน ซึ่งมีสเกลแฟคเตอร์เท่ากับ 3, 10 เปอร์เซนต์การปลอมปนเท่ากับ 5, 10 และการแจกแจงแบบลอกนอร์มอล ซึ่งมีค่าเฉลี่ยเท่ากับ 1 ส่วนเบี่ยงเบนมาตรฐานเท่ากับ 0.2264, 0.5915, 1.0069 ตามลำดับ ระดับความสัมพันธ์ระหว่างตัวแปรอิสระเท่ากับ (0.30), (0.60), (0.90), (0.99) เมื่อจำนวนตัวแปรอิสระเท่ากับ 3 และเท่ากับ (0.30, 0.30), (0.60, 0.60), (0.90, 0.90), (0.99, 0.99) เมื่อจำนวนตัวแปรอิสระเท่ากับ 5 ข้อมูลที่ใช้ในการวิจัยได้จากการจำลองด้วยเทคนิคมอนติคาร์โล ซึ่งกระทำซ้ำ 500 ครั้งในแต่ละสถานการณ์ ผลการวิจัยปรากฏว่า ระดับความสัมพันธ์ การแจกแจงของความคลาดเคลื่อน จำนวนตัวแปรอิสระและขนาดตัวอย่าง ต่างมีผลต่อประสิทธิภาพของการประมาณค่าสัมประสิทธิ์การถดถอยพหุคูณทั้งสาม วิธี โดยประสิทธิภาพมีแนวโน้มดีขึ้นเมื่อขนาดตัวอย่างมากขึ้น แต่มีแนวโน้มลดลงเมื่อระดับความสัมพันธ์ สเกลแฟคเตอร์ ส่วนเบี่ยงเบนมาตรฐาน จำนวนตัวแปรอิสระและเปอร์เซนต์การปลอมปนสูงขึ้น โดยเรีงลำดับของอิทธิพลจากมากไปน้อย วิธีริดจ์รีเกรสชันที่ใช้ข้อสนเทศโดยหลักเกณฑ์ มีประสิทธิภาพดีที่สุดทุกการแจกแจงของความคลาดเคลื่อน ยกเว้นการแจกแจงแบบลอกนอร์มอลในกรณีที่ระดับความสัมพันธ์ = 0.30 (ทุกขนาดตัวอย่าง) และ 0.60 (ขนาดตัวอย่าง = 30, 50, 100) โดยที่ส่วนเบี่ยงเบนมาตรฐาน = 0.2264, จำนวนตัวแปรอิสระ = 3 และระดับความสัมพันธ์ = (0.30, 0.30) (ขนาดตัวอย่าง = 50, 100) โดยที่ส่วนเบี่ยงเบนมาตรฐาน = 0.2264, จำนวนตัวแปรอิสระเท่ากับ 5 ในกรณีดังกล่าววิธีกำลังสองน้อยสุดมีประสิทธิภาพดีที่สุด เพราะวิธีกำลังสองน้อยสุดมีประสิทธิภาพดี เมื่อการแจกแจงของความคลาดเคลื่อนใกล้เคียงกับการแจกแจงแบบปกติ
Other Abstract: To compare multiple regression coefficients estimating methods when existing multicollinearity among independent variables by comparing least square method (LS), ridge regression with prior information method (RP) and generalized Liu Kejian method (LK). The criterion of comparison is the ratio of average value of mean square error. This research used sample sizes of 12, 30, 50 and 100. The residuals are randomized sample groups from population have normal distribution with mean of 1.0, standard deviation of 0.05, 0.10, 0.15, respectively, contaminated-normal distribution with scale factors of 3, 10 and percent contaminations of 5, 10 and lognormal distribution with mean of 1.0, standard deviation of 0.2264, 0.5915, 1.0069, respectively. The level of correlations among independent variables equal (0.30), (0.60), (0.90), (0.99) for the number of independent variables of 3 and equal (0.30, 0.30), (0.60, 0.60), (0.90, 0.90), (0.99, 0.99) for the number of independent variables of 5. The data is obtained through simulation using monte carlo technique, and repeating 500 times for each case. The results of this research are that level of correlations, distribution of residuals, number of independent variables and sample sizes have effect to efficiency of multiple regression coefficients estimating three methods. The efficiency have better trend when sample sizes increases but have worse trend when level of correlations, scale factors, standard deviation, number of independent variables and percent contaminations increases by ranging effect from most to least. Ridge regression with prior information method have the best efficiency every distribution of residuals expect for lognormal distribution in case of level of correlations = (0.30) (every sample sizes) and (0.60) (sample sizes = 30, 50, 100) which standard deviation = 0.2264, number of independent variables = 3 and level of correlations = (0.30, 0.30) (sample sizes = 50, 100) which standard deviation = 0.2264, number of independent variables = 5 in these cases least square method have the best efficiency because least square method have good efficiency when distribution of residuals close to normal distribution.
Description: วิทยานิพนธ์ (สต.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2539
Degree Name: สถิติศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: สถิติ
URI: http://cuir.car.chula.ac.th/handle/123456789/11532
ISBN: 9746362844
Type: Thesis
Appears in Collections:Grad - Theses

Files in This Item:
File Description SizeFormat 
Sompol_Ja_front.pdf1.25 MBAdobe PDFView/Open
Sompol_Ja_ch1.pdf982.06 kBAdobe PDFView/Open
Sompol_Ja_ch2.pdf1.07 MBAdobe PDFView/Open
Sompol_Ja_ch3.pdf1.01 MBAdobe PDFView/Open
Sompol_Ja_ch4.pdf4.08 MBAdobe PDFView/Open
Sompol_Ja_ch5.pdf2.63 MBAdobe PDFView/Open
Sompol_Ja_back.pdf1.29 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.