Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/46847
Title: การเปรียบเทียบวิธีตรวจสอบข้อมูลผิดปกติ ในการวิเคราะห์ความถดถอยเชิงเส้น
Other Titles: A comparative study on some procedures for detedcting outliers in liear regression analysis
Authors: สมชาย รัตนเลิศนุสรณ์
Advisors: ธีระพร วีระถาวร
Other author: จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย
Advisor's Email: Theeraporn.V@Chula.ac.th
Subjects: การวิเคราะห์การถดถอย
Regression analysis
Issue Date: 2534
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: ในงานวิจัยครั้งนี้มีวัตถุประสงค์เพื่อเปรียบเทียบอำนาจการทดสอบของตัวสถิติทดสอบ 3 วิธีการ คือ วิธีการของทิตเจน มัวร์ และเบศแมน (TMB) วิธีการของเมอริน จี มาราขิงห์ (M) และวิธีการของจีแบร์รี (GB) ซึ่งใช้ตรวจสอบข้อมูลผิดปกติในการวิเคราะห์ความถดถอยเชิงเส้นอย่างง่าย โดยจะศึกษาในกรณีการแจกแจงของความผิดพลาดมี 2 ลักษณะ คือ การแจกแจงแบบหางยาวกว่าการแจกแจงปกติ และการแจกแจงแบบเบียวา ซึ่งในแต่ละลักษณะจะศึกษาในกรณีที่มีจำนวนข้อมูลผิดปกติ 1, 2 และ 3 ค่า ตามลำดับ ผลการวิจัยสรุปได้ดังนี้ ก) กรณีที่ความผิดพลาดมีการแจกแจงแบบหางยาวกว่าการแจกแจงปกติ ในงานวิจัยครั้งนี้ใช้การแจกแจงแบบสเกลคอนทามิเนตนอร์มอล โลเคชันคอนทามิเนตนอร์มอลและที โดยทั่วไปของทุกการแจกแจงแบบหางยาวที่ศึกษาพบว่าตัวสถิติทดสอบ M และ GB สามารถควบคุมความน่าจะเป็นของความคลาดเคลื่อนประเภทที่ 1 ได้ดีใกล้เคียงกัน ส่วนตัวสถิติทดสอบ TMB ควบคุมความน่าจะเป็นของความ คลาดเคลื่อนประเภท 1 ได้น้อย ยกเว้นเมื่อใช้การแจกแจงแบบที จะสามารถควบคุมความน่าจะเป็นของความคลาดเคลื่อนประเภทที่ 1 ได้ดีใกล้เคียงกับตัวสถิติทดสอบ M และ GB ผลการเปรียบเทียบค่าอำนาจการทดสอบพบว่ากรณีที่มีจำนวนค่าผิดปกติ (k)=1 ตัวสถิติทดสอบ GB มีอำนาจการทดสอบสูงสุด รองลงมาคือตัวสถิติทดสอบ TMB และ M ตามลำดับ ส่วนกรณีที่มีจำนวนค่าผิดปกติ (k)=2 และ 3 ตัวสถิติทดสอบ M มีอำนาจการทดสอบสูงสุด รองลงมาคือตัวสถิติทดสอบ GB และ TMB ตามลำดับ ข) กรณีที่ความผิดพลาดมีการแจกแจงแบบเบ้ยวา ในงานวิจัยครั้งนี้ใช้การแจกแจงแบบคอกนอร์มอล แกมมา และไวบูลล์ โดยทั่วไปของทุกการแจกแจงแบบเบียวาที่ศึกษาว่าตัวสถิติทดสอบ M และ GB สามารถควบคุมความน่าจะเป็นของความคลาดเคลื่อนประเภทที่ 1 ได้ดีใกล้เคียงกัน ส่วนตัวสถิติทดสอบ TMB ควบคุมความน่าจะเป็นของความคลาดเคลื่อนประเภทที่ 1 ได้น้อยที่สุด ผลการเปรียบเทียบค่าอำนาจการทดสอบพบว่าให้ผลเหมือนกับกรณี ข้อ ก) ปัจจัยที่มีอิทธิพลต่ออำนาจการทดสอบจากมากไปน้อย คือ ค่าเปรอ์เซนต์การปลอมปน (p) ค่าความแปรปรวน (62) และค่า shape parameter ตามลำดับ
Other Abstract: This research has an objective to compare power of the test among three procedures of test statistics; that is , Tietjen, Moore and Beckman’s procedure (TMB) ; Mervyn G. Marasinghe’s procedure (M) and G. Barrie’s procedure (GB). These are used to detect outliers in simple linear regression analysis with a view to study of two cases of residual distributions; i.e., heavy-tailed distribution and a right-handed skew distribution. Each of the cases will be studied in case of outlier numbers of one, two and three values, respectively. The result of the research can be concluded as follow : a) In case of residual arising from heavy-tailed distribution This research is used to distribute in the type of scale contaminated normal, location contaminated normal and t distribution. All of heavy-tailed distribution types studied are generally found that M’s and GB’s test statistics are able to control probability of type I error equivalently well. Another test statistics, TMB is able to control probability of type I error little except where type t distribution will be able to control probability of type-I error well equivalent to M’s and GB’s teat statistics. The consequence of comparison power of the test values indicate that in case of outlier number (k) of 1, GB’s test statistics has a power of the test absolutely. Of the two lower levels, they are TMB’s and M’s test statistics chronologically. In case of outlier number (k) of 2 and 3, M’s test statistics has a power of the test absolutely. The two lower levels are GB’s and TMB’s test statistics, respectively. b) In case of residual arising from right-handed skew distribution This research is used to distribute in the type of lognormal gamma and weibull distribution. All of right-handed skew distribution types studied generally signify that M’s and GB’s test statistics are able to control probability of type I error equivalently well. Another test statistics, TMB is able to control probability at least. The consequence of comparison of power of the test values show that it induces the same result as the clause a) The factors influential to a power of the test from more to less are contamination percentage value (p), variance value (62) and shape parameter value scceedingly.
Description: วิทยานิพนธ์ (สต.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2534
Degree Name: สถิติศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: สถิติ
URI: http://cuir.car.chula.ac.th/handle/123456789/46847
ISBN: 9745784478
Type: Thesis
Appears in Collections:Grad - Theses

Files in This Item:
File Description SizeFormat 
Somchai_rat_front.pdf13.04 MBAdobe PDFView/Open
Somchai_rat_ch1.pdf5.54 MBAdobe PDFView/Open
Somchai_rat_ch2.pdf5.83 MBAdobe PDFView/Open
Somchai_rat_ch3.pdf2.81 MBAdobe PDFView/Open
Somchai_rat_ch4.pdf15.29 MBAdobe PDFView/Open
Somchai_rat_ch5.pdf8.9 MBAdobe PDFView/Open
Somchai_rat_back.pdf17.57 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.