Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/56473
Title: การเลือกพารามิเตอร์การปรับสำหรับวิธีการถดถอยแบบลาสโซ่
Other Titles: ON TUNING PARAMETER SELECTION OF LASSO REGRESSION
Authors: จุฑาทิพย์ นันทสุวรรณ
Advisors: วิฐรา พึ่งพาพงศ์
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี
Advisor's Email: Vitara.P@Chula.ac.th,vitara@cbs.chula.ac.th
Issue Date: 2559
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: งานวิจัยนี้มีวัตถุประสงค์เพื่อนำเสนอวิธีการเลือกพารามิเตอร์ปรับสำหรับวิธีการถดถอยแบบลาสโซ่โดยใช้การตรวจสอบข้อบังคับเบื้องต้นของการวิเคราะห์การถดถอย และเปรียบเทียบผลที่ได้กับการเลือกพารามิเตอร์ปรับจากสองวิธีที่ใช้กันอย่างแพร่หลายสำหรับการถดถอยแบบลาสโซ่ ได้แก่ วิธีการตรวจสอบไขว้ และวิธีการใช้เกณฑ์ข้อสนเทศของเบส์ โดยทำการจำลองข้อมูลให้ครอบคลุมกับเหตุการณ์ที่อาจก่อให้เกิดปัญหาเกี่ยวกับข้อบังคับเบื้องต้นของการถดถอยทั้งหมด 6 กรณี เน้นไปที่การเกิดปัญหาฟังก์ชันการถดถอยไม่เป็นเชิงเส้นและปัญหาค่าความแปรปรวนของค่าความคลาดเคลื่อนมีค่าไม่คงที่ สำหรับเกณฑ์ที่ใช้วัดประสิทธิ์ภาพของผลที่ได้จากการวิเคราะห์การถดถอยด้วยพารามิเตอร์ปรับจากวิธีต่าง ๆ ได้แก่ อัตราความผิดพลาดในการตรวจจับเชิงบวก อัตราความผิดพลาดในการตรวจจับเชิงลบ ค่าคลาดเคลื่อนจากการพยากรณ์ และค่าคลาดเคลื่อนของสัมประสิทธิ์การถดถอย ผลการศึกษาจากการจำลองข้อมูลพบว่าวิธีการตรวจสอบข้อบังคับเบื้องต้นของการวิเคราะห์การถดถอยให้อัตราความผิดพลาดในการตรวจจับเชิงบวกต่ำที่สุด วิธีการตรวจสอบไขว้ให้อัตราความผิดพลาดในการตรวจจับเชิงลบต่ำกว่าอีกสองวิธี นอกจากนี้ วิธีการตรวจสอบข้อบังคับเบื้องต้นของการวิเคราะห์การถดถอยและวิธีการตรวจสอบไขว้ ไม่มีวิธีใดวิธีหนึ่งที่เหมาะสมกว่าอย่างเด่นชัดกว่ากันเมื่อพิจารณาจากค่าคลาดเคลื่อนของการพยากรณ์และสัมประสิทธิ์การถดถอย
Other Abstract: This research is aimed to propose a method to select a tuning parameter for lasso regression by using regression diagnostics. Here we compare the results with the two popular approaches in lasso tuning parameter selection including cross-validation and Bayesian Information Criteria. Simulation studies in 6 cases emphasizing on violation of the linearity and homoscedasticity assumptions are carried out. The performance of three methods are compared in terms of false positive rate, false negative rate, prediction error, and estimation error. Our simulation studies show that regression diagnostics approach yields the lowest false positive rates and cross-validation method provides the lower false negative rates than the other two methods. In addition, regression diagnostics and cross-validation methods are comparable in terms of prediction error and estimation error.
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2559
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: สถิติ
URI: http://cuir.car.chula.ac.th/handle/123456789/56473
URI: http://doi.org/10.58837/CHULA.THE.2016.1180
metadata.dc.identifier.DOI: 10.58837/CHULA.THE.2016.1180
Type: Thesis
Appears in Collections:Acctn - Theses

Files in This Item:
File Description SizeFormat 
5881509626.pdf2.21 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.