DSpace Repository

การเปรียบเทียบวิธีคัดกรองตัวแปรสำหรับการทดสอบกลุ่มของสัมประสิทธิ์การถดถอยที่มีมิติสูงแบบเป็นลำดับชั้น

Show simple item record

dc.contributor.advisor วิฐรา พึ่งพาพงศ์ en_US
dc.contributor.author สวรรยา ภู่เงิน en_US
dc.contributor.other จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี en_US
dc.date.accessioned 2015-09-18T04:23:34Z
dc.date.available 2015-09-18T04:23:34Z
dc.date.issued 2557 en_US
dc.identifier.uri http://cuir.car.chula.ac.th/handle/123456789/46264
dc.description วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2557 en_US
dc.description.abstract งานวิจัยฉบับนี้มีวัตถุประสงค์เพื่อเปรียบเทียบวิธีการคัดกรองตัวแปรอิสระจากวิธี Lasso, Adaptive Lasso และ Elastic Net สำหรับการทดสอบกลุ่มของสัมประสิทธิ์การถดถอยที่มีมิติสูง โดยใช้เทคนิคการจัดกลุ่มแบบเป็นลำดับชั้น ในการจัดกลุ่มตัวแปรตามความสัมพันธ์ของตัวแปรอิสระ จากนั้นจึงใช้วิธีการแบ่งข้อมูลแบบสุ่มหลายๆครั้ง เพื่อหาค่า p-value ของกลุ่มสัมประสิทธิ์การถดถอยแต่ละกลุ่ม โดยการศึกษานี้จะเปรียบเทียบประสิทธิภาพของวิธีคัดกรองตัวแปรอิสระจากการจำลองข้อมูลและใช้ข้อมูลจริงที่มีขอบเขตต่างๆกัน โดยในส่วนของข้อมูลจำลองมีอัตราส่วนของขนาดตัวอย่างต่อจำนวนตัวแปรเท่ากับ 100: 500 และ 100:1000 และความสัมพันธ์ของตัวแปรอิสระเป็น 0.0 , 0.5 และ 0.9 ขณะที่ในส่วนของข้อมูลจริงจะมีความสัมพันธ์ของตัวแปรแปรอิสระเป็น 2 แบบคือมีความสัมพันธ์แบบปกติและมีความสัมพันธ์กันสูง ทั้งนี้จะใช้อัตราความผิดพลาดรวม และอำนาจการทดสอบเป็นเครื่องมือในการเปรียบเทียบและการวัดประสิทธิภาพ การศึกษาภายใต้ขอบเขตดังกล่าวผลปรากฏว่าการคัดกรองตัวแปรทั้ง 3 วิธีให้อำนาจการทดสอบต่ำ ซึ่งเมื่อเปรียบเทียบการคัดกรอง 3 วิธีพบว่า วิธี Lasso มีอำนาจการทดสอบมากที่สุด รองลงมาคือวิธี Adaptive Lasso และ วิธี Elastic Net ตามลำดับ แต่เมื่อพิจารณาถึงอัตราความผิดพลาดรวม พบว่าวิธี Adaptive Lasso และวิธี Elastic Net มีค่าต่ำที่สุด en_US
dc.description.abstractalternative This research is aimed to compare the variable screening methods including Lasso, Adaptive Lasso and Elastic Net for hierarchical testing of high-dimensional regression coefficients. Hierarchical Clustering is employed to group independents variables based on their correlations. Multi-split method is then used to obtain p-values for each group of regression coefficients. Simulated data and real data are carried out to compare the performance of variable screening methods. For simulated data, we consider the case when ratios of the sample size and number of independent variables are 100:500 and 100:1000 and the correlation among independent variables are 0.0 , 0.5 and 0.9. For real data sets, normal correlation and high correlation among independent variables are considered here. Family wise error rate and power of the test are computed to compare the performance of variable screening methods. In this study, we found that all three screening methods have low power. Furthermore, Lasso has the largest power followed by Adaptive Lasso and Elastic Net respectively. However, Adaptive Lasso and Elastic Net has lower family wise error rate than Lasso. en_US
dc.language.iso th en_US
dc.publisher จุฬาลงกรณ์มหาวิทยาลัย en_US
dc.relation.uri http://doi.org/10.14457/CU.the.2014.1131
dc.rights จุฬาลงกรณ์มหาวิทยาลัย en_US
dc.subject การวิเคราะห์การถดถอย
dc.subject Regression analysis
dc.subject Hierarchical clustering (Cluster analysis)
dc.title การเปรียบเทียบวิธีคัดกรองตัวแปรสำหรับการทดสอบกลุ่มของสัมประสิทธิ์การถดถอยที่มีมิติสูงแบบเป็นลำดับชั้น en_US
dc.title.alternative A COMPARISON OF VARIABLE SCREENING METHODS FOR HIERARCHICAL TESTING OF HIGH-DIMENSIONAL REGRESSION COEFFICIENTS en_US
dc.type Thesis en_US
dc.degree.name วิทยาศาสตรมหาบัณฑิต en_US
dc.degree.level ปริญญาโท en_US
dc.degree.discipline สถิติ en_US
dc.degree.grantor จุฬาลงกรณ์มหาวิทยาลัย en_US
dc.email.advisor Vitara.P@Chula.ac.th,vitara@cbs.chula.ac.th en_US
dc.identifier.DOI 10.14457/CU.the.2014.1131


Files in this item

This item appears in the following Collection(s)

Show simple item record