dc.contributor.advisor |
วิฐรา พึ่งพาพงศ์ |
en_US |
dc.contributor.author |
สวรรยา ภู่เงิน |
en_US |
dc.contributor.other |
จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี |
en_US |
dc.date.accessioned |
2015-09-18T04:23:34Z |
|
dc.date.available |
2015-09-18T04:23:34Z |
|
dc.date.issued |
2557 |
en_US |
dc.identifier.uri |
http://cuir.car.chula.ac.th/handle/123456789/46264 |
|
dc.description |
วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2557 |
en_US |
dc.description.abstract |
งานวิจัยฉบับนี้มีวัตถุประสงค์เพื่อเปรียบเทียบวิธีการคัดกรองตัวแปรอิสระจากวิธี Lasso, Adaptive Lasso และ Elastic Net สำหรับการทดสอบกลุ่มของสัมประสิทธิ์การถดถอยที่มีมิติสูง โดยใช้เทคนิคการจัดกลุ่มแบบเป็นลำดับชั้น ในการจัดกลุ่มตัวแปรตามความสัมพันธ์ของตัวแปรอิสระ จากนั้นจึงใช้วิธีการแบ่งข้อมูลแบบสุ่มหลายๆครั้ง เพื่อหาค่า p-value ของกลุ่มสัมประสิทธิ์การถดถอยแต่ละกลุ่ม โดยการศึกษานี้จะเปรียบเทียบประสิทธิภาพของวิธีคัดกรองตัวแปรอิสระจากการจำลองข้อมูลและใช้ข้อมูลจริงที่มีขอบเขตต่างๆกัน โดยในส่วนของข้อมูลจำลองมีอัตราส่วนของขนาดตัวอย่างต่อจำนวนตัวแปรเท่ากับ 100: 500 และ 100:1000 และความสัมพันธ์ของตัวแปรอิสระเป็น 0.0 , 0.5 และ 0.9 ขณะที่ในส่วนของข้อมูลจริงจะมีความสัมพันธ์ของตัวแปรแปรอิสระเป็น 2 แบบคือมีความสัมพันธ์แบบปกติและมีความสัมพันธ์กันสูง ทั้งนี้จะใช้อัตราความผิดพลาดรวม และอำนาจการทดสอบเป็นเครื่องมือในการเปรียบเทียบและการวัดประสิทธิภาพ การศึกษาภายใต้ขอบเขตดังกล่าวผลปรากฏว่าการคัดกรองตัวแปรทั้ง 3 วิธีให้อำนาจการทดสอบต่ำ ซึ่งเมื่อเปรียบเทียบการคัดกรอง 3 วิธีพบว่า วิธี Lasso มีอำนาจการทดสอบมากที่สุด รองลงมาคือวิธี Adaptive Lasso และ วิธี Elastic Net ตามลำดับ แต่เมื่อพิจารณาถึงอัตราความผิดพลาดรวม พบว่าวิธี Adaptive Lasso และวิธี Elastic Net มีค่าต่ำที่สุด |
en_US |
dc.description.abstractalternative |
This research is aimed to compare the variable screening methods including Lasso, Adaptive Lasso and Elastic Net for hierarchical testing of high-dimensional regression coefficients. Hierarchical Clustering is employed to group independents variables based on their correlations. Multi-split method is then used to obtain p-values for each group of regression coefficients. Simulated data and real data are carried out to compare the performance of variable screening methods. For simulated data, we consider the case when ratios of the sample size and number of independent variables are 100:500 and 100:1000 and the correlation among independent variables are 0.0 , 0.5 and 0.9. For real data sets, normal correlation and high correlation among independent variables are considered here. Family wise error rate and power of the test are computed to compare the performance of variable screening methods. In this study, we found that all three screening methods have low power. Furthermore, Lasso has the largest power followed by Adaptive Lasso and Elastic Net respectively. However, Adaptive Lasso and Elastic Net has lower family wise error rate than Lasso. |
en_US |
dc.language.iso |
th |
en_US |
dc.publisher |
จุฬาลงกรณ์มหาวิทยาลัย |
en_US |
dc.relation.uri |
http://doi.org/10.14457/CU.the.2014.1131 |
|
dc.rights |
จุฬาลงกรณ์มหาวิทยาลัย |
en_US |
dc.subject |
การวิเคราะห์การถดถอย |
|
dc.subject |
Regression analysis |
|
dc.subject |
Hierarchical clustering (Cluster analysis) |
|
dc.title |
การเปรียบเทียบวิธีคัดกรองตัวแปรสำหรับการทดสอบกลุ่มของสัมประสิทธิ์การถดถอยที่มีมิติสูงแบบเป็นลำดับชั้น |
en_US |
dc.title.alternative |
A COMPARISON OF VARIABLE SCREENING METHODS FOR HIERARCHICAL TESTING OF HIGH-DIMENSIONAL REGRESSION COEFFICIENTS |
en_US |
dc.type |
Thesis |
en_US |
dc.degree.name |
วิทยาศาสตรมหาบัณฑิต |
en_US |
dc.degree.level |
ปริญญาโท |
en_US |
dc.degree.discipline |
สถิติ |
en_US |
dc.degree.grantor |
จุฬาลงกรณ์มหาวิทยาลัย |
en_US |
dc.email.advisor |
Vitara.P@Chula.ac.th,vitara@cbs.chula.ac.th |
en_US |
dc.identifier.DOI |
10.14457/CU.the.2014.1131 |
|