DSpace Repository

การเปรียบเทียบวิธีการประมาณค่าสัมประสิทธิ์การถดถอยในโลจิสติค กรณีข้อมูลผิดปกติ

Show simple item record

dc.contributor.advisor กัลยา วานิชย์บัญชา
dc.contributor.author ไพลิน ชิ้นฟัก
dc.contributor.other จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี
dc.date.accessioned 2012-02-11T01:37:46Z
dc.date.available 2012-02-11T01:37:46Z
dc.date.issued 2552
dc.identifier.uri http://cuir.car.chula.ac.th/handle/123456789/16777
dc.description วิทยานิพนธ์ (สต.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2552 en
dc.description.abstract การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อเปรียบเทียบวิธีการประมาณค่าสัมประสิทธิ์การถดถอยในโลจิสติค กรณีที่มีค่าผิดปกติ โดยทำการศึกษาวิธีการประมาณค่า 4 วิธี คือ วิธีความควรจะเป็นสูงสุดแบบถ่วงน้ำหนักของ Croux และ Haesbroeck วิธีการประมาณค่าสัมประสิทธิ์การถดถอยด้วยวิธีความควรจะเป็นสูงสุดแบบถ่วงน้ำหนักของ Rousseeuw และ Christmann วิธีการประมาณค่าสัมประสิทธิ์การถดถอยด้วยวิธีความควรจะเป็นสูงสุดแบบถ่วงน้ำหนักของ Daniel และวิธีประมาณค่าสัมประสิทธิ์การถดถอยของ Hobza, Pardo และ Vajda โดยกำหนดให้มีตัวแปรอิสระ X1 และ X2 มีการแจกแจงแบบปกติ และแบบชี้กำลังและกำหนดให้ตัวแปรอิสระในแต่ละการแจกแจงมีค่าผิดปกติ เกณฑ์ที่ใช้เปรียบเทียบ คือร้อยละของค่าคลาดเคลื่อนเฉลี่ยสัมบูรณ์ (Mean Absolute Percentage Error : MAPE) ของตัวประมาณค่าในแต่ละสถานการณ์ของการทดลอง กำหนดขนาดตัวอย่าง เท่ากับ 20, 50, 70, 80, 90 และ 100 กำหนดสัดส่วนการปลอมปน เท่ากับ 0.00, 0.05, 0.10 และ 0.15 กำหนดระดับความรุนแรงของการปลอมปน 2 ระดับ คือ ระดับไม่รุนแรง และระดับรุนแรง กำหนดสัมประสิทธิ์การถดถอย เท่ากับ, และ และการวิจัยครั้งนี้ใช้การทดลองแบบมอนติคาร์โล และทำการทดลองซ้ำๆ กัน จนกว่าค่าประมาณสัมประสิทธิ์ การถดถอยในรอบที่ กับรอบที่ มีค่าน้อยกว่า 0.0001 ผลการวิจัยสรุปได้ดังนี้ ผลการวิจัยปรากฏว่าค่าผิดปกติ สัดส่วนการปลอมปน และขนาดตัวอย่าง มีผลต่อค่า MAPE ของวิธีการประมาณค่าสัมประสิทธิ์การถดถอยทั้ง 4 วิธี โดยค่า MAPE ของทุกวิธีมีแนวโน้มลดลง เมื่อขนาดตัวอย่างเพิ่มขึ้น ขณะที่สัดส่วนการปลอมปนคงที่ และมีแนวโน้มเพิ่มขึ้นเมื่อสัดส่วนการปลอมปนเพิ่มขึ้น ขณะที่ขนาดตัวอย่างคงที่ ส่วนการกำหนดค่าสัมประสิทธิ์การถดถอยที่แตกต่างกันนั้นไม่มีผลต่อค่า MAPE ทั้งกรณีที่ตัวแปรอิสระมีการแจงแบบปกติ และชี้กำลัง พบว่า ส่วนใหญ่วิธีการประมาณค่าสัมประสิทธิ์การถดถอยด้วยวิธีความควรจะเป็นสูงสุดแบบถ่วงน้ำหนักของ Daniel เป็นวิธีการประมาณที่ให้ค่า MAPE ต่ำที่สุด โดยเฉพาะเมื่อ ขนาดตัวอย่าง เท่ากับ 20 รองลงมาคือ วิธีการประมาณค่าสัมประสิทธิ์การถดถอยด้วยวิธีความควรจะเป็นสูงสุดแบบถ่วงน้ำหนักของ Rousseeuw และ Christmann และวิธีความควรจะเป็นสูงสุดแบบถ่วงน้ำหนักของ Croux และ Haesbroeck แต่เมื่อทำการทดสอบจากการวิเคราะห์ความแปรปรวนทางเดียว (One-Way ANOVA) พบว่าค่า MAPE เฉลี่ยของแต่ละวิธีไม่แตกต่างกัน en
dc.description.abstractalternative The objective of this research is to compare the estimation methods of parameters in logistic regression model with outliers . The estimation methods are Weight Maximum Likelihood Method of Croux and Haesbroeck, Weight Maximum Likelihood Method of Rousseeuw and Christmann, Weight Maximum Likelihood Method of Daniel and Maximum Likelihood Method of Hobza, Pardo and Vajda of parameter. There are two level of outliers, mild and extreme, and four proportions of contamination 0.00, 0.05, 0.10 and 0.15. Mean Absolute Percentage Error (MAPE) is the criterion of comparison. The sample sizes are 20, 50,70,80,90 and 100. Coefficient are, and . Distribution of independent variable are normal and exponential. Simulation data and Monte Carlo method are used to compute MAPE. The experiment was repeated until the difference of parameters between of iteration and less than 0.0001 under each situations. Results of the research are as follows: In most case, Weight Maximum Likelihood Method of Daniel have smallest MAPE ,especially when sample sizes is 20 . Next Weight Maximum Likelihood Method of Rousseeuw and Christmann and Maximum Likelihood Method of Hobza, Pardo and Vajda and Weight Maximum Likelihood Method of Croux and Haesbroeck repectively. MAPE of multivariate normal of independent less than exponential. MAPE of parameters increase when level of outliers and proportion of outliers contamination increase but they decrease when sample sizes increase. The level of outliers, proportion of outliers contamination and sample sizes have effected on parameters estimates. But differentness of coefficient have not effected on parameters estimates en
dc.format.extent 7102613 bytes
dc.format.mimetype application/pdf
dc.language.iso th es
dc.publisher จุฬาลงกรณ์มหาวิทยาลัย en
dc.relation.uri http://doi.org/10.14457/CU.the.2009.1392
dc.rights จุฬาลงกรณ์มหาวิทยาลัย en
dc.subject การวิเคราะห์การถดถอยโลจิสติก en
dc.title การเปรียบเทียบวิธีการประมาณค่าสัมประสิทธิ์การถดถอยในโลจิสติค กรณีข้อมูลผิดปกติ en
dc.title.alternative Comparative methods of estimating parameters in logistic regression model with outliers en
dc.type Thesis es
dc.degree.name สถิติศาสตรมหาบัณฑิต es
dc.degree.level ปริญญาโท es
dc.degree.discipline สถิติ es
dc.degree.grantor จุฬาลงกรณ์มหาวิทยาลัย en
dc.email.advisor fcomkvn@acc.chula.ac.th
dc.identifier.DOI 10.14457/CU.the.2009.1392


Files in this item

This item appears in the following Collection(s)

Show simple item record