DSpace  
 

CUIR at Chulalongkorn University >
Faculty and Institute >
Faculty of Commerce and Accountancy - Acctn >
Acctn - Theses >

Please use this identifier to cite or link to this item: http://cuir.car.chula.ac.th/handle/123456789/52363

Title: การเปรียบเทียบวิธีการประมาณค่าสูญหายแบบนอนอิกนอร์เรเบิล ในการวิเคราะห์การถดถอยโลจิสติก
Other Titles: A COMPARISON OF THE ESTIMATION METHODS FOR NONIGNORABLE MISSING-DATA IN LOGISTIC REGRESSION ANALYSIS
Authors: ภัทฐิดา นิลภัทรฉัตร
Advisor: อนุภาพ สมบูรณ์สวัสดี
Advisor's Email: Anupap.S@Chula.ac.th,mr.anupap@gmail.com,anupap@cbs.chula.ac.th,anupap@cbs.chula.ac.th
Issue Date: 2559
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: งานวิจัยนี้มีวัตถุประสงค์เพื่อเปรียบเทียบวิธีการประมาณค่าสูญหายของตัวแปรอิสระที่มีการสูญหายแบบนอนอิกนอร์เรเบิล ในการวิเคราะห์การถดถอยโลจิสติกแบบ 2 กลุ่ม เมื่อมีตัวแปรอิสระ 3 ตัว และเกิดการสูญหายในตัวแปรอิสระตัวใดตัวหนึ่ง โดยวิธีการประมาณค่าสูญหายที่ใช้ในงานวิจัยนี้ คือ วิธี Mean Imputation (MEAN) วิธี Median Imputation (MED) วิธี K-Nearest Neighbor (KNN) และ วิธี Multiple Imputation (MI) ข้อมูลที่ใช้ในการศึกษาได้จากการจำลองข้อมูล โดยกำหนดขนาดตัวอย่าง 70, 100 และ 200 ตัวแปรอิสระที่เกิดการสูญหายมีร้อยละของการสูญหายโดยเฉลี่ย 3 ระดับ คือ ร้อยละ 10, 20 และ 30 มีระดับการสูญหายแบบนอนอิกนอร์เรเบิล 3 ระดับ คือ การสูญหายแบบอิกนอร์เรเบิล การสูญหายแบบนอนอิกนอร์เรเบิลระดับปานกลาง และ การสูญหายแบบนอนอิกนอร์เรเบิลระดับสูง และกำหนดค่าสัมประสิทธิ์การถดถอยของตัวแปรอิสระทั้ง 3 ตัว คือ 0.5, 1 และ 1.5 ตามลำดับ ทำการจำลองในแต่ละสถานการณ์เป็นจำนวน 5,000 รอบ และเกณฑ์ที่ใช้ในการเปรียบเทียบแต่ละวิธี คือ ค่าเฉลี่ยของค่าเฉลี่ยความคลาดเคลื่อนกำลังสอง (Average Mean Square Error: AMSE) พบว่า i) วิธี MI จะมีประสิทธิภาพ เมื่อค่าสัมประสิทธิ์การถดถอยของตัวแปรอิสระที่สูญหายมีค่าต่ำ และขนาดตัวอย่างมีขนาดเล็ก ii) วิธี MEAN และ วิธี MED จะมีประสิทธิภาพ เมื่อค่าสัมประสิทธิ์การถดถอยของตัวแปรอิสระที่สูญหายมีค่าสูง และขนาดตัวอย่างมีขนาดใหญ่ iii) ค่า AMSE มีแนวโน้มเพิ่มขึ้น เมื่อร้อยละการสูญหายและสัดส่วนการสูญหายแบบนอนอิกนอร์เรเบิลเพิ่มขึ้น iv) ค่า AMSE มีแนวโน้มเพิ่มขึ้น เมื่อค่าสัมประสิทธิ์การถดถอยของตัวแปรอิสระที่สูญหายมีค่าสูง
Other Abstract: The objective of this research is to compare the estimation methods for nonignorable missing-data of the independent variables in binary logistic regression models with three independent variables. The estimation methods considered in study are Mean Imputation (MEAN), Median Imputation (MED), K-Nearest Neighbor (KNN) and Multiple Imputation (MI). Data of this research are simulated with three sample sizes of 70, 100 and 200. Three levels of missing proportion of data are 10%, 20% and 30% and three levels of nonignorable-missingness of data are ignorable, middle nonignorable and high nonignorable. Coefficients of three independent variables in simulation are set to be 0.5, 1 and 1.5, respectively. The comparison of each methods using the average mean square error (AMSE), the findings are as follows: i) MI method yield higher performance when coefficients of independent variables are low and small sample sizes, ii) MEAN method and MED method yield higher performance when coefficients of independent variables are high and large sample sizes. Iii) the AMSE increase when proportion of nonignorable-missingness of data increase, iv) the AMSE increase when coefficients of independent variables increases.
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2559
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
URI: http://cuir.car.chula.ac.th/handle/123456789/52363
Appears in Collections:Acctn - Theses

Files in This Item:

File Description SizeFormat
5781563326.pdf3.33 MBAdobe PDFView/Open  (Chula only)
View Statistics

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

Valid XHTML 1.0! DSpace Software Copyright © 2002-2010  Duraspace - Feedback