DSpace Repository

การเปรียบเทียบวิธีการใส่ค่าสูญหาย ในตัวแบบการถดถอยเชิงเส้นพหุที่ตัวแปรอิสระมีการสูญหายแบบนอนอิกนอร์เรเบิลที่สัมพันธ์กัน

Show simple item record

dc.contributor.advisor อนุภาพ สมบูรณ์สวัสดี
dc.contributor.author ศุภสันติ์ ดีมาก
dc.contributor.other จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี
dc.date.accessioned 2023-08-04T06:41:31Z
dc.date.available 2023-08-04T06:41:31Z
dc.date.issued 2565
dc.identifier.uri https://cuir.car.chula.ac.th/handle/123456789/82735
dc.description วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2565
dc.description.abstract งานวิจัยนี้มีจุดประสงค์เพื่อศึกษาและเปรียบเทียบวิธีการประมาณสูญหายในตัวแบบการถดถอยเชิงเส้นพหุคูณ ที่ตัวแปรอิสระมีการสูญหายแบบนอนอิกนอร์เรเบิลที่มีความสัมพันธ์กัน ในการศึกษานี้มีวิธีการที่ถูกพัฒนาขึ้นคือ Expected Regression Imputation (ERI) และ Conditional Expected Regression Imputation (CERI) โดยจะเปรียบเทียบประสิทธิภาพวิธีการที่พัฒนาขึ้นมากับอีก 3 วิธีการ ได้แก่ วิธี K-Nearest Neighbor Imputation (KNN), วิธี Expectation Maximization Algorithm (EM) และ วิธี Predictive Mean Matching Imputation (PMM) ) การศึกษานี้ได้ควบคุมปัจจัยความแปรปรวนของตัวแปรอิสระ, ความสัมพันธ์ของตัวแปรอิสระ, ส่วนเบี่ยงเบนมาตรฐานค่าความคลาดเคลื่อน, ร้อยละการสูญหายและระดับ Nonignorability โดยวิธีการที่ให้ค่าเฉลี่ยของค่าเฉลี่ยความคลาดเคลื่อนกำลังสอง (Average mean square error) น้อยที่สุดจะเป็นวิธีการที่มีประสิทธิภาพสูงที่สุด ผลการวิจัยพบว่า เมื่อข้อมูลมีการกระจายตัวสูงและกลางวิธี KNN มีประสิทธิภาพสูงสุดในทุกกรณีที่ศึกษา แต่ถ้าข้อมูลกระจายตัวต่ำ วิธี KNN จะดีเมื่อกรณีตัวแปรมีความสัมพันธ์กันสูงและร้อยละการสูญหายต่ำ วิธี EM จะประสิทธิภาพสูงเมื่อร้อยละการสูญหายสูงในทุกระดับความสัมพันธ์ วิธี ERI จะประสิทธิภาพสูงเมื่อตัวแปรมีความสัมพันธ์เชิงบวกในระดับกลางลงไปในเกือบทุกกรณีที่ศึกษา วิธี CERI จะประสิทธิภาพสูงเมื่อตัวแปรมีความสัมพันธ์เชิงลบในระดับกลางลงไปและร้อยละการสูญหายต่ำ
dc.description.abstractalternative The objective of this research was study and compare imputation methods for independent variables for multiple linear regression model with correlated-nonignorable-missing independent variables. In this study, methods were developed, namely the Expected Regression (ERI) and Conditional Expected Regression Imputation. Comparison of the efficiency of develop methods with 3 methods, namely K-Nearest Neighbor (KNN), Expectation Maximization (EM) and Predictive Mean Matching (PMM). This research has controlled the variance factor of independent variables, the correlation of independent variables, standard deviations of error, missing proportion of data and Nonignorability Level. By the method that makes the average mean square error as little as possible, it is considered the most effective method. The study found that when High and Middle dispersion The KNN method was most effective in all cases studied. But if Low dispersion, KNN was good when variable cases have a high relationship and low missing proportion. The EM method will be high efficiency when the missing proportion is high at all correlation levels. The ERI method was highly effective when variables have a positive correlation in the intermediate or low level in almost all cases studied. The CERI method was high efficiency when variables have a negative correlation in the middle or low to each other and the percentage of loss is low.
dc.language.iso th
dc.publisher จุฬาลงกรณ์มหาวิทยาลัย
dc.relation.uri http://doi.org/10.58837/CHULA.THE.2022.964
dc.rights จุฬาลงกรณ์มหาวิทยาลัย
dc.subject.classification Information and communication
dc.subject.classification Statistics
dc.title การเปรียบเทียบวิธีการใส่ค่าสูญหาย ในตัวแบบการถดถอยเชิงเส้นพหุที่ตัวแปรอิสระมีการสูญหายแบบนอนอิกนอร์เรเบิลที่สัมพันธ์กัน
dc.title.alternative Comparison of the imputation methods in the multiple linear regression model with correlated-nonignorable-missing independent variables 
dc.type Thesis
dc.degree.name วิทยาศาสตรมหาบัณฑิต
dc.degree.level ปริญญาโท
dc.degree.discipline สถิติ
dc.degree.grantor จุฬาลงกรณ์มหาวิทยาลัย
dc.identifier.DOI 10.58837/CHULA.THE.2022.964


Files in this item

This item appears in the following Collection(s)

Show simple item record