DSpace Repository

การเปรียบเทียบวิธีการใส่ค่าข้อมูลสูญหายแบบนอนอิกนอร์เรเบิลในการวิเคราะห์อนุกรมเวลาที่มีคุณสมบัติคงที่

Show simple item record

dc.contributor.advisor อนุภาพ สมบูรณ์สวัสดี en_US
dc.contributor.author ธีรเดช สิงห์อินทร์ en_US
dc.contributor.other จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี en_US
dc.date.accessioned 2016-12-01T08:06:20Z
dc.date.available 2016-12-01T08:06:20Z
dc.date.issued 2558 en_US
dc.identifier.uri http://cuir.car.chula.ac.th/handle/123456789/50394
dc.description วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2558 en_US
dc.description.abstract ข้อมูลสูญหายไปในข้อมูลอนุกรมเวลาเป็นปัญหาที่พบบ่อยในการวิเคราะห์ทางสถิติ ซึ่งอาจเกิดขึ้นเนื่องจากสาเหตุหลายๆประการเพื่อที่จะประมาณค่าสูญหายให้เกิดความถูกต้องแม่นยำนั้นเป็นสิ่งจำเป็นที่จะต้องเลือกวิธีการที่เหมาะสมซึ่งขึ้นอยู่กับชนิดและกลไกที่ทำให้เกิดค่าสูญหาย เพื่อทำให้ค่าประมาณที่ได้ดีที่สุดของค่าสูญหาย ในการศึกษาครั้งนี้ได้มีวัตถุประสงค์เพื่อเปรียบเทียบวิธีการใส่ค่าสูญหายสำหรับการวิเคราะห์อนุกรมเวลาที่มีข้อมูลสูญหาย การศึกษานี้ ใช้วิธี Mean Imputation วิธี LOCF และวิธี EM Algorithm ข้อมูลที่ใช้ในการศึกษาได้จากการจำลองข้อมูล โดยมีสัดส่วนการสูญหาย 3 ระดับ คือ 10%, 20% และ 30% มีระดับการสูญหายแบบนอนอิกนอร์เรเบิล 3 ระดับ คือ ไม่มี ปานกลาง และสูง จากการเปรียบเทียบแต่ละวิธีการโดยใช้ค่าเฉลี่ยของค่าเฉลี่ยค่าสัมบูรณ์เปอร์เซ็นต์ความคลาดเคลื่อน (Average Mean Absolute Percentage Error : AMAPE) พบว่า i) สำหรับตัวแบบAR(1) วิธีการใส่ค่าสูญหายวิธี Mean Imputation จะมีประสิทธิภาพดีที่สุดในกรณีที่ขนาดตัวอย่างมีขนาดเล็ก (n=50,100) และพารามิเตอร์แสดงค่าของกระบวนการถดถอยในตัวอันดับที่ 1 เป็น 0.2 ii) วิธี EM Algorithm มีประสิทธิภาพดีที่สุดในกรณีที่พารามิเตอร์แสดงค่าของกระบวนการถดถอยในตัวอันดับที่ 1 เป็น 0.5 iii) วิธี LOCF มีประสิทธิภาพดีที่สุดในกรณีที่ขนาดตัวอย่างมีขนาดเล็ก (n=50,100) และพารามิเตอร์แสดงค่าของกระบวนการถดถอยในตัวอันดับที่ 1 เป็น 0.8 iv) สำหรับตัวแบบAR(2) วิธีการใส่ค่าสูญหายวิธี Mean Imputation จะมีประสิทธิภาพดีที่สุดในกรณีที่พารามิเตอร์แสดงค่าของกระบวนการถดถอยในตัวอันดับที่ 1 และ2 เป็น 0.1 v) วิธีการใส่ค่าสูญหายวิธี Mean Imputation จะมีประสิทธิภาพดีที่สุดในกรณีที่ขนาดตัวอย่างมีขนาดเล็ก (n=50) และ ในกรณีที่พารามิเตอร์แสดงค่าของกระบวนการถดถอยในตัวอันดับที่ 1 และ2 เป็น 0.25 vi) วิธีการใส่ค่าสูญหายวิธี EM Algorithmจะมีประสิทธิภาพดีที่สุดในกรณีที่พารามิเตอร์แสดงค่าของกระบวนการถดถอยในตัวอันดับที่ 1 และ2 เป็น 0.4 en_US
dc.description.abstractalternative Missing data in time series data is a common problem in statistical analysis that occurs due to many reasons. In order to estimate missing values accurate, it is necessary to select an appropriate method depending on the type and mechanisms generating missing values so as to obtain the best possible estimates of missing values. The purpose of this study is to compare the imputation methods for time series analysis with missing data. The imputation methods were Mean imputation, LOCF, and EM Algorithm. The data were simulated under three levels of missing percentages of data 10%, 20% and 30%, three levels of nonignorable-missingness of none, medium, high. The comparison of each imputation methods using the size of average mean absolute percentage error (AMAPE), the findings are the followings: i) for first order autoregressive model, Mean Imputation perform test when the sample size is small (n=50,100) and parameter first order autoregressive process equal 0.2, ii) EM Algorithm perform best when parameter first order autoregressive process equal 0.5, iii) LOCF perform best when the sample size is small (n=50,100) and parameter first order autoregressive process equal 0.8, iv) for second order autoregressive model, Mean Imputation perform best when parameter first order autoregressive process and second order autoregressive process equal 0.1, v) Mean Imputation perform best when the sample size is small (n=50) and parameter first order autoregressive process and second order autoregressive process equal 0.25, vi) EM Algorithm perform best when parameter first order autoregressive process and second order autoregressive process equal 0.4. en_US
dc.language.iso th en_US
dc.publisher จุฬาลงกรณ์มหาวิทยาลัย en_US
dc.relation.uri http://doi.org/10.14457/CU.the.2015.972
dc.rights จุฬาลงกรณ์มหาวิทยาลัย en_US
dc.subject ข้อมูลสูญหาย (สถิติ)
dc.subject การวิเคราะห์อนุกรมเวลา
dc.subject Missing observations (Statistics)
dc.subject Time-series analysis
dc.title การเปรียบเทียบวิธีการใส่ค่าข้อมูลสูญหายแบบนอนอิกนอร์เรเบิลในการวิเคราะห์อนุกรมเวลาที่มีคุณสมบัติคงที่ en_US
dc.title.alternative Comparison of the imputation methods for nonignorable missing data in time series analysis with stationary en_US
dc.type Thesis en_US
dc.degree.name วิทยาศาสตรมหาบัณฑิต en_US
dc.degree.level ปริญญาโท en_US
dc.degree.discipline สถิติ en_US
dc.degree.grantor จุฬาลงกรณ์มหาวิทยาลัย en_US
dc.email.advisor Anupap.S@Chula.ac.th,mr.anupap@gmail.com,anupap@cbs.chula.ac.th,mr.anupap@gmail.com en_US
dc.identifier.DOI 10.14457/CU.the.2015.972


Files in this item

This item appears in the following Collection(s)

Show simple item record