Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/58741
Title: | การประมาณค่าพารามิเตอร์ในตัวแบบความถดถอยโลจิสติกเมื่อมีค่าสูญหาย |
Other Titles: | Estimation of Parameters in Logistic Regression with Missing of Independent Variables |
Authors: | ประลองพล ประสงค์พร |
Advisors: | กัลยา วานิชย์บัญชา |
Other author: | จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี |
Advisor's Email: | fcomkvn@acc.chula.ac.th, Kanlaya.V@Chula.ac.th |
Subjects: | การวิเคราะห์การถดถอยโลจิสติก การประมาณค่าพารามิเตอร์ Logistic regression analysis Parameter estimation |
Issue Date: | 2551 |
Publisher: | จุฬาลงกรณ์มหาวิทยาลัย |
Abstract: | งานวิจัยนี้มีวัตถุประสงค์เพื่อศึกษาและเปรียบเทียบวิธีการประมาณค่าพารามิเตอร์เมื่อมีค่าสูญหายเกิดขึ้นในตัวแปรอิสระของตัวประมาณตัวแบบความถดถอยโลจิสติก ที่ประมาณค่าสูญหายด้วยวิธี Mean Imputation (MEAN) วิธี Maximum Likelihood Estimation (MLE) วิธี Pseudo Maximum Likelihood Estimation (PMLE) และวิธี The Filling Method (FILL) เมื่อมีค่าสูญหายเกิดขึ้นในกรณีที่มีตัวแปรอิสระ 2 ตัว และเกิดค่าสูญหายในตัวแปรอิสระตัวใดตัวหนึ่ง โดยการจำลองข้อมูลกำหนดขนาดตัวอย่าง 40, 70 , 90 , 100 , 200 และ 400 ร้อยละการสูญหายของตัวแปรอิสระคือร้อยละ 5 ,10 และ 15 และค่าสหสัมพันธ์ระหว่างตัวแปรอิสระคือ 0 ,0.1 และ 0.2 โดยกำหนดค่าพารามิเตอร์เริ่มต้นแบ่งเป็น 2 กรณี คือ β₀,β₁,β₂ = 0.2 และ β₀,β₁ = 0.2 และ β₂ = 0.2 = 1 พิจารณาเปรียบเทียบค่าเฉลี่ยของความแตกต่างระหว่างค่าจริงและค่าประมาณ และระยะห่างมาหาลาโนบิสเฉลี่ย (Average Mahalanobis Distance) เป็นเกณฑ์ประกอบในการตัดสินใจ ข้อมูลที่ใช้ในการวิจัยครั้งนี้ได้จากการจำลองด้วยเทคนิคมอนติคาโลโดยการกระทำซ้ำ 1,000 รอบ ในแต่ละสถานการณ์ ผลการวิจัยสรุปได้ดังนี้ การเปรียบเทียบค่า BIAS และค่า AMH ของทั้ง 4 วิธีพบว่า ในกรณีขนาดตัวอย่าง น้อยกว่า 90 วิธี MEAN จะให้ค่า BIAS และค่า AMH น้อยที่สุด แต่ในกรณีขนาดตัวอย่าง มากกว่า 90 วิธี FILL จะให้ค่า BIAS และค่า AMH น้อยที่สุด โดยที่ค่า BIAS และค่า AMH มีแนวโน้มลดลงเมื่อขนาดตัวอย่างเพิ่มขึ้น เนื่องจากจำนวนข้อมูลที่เพิ่มขึ้นจะทำให้ความคลาดเคลื่อนลดลง ค่า BIAS และค่า AMH มีแนวโน้มเพิ่มขึ้นเมื่อสัดส่วนข้อมูลสูญหายในตัวแปรอิสระเพิ่มขึ้นเนื่องจากเมื่อร้อยละการสูญหายเพิ่มขึ้นจะส่งผลให้ข้อมูลที่มีอยู่ลดลง ทำให้ค่าความคลาดเคลื่อนเพิ่มขึ้น เมื่อค่าพารามิเตอร์เริ่มต้นของตัวแปรอิสระเพิ่มขึ้นค่า BIAS และค่า AMH มีแนวโน้มเพิ่มขึ้น และเมื่อระดับความสัมพันธ์ระหว่างตัวแปรอิสระเพิ่มขึ้นค่า BIAS และค่า AMH มีแนวโน้มเพิ่มขึ้น |
Other Abstract: | This research is to study and compare estimation method for missing data of the independent variables in logistic regression. The methods used to estimate missing data are Mean Imputation (MEAN) , Maximum Likelihood Estimation (MLE) , Pseudo Maximum Likelihood Estimation (PMLE) and The Filling Method (FILL) in the case of two independent variables where only one independent variable is affected by missing values. The comparisons are done under condition of sample size of 40, 70 , 90 ,100 , 200 and 400 ; percentage of missing data of 5%,10% and 15% ; correlation in independent variables of 0 , 0.1 and 0.2 . Initial parameter at β₀,β₁,β₂ = 0.2 and β₀,β₁ = 0.2, β₂ = 1. The criteria of determination is the average difference between the estimates and the true parameter and Average Mahalanobis Distance (AMH). The data for this research is simulated by using the Monte Carlo simulation technique with 1,000 repetitions for each case. The results of this research are as follows : According to the comparison of Bias and AMH from four referred methods , it is found that when sample size is less than 90, MEAN method has a smallest BIAS and AMH. In case sample size is more than 90 , FILL method has smallest BIAS and AMH. The BIAS and AMH decreases when sample size increases because more sample decreases error but BIAS and AMH increases when the proportions of missing data in independents variables increase because increasing missing will decrease sample size. In case of initial parameters of independent variables increases, BIAS and AMH increase. In case of the level of correlation among independent variables increases, BIAS and AMH increases. |
Description: | วิทยานิพนธ์ (สต.ม.) -- จุฬาลงกรณ์มหาวิทยาลัย, 2551 |
Degree Name: | สถิติศาสตรมหาบัณฑิต |
Degree Level: | ปริญญาโท |
Degree Discipline: | สถิติ |
URI: | http://cuir.car.chula.ac.th/handle/123456789/58741 |
URI: | http://doi.org/10.14457/CU.the.2008.1067 |
metadata.dc.identifier.DOI: | 10.14457/CU.the.2008.1067 |
Type: | Thesis |
Appears in Collections: | Acctn - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Pralongpol Prasongporn.pdf | 1.3 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.