Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/27512
Title: การหาจุดแบ่งของตัวแบบการถดถอยโลจิสติกแบบ 2 ประเภทสำหรับการพยากรณ์การจำแนกข้อมูลโดยใช้ฟังก์ชันคอมพลีเมนทารี ล็อก ล็อก เป็นฟังก์ชันเชื่อมโยง
Other Titles: The cut–off point estimation of binary logistic regression model for predictive classification using complementary log-log function as a link function
Authors: นิภาพรรณ ไพจินดา
Advisors: สุพล ดุรงค์วัฒนา
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี
Advisor's Email: fcomsdu@acc.chula.ac.th
Subjects: การวิเคราะห์การถดถอยโลจิสติก
การประมาณค่าพารามิเตอร์
Issue Date: 2554
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อหาจุดแบ่งที่เหมาะสมที่สุดของตัวแบบถดถอยโลจิสติก 2 ประเภทสำหรับการพยากรณ์การจำแนกข้อมูลโดยใช้ฟังก์ชันคอมพลีเมนทารี ล็อก ล็อก เป็นฟังก์ชันเชื่อมโยง เพื่อพิจารณาว่าปัจจัยอื่นๆมีผลต่อการคัดเลือกจุดแบ่งที่ 0.5 หรือไม่ ปัจจัยที่สนใจศึกษาในงานวิจัยครั้งนี้ คือ สัดส่วนของความล้มเหลวของลักษณะที่สนใจศึกษา (a) เท่ากับ 0.25,0.5 และ 0.75 จำนวนตัวแปรอิสระ (p) คือ1, 2, 3, 4 และ 5 ขนาดของตัวอย่าง (n) คือ 50, 100, 150, 200 และ 250 ระดับความสัมพันธ์ของตัวแปรอิสระ 3 ระดับ คือ ต่ำ กลาง สูง ทำการจำลองข้อมูลทั้งหมดนี้โดยเทคนิคมอนติคาร์โลด้วยโปรแกรม R และทำการคำนวณหาจุดแบ่งโดยทฤษฎีของ ผลการวิจัยสรุปได้ดังนี้ กรณีที่อัตราส่วนของความล้มเหลวของลักษณะที่สนใจศึกษาเปลี่ยนแปลงแต่ปัจจัยอื่นคงที่พบว่า ที่จำนวนตัวแปรอิสระเท่ากับ 1 ตัวจะให้ค่าเฉลี่ยของจุดแบ่งไม่เกินค่า 0.5 สลับสูงต่ำไปมา และที่จำนวนตัวแปรอิสระเท่ากับ 2, 3, 4 และ 5 ค่าเฉลี่ยของจุดแบ่งส่วนใหญ่มีค่าเพิ่มขึ้น แต่ไม่มีค่าใดเกินค่า 0.5 กรณีที่ขนาดตัวอย่างเปลี่ยนแปลงแต่ปัจจัยอื่นคงที่ พบว่าที่จำนวนตัวแปรอิสระเท่ากับ 1 และ 2 ตัวจะให้ค่าเฉลี่ยของจุดแบ่งไม่เกินค่า 0.5 สลับสูงต่ำไปมา และที่จำนวนตัวแปรอิสระเท่ากับ 3, 4 และ 5 ค่าเฉลี่ยของจุดแบ่งส่วนใหญ่มีค่าเพิ่มขึ้น แต่ไม่เกินค่า 0.5 กรณีที่จำนวนตัวแปรอิสระเปลี่ยนแปลงแต่ปัจจัยอื่นคงที่ พบว่า ที่ทุกขนาดตัวอย่างจะให้ค่าเฉลี่ยของจุดแบ่งมีค่าลดลง และสุดท้ายกรณีที่อัตราส่วนของความล้มเหลวของลักษณะที่สนใจศึกษาเปลี่ยนแปลงแต่ปัจจัยอื่นคงที่พบว่า ที่จำนวนตัวแปรอิสระเท่ากับ 1 ตัวจะให้ค่าเฉลี่ยของจุดแบ่งคงที่แต่ไม่เกิน 0.5 และ ที่จำนวนตัวแปรอิสระเท่ากับ 2, 3, 4 และ 5 ค่าเฉลี่ยของจุดแบ่งส่วนใหญ่มีค่าเพิ่มสูงขึ้น
Other Abstract: The objective of this study is to find out the cut-off point estimation of binary logistic regression model for predictive classification using complementary log-log function as a link function. The interesting factors are failure rate (a) of the values 0.25,0.5, and 0.75, number of independent variables (p) are 1, 2, 3, 4, and 5, sample size (n) are 50,100,150,200 and 250. Degrees of multicollinearity among independent variables with 3 levels are low, medium, and high level. The data are generated using Monte Carlo technique through R-program. The results are summarized as follow. As the failure rates change while keeping other factors constant, only one number of independent variable gives the mean value of the cut-off points not exceeding 0.5 in the switching manner. When the number of independent variables increase to 2, 3, 4, and 5, the mean value of the cut-off points increases as well but none of them exceed 0.5. As the sample size changes and the other factors are kept constant, the number of independent variables of 1 and 2 gives the mean value of the cut-off points not exceeding 0.5; also switching. When the number of independent variables increases to 3, 4, and 5, most of the mean values of the cut-off points increase but not exceeding the value of 0.5. As the number of the independent variables change and the other factors are kept constant, the mean value of the cut-off points is found to be increased at every level of the sample sizes. Finally, as the failure rates change when the other factors are kept constant; at the number of independent variable equal to 1, the mean value of the cut-off points is found to be constant not exceeding 0.5. When the number of independent variables increase to 2, 3, 4, and 5, the mean value of the cut-off points increase.
Description: วิทยานิพนธ์ (สต.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2554
Degree Name: สถิติศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: สถิติ
URI: http://cuir.car.chula.ac.th/handle/123456789/27512
URI: http://doi.org/10.14457/CU.the.2011.2000
metadata.dc.identifier.DOI: 10.14457/CU.the.2011.2000
Type: Thesis
Appears in Collections:Acctn - Theses

Files in This Item:
File Description SizeFormat 
nipapan_pa.pdf2.5 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.