Please use this identifier to cite or link to this item: http://cuir.car.chula.ac.th/handle/123456789/18753
Title: ตัวแบบโพรบิตแบบ 2 ประเภท สำหรับการพยากรณ์การจำแนกข้อมูลไม่จำกัดกลุ่ม
Other Titles: Binary probit model for ungrouped-data predictive classification
Authors: ชลลดา กล้วยไม้
Advisors: สุพล ดุรงค์วัฒนา
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี
Advisor's Email: fcomsdu@acc.chula.ac.th
Subjects: วิธีมอนติคาร์โล
การคำนวณเชิงตัวเลข
Issue Date: 2553
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อหาค่าของจุดแบ่งที่เหมาะสมที่สุดสำหรับการพยากรณ์การจำแนกข้อมูลไม่จัดกลุ่มโดยใช้ตัวแบบโพรบิตแบบ 2 ประเภท ปัจจัยที่นำมาพิจารณาคือ จำนวนตัวแปรอิสระ (p) แบ่งเป็น 3 ระดับ คือ น้อย(p=1, 2) ปานกลาง(p= 3, 4) และ มาก(p= 5,6) ขนาดตัวอย่าง (n) แบ่งเป็น 3 ระดับ คือ เล็ก(n=20,40) ปานกลาง (n=60,80) และใหญ่(p=100 ,120) สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจ (a) เท่ากับ 0.1,0.5 และ 0.9 ระดับความสัมพันธ์ระหว่างของตัวแปรอิสระ (M) เท่ากับ 0, 0.33,0.67 และ 0.99 ข้อมูลทั้งหมดนี้ใช้การจำลองโดยเทคนิคมอนติคาร์โล ด้วยโปรแกรม R การหาค่าของจุดแบ่งใช้ทฤษฎีของ Hadjicostas P. (2006) จากการวิจัยสรุปผลได้ดังนี้ กรณีที่จำนวนตัวแปรอิสระเปลี่ยนแปลงไป แต่ปัจจัยอื่นๆ คงที่ จะพบว่าค่าจุดของแบ่งที่สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจเท่ากับ0.1และ 0.9 จะลู่เข้าหาค่าจุดของแบ่งที่สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจเท่ากับ 0.5 ซึ่งมีค่าประมาณ 0.5 กรณีที่ขนาดตัวอย่างเปลี่ยนแปลงไป แต่ปัจจัยอื่นๆ คงที่ จะพบว่าค่าจุดของแบ่งที่สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจเท่ากับ 0.5 จะลู่เข้าหาค่า 0.5 แต่ที่สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจอื่นๆ ค่าของจุดแบ่งมีค่าต่ำกว่าค่า 0.5 กรณีที่สัดส่วนการไม่เกิดเหตุการณ์ที่สนใจเปลี่ยนแปลงไป แต่ปัจจัยอื่น ๆ คงที่ พบว่าที่สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจเท่ากับ 0.5 ค่าของจุดแบ่งมีค่าสูงที่สุดและลู่เข้าหาค่า 0.5 กรณีที่ระดับความสัมพันธ์ระหว่างตัวแปรอิสระเปลี่ยงแปลงไป แต่ปัจจัยอื่นๆ คงที่ พบว่าที่สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจเท่ากับ 0.5 ค่าจุดแบ่งจะมีค่าลดลงจากค่า 0.5 แต่ที่ค่าอื่นๆ ค่าจุดแบ่งจะมีค่าลดลงจนถึงระดับความสัมพันธ์ระหว่างตัวแปรอิสระเท่ากับ 0.67 และจะเพิ่มขึ้นอีกเล็กน้อย จากการประมาณค่าของจุดแบ่งจากตัวแบบโพรบิตแบบ 2 ประเภท ที่มีผลอันตรกิริยา (Interaction) พบว่าค่าของสัมประสิทธิ์การตัดสินใจ (R²) มีค่าสูง แสดงว่าสมการการถดถอยมีความเหมาะสมสามารถนำไปใช้ประมาณค่าของจุดแบ่งที่เหมาะสมในสถานการณ์อื่นๆ ได้
Other Abstract: The objective of this study is to find out the optimal cut-off point for predictive classification of ungrouped data using binary probit model. The interesting factors are the number of independent variables (p) with 3 levels; low level (p=1, 2), medium level (p= 3, 4) and high level (p=5,6), the sample size (n) with 3 levels ; low level (n=20,40), medium level (n=60,80) and high level (n=100,120), the failure rate (a) of the values 0.1,0.5 and 0.9 and the degree of multicollinearity among independent variables (M) of the values 0, 0.33, 0.67 and 0.99. The data in all situations are generated using Monte Carlo technique through R-program. The cut-off point is captured using Hadjicostas P. (2006) theory. The results can be summarized as follow: As the number of independent variables changed but the other factors are kept constant, with the failure rate equal to 0.1 and 0.9, the optimal cut-off point converges approximately to 0.5 as the failure rate equals to 0.5. As sample size changed but the other factors are kept constant, with the failure rate equals to 0.5, the optimal cut-off point converges approximately to 0.5. For the other situations, the optimal cut-off point are lower than 0.5. As the failure rate in data set changed but the other factors are kept constant, with the failure rate equals to 0.5, the optimal cut-off point is the highest and converges approximately to 0.5. As the degree of multicollinearity among independent variables changed but the other factors are kept constant, with the failure rate equals to 0.5, the optimal cut-off point decreases from 0.5. For the other situations, the optimal cut-off point decreases to M =0.67 then slightly increases. Finally the estimated binary probit model with all interaction terms is needed to find the estimated cut-off point for all situations. The R² is needed to measure the goodness-of-fit of the estimated model. From the estimated regression equation, the optimal cut-off point for any situation can be predicted
Description: วิทยานิพนธ์ (สต.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2553
Degree Name: สถิติศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: สถิติ
URI: http://cuir.car.chula.ac.th/handle/123456789/18753
Type: Thesis
Appears in Collections:Acctn - Theses

Files in This Item:
File Description SizeFormat 
Cholada_kl.pdf4.99 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.