DSpace Repository

ตัวแบบโพรบิตแบบ 2 ประเภท สำหรับการพยากรณ์การจำแนกข้อมูลไม่จำกัดกลุ่ม

Show simple item record

dc.contributor.advisor สุพล ดุรงค์วัฒนา
dc.contributor.author ชลลดา กล้วยไม้
dc.contributor.other จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี
dc.date.accessioned 2012-03-26T22:28:18Z
dc.date.available 2012-03-26T22:28:18Z
dc.date.issued 2553
dc.identifier.uri http://cuir.car.chula.ac.th/handle/123456789/18753
dc.description วิทยานิพนธ์ (สต.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2553 en
dc.description.abstract การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อหาค่าของจุดแบ่งที่เหมาะสมที่สุดสำหรับการพยากรณ์การจำแนกข้อมูลไม่จัดกลุ่มโดยใช้ตัวแบบโพรบิตแบบ 2 ประเภท ปัจจัยที่นำมาพิจารณาคือ จำนวนตัวแปรอิสระ (p) แบ่งเป็น 3 ระดับ คือ น้อย(p=1, 2) ปานกลาง(p= 3, 4) และ มาก(p= 5,6) ขนาดตัวอย่าง (n) แบ่งเป็น 3 ระดับ คือ เล็ก(n=20,40) ปานกลาง (n=60,80) และใหญ่(p=100 ,120) สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจ (a) เท่ากับ 0.1,0.5 และ 0.9 ระดับความสัมพันธ์ระหว่างของตัวแปรอิสระ (M) เท่ากับ 0, 0.33,0.67 และ 0.99 ข้อมูลทั้งหมดนี้ใช้การจำลองโดยเทคนิคมอนติคาร์โล ด้วยโปรแกรม R การหาค่าของจุดแบ่งใช้ทฤษฎีของ Hadjicostas P. (2006) จากการวิจัยสรุปผลได้ดังนี้ กรณีที่จำนวนตัวแปรอิสระเปลี่ยนแปลงไป แต่ปัจจัยอื่นๆ คงที่ จะพบว่าค่าจุดของแบ่งที่สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจเท่ากับ0.1และ 0.9 จะลู่เข้าหาค่าจุดของแบ่งที่สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจเท่ากับ 0.5 ซึ่งมีค่าประมาณ 0.5 กรณีที่ขนาดตัวอย่างเปลี่ยนแปลงไป แต่ปัจจัยอื่นๆ คงที่ จะพบว่าค่าจุดของแบ่งที่สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจเท่ากับ 0.5 จะลู่เข้าหาค่า 0.5 แต่ที่สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจอื่นๆ ค่าของจุดแบ่งมีค่าต่ำกว่าค่า 0.5 กรณีที่สัดส่วนการไม่เกิดเหตุการณ์ที่สนใจเปลี่ยนแปลงไป แต่ปัจจัยอื่น ๆ คงที่ พบว่าที่สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจเท่ากับ 0.5 ค่าของจุดแบ่งมีค่าสูงที่สุดและลู่เข้าหาค่า 0.5 กรณีที่ระดับความสัมพันธ์ระหว่างตัวแปรอิสระเปลี่ยงแปลงไป แต่ปัจจัยอื่นๆ คงที่ พบว่าที่สัดส่วนของการไม่เกิดเหตุการณ์ที่สนใจเท่ากับ 0.5 ค่าจุดแบ่งจะมีค่าลดลงจากค่า 0.5 แต่ที่ค่าอื่นๆ ค่าจุดแบ่งจะมีค่าลดลงจนถึงระดับความสัมพันธ์ระหว่างตัวแปรอิสระเท่ากับ 0.67 และจะเพิ่มขึ้นอีกเล็กน้อย จากการประมาณค่าของจุดแบ่งจากตัวแบบโพรบิตแบบ 2 ประเภท ที่มีผลอันตรกิริยา (Interaction) พบว่าค่าของสัมประสิทธิ์การตัดสินใจ (R²) มีค่าสูง แสดงว่าสมการการถดถอยมีความเหมาะสมสามารถนำไปใช้ประมาณค่าของจุดแบ่งที่เหมาะสมในสถานการณ์อื่นๆ ได้ en
dc.description.abstractalternative The objective of this study is to find out the optimal cut-off point for predictive classification of ungrouped data using binary probit model. The interesting factors are the number of independent variables (p) with 3 levels; low level (p=1, 2), medium level (p= 3, 4) and high level (p=5,6), the sample size (n) with 3 levels ; low level (n=20,40), medium level (n=60,80) and high level (n=100,120), the failure rate (a) of the values 0.1,0.5 and 0.9 and the degree of multicollinearity among independent variables (M) of the values 0, 0.33, 0.67 and 0.99. The data in all situations are generated using Monte Carlo technique through R-program. The cut-off point is captured using Hadjicostas P. (2006) theory. The results can be summarized as follow: As the number of independent variables changed but the other factors are kept constant, with the failure rate equal to 0.1 and 0.9, the optimal cut-off point converges approximately to 0.5 as the failure rate equals to 0.5. As sample size changed but the other factors are kept constant, with the failure rate equals to 0.5, the optimal cut-off point converges approximately to 0.5. For the other situations, the optimal cut-off point are lower than 0.5. As the failure rate in data set changed but the other factors are kept constant, with the failure rate equals to 0.5, the optimal cut-off point is the highest and converges approximately to 0.5. As the degree of multicollinearity among independent variables changed but the other factors are kept constant, with the failure rate equals to 0.5, the optimal cut-off point decreases from 0.5. For the other situations, the optimal cut-off point decreases to M =0.67 then slightly increases. Finally the estimated binary probit model with all interaction terms is needed to find the estimated cut-off point for all situations. The R² is needed to measure the goodness-of-fit of the estimated model. From the estimated regression equation, the optimal cut-off point for any situation can be predicted en
dc.format.extent 5106290 bytes
dc.format.mimetype application/pdf
dc.language.iso th es
dc.publisher จุฬาลงกรณ์มหาวิทยาลัย en
dc.relation.uri http://doi.org/10.14457/CU.the.2010.381
dc.rights จุฬาลงกรณ์มหาวิทยาลัย en
dc.subject วิธีมอนติคาร์โล
dc.subject การคำนวณเชิงตัวเลข
dc.title ตัวแบบโพรบิตแบบ 2 ประเภท สำหรับการพยากรณ์การจำแนกข้อมูลไม่จำกัดกลุ่ม en
dc.title.alternative Binary probit model for ungrouped-data predictive classification en
dc.type Thesis es
dc.degree.name สถิติศาสตรมหาบัณฑิต es
dc.degree.level ปริญญาโท es
dc.degree.discipline สถิติ es
dc.degree.grantor จุฬาลงกรณ์มหาวิทยาลัย en
dc.email.advisor fcomsdu@acc.chula.ac.th
dc.identifier.DOI 10.14457/CU.the.2010.381


Files in this item

This item appears in the following Collection(s)

Show simple item record