dc.contributor.advisor |
เสกสรร เกียรติสุไพบูลย์ |
|
dc.contributor.author |
พงศ์ทวัส ฮั่นวัฒนวงศ์ |
|
dc.contributor.other |
จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี |
|
dc.date.accessioned |
2023-02-03T04:31:30Z |
|
dc.date.available |
2023-02-03T04:31:30Z |
|
dc.date.issued |
2565 |
|
dc.identifier.uri |
http://cuir.car.chula.ac.th/handle/123456789/81688 |
|
dc.description |
วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2565 |
|
dc.description.abstract |
งานวิจัยนี้มีวัตถุประสงค์เพื่อพัฒนาเวิร์กโฟลว์สำหรับสร้างต้นไม้จำแนกประเภทที่ดีที่สุด ด้วยตัวแบบเชิงเส้นจำนวนเต็มแบบผสม ทำการประเมินประสิทธิภาพของตัวแบบต้นไม้จำแนกประเภทที่ดีที่สุดบนชุดข้อมูลเยอรมันเครดิต และขยายตัวแบบให้รองรับชุดข้อมูลที่ตัวแปรต้นมีค่าสูญหายจำนวนมาก จากการพัฒนาเวิร์กโฟลว์พบว่าการสร้างต้นไม้จำแนกประเภทที่ดีที่สุดโดยใช้ตัวแบบเชิงเส้นจำนวนเต็มแบบผสมในงานวิจัยของ Lin และ Tang (2021) และกำหนดค่าพารามิเตอร์ความซับซ้อนตั้งต้นเป็นค่าบวกใกล้เคียงศูนย์ให้ผลลัพธ์เป็นที่น่าพอใจ จากการเปรียบเทียบประสิทธิภาพระหว่างตัวแบบต้นไม้จําแนกประเภทที่ดีที่สุดกับต้นไม้ตัดสินใจบนชุดข้อมูลเยอรมันเครดิต พบว่าต้นไม้จำแนกประเภทที่ดีที่สุดให้อัตราความถูกต้องสูงกว่าต้นไม้ตัดสินใจทั้งบนชุดข้อมูลสร้างตัวแบบและบนชุดข้อมูลทวนสอบ 0.4% ถึง 3.2% ข้อดีของการพัฒนาเวิร์กโฟลว์โดยใช้โปรแกรมหาคำตอบสำหรับปัญหาเชิงเส้นจำนวนเต็มแบบผสม คือความสามารถในการขยายตัวแบบให้รองรับเงื่อนไขเพิ่มเติมได้ ในงานวิจัยนี้จึงเสนอตัวแบบต้นไม้จำแนกประเภทที่ดีที่สุดที่ถูกขยายให้รองรับชุดข้อมูลที่มีตัวแปรต้นสูญหายจำนวนมาก และแสดงให้เห็นว่าตัวแบบที่ถูกขยายสามารถทำงานอย่างมีประสิทธิผลบนเวิร์กโฟลว์ที่พัฒนาขึ้น |
|
dc.description.abstractalternative |
This research aims to develop a workflow for creating an optimal classification tree (OCT) model by using mixed-integer optimization (MIO), to evaluate the performance of the optimal classification tree model on German Credit dataset, and to extend the model to support datasets that contain explanatory variables with a lot of missing values. By developing the workflow, we found that creating an optimal classification tree by solving an MIO problem using Lin and Tang’s (2021) formulation, with the complexity parameter as a positive value close to zero, provides satisfactory results. By comparing the performance between the OCT and CART on German credit dataset, we found that both in-sample and out-of-sample accuracy of the OCT is greater than CART by 0.4 – 3.2%. One advantage of creating the OCT model by using MIO is the ability to extend the model to support additional required conditions. In this research, we propose an extension to the OCT model that supports datasets containing explanatory variables with a lot of missing values and show that the extended model can work effectively on the workflow. |
|
dc.language.iso |
th |
|
dc.publisher |
จุฬาลงกรณ์มหาวิทยาลัย |
|
dc.relation.uri |
http://doi.org/10.58837/CHULA.THE.2022.958 |
|
dc.rights |
จุฬาลงกรณ์มหาวิทยาลัย |
|
dc.subject |
การโปรแกรมเชิงเส้น |
|
dc.subject |
ต้นไม้ (ทฤษฎีกราฟ) |
|
dc.subject |
ต้นไม้ตัดสินใจ |
|
dc.subject |
Linear programming |
|
dc.subject |
Trees (Graph theory) |
|
dc.subject |
Decision trees |
|
dc.subject.classification |
Mathematics |
|
dc.title |
การพัฒนาเวิร์กโฟลว์สําหรับตัวแบบต้นไม้จําแนกประเภทที่ดีที่สุด |
|
dc.title.alternative |
A workflow development for the optimal classification tree model |
|
dc.type |
Thesis |
|
dc.degree.name |
วิทยาศาสตรมหาบัณฑิต |
|
dc.degree.level |
ปริญญาโท |
|
dc.degree.discipline |
สถิติ |
|
dc.degree.grantor |
จุฬาลงกรณ์มหาวิทยาลัย |
|
dc.identifier.DOI |
10.58837/CHULA.THE.2022.958 |
|