Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/70356
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorPeerapon Vateekul-
dc.contributor.authorTheerit Lapchaicharoenkit-
dc.contributor.otherChulalongkorn University. Faculty of Engineering-
dc.date.accessioned2020-11-11T13:54:57Z-
dc.date.available2020-11-11T13:54:57Z-
dc.date.issued2019-
dc.identifier.urihttp://cuir.car.chula.ac.th/handle/123456789/70356-
dc.descriptionThesis (M.Sc.)--Chulalongkorn University, 2019-
dc.description.abstractPrevious Thai question answering and machine reading comprehension researches focus on small scale dataset and do not utilize the deep learning approach to build the models. In this research, we develop a Thai machine reading comprehension (MRC) model on Thai MRC dataset provided by NECTEC. This dataset consists of 17,000 question-answer pairs and has two classes of questions, which are factoid and yes-no questions. We use BIDAF as the based MRC architecture. We have performed experiments with 3 different multiclass model designs, which includes special tokens, joint, and cascade model. We also utilize contextual embeddings for Thai language to enhance the model’s performance. As the results suggest that cascade architecture has the best F1 performance. We then incorporate transfer learning and modify the attention mechanisms to increase the model’s accuracy on yes-no questions.-
dc.description.abstractalternativeงานวิจัยที่เกี่ยวข้องกับการถามตอบและการอ่านทำความเข้าใจก่อนหน้านี้นั้นถูกทำบนชุดข้อมูลที่มีขนาดค่อนข้างเล็กและไม่ได้มีการใช้การเรียนรู้เชิงลึกเข้ามาช่วยในการสร้างแบบจำลอง ในงานวิจัยครั้งนี้ผู้วิจัยได้ทำการสร้างแบบจำลองการอ่านทำความเข้าใจบนชุดข้อมูลการทำความเข้าในภาษาไทยจากศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (NECTEC) ชุดข้อมูลดังกล่าวมีจำนวนคู่คำถาม คำตอบทั้งหมด 17,000 คู่ด้วยกัน โดยที่คู่คำถามคำตอบสามารถแบ่งได้เป็น 2 ประเภทด้วยกันคือคำถามข้อเท็จจริง และ คำถามตอบรับหรือปฏิเสธ  ผู้วิจัยได้ใช้แบบจำลอง BIDAF เป็นแบบจำลองหลักในการทำงานวิจัย ผู้วิจัยได้ทำการทดลองกับโครงสร้างแบบจำลองสำหรับการตอบคำถามหลายประเภท 3 รูปแบบโครงสร้างด้วยกันได้แก่ แบบคำพิเศษ (special token) แบบจำลองร่วมกัน (joint) และแบบจำลองแบบแยก (cascade) ผู้วิจัยได้ทำการใช้เวกเตอร์คำที่คำนึงถึงบริบท (contextual embedding) เพื่อเพิ่มประสิทธิภาพของแบบจำลอง หลังจากที่ผู้วิจัยพบว่าแบบจำลองแบบแยก (cascade) มีประสิทธิภาพที่ดีที่สุด ผู้วิจัยได้ทำการใช้การส่งต่อการเรียนรู้ (transfer learning) และทำการดัดแปลงกลไกการสนใจ (attention mechanism) เพื่อเพิ่มความสามารถของแบบจำลองบนคำถามแบบตอบรับหรือปฏิเสธ-
dc.language.isoen-
dc.publisherChulalongkorn University-
dc.relation.urihttp://doi.org/10.58837/CHULA.THE.2019.168-
dc.rightsChulalongkorn University-
dc.subjectMachine learning-
dc.subjectNeural networks (Computer science)-
dc.subjectQuestions and answers-
dc.subjectการเรียนรู้ของเครื่อง-
dc.subjectนิวรัลเน็ตเวิร์ค (วิทยาการคอมพิวเตอร์)-
dc.subjectคำถามและคำตอบ-
dc.subject.classificationComputer Science-
dc.subject.classificationComputer Science-
dc.titleMachine Reading Comprehension for Multiclass Questions on Thai Corpus-
dc.title.alternativeการอ่านทำความเข้าใจด้วยเครื่องสำหรับคำถามหลายประเภทบนคลังข้อความภาษาไทย-
dc.typeThesis-
dc.degree.nameMaster of Science-
dc.degree.levelMaster's Degree-
dc.degree.disciplineComputer Science-
dc.degree.grantorChulalongkorn University-
dc.email.advisorPeerapon.V@Chula.ac.th-
dc.identifier.DOI10.58837/CHULA.THE.2019.168-
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
6170932121.pdf2.52 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.