Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/65136
Title: หุ่นยนต์สนทนาที่มุ่งงานโดยใช้หน่วยความจำระยะสั้นแบบยาวกับกลไกจุดสนใจสำหรับภาษาไทย
Other Titles: A task-oriented dialogue bot using long short-term memory with attention for Thai language
Authors: รมณ รอบโลก
Advisors: บุญเสริม กิจศิริกุล
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Advisor's Email: Boonserm.K@Chula.ac.th
Issue Date: 2562
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: หุ่นยนต์สนทนาที่มุ่งงานสามารถช่วยบรรลุเป้าหมายที่เฉพาะเจาะจงให้กับผู้ใช้งานได้ เช่น การจองร้านอาหาร เป็นต้น การเรียนรู้ของเครื่องด้วยวิธีกำหนดกฎสำหรับสถานการณ์ต่าง ๆ ทำให้บทสนทนาระหว่างผู้ใช้งานกับหุ่นยนต์ขาดความยืดหยุ่นและมีต้นทุนสูงเมื่อต้องการปรับเปลี่ยนกฎ ที่ผ่านมาหุ่นยนต์สนทนาที่ใช้เทคนิคกำหนดกฎนั้น ไม่สามารถติดตามความต้องการหรือความตั้งใจที่แท้จริงของผู้ใช้งานได้ จึงเริ่มใช้วิธีการทางปัญญาประดิษฐ์ซึ่งทำให้สามารถติดตามความต้องการหรือความตั้งใจที่แท้จริงของผู้ใช้งานได้ นอกจากนี้วิธีการนี้ยังช่วยให้ผู้ใช้งานสามารถสนทนากับหุ่นยนต์ได้ยืดหยุ่นมากขึ้น ซึ่งหุ่นยนต์สนทนาที่ถูกพัฒนาด้วยวิธีนี้ส่วนมากจะใช้คำฝังตัวเป็นตัวแทนข้อความซึ่งถูกพัฒนาโดย Mikolov และคณะ [10] นอกจากนี้มีหลายงานวิจัยที่พยายามสร้างหุ่นยนต์สนทนาที่มุ่งเน้นงานแบบครบวงจรซึ่งสามารถเพิ่มประสิทธิภาพให้กับหุ่นยนต์ได้ ตัวอย่างสถาปัตยกรรมแบบครบวงจร ได้แก่ แบบจำลอง Hybrid Code Networks (HCNs) [8] ซึ่งใช้หน่วยความจำระยะสั้นแบบยาว [23] โดยใช้ชุดข้อมูลบทสนทนาการจองร้านอาหารเพื่อวัดประสิทธิภาพของแบบจำลองในการติดตามสถานะบทสนทนาสนทนาและทำนายการตอบโต้ของหุ่นยนต์ ในวิทยานิพนธ์ฉบับนี้ได้เสนอแบบจำลองที่ใช้หน่วยความจำระยะสั้นแบบยาวโดยเพิ่มกลไกจุดสนใจสำหรับการจองร้านอาหาร อย่างไรก็ตามเพื่อให้บทสนทนาจองร้านอาหารมีความซับซ้อนและสมจริงมากขึ้น จึงได้สร้างชุดข้อมูลการจองร้านอาหารที่สอดคล้องกับวัฒนธรรมไทยเพื่อทดลองว่าแบบจำลองจะทำงานอย่างไรในสภาพแวดล้อมที่สมจริงยิ่งขึ้น ซึ่งผลการทดลองแสดงให้เห็นว่าแบบจำลองที่นำเสนอนั้นมีประสิทธิภาพในการบรรลุเป้าหมายที่ต้องการ
Other Abstract: A task-oriented dialogue bot helps users achieve a predefined goal within a closed domain such as finding a restaurant and making a reservation. The defining rules for various scenarios not only cost to maintain as the number of rules grows larger but also limit the number of conversations between the bot and users. Instead of responding to user inputs with no quantifiable objective like traditional rule-based approach, a dialogue bot with the neural-based approach attempts to track the user intention in each action. Moreover, this approach also has a more flexible conversational flow. Many dialogue bots based on the Artificial Intelligence approach have been developed by learning word representations such as word embedding developed by Mikolov et al. [10] and accomplished outstanding improvements. Besides, there are attempts to build an end-to-end task-oriented dialogue bot, which can reach promising performance comparing to a hand-crafted baseline [17]. One such end-to-end architecture is the Hybrid Code Networks (HCNs) [8] using the simulated conversation of human-bot in the domain of restaurant booking translated into Thai language to train an LSTM [23] to track dialogue states and predict the next bot response. This research proposes a similar architecture to HCNs with the addition of attention to LSTM. However, for a real-world use-case, we build the new restaurant reservation dataset in order to meet the Thai culture to see how a model would perform in a more realistic environment. Experimental results show that our proposed method is effective in achieving the desired goals.  
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2562
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิทยาศาสตร์คอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/65136
URI: http://doi.org/10.58837/CHULA.THE.2019.1137
metadata.dc.identifier.DOI: 10.58837/CHULA.THE.2019.1137
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
6071025021.pdf1.73 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.