Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/65136
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | บุญเสริม กิจศิริกุล | - |
dc.contributor.author | รมณ รอบโลก | - |
dc.contributor.other | จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์ | - |
dc.date.accessioned | 2020-04-05T09:19:36Z | - |
dc.date.available | 2020-04-05T09:19:36Z | - |
dc.date.issued | 2562 | - |
dc.identifier.uri | http://cuir.car.chula.ac.th/handle/123456789/65136 | - |
dc.description | วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2562 | - |
dc.description.abstract | หุ่นยนต์สนทนาที่มุ่งงานสามารถช่วยบรรลุเป้าหมายที่เฉพาะเจาะจงให้กับผู้ใช้งานได้ เช่น การจองร้านอาหาร เป็นต้น การเรียนรู้ของเครื่องด้วยวิธีกำหนดกฎสำหรับสถานการณ์ต่าง ๆ ทำให้บทสนทนาระหว่างผู้ใช้งานกับหุ่นยนต์ขาดความยืดหยุ่นและมีต้นทุนสูงเมื่อต้องการปรับเปลี่ยนกฎ ที่ผ่านมาหุ่นยนต์สนทนาที่ใช้เทคนิคกำหนดกฎนั้น ไม่สามารถติดตามความต้องการหรือความตั้งใจที่แท้จริงของผู้ใช้งานได้ จึงเริ่มใช้วิธีการทางปัญญาประดิษฐ์ซึ่งทำให้สามารถติดตามความต้องการหรือความตั้งใจที่แท้จริงของผู้ใช้งานได้ นอกจากนี้วิธีการนี้ยังช่วยให้ผู้ใช้งานสามารถสนทนากับหุ่นยนต์ได้ยืดหยุ่นมากขึ้น ซึ่งหุ่นยนต์สนทนาที่ถูกพัฒนาด้วยวิธีนี้ส่วนมากจะใช้คำฝังตัวเป็นตัวแทนข้อความซึ่งถูกพัฒนาโดย Mikolov และคณะ [10] นอกจากนี้มีหลายงานวิจัยที่พยายามสร้างหุ่นยนต์สนทนาที่มุ่งเน้นงานแบบครบวงจรซึ่งสามารถเพิ่มประสิทธิภาพให้กับหุ่นยนต์ได้ ตัวอย่างสถาปัตยกรรมแบบครบวงจร ได้แก่ แบบจำลอง Hybrid Code Networks (HCNs) [8] ซึ่งใช้หน่วยความจำระยะสั้นแบบยาว [23] โดยใช้ชุดข้อมูลบทสนทนาการจองร้านอาหารเพื่อวัดประสิทธิภาพของแบบจำลองในการติดตามสถานะบทสนทนาสนทนาและทำนายการตอบโต้ของหุ่นยนต์ ในวิทยานิพนธ์ฉบับนี้ได้เสนอแบบจำลองที่ใช้หน่วยความจำระยะสั้นแบบยาวโดยเพิ่มกลไกจุดสนใจสำหรับการจองร้านอาหาร อย่างไรก็ตามเพื่อให้บทสนทนาจองร้านอาหารมีความซับซ้อนและสมจริงมากขึ้น จึงได้สร้างชุดข้อมูลการจองร้านอาหารที่สอดคล้องกับวัฒนธรรมไทยเพื่อทดลองว่าแบบจำลองจะทำงานอย่างไรในสภาพแวดล้อมที่สมจริงยิ่งขึ้น ซึ่งผลการทดลองแสดงให้เห็นว่าแบบจำลองที่นำเสนอนั้นมีประสิทธิภาพในการบรรลุเป้าหมายที่ต้องการ | - |
dc.description.abstractalternative | A task-oriented dialogue bot helps users achieve a predefined goal within a closed domain such as finding a restaurant and making a reservation. The defining rules for various scenarios not only cost to maintain as the number of rules grows larger but also limit the number of conversations between the bot and users. Instead of responding to user inputs with no quantifiable objective like traditional rule-based approach, a dialogue bot with the neural-based approach attempts to track the user intention in each action. Moreover, this approach also has a more flexible conversational flow. Many dialogue bots based on the Artificial Intelligence approach have been developed by learning word representations such as word embedding developed by Mikolov et al. [10] and accomplished outstanding improvements. Besides, there are attempts to build an end-to-end task-oriented dialogue bot, which can reach promising performance comparing to a hand-crafted baseline [17]. One such end-to-end architecture is the Hybrid Code Networks (HCNs) [8] using the simulated conversation of human-bot in the domain of restaurant booking translated into Thai language to train an LSTM [23] to track dialogue states and predict the next bot response. This research proposes a similar architecture to HCNs with the addition of attention to LSTM. However, for a real-world use-case, we build the new restaurant reservation dataset in order to meet the Thai culture to see how a model would perform in a more realistic environment. Experimental results show that our proposed method is effective in achieving the desired goals. | - |
dc.language.iso | th | - |
dc.publisher | จุฬาลงกรณ์มหาวิทยาลัย | - |
dc.relation.uri | http://doi.org/10.58837/CHULA.THE.2019.1137 | - |
dc.rights | จุฬาลงกรณ์มหาวิทยาลัย | - |
dc.subject.classification | Computer Science | - |
dc.title | หุ่นยนต์สนทนาที่มุ่งงานโดยใช้หน่วยความจำระยะสั้นแบบยาวกับกลไกจุดสนใจสำหรับภาษาไทย | - |
dc.title.alternative | A task-oriented dialogue bot using long short-term memory with attention for Thai language | - |
dc.type | Thesis | - |
dc.degree.name | วิทยาศาสตรมหาบัณฑิต | - |
dc.degree.level | ปริญญาโท | - |
dc.degree.discipline | วิทยาศาสตร์คอมพิวเตอร์ | - |
dc.degree.grantor | จุฬาลงกรณ์มหาวิทยาลัย | - |
dc.email.advisor | Boonserm.K@Chula.ac.th | - |
dc.identifier.DOI | 10.58837/CHULA.THE.2019.1137 | - |
Appears in Collections: | Eng - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
6071025021.pdf | 1.73 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.