Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/65416
Title: ระบบจัดหมวดหมู่เจตนาของประโยคและการสกัดชื่อเฉพาะจากประวัติสนทนาเพื่อฝึกสอนแช็ตบ็อต
Other Titles: An intent clustering and named entity extraction from chatlogs for training chatbotto training
Authors: ณัฐกิตติ์ สมอร่าม
พิชชาภา พะวงษ์
Advisors: ฑิตยา หวานวารี
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิทยาศาสตร์
Advisor's Email: Dittaya.W@chula.ac.th
Issue Date: 2561
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: โครงงาน “ระบบจัดหมวดหมู่เจตนาของประโยคและการสกัดชื่อเฉพาะจากประวัติสนทนาเพื่อฝึกสอนแช็ตบ็อต” มีจุดมุ่งหมายเพื่อช่วยลดความยุ่งยาก และอำนวยความสะดวกในการพัฒนาแช็ตบ็อต และสามารถนำไปเป็นแนวทางการออกแบบการตอบคำถามของแช็ตบ็อตได้สะดวกยิ่งขึ้น ขั้นตอนการพัฒนาระบบจัดหมวดหมู่เจตนาของประโยคและการสกัดชื่อเฉพาะจากประวัติสนทนาเพื่อฝึกสอนแช็ตบ็อต เริ่มต้นด้วยการเก็บข้อมูลประวัติสนทนา แล้วนำข้อมูลที่ได้มาเตรียมข้อมูลให้เป็นคำย่อย เมื่อได้คำย่อยแล้วนำคำย่อยมาสร้างเป็นถุงคำ จากนั้นนำถุงคำไปสร้างเวกเตอร์แทนประโยคทั้งหมด 3 รูปแบบ ได้แก่ การเข้ารหัสข้อมูลวันฮ็อต การนับความถี่ และ Term Frequency – Invert Document Frequency เมื่อได้เวกเตอร์แทนประโยคจากทั้ง 3 รูปแบบแล้ว จึงนำมาลดมิติของข้อมูลด้วยการวิเคราะห์องค์ประกอบหลัก และการจัดสรรดีรีเคลแฝง แล้วจัดหมวดหมู่เจตนาของประโยค ส่วนการสกัดชื่อเฉพาะนั้นจะเป็นการนำชุดของคำย่อยมาผ่านวิธีการเทียบคำที่ยาวที่สุด เมื่อได้หมวดหมู่ของเจตนาและชื่อเฉพาะแล้วก็นำมาสร้างแช็ตบ็อตผ่าน Dialogflow และผสานการทำงาน Dialogflow กับ Firebase และ SendGrid ผลลัพธ์ที่ได้จากการพัฒนาพบว่าการสร้างเวกเตอร์แทนประโยคด้วยวิธีการ Term Frequency – Invert Document frequency ให้ผลลัพธ์ที่ดีที่สุด การสกัดชื่อเฉพาะที่พัฒนาให้ความแม่นยำที่ 77% และแช็ตบ็อตสามารถตอบคำถามสำหรับแต่ละเจตนาได้ รวมถึงสามารถดึงข้อมูลรายละเอียดวิชาจากฐานข้อมูลใน Firebase มาประกอบการตอบคำถาม และส่งจดหมายอิเล็กทรอนิกส์ไปยังผู้ดูแลได้
Other Abstract: The purpose of “An intent clustering and named entity extraction system from chatlogs for training chatbot” is to reduce the complications and facilitating the development of chatbot. It can be used as a guideline to design a chatbot interaction. The process of developing an intent clustering and named entity extraction system from chatlogs for training chatbot: Collecting chatlogs from the facebook page. Then, we tokenize and create bag-of-words. After that, we create vector that represent of sentence by 3 methods, 1-hot encoding, frequency count, term frequency-invert document frequency. After that, we use Principal Component Analysis and Latent Dirichlet frequency to reduce vector dimension. Next, we extract named entity by longest-matching method. Finally, we integrate dialogflow with Messenger, Firebase, and SendGrid.
Description: โครงงานเป็นส่วนหนึ่งของการศึกษาตามหลักสูตรปริญญาวิทยาศาสตรบัณฑิต สาขาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย ปีการศึกษา 2561
URI: http://cuir.car.chula.ac.th/handle/123456789/65416
Type: Senior Project
Appears in Collections:Sci - Senior Projects

Files in This Item:
File Description SizeFormat 
Nattakit So_Se_2561.pdf2.62 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.