Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/65416
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | ฑิตยา หวานวารี | - |
dc.contributor.author | ณัฐกิตติ์ สมอร่าม | - |
dc.contributor.author | พิชชาภา พะวงษ์ | - |
dc.contributor.other | จุฬาลงกรณ์มหาวิทยาลัย. คณะวิทยาศาสตร์ | - |
dc.date.accessioned | 2020-04-21T05:20:42Z | - |
dc.date.available | 2020-04-21T05:20:42Z | - |
dc.date.issued | 2561 | - |
dc.identifier.uri | http://cuir.car.chula.ac.th/handle/123456789/65416 | - |
dc.description | โครงงานเป็นส่วนหนึ่งของการศึกษาตามหลักสูตรปริญญาวิทยาศาสตรบัณฑิต สาขาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย ปีการศึกษา 2561 | en_US |
dc.description.abstract | โครงงาน “ระบบจัดหมวดหมู่เจตนาของประโยคและการสกัดชื่อเฉพาะจากประวัติสนทนาเพื่อฝึกสอนแช็ตบ็อต” มีจุดมุ่งหมายเพื่อช่วยลดความยุ่งยาก และอำนวยความสะดวกในการพัฒนาแช็ตบ็อต และสามารถนำไปเป็นแนวทางการออกแบบการตอบคำถามของแช็ตบ็อตได้สะดวกยิ่งขึ้น ขั้นตอนการพัฒนาระบบจัดหมวดหมู่เจตนาของประโยคและการสกัดชื่อเฉพาะจากประวัติสนทนาเพื่อฝึกสอนแช็ตบ็อต เริ่มต้นด้วยการเก็บข้อมูลประวัติสนทนา แล้วนำข้อมูลที่ได้มาเตรียมข้อมูลให้เป็นคำย่อย เมื่อได้คำย่อยแล้วนำคำย่อยมาสร้างเป็นถุงคำ จากนั้นนำถุงคำไปสร้างเวกเตอร์แทนประโยคทั้งหมด 3 รูปแบบ ได้แก่ การเข้ารหัสข้อมูลวันฮ็อต การนับความถี่ และ Term Frequency – Invert Document Frequency เมื่อได้เวกเตอร์แทนประโยคจากทั้ง 3 รูปแบบแล้ว จึงนำมาลดมิติของข้อมูลด้วยการวิเคราะห์องค์ประกอบหลัก และการจัดสรรดีรีเคลแฝง แล้วจัดหมวดหมู่เจตนาของประโยค ส่วนการสกัดชื่อเฉพาะนั้นจะเป็นการนำชุดของคำย่อยมาผ่านวิธีการเทียบคำที่ยาวที่สุด เมื่อได้หมวดหมู่ของเจตนาและชื่อเฉพาะแล้วก็นำมาสร้างแช็ตบ็อตผ่าน Dialogflow และผสานการทำงาน Dialogflow กับ Firebase และ SendGrid ผลลัพธ์ที่ได้จากการพัฒนาพบว่าการสร้างเวกเตอร์แทนประโยคด้วยวิธีการ Term Frequency – Invert Document frequency ให้ผลลัพธ์ที่ดีที่สุด การสกัดชื่อเฉพาะที่พัฒนาให้ความแม่นยำที่ 77% และแช็ตบ็อตสามารถตอบคำถามสำหรับแต่ละเจตนาได้ รวมถึงสามารถดึงข้อมูลรายละเอียดวิชาจากฐานข้อมูลใน Firebase มาประกอบการตอบคำถาม และส่งจดหมายอิเล็กทรอนิกส์ไปยังผู้ดูแลได้ | en_US |
dc.description.abstractalternative | The purpose of “An intent clustering and named entity extraction system from chatlogs for training chatbot” is to reduce the complications and facilitating the development of chatbot. It can be used as a guideline to design a chatbot interaction. The process of developing an intent clustering and named entity extraction system from chatlogs for training chatbot: Collecting chatlogs from the facebook page. Then, we tokenize and create bag-of-words. After that, we create vector that represent of sentence by 3 methods, 1-hot encoding, frequency count, term frequency-invert document frequency. After that, we use Principal Component Analysis and Latent Dirichlet frequency to reduce vector dimension. Next, we extract named entity by longest-matching method. Finally, we integrate dialogflow with Messenger, Firebase, and SendGrid. | en_US |
dc.language.iso | th | en_US |
dc.publisher | จุฬาลงกรณ์มหาวิทยาลัย | en_US |
dc.rights | จุฬาลงกรณ์มหาวิทยาลัย | en_US |
dc.title | ระบบจัดหมวดหมู่เจตนาของประโยคและการสกัดชื่อเฉพาะจากประวัติสนทนาเพื่อฝึกสอนแช็ตบ็อต | en_US |
dc.title.alternative | An intent clustering and named entity extraction from chatlogs for training chatbotto training | en_US |
dc.type | Senior Project | en_US |
dc.email.advisor | Dittaya.W@chula.ac.th | - |
Appears in Collections: | Sci - Senior Projects |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Nattakit So_Se_2561.pdf | 2.62 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.