DSpace Repository

ระบบจัดหมวดหมู่เจตนาของประโยคและการสกัดชื่อเฉพาะจากประวัติสนทนาเพื่อฝึกสอนแช็ตบ็อต

Show simple item record

dc.contributor.advisor ฑิตยา หวานวารี
dc.contributor.author ณัฐกิตติ์ สมอร่าม
dc.contributor.author พิชชาภา พะวงษ์
dc.contributor.other จุฬาลงกรณ์มหาวิทยาลัย. คณะวิทยาศาสตร์
dc.date.accessioned 2020-04-21T05:20:42Z
dc.date.available 2020-04-21T05:20:42Z
dc.date.issued 2561
dc.identifier.uri http://cuir.car.chula.ac.th/handle/123456789/65416
dc.description โครงงานเป็นส่วนหนึ่งของการศึกษาตามหลักสูตรปริญญาวิทยาศาสตรบัณฑิต สาขาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย ปีการศึกษา 2561 en_US
dc.description.abstract โครงงาน “ระบบจัดหมวดหมู่เจตนาของประโยคและการสกัดชื่อเฉพาะจากประวัติสนทนาเพื่อฝึกสอนแช็ตบ็อต” มีจุดมุ่งหมายเพื่อช่วยลดความยุ่งยาก และอำนวยความสะดวกในการพัฒนาแช็ตบ็อต และสามารถนำไปเป็นแนวทางการออกแบบการตอบคำถามของแช็ตบ็อตได้สะดวกยิ่งขึ้น ขั้นตอนการพัฒนาระบบจัดหมวดหมู่เจตนาของประโยคและการสกัดชื่อเฉพาะจากประวัติสนทนาเพื่อฝึกสอนแช็ตบ็อต เริ่มต้นด้วยการเก็บข้อมูลประวัติสนทนา แล้วนำข้อมูลที่ได้มาเตรียมข้อมูลให้เป็นคำย่อย เมื่อได้คำย่อยแล้วนำคำย่อยมาสร้างเป็นถุงคำ จากนั้นนำถุงคำไปสร้างเวกเตอร์แทนประโยคทั้งหมด 3 รูปแบบ ได้แก่ การเข้ารหัสข้อมูลวันฮ็อต การนับความถี่ และ Term Frequency – Invert Document Frequency เมื่อได้เวกเตอร์แทนประโยคจากทั้ง 3 รูปแบบแล้ว จึงนำมาลดมิติของข้อมูลด้วยการวิเคราะห์องค์ประกอบหลัก และการจัดสรรดีรีเคลแฝง แล้วจัดหมวดหมู่เจตนาของประโยค ส่วนการสกัดชื่อเฉพาะนั้นจะเป็นการนำชุดของคำย่อยมาผ่านวิธีการเทียบคำที่ยาวที่สุด เมื่อได้หมวดหมู่ของเจตนาและชื่อเฉพาะแล้วก็นำมาสร้างแช็ตบ็อตผ่าน Dialogflow และผสานการทำงาน Dialogflow กับ Firebase และ SendGrid ผลลัพธ์ที่ได้จากการพัฒนาพบว่าการสร้างเวกเตอร์แทนประโยคด้วยวิธีการ Term Frequency – Invert Document frequency ให้ผลลัพธ์ที่ดีที่สุด การสกัดชื่อเฉพาะที่พัฒนาให้ความแม่นยำที่ 77% และแช็ตบ็อตสามารถตอบคำถามสำหรับแต่ละเจตนาได้ รวมถึงสามารถดึงข้อมูลรายละเอียดวิชาจากฐานข้อมูลใน Firebase มาประกอบการตอบคำถาม และส่งจดหมายอิเล็กทรอนิกส์ไปยังผู้ดูแลได้ en_US
dc.description.abstractalternative The purpose of “An intent clustering and named entity extraction system from chatlogs for training chatbot” is to reduce the complications and facilitating the development of chatbot. It can be used as a guideline to design a chatbot interaction. The process of developing an intent clustering and named entity extraction system from chatlogs for training chatbot: Collecting chatlogs from the facebook page. Then, we tokenize and create bag-of-words. After that, we create vector that represent of sentence by 3 methods, 1-hot encoding, frequency count, term frequency-invert document frequency. After that, we use Principal Component Analysis and Latent Dirichlet frequency to reduce vector dimension. Next, we extract named entity by longest-matching method. Finally, we integrate dialogflow with Messenger, Firebase, and SendGrid. en_US
dc.language.iso th en_US
dc.publisher จุฬาลงกรณ์มหาวิทยาลัย en_US
dc.rights จุฬาลงกรณ์มหาวิทยาลัย en_US
dc.title ระบบจัดหมวดหมู่เจตนาของประโยคและการสกัดชื่อเฉพาะจากประวัติสนทนาเพื่อฝึกสอนแช็ตบ็อต en_US
dc.title.alternative An intent clustering and named entity extraction from chatlogs for training chatbotto training en_US
dc.type Senior Project en_US
dc.email.advisor Dittaya.W@chula.ac.th


Files in this item

This item appears in the following Collection(s)

Show simple item record