ระบบจัดหมวดหมู่เจตนาของประโยคและการสกัดชื่อเฉพาะจากประวัติสนทนาเพื่อฝึกสอนแช็ตบ็อต

ณัฐกิตติ์ สมอร่าม; พิชชาภา พะวงษ์

dc.contributor.advisor	ฑิตยา หวานวารี
dc.contributor.author	ณัฐกิตติ์ สมอร่าม
dc.contributor.author	พิชชาภา พะวงษ์
dc.contributor.other	จุฬาลงกรณ์มหาวิทยาลัย. คณะวิทยาศาสตร์
dc.date.accessioned	2020-04-21T05:20:42Z
dc.date.available	2020-04-21T05:20:42Z
dc.date.issued	2561
dc.identifier.uri	http://cuir.car.chula.ac.th/handle/123456789/65416
dc.description	โครงงานเป็นส่วนหนึ่งของการศึกษาตามหลักสูตรปริญญาวิทยาศาสตรบัณฑิต สาขาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย ปีการศึกษา 2561	en_US
dc.description.abstract	โครงงาน “ระบบจัดหมวดหมู่เจตนาของประโยคและการสกัดชื่อเฉพาะจากประวัติสนทนาเพื่อฝึกสอนแช็ตบ็อต” มีจุดมุ่งหมายเพื่อช่วยลดความยุ่งยาก และอำนวยความสะดวกในการพัฒนาแช็ตบ็อต และสามารถนำไปเป็นแนวทางการออกแบบการตอบคำถามของแช็ตบ็อตได้สะดวกยิ่งขึ้น ขั้นตอนการพัฒนาระบบจัดหมวดหมู่เจตนาของประโยคและการสกัดชื่อเฉพาะจากประวัติสนทนาเพื่อฝึกสอนแช็ตบ็อต เริ่มต้นด้วยการเก็บข้อมูลประวัติสนทนา แล้วนำข้อมูลที่ได้มาเตรียมข้อมูลให้เป็นคำย่อย เมื่อได้คำย่อยแล้วนำคำย่อยมาสร้างเป็นถุงคำ จากนั้นนำถุงคำไปสร้างเวกเตอร์แทนประโยคทั้งหมด 3 รูปแบบ ได้แก่ การเข้ารหัสข้อมูลวันฮ็อต การนับความถี่ และ Term Frequency – Invert Document Frequency เมื่อได้เวกเตอร์แทนประโยคจากทั้ง 3 รูปแบบแล้ว จึงนำมาลดมิติของข้อมูลด้วยการวิเคราะห์องค์ประกอบหลัก และการจัดสรรดีรีเคลแฝง แล้วจัดหมวดหมู่เจตนาของประโยค ส่วนการสกัดชื่อเฉพาะนั้นจะเป็นการนำชุดของคำย่อยมาผ่านวิธีการเทียบคำที่ยาวที่สุด เมื่อได้หมวดหมู่ของเจตนาและชื่อเฉพาะแล้วก็นำมาสร้างแช็ตบ็อตผ่าน Dialogflow และผสานการทำงาน Dialogflow กับ Firebase และ SendGrid ผลลัพธ์ที่ได้จากการพัฒนาพบว่าการสร้างเวกเตอร์แทนประโยคด้วยวิธีการ Term Frequency – Invert Document frequency ให้ผลลัพธ์ที่ดีที่สุด การสกัดชื่อเฉพาะที่พัฒนาให้ความแม่นยำที่ 77% และแช็ตบ็อตสามารถตอบคำถามสำหรับแต่ละเจตนาได้ รวมถึงสามารถดึงข้อมูลรายละเอียดวิชาจากฐานข้อมูลใน Firebase มาประกอบการตอบคำถาม และส่งจดหมายอิเล็กทรอนิกส์ไปยังผู้ดูแลได้	en_US
dc.description.abstractalternative	The purpose of “An intent clustering and named entity extraction system from chatlogs for training chatbot” is to reduce the complications and facilitating the development of chatbot. It can be used as a guideline to design a chatbot interaction. The process of developing an intent clustering and named entity extraction system from chatlogs for training chatbot: Collecting chatlogs from the facebook page. Then, we tokenize and create bag-of-words. After that, we create vector that represent of sentence by 3 methods, 1-hot encoding, frequency count, term frequency-invert document frequency. After that, we use Principal Component Analysis and Latent Dirichlet frequency to reduce vector dimension. Next, we extract named entity by longest-matching method. Finally, we integrate dialogflow with Messenger, Firebase, and SendGrid.	en_US
dc.language.iso	th	en_US
dc.publisher	จุฬาลงกรณ์มหาวิทยาลัย	en_US
dc.rights	จุฬาลงกรณ์มหาวิทยาลัย	en_US
dc.title	ระบบจัดหมวดหมู่เจตนาของประโยคและการสกัดชื่อเฉพาะจากประวัติสนทนาเพื่อฝึกสอนแช็ตบ็อต	en_US
dc.title.alternative	An intent clustering and named entity extraction from chatlogs for training chatbotto training	en_US
dc.type	Senior Project	en_US
dc.email.advisor	Dittaya.W@chula.ac.th