Abstract:
โครงงาน “ระบบจัดหมวดหมู่เจตนาของประโยคและการสกัดชื่อเฉพาะจากประวัติสนทนาเพื่อฝึกสอนแช็ตบ็อต” มีจุดมุ่งหมายเพื่อช่วยลดความยุ่งยาก และอำนวยความสะดวกในการพัฒนาแช็ตบ็อต และสามารถนำไปเป็นแนวทางการออกแบบการตอบคำถามของแช็ตบ็อตได้สะดวกยิ่งขึ้น ขั้นตอนการพัฒนาระบบจัดหมวดหมู่เจตนาของประโยคและการสกัดชื่อเฉพาะจากประวัติสนทนาเพื่อฝึกสอนแช็ตบ็อต เริ่มต้นด้วยการเก็บข้อมูลประวัติสนทนา แล้วนำข้อมูลที่ได้มาเตรียมข้อมูลให้เป็นคำย่อย เมื่อได้คำย่อยแล้วนำคำย่อยมาสร้างเป็นถุงคำ จากนั้นนำถุงคำไปสร้างเวกเตอร์แทนประโยคทั้งหมด 3 รูปแบบ ได้แก่ การเข้ารหัสข้อมูลวันฮ็อต การนับความถี่ และ Term Frequency – Invert Document Frequency เมื่อได้เวกเตอร์แทนประโยคจากทั้ง 3 รูปแบบแล้ว จึงนำมาลดมิติของข้อมูลด้วยการวิเคราะห์องค์ประกอบหลัก และการจัดสรรดีรีเคลแฝง แล้วจัดหมวดหมู่เจตนาของประโยค ส่วนการสกัดชื่อเฉพาะนั้นจะเป็นการนำชุดของคำย่อยมาผ่านวิธีการเทียบคำที่ยาวที่สุด เมื่อได้หมวดหมู่ของเจตนาและชื่อเฉพาะแล้วก็นำมาสร้างแช็ตบ็อตผ่าน Dialogflow และผสานการทำงาน Dialogflow กับ Firebase และ SendGrid ผลลัพธ์ที่ได้จากการพัฒนาพบว่าการสร้างเวกเตอร์แทนประโยคด้วยวิธีการ Term Frequency – Invert Document frequency ให้ผลลัพธ์ที่ดีที่สุด การสกัดชื่อเฉพาะที่พัฒนาให้ความแม่นยำที่ 77% และแช็ตบ็อตสามารถตอบคำถามสำหรับแต่ละเจตนาได้ รวมถึงสามารถดึงข้อมูลรายละเอียดวิชาจากฐานข้อมูลใน Firebase มาประกอบการตอบคำถาม และส่งจดหมายอิเล็กทรอนิกส์ไปยังผู้ดูแลได้