Abstract:
การค้นคืนข้ามภาษานั้นเป็นงานที่ท้าทายในวิทยาการด้านการประมวลผลภาษาธรรมชาติของไทย ด้วยเหตุผลในด้านของความแตกต่างระหว่างภาษา เช่น การออกเสียง และ กฎการทับศัพท์ วิทยานิพนธ์เล่มนี้ได้นำเสนอ ขั้นตอนวิธีการค้นคืนข้ามภาษาสำหรับคำทับศัพท์ภาษาไทย/อังกฤษโดยใช้ทรานฟอร์เมอร์ วิธีการที่นำเสนอนี้ช่วยให้สามารถค้นคืนคำทับศัพท์ข้ามภาษาได้โดยไม่ต้องอาศัยพจนานุกรม ซึ่งการค้นคืนข้ามภาษาโดยไม่อาศัยพจนุกรมนั้นจำเป็นต้องใช้หลักการเข้ารหัสเสียงซึ่งเป็นสัญลักษณ์แทนเสียงอ่านของคำ จากผลการทดลองของโมเดลการเรียนรู้แบบกึ่งสอน (Semi-supervised) ด้วยวิธี K-Fold cross validation แสดงให้เห็นว่า ขั้นตอนวิธีการเข้ารหัสคำที่นำเสนอให้ค่าเฉลี่ยของค่าแม่นยำ ค่าเรียกคืน และค่า F1 อยู่ที่ 85.08%, 88.25% และ 86.63% ตามลำดับ สำหรับชุดข้อมูลภาษาไทย และค่าเฉลี่ยของค่าแม่นยำ ค่าเรียกคืน และค่า F1 ของชุดข้อมูลภาษาอังกฤษอยู่ที่ 80.44%, 87.15% และ 83.66% ตามลำดับ