Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/77282
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | บุญเสริม กิจศิริกุล | - |
dc.contributor.author | อภิชัจจ์ โชดกวณิชย์ | - |
dc.contributor.other | จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์ | - |
dc.date.accessioned | 2021-09-22T23:39:21Z | - |
dc.date.available | 2021-09-22T23:39:21Z | - |
dc.date.issued | 2563 | - |
dc.identifier.uri | http://cuir.car.chula.ac.th/handle/123456789/77282 | - |
dc.description | วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2563 | - |
dc.description.abstract | การค้นคืนข้ามภาษานั้นเป็นงานที่ท้าทายในวิทยาการด้านการประมวลผลภาษาธรรมชาติของไทย ด้วยเหตุผลในด้านของความแตกต่างระหว่างภาษา เช่น การออกเสียง และ กฎการทับศัพท์ วิทยานิพนธ์เล่มนี้ได้นำเสนอ ขั้นตอนวิธีการค้นคืนข้ามภาษาสำหรับคำทับศัพท์ภาษาไทย/อังกฤษโดยใช้ทรานฟอร์เมอร์ วิธีการที่นำเสนอนี้ช่วยให้สามารถค้นคืนคำทับศัพท์ข้ามภาษาได้โดยไม่ต้องอาศัยพจนานุกรม ซึ่งการค้นคืนข้ามภาษาโดยไม่อาศัยพจนุกรมนั้นจำเป็นต้องใช้หลักการเข้ารหัสเสียงซึ่งเป็นสัญลักษณ์แทนเสียงอ่านของคำ จากผลการทดลองของโมเดลการเรียนรู้แบบกึ่งสอน (Semi-supervised) ด้วยวิธี K-Fold cross validation แสดงให้เห็นว่า ขั้นตอนวิธีการเข้ารหัสคำที่นำเสนอให้ค่าเฉลี่ยของค่าแม่นยำ ค่าเรียกคืน และค่า F1 อยู่ที่ 85.08%, 88.25% และ 86.63% ตามลำดับ สำหรับชุดข้อมูลภาษาไทย และค่าเฉลี่ยของค่าแม่นยำ ค่าเรียกคืน และค่า F1 ของชุดข้อมูลภาษาอังกฤษอยู่ที่ 80.44%, 87.15% และ 83.66% ตามลำดับ | - |
dc.description.abstractalternative | Cross-language transliterated word retrieval is a challenging task for Thai Natural Language Processing due to the difference between languages such as pronunciation and transliteration rules. This thesis presents Thai/English cross-language transliterated word retrieval using Transformer. The proposed method enables transliterated word retrieval without using a dictionary. The phonetic code is used for cross-language retrieval. The phonetic code of a word represents the sound of a word. The results from our semi-supervised model using K-Fold cross validation showed that the model yielded precision, recall and F1 at 85.08%, 88.25% and 86.63% respectively for Thai-based datasets, and 80.44%, 87.15% and 83.66% respectively for English-based datasets. | - |
dc.language.iso | th | - |
dc.publisher | จุฬาลงกรณ์มหาวิทยาลัย | - |
dc.relation.uri | http://doi.org/10.58837/CHULA.THE.2020.1025 | - |
dc.rights | จุฬาลงกรณ์มหาวิทยาลัย | - |
dc.subject.classification | Computer Science | - |
dc.title | การค้นคืนข้ามภาษาสำหรับคำทับศัพท์ภาษาไทย/อังกฤษโดยใช้ทรานฟอร์เมอร์ | - |
dc.title.alternative | Thai/English cross-language transliterated word retrieval using transformer | - |
dc.type | Thesis | - |
dc.degree.name | วิทยาศาสตรมหาบัณฑิต | - |
dc.degree.level | ปริญญาโท | - |
dc.degree.discipline | วิทยาศาสตร์คอมพิวเตอร์ | - |
dc.degree.grantor | จุฬาลงกรณ์มหาวิทยาลัย | - |
dc.identifier.DOI | 10.58837/CHULA.THE.2020.1025 | - |
Appears in Collections: | Eng - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
6270310421.pdf | 2.31 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.