Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/5383
Title: การเข้ารหัสคำทับศัพท์ภาษาไทย/อังกฤษ เพื่อการค้นคืนข้ามภาษาด้วยเทคนิคนิวรอลเน็ตเวิร์ก
Other Titles: Thai/English transliterated word encoding for cross-language retrieval using neural networks
Authors: ทัศนวรรณ ศูนย์กลาง
Advisors: สมชาย ประสิทธิ์จูตระกูล
บุญเสริม กิจศิริกุล
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Advisor's Email: Somchai.P@Chula.ac.th
boonserm@cp.eng.chula.ac.th, Boonserm.K@chula.ac.th
Subjects: ภาษาไทย -- การออกเสียง
ภาษาอังกฤษ -- การออกเสียง
นิวรัลเน็ตเวิร์ค (คอมพิวเตอร์)
การค้นข้อสนเทศ
Issue Date: 2543
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: นำเสนอขั้นตอนวิธีการเข้ารหัสคำทับศัพท์ภาษาไทย/ภาษาอังกฤษ โดยใช้เทคนิคนิวรอลเน็ตเวิร์ก เพื่อการค้นคืนข้ามภาษา คำทับศัพท์ที่อนุญาตให้ใช้เป็นข้อคำถาม จะเป็นคำทับศัพท์ระหว่างคำภาษาอังกฤษกับคำภาษาไทย ซึ่งจะสามารถค้นคืนข้ามภาษาได้โดยไม่ต้องอาศัยพจนานุกรม ขั้นตอนวิธีการเข้ารหัสคำทับศัพท์ ใช้นิวรอลเน็ตเวิร์กแบบแบ็กพรอพาเกชัน เรียนรู้วิธีการเข้ารหัสคำ โดยรับข้อมูลขาเข้าเป็นตัวอักขระที่สนใจทีละตัว พร้อมทั้งตัวอักขระข้างเคียงหน้าหลังข้างละสี่ตัวของคำ และให้ข้อมูลขาออกเป็นรหัสเสียงของอักขระขาเข้านั้น แล้วนำรหัสคำที่ได้ไปเปรียบเทียบรหัสคำแบบประมาณ ผลการทดลองแสดงให้เห็นว่า ขั้นตอนวิธีการเข้ารหัสคำที่นำเสนอให้ค่าเฉลี่ยของค่าแม่นยำ และค่าเรียกคืนสูงถึง 81.91 เปอร์เซ็นต์ ในกรณีคำภาษาไทยทับศัพท์ภาษาอังกฤษ และ 84.41 เปอร์เซ็นต์ในกรณีคำภาษาอังกฤษทับศัพท์ภาษาไทย เมื่ออนุญาตให้มีความแตกต่างของรหัส ที่นำมาเปรียบเทียบได้ไม่เกินหนึ่ง
Other Abstract: Presents an algorithm for Thai-English transliterated word encoding using backpropagation neural networks for a cross-language information retrieval system. The query of Thai-English transliterated words can be cross-language retrieved without using the dictionary. By successively feeding each character of the word along with its eight neighboring (preceeding and following) characters as the network inputs, we can obtain a sequence of phonetic codes of the word from the network output. The codes are then approximately matched with the codes of keywords in the index. Experimental results using K-fold cross validation technique showed that the average recall and precision of the Thai-to-English and English-to-Thai transliterated word cross-language retrieval are 81.91% and 84.41%, respectively with allowable edit distance of one.
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2543
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิทยาศาสตร์คอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/5383
ISBN: 9743469443
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
Tasanawan.pdf775.06 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.