Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/9581
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | สมชาย ประสิทธิ์จูตระกูล | - |
dc.contributor.author | ประยุทธ สุวรรณวิสารท | - |
dc.contributor.other | จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย | - |
dc.date.accessioned | 2009-08-04T04:57:51Z | - |
dc.date.available | 2009-08-04T04:57:51Z | - |
dc.date.issued | 2541 | - |
dc.identifier.isbn | 9743321233 | - |
dc.identifier.uri | http://cuir.car.chula.ac.th/handle/123456789/9581 | - |
dc.description | วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2541 | en |
dc.description.abstract | วิทยานิพนธ์ฉบับนี้นำเสนอขั้นตอนวิธีการเข้ารหัสคำทับศัพท์เพื่อการค้นคืนข้ามภาษาไทย-อังกฤษ ซึ่งอนุญาตให้ใช้ข้อคำถามที่เป็นคำทับศัพท์ภาษาอังกฤษหรือภาษาไทยในการค้นคืนเอกสารที่มีคำหลักตรงกันในอีกภาษา โดยมีข้อสมมุติฐานว่าสามารถทำการค้นคืนข้ามภาษาไทย-อังกฤษได้โดยไม่ต้องอาศัยพจนานุกรม ขั้นตอนวิธีที่นำเสนอแบ่งออกเป็นสองส่วนคือ (1) ขั้นตอนวิธีการเข้ารหัสคำทับศัพท์เพื่อการค้นคืนข้ามแบบภาษาไทยทับศัพท์ภาษาอังกฤษ และ (2) ขั้นตอนวิธีการเข้ารหัสคำทับศัพท์เพื่อการค้นคืนข้ามแบบภาษาอังกฤษทับศัพท์ภาษาไทย ขั้นตอนวิธีการค้นคืนข้ามภาษานี้จะทำงานโดยการเข้ารหัสคำในข้อคำถามแล้วนำรหัสคำที่ได้ไปเปรียบเทียบกับรหัสคำในดัชนีคำหลัก การเปรียบเทียบรหัสคำในการข้ามภาษาแบบภาษาไทยทับศัพท์ภาษาอังกฤษจะอาศัยวิธีการเปรียบเทียบแบบเหมือนกันทุกประการ ส่วนการเปรียบเทียบรหัสคำในการข้ามภาษาอังกฤษทับศัพท์ภาษาไทยจะอาศัยวิธีการเปรียบเทียบเชิงประมาณและแยกเปรียบเทียบส่วนพยัญชนะและสระออกจากกัน โดยใช้เทคนิคกำหนดการพลวัต ผลการทดลองแสดงให้เห็นว่าขั้นตอนวิธีการเข้ารหัสคำทับศัพท์เพื่อการค้นคืนข้ามภาษาไทย-อังกฤษแบบภาษาไทยทับศัพท์ภาษาอังกฤษมีค่าเรียกคืนสูงถึง 90 เปอร์เซ็นต์ และค่าแม่นยำสูงถึง 78 เปอร์เซ็นต์ เมื่อคำทับศัพท์มีความยาวมากกว่า 7 ตัวอักษรและแบบภาษาอังกฤษทับศัพท์ภาษาไทยมีค่าเรียกคืนสูงถึง 73 เปอร์เซ็นต์ และค่าแม่นยำสูงถึง 69 เปอร์เซ็นต์ | en |
dc.description.abstractalternative | This thesis presents two algorithms for transliterated word encoding for Thai-English cross-language retrieval. The algorithms enable retrieval of documents containing either the English-to-Thai or Thai-to-English transliterated keywords. We have a hypothesis that cross-language retrieval does not use a dictionary. The proposed algorithms are (1) English-to-Thai transliterated word encoding for cross-language retrieval algorithm and (2) Thai-to-English transliterated word encoding for cross-language retrieval algorithm. This cross-language retrieval is done by encoding each word in the query terms and then matching the query code with codes of keywords in the index. The English-to-Thai cross-language retrieval uses exact code matching. On the other hand, the Thai-to-English uses approximate code matching (separatedly done for consonant and vowel parts) by using dynamic programming technique. Experimental results showed that for keywords of length longer than seven characters the recall and precision of the English-to-Thai transliterated word cross-language retrieval are 90% and 78%, respectively. The recall and precision of the Thai-to-English transliterated word are around 73% and 69%, respectively. | en |
dc.format.extent | 791049 bytes | - |
dc.format.extent | 734746 bytes | - |
dc.format.extent | 877858 bytes | - |
dc.format.extent | 764340 bytes | - |
dc.format.extent | 964232 bytes | - |
dc.format.extent | 717710 bytes | - |
dc.format.extent | 1036331 bytes | - |
dc.format.mimetype | application/pdf | - |
dc.format.mimetype | application/pdf | - |
dc.format.mimetype | application/pdf | - |
dc.format.mimetype | application/pdf | - |
dc.format.mimetype | application/pdf | - |
dc.format.mimetype | application/pdf | - |
dc.format.mimetype | application/pdf | - |
dc.language.iso | th | es |
dc.publisher | จุฬาลงกรณ์มหาวิทยาลัย | en |
dc.rights | จุฬาลงกรณ์มหาวิทยาลัย | en |
dc.subject | การถอดตัวอักษร | en |
dc.subject | การค้นข้อสนเทศ | en |
dc.subject | ดัชนีเสียง | en |
dc.title | การเข้ารหัสคำทับศัพท์เพื่อการค้นคืนข้ามภาษาไทย-อังกฤษ | en |
dc.title.alternative | Transliterated word encoding for Thai-English cross-language retrieval | en |
dc.type | Thesis | es |
dc.degree.name | วิทยาศาสตรมหาบัณฑิต | es |
dc.degree.level | ปริญญาโท | es |
dc.degree.discipline | วิทยาศาสตร์คอมพิวเตอร์ | es |
dc.degree.grantor | จุฬาลงกรณ์มหาวิทยาลัย | en |
dc.email.advisor | Somchai.P@Chula.ac.th | - |
Appears in Collections: | Grad - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Prayut_Su_front.pdf | 772.51 kB | Adobe PDF | View/Open | |
Prayut_Su_ch1.pdf | 717.53 kB | Adobe PDF | View/Open | |
Prayut_Su_ch2.pdf | 857.28 kB | Adobe PDF | View/Open | |
Prayut_Su_ch3.pdf | 746.43 kB | Adobe PDF | View/Open | |
Prayut_Su_ch4.pdf | 941.63 kB | Adobe PDF | View/Open | |
Prayut_Su_ch5.pdf | 700.89 kB | Adobe PDF | View/Open | |
Prayut_Su_back.pdf | 1.01 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.