Please use this identifier to cite or link to this item: http://cuir.car.chula.ac.th/handle/123456789/37613
Title: การแปลงกราฟีมภาษาอังกฤษเป็นโฟนีมภาษาไทย
Other Titles: English grapheme to Thai phoneme conversion
Authors: กฤตนันท์ พิทักษ์ภวัตกุล
Advisors: อติวงศ์ สุชาโต
โปรดปราน บุณยพุกกณะ
ชัย วุฒิวิวัฒน์ชัย
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Advisor's Email: Atiwong.S@Chula.ac.th
Proadpran.Pu@Chula.ac.th
ไม่มีข้อมูล
Subjects: ภาษาไทย -- หน่วยเสียง
ภาษาอังกฤษ -- การถอดตัวอักษรเป็นภาษาไทย
การสังเคราะห์เสียง
ระบบประมวลผลเสียงพูด
Thai language -- Phonemics
English language -- Transliteration into Thai
Speech synthesis
Speech processing systems
Issue Date: 2555
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: ความเป็นธรรมชาติของเสียงสังเคราะห์เป็นเป้าหมายสำคัญของระบบสังเคราะห์เสียง (Text-to-speech system) ซึ่งกระบวนการสำคัญก็คือการหาคำอ่านของคำที่จะสังเคราะห์เสียง แต่ในระบบสังเคราะห์เสียงภาษาไทยการหาคำอ่านของคำภาษาอังกฤษไม่สามารถหาได้แบบตรงไปตรงมา ดังนั้นเพื่อให้ระบบสังเคราะห์เสียงภาษาไทยสามารถสังเคราะห์เสียงคำภาษาอังกฤษ ที่อาจจะปรากฏร่วมกับคำภาษาไทยได้นั้น จึงเสนอระบบการหาคำอ่านในหน่วยเสียงภาษาไทยจากคำภาษาอังกฤษ ซึ่งประกอบไปด้วย 3 กระบวนการหลัก คือ โมเดลการทำนายหน่วยเสียง กระบวนการประมวลผลหลังจากการทำนายหน่วยเสียง และโมเดลการทำนายเสียงวรรณยุกต์ โดยโมเดลการทำนายหน่วยเสียงใช้อัลกอริทึม ออนไลน์ดิสคริมิเนทีฟเทรนนิงเฟรมเวิร์ค (Online discriminative training framework) ในกระบวนการเรียนรู้ร่วมกับค่าลักษณะสำคัญต่างๆ ดังนี้ บริบท (Context) เอ็นแกรม (ngram) มาร์คอฟออร์เดอร์ (Markov order) ลิเนียร์เชน (Linear-chain) และจอยต์เอ็นแกรม (Joint n-gram) ในขณะที่กระบวนการประมวลผลหลังจากการทำนายหน่วยเสียง จะทำการแก้ไขหน่วยเสียงที่ผิดหลักพยางค์ในภาษาไทย และโมเดลการทำนายเสียงวรรณยุกต์อัลกอริทึมต้นไม้ (Classification and regression tree: CART) ในกระบวนการเรียนรู้ ร่วมกับค่าลักษณะสำคัญต่างๆ ที่เกี่ยวข้องกับหลักภาษาศาสตร์ ผลลัพธ์ความแม่นยำเฉลี่ย ในระดับพยางค์เท่ากับ 76.03%, ความแม่นยำเฉลี่ยในระดับคำเท่ากับ 53.93% และผลลัพธ์ในแง่ความพึงพอใจพบว่า 90.95% เป็นผลลัพธ์ที่ยอมรับได้
Other Abstract: The naturalness of synthesized sound is considered as a primary goal in textto-speech (TTS) system. The important process, which makes the system reach the purpose, is grapheme-to-phoneme (G2P) conversion. However, in Thai TTS system, transcribing English texts to Thai phones is not a trivial task. This study, therefore, proposes the method of finding Thai transcriptions of English words in order to deal with English words existing among Thai words in modern written language. The system consists of three main components: phone prediction model, postprocessing, and tone prediction model. Phone prediction model is constructed by applying the online discriminative training framework as its learning algorithm. The features used in phone prediction model are context, n-gram, markov order, linearchain and joint n-gram. Post-processing is created for correcting some phone errors which break Thai syllable structure rules. Tone prediction model is built by using classification and regression tree (CART) algorithm with linguistic features. Results show that the average syllable and word accuracy are 76.03% and 53.93% respectively. Moreover, the result of subjective test indicates that 90.95% is acceptable.
Description: วิทยานิพนธ์ (วศ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2555
Degree Name: วิศวกรรมศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิศวกรรมคอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/37613
URI: http://doi.org/10.14457/CU.the.2012.1168
metadata.dc.identifier.DOI: 10.14457/CU.the.2012.1168
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
kitanan_pi.pdf2.18 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.