Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/37613
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorอติวงศ์ สุชาโต-
dc.contributor.advisorโปรดปราน บุณยพุกกณะ-
dc.contributor.advisorชัย วุฒิวิวัฒน์ชัย-
dc.contributor.authorกฤตนันท์ พิทักษ์ภวัตกุล-
dc.contributor.otherจุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์-
dc.date.accessioned2013-12-31T07:45:23Z-
dc.date.available2013-12-31T07:45:23Z-
dc.date.issued2555-
dc.identifier.urihttp://cuir.car.chula.ac.th/handle/123456789/37613-
dc.descriptionวิทยานิพนธ์ (วศ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2555en_US
dc.description.abstractความเป็นธรรมชาติของเสียงสังเคราะห์เป็นเป้าหมายสำคัญของระบบสังเคราะห์เสียง (Text-to-speech system) ซึ่งกระบวนการสำคัญก็คือการหาคำอ่านของคำที่จะสังเคราะห์เสียง แต่ในระบบสังเคราะห์เสียงภาษาไทยการหาคำอ่านของคำภาษาอังกฤษไม่สามารถหาได้แบบตรงไปตรงมา ดังนั้นเพื่อให้ระบบสังเคราะห์เสียงภาษาไทยสามารถสังเคราะห์เสียงคำภาษาอังกฤษ ที่อาจจะปรากฏร่วมกับคำภาษาไทยได้นั้น จึงเสนอระบบการหาคำอ่านในหน่วยเสียงภาษาไทยจากคำภาษาอังกฤษ ซึ่งประกอบไปด้วย 3 กระบวนการหลัก คือ โมเดลการทำนายหน่วยเสียง กระบวนการประมวลผลหลังจากการทำนายหน่วยเสียง และโมเดลการทำนายเสียงวรรณยุกต์ โดยโมเดลการทำนายหน่วยเสียงใช้อัลกอริทึม ออนไลน์ดิสคริมิเนทีฟเทรนนิงเฟรมเวิร์ค (Online discriminative training framework) ในกระบวนการเรียนรู้ร่วมกับค่าลักษณะสำคัญต่างๆ ดังนี้ บริบท (Context) เอ็นแกรม (ngram) มาร์คอฟออร์เดอร์ (Markov order) ลิเนียร์เชน (Linear-chain) และจอยต์เอ็นแกรม (Joint n-gram) ในขณะที่กระบวนการประมวลผลหลังจากการทำนายหน่วยเสียง จะทำการแก้ไขหน่วยเสียงที่ผิดหลักพยางค์ในภาษาไทย และโมเดลการทำนายเสียงวรรณยุกต์อัลกอริทึมต้นไม้ (Classification and regression tree: CART) ในกระบวนการเรียนรู้ ร่วมกับค่าลักษณะสำคัญต่างๆ ที่เกี่ยวข้องกับหลักภาษาศาสตร์ ผลลัพธ์ความแม่นยำเฉลี่ย ในระดับพยางค์เท่ากับ 76.03%, ความแม่นยำเฉลี่ยในระดับคำเท่ากับ 53.93% และผลลัพธ์ในแง่ความพึงพอใจพบว่า 90.95% เป็นผลลัพธ์ที่ยอมรับได้en_US
dc.description.abstractalternativeThe naturalness of synthesized sound is considered as a primary goal in textto-speech (TTS) system. The important process, which makes the system reach the purpose, is grapheme-to-phoneme (G2P) conversion. However, in Thai TTS system, transcribing English texts to Thai phones is not a trivial task. This study, therefore, proposes the method of finding Thai transcriptions of English words in order to deal with English words existing among Thai words in modern written language. The system consists of three main components: phone prediction model, postprocessing, and tone prediction model. Phone prediction model is constructed by applying the online discriminative training framework as its learning algorithm. The features used in phone prediction model are context, n-gram, markov order, linearchain and joint n-gram. Post-processing is created for correcting some phone errors which break Thai syllable structure rules. Tone prediction model is built by using classification and regression tree (CART) algorithm with linguistic features. Results show that the average syllable and word accuracy are 76.03% and 53.93% respectively. Moreover, the result of subjective test indicates that 90.95% is acceptable.en_US
dc.language.isothen_US
dc.publisherจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.relation.urihttp://doi.org/10.14457/CU.the.2012.1168-
dc.rightsจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.subjectภาษาไทย -- หน่วยเสียงen_US
dc.subjectภาษาอังกฤษ -- การถอดตัวอักษรเป็นภาษาไทยen_US
dc.subjectการสังเคราะห์เสียงen_US
dc.subjectระบบประมวลผลเสียงพูดen_US
dc.subjectThai language -- Phonemicsen_US
dc.subjectEnglish language -- Transliteration into Thaien_US
dc.subjectSpeech synthesisen_US
dc.subjectSpeech processing systemsen_US
dc.titleการแปลงกราฟีมภาษาอังกฤษเป็นโฟนีมภาษาไทยen_US
dc.title.alternativeEnglish grapheme to Thai phoneme conversionen_US
dc.typeThesisen_US
dc.degree.nameวิศวกรรมศาสตรมหาบัณฑิตen_US
dc.degree.levelปริญญาโทen_US
dc.degree.disciplineวิศวกรรมคอมพิวเตอร์en_US
dc.degree.grantorจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.email.advisorAtiwong.S@Chula.ac.th-
dc.email.advisorProadpran.Pu@Chula.ac.th-
dc.email.advisorไม่มีข้อมูล-
dc.identifier.DOI10.14457/CU.the.2012.1168-
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
kitanan_pi.pdf2.18 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.