Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/58128
Title: การแปลงข้อความภาษาไทยกลางเป็นเสียงสังเคราะห์ภาษาไทยถิ่นเหนือ
Other Titles: Central Thai to Northern Thai Dialect Text-to-Speech
Authors: พรรณกร ชาวอ่างทอง
Advisors: อติวงศ์ สุชาโต
โปรดปราน บุณยพุกกณะ
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Advisor's Email: Atiwong.S@Chula.ac.th,atiwong@gmail.com,Atiwong.S@chula.ac.th
citation.car.chula@gmail.com
Issue Date: 2559
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: ภาษาถิ่นไทย หรือภาษาไทยที่มีเอกลักษณ์ของสำเนียงการพูดซึ่งแตกต่างกันออกไปตามแต่ละท้องถิ่น แม้จะมีภาษาไทยกลางซึ่งเป็นภาษาถิ่นมาตรฐานเดียวกัน แต่เมื่อต้องไปเยือนต่างภูมิลำเนา การสื่อสารด้วยภาษาถิ่นนั้น ๆ กับประชากรในท้องถิ่นเป็นสิ่งที่หลีกเลี่ยงได้ยาก การสื่อสารกับประชากรในท้องถิ่น ที่เข้าใจเพียงภาษาไทยถิ่นเหนือ นำไปสู่แนวคิดการสร้างส่วนการแปลงข้อความภาษาไทยกลางเป็นเสียงสังเคราะห์ภาษาไทยถิ่นเหนือ ซึ่งได้นำเสนอในวิทยานิพนธ์ฉบับนี้ ขั้นตอนเริ่มจากการรับเข้าข้อความภาษาไทยกลาง ระบบจะแปลแล้วสังเคราะห์เสียงภาษาไทยถิ่นเหนือออกมา ในงานวิจัยนี้ประยุกต์ใช้เทคนิควิธีในการสังเคราะห์เสียงภาษาไทยกลาง โดยการปรับแต่งส่วนการแปลงกราฟีมเป็นโฟนีมและสร้างแบบจำลองเสียงใหม่สำหรับหน่วยเสียงของภาษาไทยถิ่นเหนือ ส่วนของการแปลงกราฟีมเป็นโฟนีมภาษาไทยถิ่นเหนือ สร้างจากวิธีการแปลงด้วยกฎร่วมกับพจนานุกรม กฎการแปลงและคำศัพท์ในส่วนการแปลงของพจนานุกรมอ้างอิงตามหลักภาษาศาสตร์และพจนานุกรมของภาษาไทยถิ่นเหนือตามลำดับ การประเมินผลการแปลงด้วยกฎในระดับพยางค์เบื้องต้นแสดงผลลัพธ์ความถูกต้องอยู่ที่ 83.19% ในส่วนของขั้นตอนการสร้างแบบจำลองเสียงเริ่มต้นจากการนำเสนอวิธีการคัดเลือกประโยคเพื่อใช้สร้างชุดข้อมูลฝึกฝน จากการเปรียบเทียบสรุปผลลัพธ์แสดงให้เห็นว่าวิธีการคัดเลือกเพื่อค้นหารูปแบบเดี่ยวที่ยังไม่ปรากฏ มีความครอบคลุมการกระจายตัวของโฟนีมในเปอร์เซ็นไทล์สูงสุดอยู่ที่ 95.32% หลังจากนำชุดข้อมูลฝึกฝนจากวิธีการคัดเลือกดังกล่าว ไปสร้างแบบจำลองเสียงภาษาไทยถิ่นเหนือ เสียงสังเคราะห์แบบจำลองประเมินผลด้วยผู้เชี่ยวชาญทางด้านภาษาไทยถิ่นเหนือ 20 คน การประเมินผลแสดงผลลัพธ์ความถูกต้องจากความเข้าใจในการฟังที่ระดับพยางค์ 97.16% คะแนนความพึงพอใจประเมินด้วยคะแนนความคิดเห็นด้านสำเนียงความเป็นภาษาไทยถิ่นเหนือ 3.73 ด้านความเป็นธรรมชาติคล้ายเสียงมนุษย์ 3.68 และด้านความชัดเจน 3.63 ซึ่งจัดอยู่ในระดับที่ดีถึงยอมรับได้
Other Abstract: The dialects of Thai Language have distinct identity associated with their accents. Errors in communication between different native speakers of these dialects despite their standard language origination cannot be avoided as they move across regions of the country. Communication with people who understand only the Northern Thai Dialect (NTD) brought us to the idea to invent the Central Thai to Northern Thai Dialect Text-to-Speech (TTS). Starting from getting text input in the Central Thai Dialect (CTD), the process converts the text to phoneme and synthesizes speech output in NTD. Two component were modified: Grapheme to Phoneme (G2P) and Speech models. We implemented the NTD-G2P by using rule-based and dictionary-based approaches. NTD-G2P conversion accuracy is 83.19% at the syllable level. NTD-ORCHID corpus which is a NTD counterpart of the original ORCHID corpus was built automatically based on a proposed set of phoneme mapping rules. To limit the number of training utterances collected for the acoustic modeling step, we experimented among various utterance selection methods in the order to select a set to 600 7-gram-rich utterances. The best method yielded 95.32% coverage of 7-grams in the uppermost percentile. The synthetic NTD utterances achieved ratings of 3.73 for the accent, 3.68 for the naturalness, and 3.63 for the intelligibility. The overall comprehension percentage was achieved 97%.
Description: วิทยานิพนธ์ (วศ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2559
Degree Name: วิศวกรรมศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิศวกรรมคอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/58128
URI: http://doi.org/10.58837/CHULA.THE.2016.976
metadata.dc.identifier.DOI: 10.58837/CHULA.THE.2016.976
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
5670527921.pdf4.96 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.