Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/35943
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | อติวงศ์ สุชาโต | - |
dc.contributor.advisor | โปรดปราน บุณยพุกกณะ | - |
dc.contributor.author | ต่อศักดิ์ สุนทรพันธุ์ | - |
dc.contributor.other | จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์ | - |
dc.date.accessioned | 2013-09-19T12:25:41Z | - |
dc.date.available | 2013-09-19T12:25:41Z | - |
dc.date.issued | 2551 | - |
dc.identifier.uri | http://cuir.car.chula.ac.th/handle/123456789/35943 | - |
dc.description | วิทยานิพนธ์ (วศ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2551 | en_US |
dc.description.abstract | วิทยานิพนธ์นี้นำเสนอการออกแบบและพัฒนาการสังเคราะห์เสียงพูดภาษาไทยแบบเชื่อมต่อจากฐานข้อมูลเสียงพูดขนาดเล็ก โดยใช้วิธีการคัดเลือกหน่วยเสียง และการออกแบบฐานข้อมูลเสียงพูดอย่างมีประสิทธิภาพ โดยใช้หน่วยเสียงอัฒพยางค์เป็นหน่วยเสียงพื้นฐาน โดยนำพยางค์ และคำที่มีสถิติการปรากฏอยู่ในข้อความภาษาไทยมากที่สุดที่ตรงกับหน่วยเสียงอัฒพยางค์ที่ได้ออกแบบไว้มาสร้างประโยคเพื่อใช้จัดเก็บเสียงพูด ฐานข้อมูลเสียงพูดที่ได้ประกอบด้วยข้อความจำนวน 73 ข้อความ (687 พยางค์ หรือ 1,892 โฟนีม) และมีขนาดของฐานข้อมูลเท่ากับ 4.26 MB ที่อัตราสุ่มตัวอย่าง 8 kHz สำหรับการบันทึกเสียงพูด ในการประเมินผลได้ทำการวัดคุณภาพโดยรวมของเสียงสังเคราะห์ด้วยวิธีเอ็มโอเอส (MOS) ซึ่งได้คะแนนเท่ากับ 3.33 คะแนน และได้นำเสียงสังเคราะห์ที่ได้จากงานวิจัยนี้ไปเปรียบเทียบกับเสียงสังเคราะห์ของวาจา 2 เป็นระบบสังเคราะห์เสียงที่ใช้เทคนิคการสังเคราะห์เสียงแบบอัฒพยางค์ ซึ่งผลการเปรียบเทียบคุณภาพโดยรวมของเสียงสังเคราะห์ด้วยวิธีซีซีอาร์ (CCR) ปรากฏว่าเสียงสังเคราะห์ของงานวิจัยนี้ทำคะแนนได้ดีกว่าอยู่ 0.674 คะแนน | en_US |
dc.description.abstractalternative | This thesis presents a design and development of a concatenative speech synthesis from a small Thai speech corpus, using a unit selection technique where the design of the speech corpus is heavily emphasized. Demisyllable units, used as the smallest units of the concatenation, are statistically selected from the most frequently-used syllables and words appearing in Thai articles. Utterance transcriptions for sound recording are designed to efficiently contained these syllables and words. The speech corpus consists of 73 sentences (687 syllables or 1,892 phoneme units) has a 4.26 MB disk size at 8 kHz sampling rate of voice record. A subjective test shows a 3.33 mean opinion score on the synthesized speech quality. The synthetic utterances are also evaluated in comparison with the Vaja2 demisyllable speech synthesis system. Such a subjective direct comparison yields a 0.674 comparison category rating score in favor of the proposed system | en_US |
dc.language.iso | th | en_US |
dc.publisher | จุฬาลงกรณ์มหาวิทยาลัย | en_US |
dc.relation.uri | http://doi.org/10.14457/CU.the.2008.808 | - |
dc.rights | จุฬาลงกรณ์มหาวิทยาลัย | en_US |
dc.subject | เสียงพูด -- ฐานข้อมูล | en_US |
dc.subject | การรู้จำเสียงพูดอัตโนมัติ | en_US |
dc.subject | การออกแบบฐานข้อมูล | en_US |
dc.subject | Database design | en_US |
dc.subject | Voice -- Databases | en_US |
dc.subject | Automatic speech recognition | en_US |
dc.title | การออกแบบและพัฒนาการสังเคราะห์เสียงพูดภาษาไทยแบบเชื่อมต่อโดยใช้ฐานข้อมูลเสียงพูดขนาดเล็ก | en_US |
dc.title.alternative | Design and development of concatenative Thai speech synthesis using a small speech corpus | en_US |
dc.type | Thesis | en_US |
dc.degree.name | วิศวกรรมศาสตรมหาบัณฑิต | en_US |
dc.degree.level | ปริญญาโท | en_US |
dc.degree.discipline | วิศวกรรมคอมพิวเตอร์ | en_US |
dc.degree.grantor | จุฬาลงกรณ์มหาวิทยาลัย | en_US |
dc.email.advisor | Atiwong.S@Chula.ac.th | - |
dc.email.advisor | proadpran.p@chula.ac.th | - |
dc.identifier.DOI | 10.14457/CU.the.2008.808 | - |
Appears in Collections: | Eng - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
torsak_so.pdf | 2.79 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.