Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/43049
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorอติวงศ์ สุชาโตen_US
dc.contributor.advisorโปรดปราน บุณยพุกกณะen_US
dc.contributor.authorกลวัชร ตระกูลสุขen_US
dc.contributor.otherจุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์en_US
dc.date.accessioned2015-06-24T06:23:40Z
dc.date.available2015-06-24T06:23:40Z
dc.date.issued2556en_US
dc.identifier.urihttp://cuir.car.chula.ac.th/handle/123456789/43049
dc.descriptionวิทยานิพนธ์ (วศ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2556en_US
dc.description.abstractความเป็นธรรมชาติของเสียงสังเคราะห์ (Text-to-Speech System) นั้นเป็นประเด็นที่สำคัญในระบบสังเคราะห์เสียง ในการรองรับโครงร่างความถี่มูลฐาน (Fundamental Frequency Contour) ของเสียงสังเคราะห์ของพยางค์ใดๆ อย่างไม่มีกฎเกณฑ์ที่ถูกกำหนดขึ้นนั้น ระบบสังเคราะห์เสียงยังต้องสามารถคงไว้ซึ่งความเป็นธรรมชาติของเสียงสังเคราะห์ได้ วิทยานิพนธ์นี้จึงเสนอการประเมินความเป็นธรรมชาติแบบอัตโนมัติของโครงร่างความถี่มูลฐาน เพื่อพิจารณาระดับของความเป็นธรรมชาติของเสียงสังเคราะห์ของพยางค์เมื่อถูกรับรู้จากผู้ฟัง ด้วยแบบจำลองการทำนายความเป็นธรรมชาติ โดยอาศัยจุดกึ่งกลาง (Midpoint) และจุดปลาย (Endpoint) ของเส้นความถี่มูลฐานในช่วงของหน่วยตามพยางค์ (Rhyme) ที่ได้จากการวิเคราะห์ผลการทดลองการรับรู้เสียงวรรณยุกต์ในผู้ฟัง ซึ่งแบบจำลองนี้ได้ถูกใช้เพื่อการพัฒนาอัลกอรึทึมในการทำนายความเป็นธรรมชาติของเสียงวรรณยุกต์จากเส้นความถี่มูลฐานโดยใช้แบบจำลองเรขาคณิต (Geometric Model) ในการประเมินผลของอัลกอรึทึมในการทำนายความเป็นธรรมชาติของเสียงวรรณยุกต์ ได้ใช้ผู้ฟังรับรู้และประเมินความเป็นธรรมชาติของพยางค์จากเส้นความถี่มูลฐาน 45 รูปแบบ ซึ่งแต่ละรูปแบบ จะถูกผู้ฟังประเมินซ้ำกัน 2 ครั้ง ซึ่งอัลกอริทึมที่ได้นำเสนอนั้นมีอัตราความสอดคล้องประมาณ 80% เมื่อเทียบกับการตัดสินถึงความเป็นธรรมชาติของเสียงวรรณยุกต์ในพยางค์ของผู้ฟังen_US
dc.description.abstractalternativeNaturalness is an important issue in the Text-To-Speech (TTS) system. To support arbitrarily defined pitch contours for any synthesized syllables, a TTS should be able to maintain the naturalness of the synthetic speech. This work proposed an automatic evaluation of pitch contours in order to determine the level of naturalness of synthesized syllables when perceived by human listeners. By analyzing results, tone perception experiments conducted on human listeners in this work, a syllable tone naturalness prediction model based on the midpoint and endpoint of the syllable’s rhyme part was proposed. The model was then used for developing a tone naturalness prediction algorithm using geometric models of pitch contours. The evaluation of the tone naturalness prediction algorithm involved human listeners perceiving the naturalness of syllables with 45 pitch contour patterns, each of which with 2 repetitions. The proposed algorithm achieved approximately 80% consistency rate compared against human listeners’ decisions on tone naturalness of the syllables.en_US
dc.language.isothen_US
dc.publisherจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.relation.urihttp://doi.org/10.14457/CU.the.2013.518-
dc.rightsจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.subjectการสังเคราะห์เสียง
dc.subjectการประมวลผลเสียงด้วยคอมพิวเตอร์
dc.subjectSpeech systhesis
dc.subjectComputer sound processing
dc.titleการสร้างแบบจำลองการรับรู้ความเป็นธรรมชาติของเสียงวรรณยุกต์ด้วยแบบจำลองเรขาคณิตen_US
dc.title.alternativeMODELLING OF TONE NATURALNESS PERCEPTION USING GEOMETRIC MODELen_US
dc.typeThesisen_US
dc.degree.nameวิศวกรรมศาสตรมหาบัณฑิตen_US
dc.degree.levelปริญญาโทen_US
dc.degree.disciplineวิศวกรรมคอมพิวเตอร์en_US
dc.degree.grantorจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.email.advisoratiwong.s@chula.ac.then_US
dc.email.advisorProadpran.P@Chula.ac.th
dc.identifier.DOI10.14457/CU.the.2013.518-
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
5570475821.pdf3.44 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.