Please use this identifier to cite or link to this item: http://cuir.car.chula.ac.th/handle/123456789/16204
Title: วิธีการวิเคราะห์ด้วยการสังเคราะห์เพื่อประมาณพื้นที่หน้าตัดช่องทางเสียงสำหรับการสังเคราะห์เสียงภาษาไทย
Other Titles: Analysis-by-synthesis approach to vocal tract cross sectional area estimation for Thai speech synthesis
Authors: ศศิวิมล ชาญวานิชบริการ
Advisors: อติวงศ์ สุชาโต
โปรดปราน บุณยพุกกณะ
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Advisor's Email: Atiwong.S@Chula.ac.th
ไม่มีข้อมูล
Subjects: ภาษาไทย -- หน่วยเสียง
เสียงพูด
Issue Date: 2551
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: โดยปรกติแล้วการเคลื่อนที่และการวางตัวของอวัยวะในช่องปากขณะทำการเปล่งเสียงเพื่อการสื่อสารไม่สามารถถูกสังเกตเห็นได้ด้วยตาเปล่า การใช้แบบจำลองอวัยวะในช่องทางเสียงแสดงกลไกการเปลี่ยนแปลงรูปร่างพื้นที่หน้าตัดช่องทางเสียงในการเปล่งเสียงพูด จะเป็นเครื่องมือในการเรียนการเปล่งเสียงพูดอย่างถูกต้อง และสามารถสังเคราะห์เสียงจากรูปร่างช่องทางเสียงที่มีการเปลี่ยนแปลงตลอดช่วงเวลาในการเปล่งเสียงต่อเนื่องวิทยานิพนธ์นี้นำเสนอพารามิเตอร์ที่ใช้ควบคุมรูปร่างของช่องทางเสียงและพารามิเตอร์ที่ควบคุมลักษณะของหน่วยเสียง เพื่อการแสดงกลไกการเปล่งเสียงพูดที่ถูกต้องจึงเสนอวิธีการหารูปร่างพื้นที่หน้าตัดของช่องทางเสียงของหน่วยเสียงพยัญชนะและหน่วยเสียงสระในภาษาไทยโดยเปรียบเทียบข้อมูลของความถี่ฟอร์แมนต์อันดับที่ 1 ถึง 3 ของเสียงสังเคราะห์ที่ได้กับข้อมูลของเสียงภาษาไทยจากเสียงพูดจริง รวมทั้งเสนอวิธีการหาการเปลี่ยนแปลงของพื้นที่หน้าตัดของช่องทางเสียงขณะเปล่งเสียงโดยใช้เส้นโค้งเบซิเยร์ที่สามารถสร้างเส้นโค้งรูปแบบต่าง ๆ เปลี่ยนแปลงไปตามจุดควบคุมความโค้งเบซิเยร์ จากนั้นทำการเปรียบเทียบกับลักษณะการเปลี่ยนแปลงของความถี่ฟอร์แมนต์ที่ 1 และ 2 จุดควบคุมความโค้งคู่ที่ให้ผลสหสัมพันธ์ของแนวฟอร์แมนต์ที่ 1 และ 2 ของเสียงสังเคราะห์และเสียงจริงมากที่สุดจะถูกเลือกให้เป็นจุดควบคุมเส้นการเปลี่ยนแปลงพื้นที่หน้าตัดของช่องทางเสียงของหน่วยเสียงพยัญชนะและคู่สระนั้น ๆ และเสนอการประมาณรูปร่างช่องทางเสียงพยัญชนะที่เกิดการใช้อวัยวะออกเสียงร่วมกับหน่วยเสียงสระที่ติดกัน ผลจากการเสนอวิธีการข้างต้นการหารูปร่างช่องทางเสียงสระด้วยการวิเคราะห์จากเสียงสังเคราะห์ที่ได้ให้ผลสอดคล้องกับรูปร่างช่องทางเสียงที่ใช้ในการออกเสียงจริง การประมาณการเปลี่ยนพื้นที่หน้าตัดของช่องทางเสียงขณะเปล่งเสียงให้ผลเฉพาะเจาะจงกับคู่พยัญชนะและสระเฉพาะตัว และเช่นเดียวกันผลวิเคราะห์การประมาณรูปร่างช่องทางเสียงพยัญชนะที่เกิดการใช้อวัยวะออกเสียงร่วมกับหน่วยเสียงสระข้างเคียงก็ได้ผลเฉพาะเจาะจงกับคู่พยัญชนะและสระคู่นั้นๆ
Other Abstract: Movement and alignment of human speech production organs while producing speech sound are partially visible. Using a model of vocal tract that represent the variations of the cross section area of the vocal tract is the tool for correctly learning speech production utterance and with co-articulation compensation capability. The aims of this thesis are to present the parameters that were used to control the shape of vocal tract and the parameters that control the phoneme properties and to present the accurate speech production mechanism of vocal tract. Therefore this thesis will introduce the vocal tract shape estimation method of the consonant and vowel in Thai by comparing the F1 to F3 of the synthetic speech and real speech. This thesis also introduces the method to estimate the variations of the cross-section area of the vocal tract using bezier interpolation then compare the deviation of F1 and F2. The most dominant control points in the bezier curve that produce the correlation of F1 and F2 of the synthetic speech closet to the real speech will be chosen as control points. Vocal tract shape estimation by analyzing synthetic speech conforms to the vocal tract shape of real speech. Cross section area estimation from synthetic speech that conforms to real speech is unique for each couple of consonant and vowel as well as the estimation with co-articulation compensation.
Description: วิทยานิพนธ์ (วศ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2551
Degree Name: วิศวกรรมศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิศวกรรมคอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/16204
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
Sasivimon_ch.pdf2.31 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.