Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/5233
Title: | ระบบสอบถามรายนามผู้ใช้โทรศัพท์แบบอัตโนมัติโดยใช้ระบบรู้จำเสียงพูดและสังเคราะห์เสียงพูดภาษาไทย |
Other Titles: | Automatic telephone directory assistance system using Thai speech recognition and synthesis |
Authors: | ทักษพล พึ่งยนต์ |
Advisors: | บุญเสริม กิจศิริกุล |
Other author: | จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์ |
Advisor's Email: | boonserm@cp.eng.chula.ac.th, Boonserm.K@chula.ac.th |
Subjects: | ระบบตอบรับอัตโนมัติ โทรศัพท์ -- ทำเนียบนาม การรู้จำเสียงพูดอัตโนมัติ ภาษาไทย -- หน่วยเสียง |
Issue Date: | 2546 |
Publisher: | จุฬาลงกรณ์มหาวิทยาลัย |
Abstract: | วิทยานิพนธ์ฉบับนี้นำเสนอระบบสอบถามรายนามผู้ใช้โทรศัพท์แบบอัตโนมัติ โดยใช้เทคนิคของการรู้จำเสียงพูดและสังเคราะห์เสียงพูดภาษาไทยมาประยุกต์ใช้ในการพัฒนาระบบเพื่อให้ผู้ใช้งานได้เกิดความพึงพอใจและความสะดวกรวดเร็วในการให้บริการเพิ่มมากขึ้น ส่วนประกอบสำคัญของระบบประกอบด้วย ส่วนการรู้จำเสียงพูดตัวเลขต่อเนื่องภาษาไทยระดับพยางค์ และส่วนของการสังเคราะห์เสียงพูดชื่อและนามสกุลของผู้ใช้โทรศัพท์ภาษาไทย ในขั้นตอนการตัดแบ่งพยางค์อัตโนมัติของเสียงพูดต่อเนื่อง ได้นำหลักเกณฑ์ของค่าพลังงานของเสียงและค่าอัตราการตัดผ่านระดับกำหนดมาใช้เป็นเกณฑ์ในการแบ่งพยางค์ ส่วนลักษณะสำคัญทางสวนศาสตร์ที่นำมาใช้ได้แก่ ราสต้า-พีแอลพี และอนุพันธ์อันดับที่หนึ่ง และเทคนิคการเรียนรู้ที่ใช้ในการรู้จำคือ ข่ายงานระบบประสาทเทียม ซึ่งใช้การฝึกแบบแพร่กระจายความผิดพลาดย้อนกลับ ส่วนของการสังเคราะห์เสียงพูดใช้วิธีการนำหน่วยเสียงย่อยที่ทำการเก็บไว้ในพจนานุกรมหน่วยเสียง แล้วนำมาต่อกันเป็นเสียงพูดชื่อและนามสกุล และได้นำเอาทฤษฎีเซตวิภัชนัยมาช่วยคำนวณหาค่าความใกล้เคียงของคำพ้องเสียง เพื่อลดจำนวนคำศัพท์ที่เพิ่มขึ้นในพจนานุกรมหน่วยเสียง ผลการทดลองของทั้งระบบปรากฎว่าให้ค่าความถูกต้องของระบบ 75 เปอร์เซ็นต์ และให้ค่าความถูกต้องระดับพยางค์ 94 เปอร์เซ็นต์ |
Other Abstract: | This thesis presents an Automatic Telephone Directory Assistance System which uses speech recognition and speech synthesis technique to increase satisfaction and convenience of the user. The system consists of speech recognition, based on connected word models, and speech synthesis of the Thai telephone directory. The automatic continuous speech segmentation method uses Energy and Band Crossing Rate of sounds to segment syllables. The Rasta-PLP coefficients and its delta of the syllable are used as an acoustic feature vector. Artificial Neural Networks (ANNs) with the error-back propagation algorithm are employed for training the system. In the part of speech synthesis, Concatenation Synthesis method is employed. The Fuzzy Set is used for matching the approximated sounds. Experimental results show that the accuracies of 75% and 94% are obtained for the automatic telephone directory assistance system and for syllables , respectively. |
Description: | วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2546 |
Degree Name: | วิทยาศาสตรมหาบัณฑิต |
Degree Level: | ปริญญาโท |
Degree Discipline: | วิทยาศาสตร์คอมพิวเตอร์ |
URI: | http://cuir.car.chula.ac.th/handle/123456789/5233 |
ISBN: | 9741748531 |
Type: | Thesis |
Appears in Collections: | Eng - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Taksapol.pdf | 7.13 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.