Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/44227
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorโปรดปราน บุณยพุกกณะ-
dc.contributor.advisorอติวงศ์ สุชาโต-
dc.contributor.authorณัฏฐ์ เลิศวงศ์คณากูล-
dc.contributor.otherจุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์-
dc.date.accessioned2015-08-03T09:03:58Z-
dc.date.available2015-08-03T09:03:58Z-
dc.date.issued2555-
dc.identifier.urihttp://cuir.car.chula.ac.th/handle/123456789/44227-
dc.descriptionวิทยานิพนธ์ (วศ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2555en_US
dc.description.abstractการประสานเวลาอัตโนมัติระหว่างเสียงและข้อความนั้น เป็นวิธีการที่แสดงเนื้อหาเดียวกันจากสื่อที่แตกต่างกัน ซึ่งในที่นี้คือเสียงและข้อความ ซึ่งโปรแกรมประยุกต์ส่วนใหญ่จะเป็นการประสานเวลาในระดับประโยค และใช้ข้อมูลของเสียงและข้อความทั้งหมดในการประสานเวลา แต่เนื่องด้วยความต้องการของโปรแกรมประยุกต์บางประเภท เช่น โปรแกรมการสร้างหนังสือเสียงซึ่งมีข้อความทั้งหมด และต้องการที่จะประสานเวลาในทันทีที่เสียงเข้ามาในระบบ อย่างไรก็ตาม ด้วยลักษณะของภาษาไทยซึ่งมีการแบ่งประโยคและคำไม่ชัดเจน ทำให้การประสานเวลานั้นมีความท้าทาย ดังนั้นวิทยานิพนธ์นี้จึงเสนอขั้นตอนวิธีในการประสานเวลาอัตโนมัติแบบทันทีระหว่างเสียงและข้อความในระดับพยางค์ ขั้นตอนวิธีที่นำเสนอนั้นใช้หลักการในการตรวจหาพยางค์และตรวจหาความไม่ตรงกันของการถอดเสียง การทดลองได้ศึกษาการใช้ลักษณะเด่นต่าง ๆ และการปรับค่าพารามิเตอร์อย่างละเอียด ขั้นตอนวิธีที่นำเสนอถูกนำมาเปรียบเทียบกับระบบอ้างอิง 2 ระบบ ซึ่งได้ผลลัพธ์ดีกว่าระบบอ้างอิง 75% และ 41% ตามลำดับ และในแง่ของเวลาสามารถคำนวณได้ในทันทีen_US
dc.description.abstractalternativeMost of the researches in synchronization of audio and text have been focusing on the synchronization at the level of utterance. However, to generate audio books in unstructed language like Thai from live speech, a finer lever of synchronization is necessary. We propose an algorithm to synchronize live speech with its corresponding transcription in real time at syllabic unit. The proposed algorithm employs the syllable detection concept and the transcription errors detection concept. The experiment was studied the features and the parameters empirically. The result were compared with 2 baselines and found that the proposed algorithm was better than 2 baselines 75% and 41% respectively. In term of processing time, the proposed algorithm was able to give the results in real-time.en_US
dc.language.isothen_US
dc.publisherจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.relation.urihttp://doi.org/10.14457/CU.the.2012.436-
dc.rightsจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.subjectการถอดเสียงen_US
dc.subjectระบบแปลงเสียงเป็นข้อความen_US
dc.subjectระบบประมวลผลเสียงพูดen_US
dc.subjectการรู้จำเสียงพูดอัตโนมัติen_US
dc.subjectภาษาศาสตร์คอมพิวเตอร์en_US
dc.subjectTranscriptionen_US
dc.subjectSpeech-to-text systemsen_US
dc.subjectSpeech processing systemsen_US
dc.subjectAutomatic speech recognitionen_US
dc.subjectComputational linguisticsen_US
dc.titleการประสานเวลาอัตโนมัติแบบทันทีระหว่างเสียงและข้อความen_US
dc.title.alternativeReal-Time automatic Speech-Text Alignmenten_US
dc.typeThesisen_US
dc.degree.nameวิศวกรรมศาสตรมหาบัณฑิตen_US
dc.degree.levelปริญญาโทen_US
dc.degree.disciplineวิศวกรรมคอมพิวเตอร์en_US
dc.degree.grantorจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.email.advisorproadpran.p@chula.ac.th-
dc.email.advisoratiwong.s@chula.ac.th-
dc.identifier.DOI10.14457/CU.the.2012.436-
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
Nat_le.pdf2.21 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.