Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/30016
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorวีระ ริ้วพิทักษ์
dc.contributor.authorไพศาล ธรรมโพธิทอง
dc.contributor.otherจุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย
dc.date.accessioned2013-03-18T16:09:31Z
dc.date.available2013-03-18T16:09:31Z
dc.date.issued2533
dc.identifier.isbn9745778346
dc.identifier.urihttp://cuir.car.chula.ac.th/handle/123456789/30016
dc.descriptionวิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2533en
dc.description.abstractระบบการรับรู้เสียงพูดที่ทำการวิจัยนี้เป็นแบบคำเดี่ยวต่างบุคคล ซึ่งขั้นตอนในการวิจัยแบ่ง 3 ส่วน คือขั้นตอนแรกจะทำการหาค่าสัมประสิทธิ์ของสัญญาณ และค่าคาบเสียงสูงต่ำของกลุ่มคำ 2 กลุ่ม เพื่อจะนำมาสร้างเป็นแบบอ้างอิงจากผู้พูด 30 คน ขั้นตอนที่สองกลุ่มของแบบอ้างอิงทั้ง 2 กลุ่ม จะถูกนำมาผ่านการคัดเลือกให้ได้คำละ 10 แบบ โดยอาศัยเทคนิคการจัดกลุ่ม และทำการให้เลเบล ขั้นที่สามจะทำการทดสอบโดยอาศัยแบบทดสอบจากผู้พูด 5 คน มาทำการเปรียบเทียบกับแบบอ้างอิง การคำนวณหา ค่าความแตกต่างระหว่างแบบทดสอบกับแบบอ้างอิง ได้ใช้ เทคนิคของไดนามิคโปรแกรมมิ่ง และกฎการตัดสินใจได้อาศัยเทคนิคของ K-Nearest Neighbour (KNN) การกำหนดค่าความแตกต่างที่ยอมรับได้ ถูกนำมาใช้เพื่อปรับปรงอัตราความถูกต้องในการรับรู้ การทำ Post Processing โดยใช้ค่า Zero Crossing เพื่อปรับปรุงอัตราความถูกต้องของการรับรู้ระหว่างคำว่า "ปาก" และ "มาก" ผลการวิจัยจากคำทดสอบกลุ่มแรกไต้อัตราความถูกต้องร้อยละ 85.8 และคำทดสอบกลุ่มที่สอง ได้อัตราความถูกต้องร้อยละ 94.3
dc.description.abstractalternativeThis multispeaker voice recognition system is an isolated word : speaker independent system. The procedure in developing this system is of 3 steps 1) The analysis of 2 sets of reference words from 30 speakers in terms of the reflection coefficient and pitch period values, 2) the reference patterns of these 2 sets of words are created and 10 desired patterns are created by clustering Technique and then labeled, 3) the test patterns from 5 subjects are compared with the reference patterns. The distance between the test and the reference patterns is formed by the Dynamic Programming Technique. The decision rules are created by using the K-nearest neighbor (KNN) technique. A range of acceptable distance value has been set to improve recognition rate. Post processing using Zero crossing was also added to improve the recognition rate in the word pair /pa:k/ and /ma:k/. 85.8% of accurate recognition is formed in the first set of words and 94.3 % is formed in the second set of words.
dc.format.extent4803854 bytes
dc.format.extent2118309 bytes
dc.format.extent14929423 bytes
dc.format.extent4762416 bytes
dc.format.extent6572949 bytes
dc.format.extent3204523 bytes
dc.format.extent1474946 bytes
dc.format.extent12723021 bytes
dc.format.mimetypeapplication/pdf
dc.format.mimetypeapplication/pdf
dc.format.mimetypeapplication/pdf
dc.format.mimetypeapplication/pdf
dc.format.mimetypeapplication/pdf
dc.format.mimetypeapplication/pdf
dc.format.mimetypeapplication/pdf
dc.format.mimetypeapplication/pdf
dc.language.isothes
dc.publisherจุฬาลงกรณ์มหาวิทยาลัยen
dc.rightsจุฬาลงกรณ์มหาวิทยาลัยen
dc.titleระบบการรับรู้เสียงพูดแบบต่างบุคคลen
dc.title.alternativeMultispeaker recognition systemen
dc.typeThesises
dc.degree.nameวิทยาศาสตรมหาบัณฑิตes
dc.degree.levelปริญญาโทes
dc.degree.disciplineวิทยาศาสตร์คอมพิวเตอร์es
dc.degree.grantorจุฬาลงกรณ์มหาวิทยาลัยen
Appears in Collections:Grad - Theses

Files in This Item:
File Description SizeFormat 
Paisan_th_front.pdf4.69 MBAdobe PDFView/Open
Paisan_th_ch1.pdf2.07 MBAdobe PDFView/Open
Paisan_th_ch2.pdf14.58 MBAdobe PDFView/Open
Paisan_th_ch3.pdf4.65 MBAdobe PDFView/Open
Paisan_th_ch4.pdf6.42 MBAdobe PDFView/Open
Paisan_th_ch5.pdf3.13 MBAdobe PDFView/Open
Paisan_th_ch6.pdf1.44 MBAdobe PDFView/Open
Paisan_th_back.pdf12.42 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.