Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/4186
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorสมชาย จิตะพันธ์กุล-
dc.contributor.advisorจุฬารัตน์ ตันประเสริฐ-
dc.contributor.authorพงศ์ไท ทาสระคู-
dc.contributor.otherจุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์-
dc.date.accessioned2007-09-18T10:15:29Z-
dc.date.available2007-09-18T10:15:29Z-
dc.date.issued2542-
dc.identifier.isbn9743340386-
dc.identifier.urihttp://cuir.car.chula.ac.th/handle/123456789/4186-
dc.descriptionวิทยานิพนธ์ (วศ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2542en
dc.description.abstractวิทยานิพนธ์นี้มีวัตถุประสงค์เพื่อนำเสนอระบบบ่งชี้ผู้พูดแบบระบบเปิด โดยใช้แบบจำลองฮิดเดนมาร์คอฟร่วมกับการควอนไทซ์แบบเวกเตอร์ โดยใช้ชุดรหัสแบบหลายชุดรหัส ระบบบ่งชี้ผู้พูดนี้เป็นระบบที่ขึ้นกับบทคำพูด และใช้กับเสียงพูดต่อเนื่อง ในขั้นตอนการตรวจสอบผู้พูดซึ่งเป็นขั้นตอนสุดท้ายของระบบบ่งชี้ผู้พูดแบบระบบเปิดนั้น ได้มีการนำเสนอฟังก์ชันของความแตกต่างขึ้นมาใช้ สำหรับการทดลองทำกับฐานข้อมูลเสียงพูดกับตัวเลขต่อเนื่อง "สาม-ห้า-สอง-เก้า-สี่" โดยแบ่งเป็นจำนวนผู้พูดในระบบ 10 คน และจำนวนของผู้พูดนอกระบบ 17 คน ผู้พูดแต่ละคนจะบันทึกเสียงแยกกัน 2 ช่วง แต่ละช่วงเว้นห่างกัน 1 เดือน และการบันทึกเสียงในแต่ละช่วงจะบันทึกคนละ 10 เสียง ผลการทดลองปรากฏว่า ลักษณะสำคัญ MFCC ให้ผลดีที่สุดจากการศึกษาลักษณะสำคัญ 3 แบบ ได้แก่ LPC, CEP, และ MFCC พบว่า MFCC ให้อัตราการบ่งชี้ผิดพลาดเฉลี่ยเป็น 0.40 เปอร์เซ็นต์ อัตราการยอมรับผิดพลาดเฉลี่ย 0.71 เปอร์เซ็นต์ และอัตราการปฏิเสธผิดพลาดเฉลี่ย 9.40 เปอร์เซ็นต์en
dc.description.abstractalternativeThis thesis has the objective to develop an open-set speaker identification system using Hidden Markov Model and Vector Quantization with multiple codebooks. The system is a text-dependent continuous speech speaker identification system. In the final verification process, a different function is proposed to improve the performance of the system. The "3-5-2-9-4" or /sa:2 s@:ng ka:w2 si:1/ speech database used in the experiment consists of 10 speakers and 17 imposters. Each speaker did the record twice, where in the second session was performed one month after the first session, and each speaker was recorded 10 times per session. The experiment results show that MFCC is the best result with 0.4% average identification error rate (MFCC, LPC, and CEP have been tested in the experiments), 0.71% average false acceptance rate, and 9.40% average false rejection rate.en
dc.format.extent10603793 bytes-
dc.format.mimetypeapplication/pdf-
dc.language.isothen
dc.publisherจุฬาลงกรณ์มหาวิทยาลัยen
dc.rightsจุฬาลงกรณ์มหาวิทยาลัยen
dc.subjectการรู้จำเสียงพูดอัตโนมัติen
dc.subjectแบบจำลองฮิดเดนมาร์คอฟen
dc.titleระบบบ่งชี้ผู้พูดแบบระบบเปิดโดยใช้แบบจำลองฮิตเดนมาร์คอฟแบบหลายชุดรหัสen
dc.title.alternativeOpen set speaker identification using multiple codebook HMMen
dc.typeThesisen
dc.degree.nameวิศวกรรมศาสตรมหาบัณฑิตen
dc.degree.levelปริญญาโทen
dc.degree.disciplineวิศวกรรมไฟฟ้าen
dc.degree.grantorจุฬาลงกรณ์มหาวิทยาลัยen
dc.email.advisorSomchai.J@chula.ac.th-
dc.email.advisormook@notes.nectec.or.th-
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
pongthai.pdf7.33 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.