การรู้จำเสียงพูดตัวเลขไทยโดยไม่ขึ้นต่อผู้พูด โดยการใช้ไดนามิกไทม์วาร์ปปิง

ระพีพัฒน์ เพ็ญศิริ

Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/72145

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	สมชาย จิตะพันธ์กุล	-
dc.contributor.author	ระพีพัฒน์ เพ็ญศิริ	-
dc.contributor.other	จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย	-
dc.date.accessioned	2021-02-05T04:39:31Z	-
dc.date.available	2021-02-05T04:39:31Z	-
dc.date.issued	2538	-
dc.identifier.isbn	9746326023	-
dc.identifier.uri	http://cuir.car.chula.ac.th/handle/123456789/72145	-
dc.description	วิทยานิพนธ์ (วศ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2538	en_US
dc.description.abstract	วิทยานิพนธ์ฉบับนี้มีจุดมุ่งหมายเพื่อศึกษาการรู้จำตัวเลขไทยแบบไม่ขึ้นต่อผู้พูดโดยใช้ไดนามิกไทม์วาร์ปปิง การวิเคราะห์ข้อมูลเสียงเพื่อหารูปแบบจะใช้เป็นคำเดี่ยว โดยการใช้ดีสครีตทรานสีฟอร์มของเสียงในแต่ละเฟรม จากนั้นทำ หาพารามิเตอร์ของรูปแบบของคำนั้น ๆ จากนั้นทำการคำนวณหา distance ระหว่างแบบทดสอบ (test pattern) กับแบบอ้างอิง (reference pattern) ผลการศึกษาด้วยวิธีการที่นำเสนอนี้ โดยทำการทดสอบบนเครื่อง IBM PC/AT compatible โดยอัตราการรู้จำของเสียงตัวเลขไทย 0 - 9 โดยไม่ขึ้นต่อผู้พูดจะมีค่าเป็น 79.25 % และอัตราความถูกต้องภายในกลุ่มที่ใช้สร้างแบบอ้างอิงจำนวน 20 คน จำนวน 600 คำ จะได้ 87.17 % และอัตราการรู้จำของเสียงตัวเลขไทย 0 - 9, “สิบ”, “เอ็ด”, “ยี่”, “ร้อย”, “พัน”, “หมื่น”, “แสน”, และ “ล้าน” โดยไม่ขึ้นต่อผู้พูดภายในกลุ่มที่สร้างแบบอ้างอิงจำนวน 20 คน จำนวน 1080 คำ จะ ได้ 74.07 % ผลการรู้จำเสียงพูดที่ดีจะขึ้นกับการเลือกใช้พารามิเตอร์ในการแทนเสียงพูด และจะเห็นได้ว่าการนำเอาไดนามิกไทม์วาร์ปปิงมาใช้ร่วมกับเทคนิคนี้นั้นเหมาะกับการรู้จำเสียงที่ไม่มากแบบ	-
dc.description.abstractalternative	This thesis has the objective to study on speaker-independent Thai numerical voice recognition by using dynamic time warping. In analysis to find a pattern uses isolated word by discrete Hartley transform in each frame of voice. Then, to find parameters of pattern of each word, after that to calculate distance between a test pattern and a reference pattern. This proposed method results the zero to nine independent voice recognition rate 79.25 % with 20 testing persons, 87.17 % with 20 training persons with 600 words and zero to nine, “sib”, “ed”, “yee”, “roy”, “pan”, “hmuan”, “san”, “Ian” independent voice recognition rate 74.07 % with 20 training persons with 1080 word, by testing on IBM PC/AT compatible. Good voice recognition result is depended on voice parameter selection and shows that using DTW for this technique is appropriate for no many voice recognized patterns.	-
dc.language.iso	th	en_US
dc.publisher	จุฬาลงกรณ์มหาวิทยาลัย	en_US
dc.rights	จุฬาลงกรณ์มหาวิทยาลัย	en_US
dc.subject	การรู้จำเสียงพูดอัตโนมัติ	en_US
dc.subject	ไดนามิกไทม์วาร์ปปิง	en_US
dc.subject	Dynamic Time Warping	en_US
dc.subject	การประมวลสัญญาณดิจิทัล	en_US
dc.title	การรู้จำเสียงพูดตัวเลขไทยโดยไม่ขึ้นต่อผู้พูด โดยการใช้ไดนามิกไทม์วาร์ปปิง	en_US
dc.title.alternative	Speaker-independent Thai numerical voice recognition by using dynamic time warping	en_US
dc.type	Thesis	en_US
dc.degree.name	วิศวกรรมศาสตรมหาบัณฑิต	en_US
dc.degree.level	ปริญญาโท	en_US
dc.degree.discipline	วิศวกรรมไฟฟ้า	en_US
dc.degree.grantor	จุฬาลงกรณ์มหาวิทยาลัย	en_US
dc.email.advisor	Somchai.J@chula.ac.th	-
Appears in Collections:	Grad - Theses

Files in This Item:

File	Description	Size	Format
Rapeepat_pe_front_p.pdf	บรรณานุกรม และภาคผนวก	925.02 kB	Adobe PDF	View/Open
Rapeepat_pe_ch1_p.pdf	บทที่ 1	695.61 kB	Adobe PDF	View/Open
Rapeepat_pe_ch2_p.pdf	บทที่ 2	1.2 MB	Adobe PDF	View/Open
Rapeepat_pe_ch3_p.pdf	บทที่ 3	1.42 MB	Adobe PDF	View/Open
Rapeepat_pe_ch4_p.pdf	บทที่ 4	956.77 kB	Adobe PDF	View/Open
Rapeepat_pe_ch5_p.pdf	บทที่ 5	670.33 kB	Adobe PDF	View/Open
Rapeepat_pe_back_p.pdf	บรรณานุกรม และภาคผนวก	1.4 MB	Adobe PDF	View/Open

Show simple item record