Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/71890
Title: | การรู้จำคำพูดภาษาไทย โดยใช้ลักษณะบ่งความต่างของหน่วยเสียง |
Other Titles: | Thai speech recognition system based on phonemic distinctive features |
Authors: | ณัฐกร ทับทอง |
Advisors: | สมชาย ทยานยง สุดาพร ลักษณียนาวิน |
Other author: | จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย |
Subjects: | ภาษาไทย -- สัทศาสตร์ การรู้จำ (จิตวิทยา) |
Issue Date: | 2538 |
Publisher: | จุฬาลงกรณ์มหาวิทยาลัย |
Abstract: | การวิจัยนี้มุ่งสร้างระบบการรู้จำคำพูดภาษาไทย ชนิดไม่จำกัดผู้พูด โดยใช้ลักษณะบ่งความต่าง ทางสวนสัทศาสตร์ของหน่วยเสียงชุดหนึ่ง ระบบการรู้จำนี้จะรู้จำคำสมมติที่สร้างขึ้นอย่างมีระบบจำนวน 134 คำ ในผู้พูด 6 คน รวมจำนวนคำตัวอย่างที่ใช้ในการทดสอบระบบ 804 คำ หน่วยเสียงที่ใช้ศึกษาประกอบด้วยหน่วยเสียง 21 หน่วย ได้แก่ หน่วยเสียงพยัญชนะ 10 หน่วยเสียง คือ /p/, /ph/, ldi, /c/, /ch/, /n/, /f/, /s/, /r/ และ /w/ หน่วยเสียงสระ 6 หน่วยเสียง คือ /i/, /ii/, la/, laal, /u/, และ /uu/ และหน่วยเสียงวรรณยุกต์ 5 หน่วยเสียง คือ สามัญ, เอก, โท , ตรี และ จัตวา กำหนดชุดคำที่นำมาทดสอบ 3 ชุด คือ 1. ชุดคำ ก ประกอบด้วย 24 คำ ซึ่งเป็นคำที่มี พยัญชนะด้น /p/ และมีสระ 6 หน่วยเสียง และมีวรรณยุกต์ 5 หน่วยเสียง (5 หน่วยเสียงสำหรับสระเสียงยาว และ 3 หน่วยเสียงสำหรับสระเสียงสั้น) เป็นตัวแปร 2. ชุดคำ ข ประกอบด้วย 50 คำ ซึ่งเป็นคำที่มี สระ laal และมีพยัญชนะด้น 10 หน่วยเสียง และมีวรรณยุกต์ 5 หน่วยเสียง เป็นตัวแปร 3. ชุดคำ ค ประกอบด้วยคำ 60 คำ ซึ่งเป็นคำที่มีวรรณยุกต์เอก และมีพยัญชนะด้น 10 หน่วยเสียง และมีสระทั้ง 6 หน่วยเสียง เป็นตัวแปร การทดลองแบ่งออกเป็น 3 ตอน 1. การรู้จำหน่วยเสียงวรรณยุกต์ ใช้ลักษณะสำคัญทางสวนสัทศาสตร์ คือ ทิศทางของความที่พูลฐาน (F0 direction) และระดับของความถี่มูลฐาน (F0 height) สำหรับแยกหน่วยเสียงทั้ง 5 ออกจากกัน การทดลองใช้คำทดสอบจากชุด ก และ ข จากผู้พูดกลุ่มเพศละ 3 คน รวม 6 คนผลการรู้จำถูกต้อง เมื่อทดลองกับชุดคำ ก คิดเป็นร้อยละ 92.3 และชุดคำ ข คิดเป็นร้อยละ 97.0 2. การรู้จำหน่วยเสียงสระ ใช้ลักษณะสำคัญทางสวนสัทศาสตร์ 3 ประการ คือ ค่าความถี่ฟอร์แมนท์ที่หนึ่ง (F1) ค่าความที่ฟอร์แมนท์ที่สอง (F2) และค่าระยะเวลา (duration) สำหรับแยกหน่วยเสียงทั้ง 6 ออกจากกัน การทดลองใช้คำทดสอบจากชุด ก และ ค จากผู้พูดกลุ่มเพศละ 3 คน รวม 6 คน ผลการรู้จำถูกต้อง เมื่อทดลองกับชุดคำ ก คิดเป็นร้อยละ 100.0 และชุดคำ ข คิดเป็นร้อยละ 100.0 3. การรู้จำหน่วยเสียงพยัญชนะ ใช้ลักษณะสำคัญทางสวนสัทศาสตร์โดยสร้างระบบการตัดสินใจ เป็นโครงสร้างต้นไม้แบบทวิภาค (Binary Tree) 7 ประการ คือ ค่าจุดตัดศูนย์ ค่าจุดสูงสุดและจุดตํ่าสุด ค่าพลังงานสัมพัทธ์ เฉลี่ย ค่าระยะเวลา ค่าระยะเวลาของช่วงระเบิด ลักษณะช่วงเงียบเชิงกล และค่าความถี่ฟอร์แมนท์ที่สองที่ตำแหน่ง เริ่มต้นของจุดเชื่อมต่อระหว่างพยัญชนะกับสระ การทดลองใช้คำทดสอบจากชุด ข และ ค จากผู้พูดกลุ่มเพศละ 1 คน รวม 2 คน ผลการรู้จำถูกต้อง เมื่อทดลองกับชุดคำ ข คิดเป็นร้อยละ 99.0 และชุดคำ ค คิดเป็นร้อยละ 90.0 |
Other Abstract: | This research attempts to use distinctive acoustic features of a set of phonemes for a multispeaker recognition system of hypothetical words created from a selected set of phonemes under study which consists of 21 Thai phonemes. They are 10 consonant phonemes : /p/, /ph/, /d/, /c/, /ch/, /n/, /f/, /s/, /r/ and /w/; 6 vowel phonemes : /i/, /ii/, /a/, /aa/, /u/ and /uu/; and 5 tone phonemes i.e. mid, low, falling, high and rising. The experiment was based on 3 sets of hypothetical words: 1. Set A consists of 24 hypothetical words with initial consonant /p/, and with 6 vowels and 5 tones (5 tones for the 3 long vowels, and 3 tones for the 3 short vowels), used as variables. 2. Set B consists of 50 hypothetical words with initial vowel /aa/, and with 10 consonants and 5 tones, used as variables. 3. Set C consists of 60 hypothetical words with initials low tone, and with 6 vowels and with 10 consonants, used as variables. The experiment was divided into 3 parts. 1. Recognition of the tone phonemes, two acoustic characteristics of F0 i.e. F0 direction and F0 height were investigated with test tokens from 6 speakers of 3 males and 3 females. Recognition rate of 92.3 % for set A and 97.0% for set B are reported. 2. Recognition of the vowel phonemes, three acoustic characteristics of vowel i.e. Fl, F2 and vowel duration were investigated with test tokens from 6 speakers of 3 males and 3 females. Recognition rate at 100.0 % is found in set A and set c. 3. Recognition of the consonants phonemes, seven acoustic characteristics of consonants i.e. zero crossing, extreme high or low amplitude, acoustic energy, noise duration, burst duration, acoustic silence and F2 frequency at the transition zone between consonant and vowel are used to make decision rules. Binary tree structure with test j tokens form 2 speakers of 1 male and 3 female is used for consonant recognition. Recognition rate of 99.0 % for set B and 90.0% for set c are reported. |
Description: | วิทยานิพนธ์ (วท.ม.) -- จุฬาลงกรณ์มหาวิทยาลัย, 2538 |
Degree Name: | วิทยาศาสตรมหาบัณฑิต |
Degree Level: | ปริญญาโท |
Degree Discipline: | วิศวกรรมคอมพิวเตอร์ |
URI: | http://cuir.car.chula.ac.th/handle/123456789/71890 |
ISBN: | 9746316923 |
Type: | Thesis |
Appears in Collections: | Grad - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Nuttakorn_th_front_p.pdf | 1.18 MB | Adobe PDF | View/Open | |
Nuttakorn_th_ch1_p.pdf | 748.54 kB | Adobe PDF | View/Open | |
Nuttakorn_th_ch2_p.pdf | 1.9 MB | Adobe PDF | View/Open | |
Nuttakorn_th_ch3_p.pdf | 772.56 kB | Adobe PDF | View/Open | |
Nuttakorn_th_ch4_p.pdf | 1.47 MB | Adobe PDF | View/Open | |
Nuttakorn_th_ch5_p.pdf | 1.2 MB | Adobe PDF | View/Open | |
Nuttakorn_th_ch6_p.pdf | 1.21 MB | Adobe PDF | View/Open | |
Nuttakorn_th_ch7_p.pdf | 1.09 MB | Adobe PDF | View/Open | |
Nuttakorn_th_back_p.pdf | 2.54 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.