Abstract:
การจำแนกเสียงพูดคือความสามารถในการจำแนกระหว่างเสียงพยางค์หรือคำ คนที่มีความสามารถในการจำแนกเสียงพูดต่ำมักจะมีปัญหาในการแยกระหว่างคำที่มีเสียงคล้ายกัน โดยปกติการจำแนกเสียงพูดถูกประเมินโดยนักโสตสัมผัสวิทยาทำให้เข้าถึงการประเมินได้ยากเนื่องจากมีนักโสตสัมผัสวิทยาจำนวนไม่มาก นอกจากนี้การประเมินอาจใช้เวลานานหรือไม่สะดวกสำหรับผู้ป่วยบางกลุ่ม เพื่อลดปัญหาเหล่านี้จึงมีการพัฒนาวิธีประเมินการจำแนกเสียงพูดโดยใช้ศักย์ไฟฟ้าสมองสัมพันธ์กับเหตุการณ์ (Event-Related Potentials) วิธีหนึ่งที่มีการใช้คือการสังเกตองค์ประกอบ Mismatch Negativity (MMN) ระหว่างทำการทดลองการฟังแบบ Oddball ต่อมามีการเสนอวิธีใหม่โดยนำสิ่งกระตุ้นทางสายตาที่เป็นตัวอักษรมาใช้ร่วมกับสิ่งกระตุ้นทางเสียง งานวิจัยนี้เสนอวิธีการประเมินโดยใช้ภาพที่แสดงถึงความหมายของคำโดยแบ่งออกเป็นสามแบบที่มีจำนวนภาพและลำดับในการทดลองแตกต่างกัน วิธีใช้ภาพความหมายของคำแต่ละแบบรวมทั้งวิธีที่ใช้การฟังแบบ Oddball และวิธีที่ใช้ตัวอักษรถูกนำมาทดสอบโดยใช้คำสองคำที่มีเสียงพยัญชนะต่างกันแต่มีเสียงสระและเสียงวรรณยุกต์เหมือนกันเพื่อเปรียบเทียบระหว่างแต่ละวิธีโดยนำรูปคลื่นที่ได้มาสร้างเป็นชุดคุณลักษณะแล้วใช้เทคนิคการเรียนรู้ของเครื่อง (Machine Learning) เพื่อจำแนกระหว่างแต่ละเงื่อนไขในการทดลองซึ่งตัวจำแนกที่ใช้ได้แก่ Linear Discriminant Analysis (LDA) และ Support Vector Machine (SVM) จากการเปรียบเทียบพบว่ามีวิธีที่สามารถนำมาใช้สองวิธี ได้แก่วิธีใช้ภาพความหมายของคำแบบภาพเดียวและวิธีไม่ใช้ภาพ ทั้งสองวิธีนี้ให้ความแม่นยำในการจำแนกสูงกว่า 80% และใช้เวลาหรือสมาธิในการทดลองน้อยกว่าวิธีอื่น การประเมินการจำแนกเสียงพูดโดยใช้วิธีเหล่านี้สามารถนำไปใช้เป็นเครื่องมือคัดกรองอัตโนมัติที่ช่วยประเมินและแนะนำว่าผู้ป่วยควรจะถูกส่งต่อเพื่อตรวจยืนยันกับนักโสตสัมผัสวิทยาหรือไม่ซึ่งสามารถช่วยลดภาระงานของนักโสตสัมผัสวิทยาและทำให้การประเมินเข้าถึงได้ง่ายขึ้น