Abstract:
วิทยานิพนธ์ฉบับนี้มีจุดมุ่งหมายเพื่อสร้างระบบรู้จำอักษภาษาไทย โดยใช้ลักษณะบ่งความต่างของอักษรไทย ซึ่งประกอบด้วยงาน 3 ส่วนหลักคือ ส่วนรู้จำอักษรเดี่ยว ส่วนแยกอักษรที่ติดกัน และส่วนวิเคราะห์เอกสาร ในส่วนการรู้จำอักษรภาษาไทยใช้การแบ่งกลุ่มโดยใช้ลักษณะของโครงสร้างหลักร่วมกับระดับของอักษรโดยแบ่งเป็นอักษรระดับบน 1 กลุ่ม ระดับล่าง 1 กลุ่ม และระดับกลางอีก 7 กลุ่ม แล้วจึงแยกแยะในกลุ่มย่อยโดยใช้ลักษณะบ่งความต่างของอักษรไทย ในส่วนการตัดแยกอักษรที่ติดกันนั้นใช้ลักษณะบ่งความต่างของอักษรไทยแบ่งประเภทของการติดกันโดยใช้ระดับของอักษรได้เป็น 10 กลุ่มแล้วใช้วิธีเฉพาะของแต่ละกลุ่มในการตัดแยก ในส่วนการวิเคราะห์เอกสารมีการแก้ความเอียงของเอกสาร การแยกคอลัมน์และแยกบรรทัดตัวอักษร โดยทำการทดสอบบนเครื่องไมโครคอมพิวเตอร์ CPU 80486DX2-80 กับอักษรกว่า 50,000 ตัวอักษรได้ผลการรู้จำร้อยละ 97.6 และใช้เวลาเฉลี่ยในการรู้จำ 36.4 อักษรต่อวินาที