Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/71636
Title: การแยกตัวอักษรภาษาไทยที่ติดกัน เพื่อการรู้จำตัวอักษรพิมพ์ภาษาไทย
Other Titles: Touching Thai character segmentation for Thai character recognition
Authors: สมเกียรติ วัฒนาประสบสุข
Advisors: บุญเสริม กิจศิริกุล
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Subjects: ภาษาไทย -- ตัวอักษร
การรู้จำอักขระ (คอมพิวเตอร์)
Issue Date: 2543
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: วิทยานิพนธ์ฉบับนี้มีจุดมุ่งหมายเพื่อสร้างระบบการตัดแยกตัวอักษรภาษาไทยที่ติดกัน โดยลักษณะบ่งความต่างของอักษรไทย ซึ่งสามารถแบ่งออกเป็น 3 ขั้นตอนคือ ส่วนวิเคราะห์หาตัวอักษรที่ติดกัน โดยแบ่งกลุ่มของตัวอักษรตามระดับของตัวอักษรออกเป็น 5 กลุ่ม แล้วจัดกลุ่มที่สามารถติดกันได้โดยสามารถแบ่งออกเป็นกลุ่มตัวอักษรที่ติดกันได้ถึง 11 กลุ่ม ส่วนวิเคราะห์หาจุดตัดแยก ในส่วนนี้ใช้วิธีโปรเจกชั่นในแนวดิ่ง และแนวนอนวิธี นิวเมตริกซ์ในแนวดิ่งและแนวนอน และวิธี หาอนุพันธ์อันดับที่สองของค่าโปรเจกชั่น กับค่าโปรเจกซัน ส่วนวิเคราะห์ตัดแยกตัวอักษร ใช้วิธีการตัดแบบตรง การตัดโดยตัดตามขอบของตัวอักษรที่ติดกัน และการตัดอักษรที่ไขว้กัน ผลการวิจัยพบว่า การตัดแยกตัวอักษรพิมพ์ภาษาไทย มีความถูกต้องร้อยละ 63.14% โดย ประมาณ และใช้เวลาโดยเฉลี่ย 22.07 ตัวอักษรต่อวินาที โดยทำการทดสอบบนเครื่องไมโครคอมพิวเตอร์ CPU Pentium II 400 MHz จำนวนตัวอักษรที่ทำการทดลอบประมาณ 13,563 ตัวอักษร
Other Abstract: The objective of this thesis is to propose a method for segmentation of connected Thai characters’ based on Thai character distinctive features. The method consist of 3 main parts ; 1) a module of connected character analysis that classifies Thai characters into 5 groups by using levels of the characters and then grouping them into 11 groups of connected characters if possible, 2) a module of connected point analysis that includes vertical and horizontal projection techniques, new matrix and the 2nd derivative of projection techniques, and 3) a module of character segmentation analysis that uses vertical cut, contour cut and cross cut techniques. The result of this thesis shows that the accuracy of character segmentation is 63.14% on average, processing time is 22.07 characters per second. The experiment is conducted on a microcomputer of CPU Pentium II 400 MHz by using documents consisting of 13,563 characters.
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2543
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิทยาศาสตร์คอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/71636
ISBN: 9743470018
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
Somkiat_wa_front_p.pdfหน้าปก สารบัญ และบทคัดย่อ768.68 kBAdobe PDFView/Open
Somkiat_wa_ch1_p.pdfบทที่ 1688.55 kBAdobe PDFView/Open
Somkiat_wa_ch2_p.pdfบทที่ 2850.04 kBAdobe PDFView/Open
Somkiat_wa_ch3_p.pdfบทที่ 31.1 MBAdobe PDFView/Open
Somkiat_wa_ch4_p.pdfบทที่ 4763.68 kBAdobe PDFView/Open
Somkiat_wa_ch5_p.pdfบทที่ 5632.43 kBAdobe PDFView/Open
Somkiat_wa_back_p.pdfบรรณานุกรมและภาคผนวก930.23 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.