Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/71636
Title: | การแยกตัวอักษรภาษาไทยที่ติดกัน เพื่อการรู้จำตัวอักษรพิมพ์ภาษาไทย |
Other Titles: | Touching Thai character segmentation for Thai character recognition |
Authors: | สมเกียรติ วัฒนาประสบสุข |
Advisors: | บุญเสริม กิจศิริกุล |
Other author: | จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์ |
Subjects: | ภาษาไทย -- ตัวอักษร การรู้จำอักขระ (คอมพิวเตอร์) |
Issue Date: | 2543 |
Publisher: | จุฬาลงกรณ์มหาวิทยาลัย |
Abstract: | วิทยานิพนธ์ฉบับนี้มีจุดมุ่งหมายเพื่อสร้างระบบการตัดแยกตัวอักษรภาษาไทยที่ติดกัน โดยลักษณะบ่งความต่างของอักษรไทย ซึ่งสามารถแบ่งออกเป็น 3 ขั้นตอนคือ ส่วนวิเคราะห์หาตัวอักษรที่ติดกัน โดยแบ่งกลุ่มของตัวอักษรตามระดับของตัวอักษรออกเป็น 5 กลุ่ม แล้วจัดกลุ่มที่สามารถติดกันได้โดยสามารถแบ่งออกเป็นกลุ่มตัวอักษรที่ติดกันได้ถึง 11 กลุ่ม ส่วนวิเคราะห์หาจุดตัดแยก ในส่วนนี้ใช้วิธีโปรเจกชั่นในแนวดิ่ง และแนวนอนวิธี นิวเมตริกซ์ในแนวดิ่งและแนวนอน และวิธี หาอนุพันธ์อันดับที่สองของค่าโปรเจกชั่น กับค่าโปรเจกซัน ส่วนวิเคราะห์ตัดแยกตัวอักษร ใช้วิธีการตัดแบบตรง การตัดโดยตัดตามขอบของตัวอักษรที่ติดกัน และการตัดอักษรที่ไขว้กัน ผลการวิจัยพบว่า การตัดแยกตัวอักษรพิมพ์ภาษาไทย มีความถูกต้องร้อยละ 63.14% โดย ประมาณ และใช้เวลาโดยเฉลี่ย 22.07 ตัวอักษรต่อวินาที โดยทำการทดสอบบนเครื่องไมโครคอมพิวเตอร์ CPU Pentium II 400 MHz จำนวนตัวอักษรที่ทำการทดลอบประมาณ 13,563 ตัวอักษร |
Other Abstract: | The objective of this thesis is to propose a method for segmentation of connected Thai characters’ based on Thai character distinctive features. The method consist of 3 main parts ; 1) a module of connected character analysis that classifies Thai characters into 5 groups by using levels of the characters and then grouping them into 11 groups of connected characters if possible, 2) a module of connected point analysis that includes vertical and horizontal projection techniques, new matrix and the 2nd derivative of projection techniques, and 3) a module of character segmentation analysis that uses vertical cut, contour cut and cross cut techniques. The result of this thesis shows that the accuracy of character segmentation is 63.14% on average, processing time is 22.07 characters per second. The experiment is conducted on a microcomputer of CPU Pentium II 400 MHz by using documents consisting of 13,563 characters. |
Description: | วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2543 |
Degree Name: | วิทยาศาสตรมหาบัณฑิต |
Degree Level: | ปริญญาโท |
Degree Discipline: | วิทยาศาสตร์คอมพิวเตอร์ |
URI: | http://cuir.car.chula.ac.th/handle/123456789/71636 |
ISBN: | 9743470018 |
Type: | Thesis |
Appears in Collections: | Eng - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Somkiat_wa_front_p.pdf | หน้าปก สารบัญ และบทคัดย่อ | 768.68 kB | Adobe PDF | View/Open |
Somkiat_wa_ch1_p.pdf | บทที่ 1 | 688.55 kB | Adobe PDF | View/Open |
Somkiat_wa_ch2_p.pdf | บทที่ 2 | 850.04 kB | Adobe PDF | View/Open |
Somkiat_wa_ch3_p.pdf | บทที่ 3 | 1.1 MB | Adobe PDF | View/Open |
Somkiat_wa_ch4_p.pdf | บทที่ 4 | 763.68 kB | Adobe PDF | View/Open |
Somkiat_wa_ch5_p.pdf | บทที่ 5 | 632.43 kB | Adobe PDF | View/Open |
Somkiat_wa_back_p.pdf | บรรณานุกรมและภาคผนวก | 930.23 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.