Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/68928
Title: การรู้จำตัวอักษรพิมพ์ภาษาไทย โดยใช้เทคนิคด้านการวิเคราะห์ตัวประกอบสำคัญและนิวรอลเน็ตเวิร์ก
Other Titles: Thai printed characters recognition using principal component analysis and neural networks
Authors: ธเนศ ศรีวิรุฬห์ชัย
Advisors: บุญเสริม กิจศิริกุล
Other author: จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย
Advisor's Email: Boonserm.K@Chula.ac.th
Subjects: การรู้จำอักขระ (คอมพิวเตอร์)
นิวรัลเน็ตเวิร์ค (วิทยาการคอมพิวเตอร์)
การวิเคราะห์ตัวประกอบสำคัญ
แบคพรอพาเกชัน (ปัญญาประดิษฐ์)
Character recognition
Neural networks (Computer science)
Principal components analysis
Back propagation (Artificial intelligence)
Issue Date: 2541
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: วิทยานิพนธ์นี้มีวัตถุประสงค์เพื่อประยุกต์ใช้เทคนิคด้านการวิเคราะห์ตัวประกอบสำคัญและ นิวรอลเน็ตเวิร์กในการรู้จำตัวอักษรพิมพ์ภาษาไทย และพัฒนาโปรแกรมสำหรับรู้จำตัวอักษรพิมพ์ภาษาไทยโดยใช้เทคนิคด้านการวิเคราะห์ตัวประกอบสำคัญและนิวรอลเน็ตเวิร์ก การรู้จำตัวอักษรพิมพ์ภาษาไทยโดยใช้เทคนิคด้านการวิเคราะห์ตัวประกอบสำคัญและนิวรอลเน็ตเวิร์ก มีขบวนการทำงานคือ ทำการอ่านภาพตัวอักษรภาษาไทยหนึ่งภาพต่อหนึ่งตัวอักษร ลักษณะภาพแบบขาวดำ แล้วทำการเปลี่ยนขนาดภาพให้อยู่ในขนาด 32 X 32 จุด ทำการแปลงแบบเค-แอลของเมตริกซ์ของจุดภาพและทำการวิเคราะห์เมตริกซ์รูปแบบที่ได้จากการแปลงด้วยนิวรอลเน็ตเวิร์กแบบแบคพรอพาเกชัน ในการวิจัยได้นำข้อมูลภาพตัวอักษรที่ได้จากการพิมพ์ด้วยเครื่องพิมพ์เลเซอร์ที่ความละเอียด 600 จุด ต่อนิ้ว นำเอกสารมาอ่านผ่านเครื่องสแกนเนอร์ความละเอียด 200 จุดต่อนิ้วจำนวน 3264 ตัวอักษรซึ่งประกอบด้วยตัวอักษรแบบ AngsanaUPC, BrowaliaUPC, CordiaUPC, DilleniaUPC, EucrosiaUPC และ FreesiaUPC แต่ละแบบประกอบด้วยตัวอักษรขนาด 16, 18, 20, 22, 24, 26, 28 และ 36 จุด เป็นตัวอักษรต้นแบบ และทำการทดสอบด้วยข้อมูลภาพตัวอักษรที่ได้จากการพิมพ์ด้วยเครื่องพิมพ์เลเซอร์ที่ความละเอียด 600 จุดต่อนิ้ว นำเอกสารที่ได้จากเครื่องพิมพ์มาถ่ายเอกสารให้จางลง และนำเอกสารที่ได้จากเครื่องพิมพ์มาถ่ายเอกสารให้เข้มขึ้น แล้วนำเอกสารทั้ง 2 ฉบับมาอ่านผ่านเครื่องสแกนเนอร์ที่ความละเอียด 200 จุดต่อนิ้วจำนวน 6528 ตัวอักษรซึ่งประกอบด้วยตัวอักษรแบบ AngsanaUPC, BrowaliaUPC, CordiaUPC, DilleniaUPC, EucrosiaUPC และ FreesiaUPC แต่ละแบบประกอบด้วยตัวอักษรขนาด 16, 18, 20, 22, 24, 26, 28 และ 36 จุด ได้ผลการรู้จำมีความถูกต้องเฉลี่ยร้อยละ 96.84
Other Abstract: The objective of this thesis is to apply principal component analysis and neural networks to Thai printed characters recognition, and develop a program for this task. The process of recognizing Thai printed characters using principal component analysis and neural networks are as follows. First, read bi-level character image at one picture per character. Second, for each character image normalize its size into 32x32 dots. Next, transform the normalized image by K-L transform. Finally, classify transformed matrix by backpropagation neural networks. In this research, training prototype characters were generated from the outputs from laser printer at 600 dots per inch. The originals composed of 3264 characters in 6 fonts: AngsanaUPC, BrowaliaUPC, CordiaUPC, DilleniaUPC, EucrosiaUPC, and FreesiaUPC, each of which is composed of size 16, 18, 20, 22, 24, 26, 28, and 36 points. The originals were scanned at 200 dots per inch and used as the training prototype characters. The program was tested with two sets of samples. The first sample set was generated by photocopying the original printout by a photocopy machine with lightened mode and the second set was generated with darkened mode. The total number of samples is 6528 characters. The samples were then scanned at 200 dots per inch and tested with the program. The recognition rate is about 96.84%.
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2541
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิทยาศาสตร์คอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/68928
ISBN: 9743315136
Type: Thesis
Appears in Collections:Grad - Theses

Files in This Item:
File Description SizeFormat 
Tanes_sr_front_p.pdfหน้าปก และบทคัดย่อ907.87 kBAdobe PDFView/Open
Tanes_sr_ch1_p.pdfบทที่ 1776.07 kBAdobe PDFView/Open
Tanes_sr_ch2_p.pdfบทที่ 2904.94 kBAdobe PDFView/Open
Tanes_sr_ch3_p.pdfบทที่ 3947.12 kBAdobe PDFView/Open
Tanes_sr_ch4_p.pdfบทที่ 41.27 MBAdobe PDFView/Open
Tanes_sr_ch5_p.pdfบทที่ 5641.67 kBAdobe PDFView/Open
Tanes_sr_back_p.pdfบรรณานุกรม และภาคผนวก1.18 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.