Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/68928
Title: | การรู้จำตัวอักษรพิมพ์ภาษาไทย โดยใช้เทคนิคด้านการวิเคราะห์ตัวประกอบสำคัญและนิวรอลเน็ตเวิร์ก |
Other Titles: | Thai printed characters recognition using principal component analysis and neural networks |
Authors: | ธเนศ ศรีวิรุฬห์ชัย |
Advisors: | บุญเสริม กิจศิริกุล |
Other author: | จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย |
Advisor's Email: | Boonserm.K@Chula.ac.th |
Subjects: | การรู้จำอักขระ (คอมพิวเตอร์) นิวรัลเน็ตเวิร์ค (วิทยาการคอมพิวเตอร์) การวิเคราะห์ตัวประกอบสำคัญ แบคพรอพาเกชัน (ปัญญาประดิษฐ์) Character recognition Neural networks (Computer science) Principal components analysis Back propagation (Artificial intelligence) |
Issue Date: | 2541 |
Publisher: | จุฬาลงกรณ์มหาวิทยาลัย |
Abstract: | วิทยานิพนธ์นี้มีวัตถุประสงค์เพื่อประยุกต์ใช้เทคนิคด้านการวิเคราะห์ตัวประกอบสำคัญและ นิวรอลเน็ตเวิร์กในการรู้จำตัวอักษรพิมพ์ภาษาไทย และพัฒนาโปรแกรมสำหรับรู้จำตัวอักษรพิมพ์ภาษาไทยโดยใช้เทคนิคด้านการวิเคราะห์ตัวประกอบสำคัญและนิวรอลเน็ตเวิร์ก การรู้จำตัวอักษรพิมพ์ภาษาไทยโดยใช้เทคนิคด้านการวิเคราะห์ตัวประกอบสำคัญและนิวรอลเน็ตเวิร์ก มีขบวนการทำงานคือ ทำการอ่านภาพตัวอักษรภาษาไทยหนึ่งภาพต่อหนึ่งตัวอักษร ลักษณะภาพแบบขาวดำ แล้วทำการเปลี่ยนขนาดภาพให้อยู่ในขนาด 32 X 32 จุด ทำการแปลงแบบเค-แอลของเมตริกซ์ของจุดภาพและทำการวิเคราะห์เมตริกซ์รูปแบบที่ได้จากการแปลงด้วยนิวรอลเน็ตเวิร์กแบบแบคพรอพาเกชัน ในการวิจัยได้นำข้อมูลภาพตัวอักษรที่ได้จากการพิมพ์ด้วยเครื่องพิมพ์เลเซอร์ที่ความละเอียด 600 จุด ต่อนิ้ว นำเอกสารมาอ่านผ่านเครื่องสแกนเนอร์ความละเอียด 200 จุดต่อนิ้วจำนวน 3264 ตัวอักษรซึ่งประกอบด้วยตัวอักษรแบบ AngsanaUPC, BrowaliaUPC, CordiaUPC, DilleniaUPC, EucrosiaUPC และ FreesiaUPC แต่ละแบบประกอบด้วยตัวอักษรขนาด 16, 18, 20, 22, 24, 26, 28 และ 36 จุด เป็นตัวอักษรต้นแบบ และทำการทดสอบด้วยข้อมูลภาพตัวอักษรที่ได้จากการพิมพ์ด้วยเครื่องพิมพ์เลเซอร์ที่ความละเอียด 600 จุดต่อนิ้ว นำเอกสารที่ได้จากเครื่องพิมพ์มาถ่ายเอกสารให้จางลง และนำเอกสารที่ได้จากเครื่องพิมพ์มาถ่ายเอกสารให้เข้มขึ้น แล้วนำเอกสารทั้ง 2 ฉบับมาอ่านผ่านเครื่องสแกนเนอร์ที่ความละเอียด 200 จุดต่อนิ้วจำนวน 6528 ตัวอักษรซึ่งประกอบด้วยตัวอักษรแบบ AngsanaUPC, BrowaliaUPC, CordiaUPC, DilleniaUPC, EucrosiaUPC และ FreesiaUPC แต่ละแบบประกอบด้วยตัวอักษรขนาด 16, 18, 20, 22, 24, 26, 28 และ 36 จุด ได้ผลการรู้จำมีความถูกต้องเฉลี่ยร้อยละ 96.84 |
Other Abstract: | The objective of this thesis is to apply principal component analysis and neural networks to Thai printed characters recognition, and develop a program for this task. The process of recognizing Thai printed characters using principal component analysis and neural networks are as follows. First, read bi-level character image at one picture per character. Second, for each character image normalize its size into 32x32 dots. Next, transform the normalized image by K-L transform. Finally, classify transformed matrix by backpropagation neural networks. In this research, training prototype characters were generated from the outputs from laser printer at 600 dots per inch. The originals composed of 3264 characters in 6 fonts: AngsanaUPC, BrowaliaUPC, CordiaUPC, DilleniaUPC, EucrosiaUPC, and FreesiaUPC, each of which is composed of size 16, 18, 20, 22, 24, 26, 28, and 36 points. The originals were scanned at 200 dots per inch and used as the training prototype characters. The program was tested with two sets of samples. The first sample set was generated by photocopying the original printout by a photocopy machine with lightened mode and the second set was generated with darkened mode. The total number of samples is 6528 characters. The samples were then scanned at 200 dots per inch and tested with the program. The recognition rate is about 96.84%. |
Description: | วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2541 |
Degree Name: | วิทยาศาสตรมหาบัณฑิต |
Degree Level: | ปริญญาโท |
Degree Discipline: | วิทยาศาสตร์คอมพิวเตอร์ |
URI: | http://cuir.car.chula.ac.th/handle/123456789/68928 |
ISBN: | 9743315136 |
Type: | Thesis |
Appears in Collections: | Grad - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Tanes_sr_front_p.pdf | หน้าปก และบทคัดย่อ | 907.87 kB | Adobe PDF | View/Open |
Tanes_sr_ch1_p.pdf | บทที่ 1 | 776.07 kB | Adobe PDF | View/Open |
Tanes_sr_ch2_p.pdf | บทที่ 2 | 904.94 kB | Adobe PDF | View/Open |
Tanes_sr_ch3_p.pdf | บทที่ 3 | 947.12 kB | Adobe PDF | View/Open |
Tanes_sr_ch4_p.pdf | บทที่ 4 | 1.27 MB | Adobe PDF | View/Open |
Tanes_sr_ch5_p.pdf | บทที่ 5 | 641.67 kB | Adobe PDF | View/Open |
Tanes_sr_back_p.pdf | บรรณานุกรม และภาคผนวก | 1.18 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.