Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/51963
Title: การเปรียบเทียบการรู้จำลายมือเขียนตัวอักษรไทยในการจำแนกกลุ่มระหว่างวิธีเคเนียเรสเนเบอร์กับวิธีเคอร์เนล
Other Titles: Comparision of Thai alphabet handwriting recognition in classification using K-nearest Neighbour methods and Kernel methods
Authors: ธวัชชัย กิติวงษ์ประทีป
Advisors: อัครินทร์ ไพบูลย์พานิช
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี
Advisor's Email: Akarin.P@chula.ac.th
Subjects: การรู้จำอักขระ (คอมพิวเตอร์)
การรู้จำรูปแบบ
การวิเคราะห์ข้อมูลภาพ
Character recognition
Image analysis
Pattern recognition systems
Issue Date: 2556
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: การวิจัยในครั้งนี้ มีวัตถุประสงค์เพื่อเปรียบเทียบการรู้จำลายมือเขียนตัวอักษรไทยในการจำแนกกลุ่มระหว่างวิธีเคเนียเรสเนเบอร์กับวิธีเคอร์เนล โดยใช้การแปลงฟูเรียร์มาพิจารณาคุณลักษณะของตัวอักษร ซึ่งทำการทดลองกับข้อมูลตัวอักษรจำนวน 2 ชุด คือ ข้อมูลลายมือเขียนตัวอักษรไทยมาจากการเขียน 1 คน และข้อมูลลายมือเขียนตัวอักษรไทยมาจากการเขียน 10 คน จำนวนสัมประสิทธิ์ฟูเรียร์ที่ใช้ในการศึกษา คือ 200, 500 และ 1,000 และข้อมูลลายมือเขียนตัวอักษรไทยที่ใช้ในการศึกษา คือ ตัวอักษรละ 90 ตัว แบ่งเป็นตัวอย่างเรียนรู้ 60 ตัวและตัวอย่างทดสอบ 30 ตัว ซึ่งศึกษากรณีตัวอย่างเรียนรู้ขนาด 10, 20, 30, 40, 50 และ 60 และใช้ค่าอัตราความผิดพลาดของการจำแนกกลุ่ม (error rate of misclassification) เป็นเกณฑ์ในการเปรียบเทียบ จากผลการศึกษา เมื่อพิจารณาข้อมูลลายมือเขียนตัวอักษรไทยมาจากการเขียน 1 คน พบว่า วิธีเคเนียเรสเนเบอร์ โดยวัดระยะห่างระยะทางแบบ Euclidean กับ Cosine ที่ k = 2 จำนวนขนาดตัวอย่างเรียนรู้ 60 ที่ค่าสัมประสิทธิ์ฟูเรียร์ 500 ให้ประสิทธิภาพในการจำแนกกลุ่มดีกว่ากรณีอื่นๆ โดยให้ผลลัพธ์ค่าอัตราความผิดพลาดของการจำแนกกลุ่ม คือ 3.89% และเมื่อพิจารณาข้อมูลลายมือเขียนตัวอักษรไทยมาจากการเขียน 10 คน พบว่า วิธีเคเนียเรสเนเบอร์ โดยวัดระยะห่างระยะทางแบบ Euclidean ที่ k = 5 จำนวนขนาดตัวอย่างเรียนรู้ 60 ที่ค่าสัมประสิทธิ์ฟูเรียร์ 500 ให้ประสิทธิภาพในการจำแนกกลุ่มดีกว่ากรณีอื่นๆ โดยให้ผลลัพธ์ค่าอัตราความผิดพลาดของการจำแนกกลุ่ม คือ 15.28%
Other Abstract: The objective of this research is to compare recognition two nonparametric classification methods: K-nearest neighbour and Kernel with normal kernel, LSCV and LKCV when applied to Thai alphabet handwriting data, when collected from both one person and ten persons. To turn images into numerical data, fourier transform was used with fourier coefficients: 200, 500 and 1,000. Each handwritten letter were collected 90 times, from which the Test data set of 60 samples were randomly selected. The Training data set consists of the remaining samples with the size ranging from 10, 20, 30, 40, 50 and 60. The error rate of misclassification was used as the criterion of comparison. Result of study shows that, for the Thai alphabet handwriting data from one person, K-nearest neighbour methods, using euclidean distance and cosine distance with 60 training sets at k = 2 and 500 coefficeints, has misclassification rate of 3.89% which is than other cases and error rate of misclassification. For the Thai alphabet handwriting data from ten persons, K-nearest neighbour methods using euclidean distance with 60 training sets at k = 5 and 500 coefficeints has better classification rate than other cases and error rate of misclassification is 15.28%.
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2556
Degree Name: สถิติศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: สถิติ
URI: http://cuir.car.chula.ac.th/handle/123456789/51963
URI: http://doi.org/10.14457/CU.the.2013.1706
metadata.dc.identifier.DOI: 10.14457/CU.the.2013.1706
Type: Thesis
Appears in Collections:Acctn - Theses

Files in This Item:
File Description SizeFormat 
thawatchai_ki.pdf3.46 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.