Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/52285
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorบุญเสริม กิจศิริกุลen_US
dc.contributor.authorทวีศักดิ์ เอี่ยมสวัสดิ์en_US
dc.contributor.otherจุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์en_US
dc.date.accessioned2017-03-03T03:04:35Z-
dc.date.available2017-03-03T03:04:35Z-
dc.date.issued2559en_US
dc.identifier.urihttp://cuir.car.chula.ac.th/handle/123456789/52285-
dc.descriptionวิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2559en_US
dc.description.abstractวิธีแบ่งส่วนสำหรับการรู้จำตัวอักษรทำงานโดยการแบ่งภาพบรรทัดตัวอักษรเป็นภาพตัวอักษรและนำไปรู้จำตัวอักษรแต่ละตัวอักษร วิธีนี้ได้รับผลกระทบจากประสิทธิภาพของกระบวนการแบ่งส่วนในปัญหาตัวอักษรที่เชื่อมติดกันหรือตัวอักษรที่บางส่วนขาดหายอย่างมาก ในขณะที่วิธีไม่แบ่งส่วนจะทำการรู้จำภาพบรรทัดตัวอักษรโดยไม่แบ่งส่วนภาพตัวอักษรแต่ละตัว วิธีนี้เหมาะสมกับภาษาอย่างเช่นภาษาไทยที่ประกอบด้วยตัวอักษรที่เชื่อมติดกันจำนวนมาก เป้าหมายของวิทยานิพนธ์นี้คือการประยุกต์ใช้หน่วยความจำระยะสั้นแบบยาว ซึ่งเป็นวิธีไม่แบ่งส่วนในการรู้จำตัวอักษรภาษาไทย นอกจากนี้วิทยานิพนธ์นำเสนอวิธีการเลื่อนองค์ประกอบแนวตั้ง ในการแก้ไขปัญหารูปแบบการรวมกันของตัวอักษรที่เกิดขึ้นแนวตั้งจำนวนมากบนโครงสร้างตัวอักษรสี่ระดับของภาษาไทย และยากต่อการนำมาใช้กับโครงข่ายหน่วยความจำระยะสั้นแบบยาวมาตรฐาน ผลการทดลองแสดงค่าความแม่นยำเปรียบเทียบวิธีที่นำเสนอบนโครงข่ายหน่วยความจำระยะสั้นแบบยาวมาตรฐาน กับซอฟต์แวร์เชิงพาณิชย์ในการรู้จำตัวอักษรภาษาไทยen_US
dc.description.abstractalternativeThe segmentation-based approach for Optical Character Recognition (OCR) works by first segmenting a text line image into individual character images and then recognizing the characters. The approach relies heavily on the performance of the segmentation process and thus suffers from the problem of touching and broken characters. On the other hand, the unsegmented approach for OCR processes the text line image without segmenting the image into individual characters, and the approach is more suitable for languages such as Thai that contains a lot of touching characters in nature. This thesis proposes an application of Long Short-Term Memory (LSTM), which is an unsegmented method, to Thai OCR. The thesis also introduces a method called vertical component shifting to solve the problem of a large number of vertically occurring character combinations that occur in four-level writing system of Thai, and pose difficulty for standard LSTM networks. The experimental results demonstrate the better accuracy of our proposed method over standard LSTM networks and other commercial software for Thai OCR.en_US
dc.language.isothen_US
dc.publisherจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.relation.urihttp://doi.org/10.58837/CHULA.THE.2016.825-
dc.rightsจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.subjectการรู้จำอักขระ (คอมพิวเตอร์)-
dc.subjectCharacter recognition-
dc.titleการรู้จำตัวอักษรพิมพ์ภาษาไทยโดยใช้หน่วยความจำระยะสั้นแบบยาวen_US
dc.title.alternativeThai printed character recognition using long short-term memoryen_US
dc.typeThesisen_US
dc.degree.nameวิทยาศาสตรมหาบัณฑิตen_US
dc.degree.levelปริญญาโทen_US
dc.degree.disciplineวิทยาศาสตร์คอมพิวเตอร์en_US
dc.degree.grantorจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.email.advisorBoonserm.K@Chula.ac.th,Boonserm.K@chula.ac.then_US
dc.identifier.DOI10.58837/CHULA.THE.2016.825-
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
5770420421.pdf4.73 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.