Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/11059
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorบุญเสริม กิจศิริกุล-
dc.contributor.authorเกรียงศักดิ์ เหล็กดี-
dc.contributor.otherจุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์-
dc.date.accessioned2009-09-09T11:54:52Z-
dc.date.available2009-09-09T11:54:52Z-
dc.date.issued2546-
dc.identifier.isbn9741757808-
dc.identifier.urihttp://cuir.car.chula.ac.th/handle/123456789/11059-
dc.descriptionวิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2546en
dc.description.abstractพัฒนาโปรแกรมสำหรับการประมวลผลล่วงหน้าของภาพเอกสาร ซึ่งจะประกอบไปด้วยโปรแกรมในการสร้างภาพไบนารีจากภาพเอกสาร ที่ประกอบไปด้วยข้อความ พื้นหลัง หรือภาพถ่าย และโปรแกรมปรับมุมการเอียงของภาพเอกสารโดยอัตโนมัติ งานวิจัยนี้ได้นำเสนอโปรแกรมในการสร้างภาพไบนารีด้วยอัลกอริทึม 2 อัลกอริทึมคือ อัลกอริทึมไนแบล็กหรืออัลกอริทึมของยาโนวิทซ์และบรัคสเตียน และโปรแกรมปรับมุมการเอียงของภาพเอกสารโดยอัตโนมัติอีก 2 อัลกอริทึมคืออัลกอริทึมฮัจทรานสฟอร์มและเนียเรสเนเบอร์คัทเตอริง ข้อมูลภาพเอกสารที่ใช้ทดสอบประกอบด้วยเอกสาร 2 ชุด เอกสารชุดแรกที่ทดลองการไบไรเซชันจะด้วยอัลกอริทึมไนแบล็ก หรืออัลกอริทึมของยาโนวิทซ์และบรัคสเตียน ผลจากการทดลองในการทำไบนาไรเซชันโดยรวม อัลกอริทึมของไนแบล็กจะมีประสิทธิภาพมากกว่า อัลกอริทึมของยาโนวิทซ์และบรัคสเตียน จากภาพเอกสารจำนวน 10 ภาพ มีจำนวนตัวอักษรรวม 2,316 ตัว ผลการรู้จำตัวอักษรเมื่อนำภาพเอกสารที่ผ่านการทำไบนาไรเซชัน ด้วยอัลกอริทึมของอ็อดสึ จำนวนตัวอักษรที่ถูกต้องเท่ากับ 49.32% เอกสารภาพที่ผ่านอัลกอริทึมของไนแบล็ก จำนวนตัวอักษรที่ถูกต้องเท่ากับ 63.16% เอกสารภาพที่ผ่านอัลกอริทึม ของยาโนวิทซ์และบรัคสเตียน จำนวนตัวอักษรที่ถูกต้องเท่ากับ 60.75% ส่วนผลจากการทดลองในการปรับมุมการเอียงโดยอัตโนมัติ ด้วยอัลกอริทึมเนียเรสเนเบอร์คัทเตอริงจะเร็วกว่า และมีความละเอียดมากกว่าอัลกอริทึมฮัจทรานสฟอร์ม โดยที่อัลกอริทึมเนียเรสเนเบอร์คัทเตอริงมีค่าของมุมคลาดเคลื่อน +-0 ํ ถึง +-2 ํ และอัลกอริทึมฮัจทรานสฟอร์มมีค่าของมุมคลาดเคลื่อน คลาดเคลื่อน +-0 ํ ถึง +-3 ํen
dc.description.abstractalternativeIn this thesis, a set of computer programs for document image pre-processing for Thai optical character recognition are proposed. The binarization program generates binary images from document images composing of text, background, and/or image data. Another program performs automatic skew detection of document images. Niblack's algorithm and Yanowitz and Bruckstein's algorithm were implemented for comparison of binarization. Hough Transform's algorithm and Nearest-Neighbor Clustering's algorithm were implemented for comparison of automatic skew detection. The experimental result of binarization demonstrates that Niblack's algorithm is superior to Yanowitz and Bruckstein's algorithm. The accuracy of OCR after binarization with this algorithm is 63.75% whereas Yanowitz and Bruckstein's algorithm produces accuracy of only 60.75%. For automatic skew detection, Nearest-Neighbor Clustering's algorithm provides higher speed and finer skew correction than Hough Transform's algorithm.en
dc.format.extent1953679 bytes-
dc.format.mimetypeapplication/pdf-
dc.language.isothes
dc.publisherจุฬาลงกรณ์มหาวิทยาลัยen
dc.rightsจุฬาลงกรณ์มหาวิทยาลัยen
dc.subjectระบบการสร้างภาพเอกสารen
dc.subjectการรู้จำอักขระ (คอมพิวเตอร์)en
dc.subjectภาษาไทย -- ตัวอักษรen
dc.titleการประมวลผลล่วงหน้าของภาพเอกสารสำหรับการรู้จำตัวอักษรภาษาไทยen
dc.title.alternativeDocument image pre-processing for Thai optical character recognitionen
dc.typeThesises
dc.degree.nameวิทยาศาสตรมหาบัณฑิตes
dc.degree.levelปริญญาโทes
dc.degree.disciplineวิทยาศาสตร์คอมพิวเตอร์es
dc.degree.grantorจุฬาลงกรณ์มหาวิทยาลัยen
dc.email.advisorboonserm@cp.eng.chula.ac.th, Boonserm.K@chula.ac.th-
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
Kriangsak.pdf1.91 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.