Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/72099
Title: | การออกแบบและพัฒนาส่วนจำเพาะการค้นข้อความไทยในเอกสารพีดีเอฟ |
Other Titles: | A design and development of a Thai text search module in PDF files |
Authors: | สุรพงษ์ เชาว์เชี่ยวชาญ |
Advisors: | สมชาย ประสิทธิ์จูตระกูล |
Other author: | จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์ |
Advisor's Email: | Somchai.P@Chula.ac.th |
Subjects: | การค้นคืนสารสนเทศ ระบบการสร้างภาพเอกสาร ภาษาไทย Portable document software |
Issue Date: | 2543 |
Publisher: | จุฬาลงกรณ์มหาวิทยาลัย |
Abstract: | วิทยานิพนธ์นี้นำเสนอการออกแบบและพัฒนาส่วนจำเพาะซึ่งใช้สำหรับการค้นข้อความไทยในเอกสารพีดีเอฟ ส่วนจำเพาะนี้มีหน้าที่หลักคือการถอดรหัสอักขระ การเปรียบเทียบลายอักขระ และการแสดงตำแหน่งในเอกสารที่ค้นพบ ความซับซ้อนของส่วนจำเพาะนี้อยู่ที่ขั้นตอนการถอดรหัส ทั้งนี้เนื่องจากเครื่องมือการสร้างเอกสารพีดีเอฟในปัจจุบันไม่สนับสนุนการเข้ารหัสภาษาไทยที่เป็นมาตรฐาน ดังนั้นอักขระไทยต่างๆ ในเอกสารพีดีเอฟ จึงถูกเข้ารหัสในหลากหลายรูปแบบ ขั้นตอนการถอดรหัสอาศัยข้อมูลของแบบอักษรชื่ออักขระและสภาพแวดล้อมที่สร้างเอกสารพีดีเอฟนั้นๆ ประกอบการวิเคราะห์การถอดรหัส การพัฒนาอาศัยชุดพัฒนาส่วนจำเพาะที่ใช้ได้กับซอฟต์แวร์แสดงเอกสารพีดีเอฟอะโครแบต ส่วนจำเพาะสามารถค้นข้อความไทยในเอกสารพีดีเอฟที่มีการเข้ารหัสภาษาไทยในรูป แบบคงที่ได้ทุกรูป แบบ |
Other Abstract: | This thesis presents a design and development of a Thai text search module in PDF files. The Objectives of this module are to decode characters, match strings, and highlight the matched strings. The complexity of the module is in the decoding step since current PDF creation tools do not support standard Thai character encoding. As a result, Thai characters are encoded in many different formats. The decoding step uses font description, character names, and information related to tools and environment used for generating PDF files for analyzing encoded characters. The module was developed using Acrobat PDF software development kit. The module can search Thai text in any fixed-format encoded PDF files. |
Description: | วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2543 |
Degree Name: | วิทยาศาสตรมหาบัณฑิต |
Degree Level: | ปริญญาโท |
Degree Discipline: | วิทยาศาสตร์คอมพิวเตอร์ |
URI: | http://cuir.car.chula.ac.th/handle/123456789/72099 |
ISBN: | 9743469591 |
Type: | Thesis |
Appears in Collections: | Eng - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Surapong_ch_front_p.pdf | หน้าปก สารบัญ และบทคัดย่อ | 822.16 kB | Adobe PDF | View/Open |
Surapong_ch_ch1_p.pdf | บทที่ 1 | 875.08 kB | Adobe PDF | View/Open |
Surapong_ch_ch2_p.pdf | บทที่ 2 | 1.37 MB | Adobe PDF | View/Open |
Surapong_ch_ch3_p.pdf | บทที่ 3 | 1.31 MB | Adobe PDF | View/Open |
Surapong_ch_ch4_p.pdf | บทที่ 4 | 739.16 kB | Adobe PDF | View/Open |
Surapong_ch_ch5_p.pdf | บทที่ 5 | 1.13 MB | Adobe PDF | View/Open |
Surapong_ch_ch6_p.pdf | บทที่ 6 | 684.16 kB | Adobe PDF | View/Open |
Surapong_ch_back_p.pdf | บรรณานุกรมและภาคผนวก | 1.84 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.