Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/12636
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | ยรรยง เต็งอำนวย | - |
dc.contributor.author | พิสิทธิ์ พรมจันทร์ | - |
dc.contributor.other | จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย | - |
dc.date.accessioned | 2010-05-10T09:57:50Z | - |
dc.date.available | 2010-05-10T09:57:50Z | - |
dc.date.issued | 2540 | - |
dc.identifier.isbn | 9746381334 | - |
dc.identifier.uri | http://cuir.car.chula.ac.th/handle/123456789/12636 | - |
dc.description | วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2540 | en |
dc.description.abstract | งานวิจัยนี้ได้ทำการวิเคราะห์ หาแนวทางในการเปรียบเทียบสมรรถนะของโปรแกรมและอัลกอริธึมตัดคำภาษาไทย โดยเริ่มจากการสังเคราะห์ตัวอย่างมาตรวัด ที่จะใช้ในการวัดและเปรียบเทียบประสิทธิภาพ ศึกษาคุณลักษณะเฉพาะของเอกสารภาษาไทย ที่มีผลต่อประสิทธิภาพของโปรแกรมตัดคำภาษาไทย รวบรวมโปรแกรมและอัลกอริธึมตัดคำภาษาไทย ที่ได้มีการพัฒนาและเผยแพร่ใช้งานในปัจจุบัน รวบรวมข้อมูลภาษาไทยที่ใช้อ้างอิง รวมไปถึงพจนานุกรมที่ใช้ในการตรวจสอบความถูกต้องของการตัดคำ จากนั้นจึงทำการพัฒนาวิธีการวัดประสิทธิภาพ และทำการวัดประสิทธิภาพ จากผลการวัดประสิทธิภาพพบว่าแบบเปรียบเทียบคำที่ยาวที่สุดจะตัดได้จำนวนคำที่ถูกต้องออกมามากที่สุด แบบการแก้ไขย้อนกลับจะได้คำผิดน้อยที่สุด แบบอาศัยความถี่ของการใช้คำจะได้อัตราความถูกต้องต่อจำนวนคำในพจนานุกรมสูงสุด แบบใช้พจนานุกรมลดความกำกวมสามารถจัดการกับคำกำกวมได้ดีที่สุดและแบบเปรียบเทียบคำที่สั้นที่สุดจะตัดออกมาได้จำนวนคำสูงสุด นอกจากนี้พบว่าโครงสร้างข้อมูลสำหรับพจนานุกรมที่ใช้ในโปรแกรมตัดคำมีผลมากในด้านความเร็ว โดยที่โครงสร้างข้อมูลแบบทรัยให้ความเร็วสูงสุดในปัจจุบัน | en |
dc.description.abstractalternative | In this thesis, the guidelines for performance comparison of Thai Words Separation Programs have been analyzed. The thesis begin from synthesis of example of performance indicators, study the characteristics of Thai documents that effect performance of the Thai Words Separation Programs. Then, collect Thai Words Separation Programs and algorithms that had been developed and announced to be used currently, collect the Thai reference data which include the reference dictionary to validate the accuracy of Thai Words Separation, and develop the measurement methodology. Finally, I do the performance measurement using the developed methodology. Experimental results show that the Longest Pattern Matching gives the most accurate words output while the Back Tracking Algorithm gives the least error words. Words Usage Frequency gives the highest valid words ratio per number of words in its dictionary. The usage of ambiguity dictionary gives the best ambiguous case resolution, whereas the Shortest Pattern Matching gives the highest number of words output. Additionally, it is found that the data structure for dictionary that used in Thai Words Separation Programs extremely effects in term of speed, meanwhile the Trie structure is the most popular method that has been used in the present due to its outperform speed. | en |
dc.format.extent | 320209 bytes | - |
dc.format.extent | 286645 bytes | - |
dc.format.extent | 476052 bytes | - |
dc.format.extent | 251060 bytes | - |
dc.format.extent | 239270 bytes | - |
dc.format.extent | 249287 bytes | - |
dc.format.extent | 312388 bytes | - |
dc.format.extent | 195691 bytes | - |
dc.format.extent | 937713 bytes | - |
dc.format.extent | 250977 bytes | - |
dc.format.extent | 261235 bytes | - |
dc.format.mimetype | application/pdf | - |
dc.format.mimetype | application/pdf | - |
dc.format.mimetype | application/pdf | - |
dc.format.mimetype | application/pdf | - |
dc.format.mimetype | application/pdf | - |
dc.format.mimetype | application/pdf | - |
dc.format.mimetype | application/pdf | - |
dc.format.mimetype | application/pdf | - |
dc.format.mimetype | application/pdf | - |
dc.format.mimetype | application/pdf | - |
dc.format.mimetype | application/pdf | - |
dc.language.iso | th | es |
dc.publisher | จุฬาลงกรณ์มหาวิทยาลัย | en |
dc.rights | จุฬาลงกรณ์มหาวิทยาลัย | en |
dc.subject | อัลกอริทึม | en |
dc.subject | การตัดคำ | en |
dc.title | การวิเคราะห์แนวทางการเปรียบเทียบสมรรถนะของโปรแกรมแยกคำภาษาไทย | en |
dc.title.alternative | Analysis of guidelines for performance comparison of Thai word separation programs | en |
dc.type | Thesis | es |
dc.degree.name | วิทยาศาสตรมหาบัณฑิต | es |
dc.degree.level | ปริญญาโท | es |
dc.degree.discipline | วิทยาศาสตร์คอมพิวเตอร์ | es |
dc.degree.grantor | จุฬาลงกรณ์มหาวิทยาลัย | en |
dc.email.advisor | Yunyong.T@Chula.ac.th | - |
Appears in Collections: | Grad - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Pisit_Pr_front.pdf | 312.7 kB | Adobe PDF | View/Open | |
Pisit_Pr_ch1.pdf | 279.93 kB | Adobe PDF | View/Open | |
Pisit_Pr_ch2.pdf | 464.89 kB | Adobe PDF | View/Open | |
Pisit_Pr_ch3.pdf | 245.18 kB | Adobe PDF | View/Open | |
Pisit_Pr_ch4.pdf | 233.66 kB | Adobe PDF | View/Open | |
Pisit_Pr_ch5.pdf | 243.44 kB | Adobe PDF | View/Open | |
Pisit_Pr_ch6.pdf | 305.07 kB | Adobe PDF | View/Open | |
Pisit_Pr_ch7.pdf | 191.1 kB | Adobe PDF | View/Open | |
Pisit_Pr_ch8.pdf | 915.74 kB | Adobe PDF | View/Open | |
Pisit_Pr_ch9.pdf | 245.09 kB | Adobe PDF | View/Open | |
Pisit_Pr_back.pdf | 255.11 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.