Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/64152
Title: | โปรแกรมตอบคำถามจากคลังข้อมูลวิกิพีเดียภาษาไทย |
Other Titles: | A question answering program from Thai Wikipedia |
Authors: | ณัฐภาศ์ แจ้งสว่าง ปณิตา วิโรจน์วงษ์ชัย |
Advisors: | ฑิตยา หวานวารี |
Other author: | จุฬาลงกรณ์มหาวิทยาลัย. คณะวิทยาศาสตร์ |
Advisor's Email: | Dittaya.W@chula.ac.th |
Subjects: | วิกิ (วิทยาการคอมพิวเตอร์) โปรแกรมประยุกต์ Wikis (Computer science) Application software |
Issue Date: | 2561 |
Publisher: | จุฬาลงกรณ์มหาวิทยาลัย |
Abstract: | ในยุคสมัยนี้ข้อมูลข่าวสารมีความจำเป็นต่อการดำเนินชีวิตมากขึ้น การค้นหาข้อมูลจึงเป็นสิ่งที่มีความสำคัญ ในปัจจุบันงานด้านการค้นหาข้อมูล ส่วนมากไม่ได้ตอบสนองผู้ใช้โดยตรง ผู้ใช้จะต้องค้นหาคำตอบที่ต้องการจากรายการเอกสาร แต่ในความเป็นจริงผู้ใช้ต้องการคำตอบเป็นข้อความสั้น ๆ โครงงานฉบับนี้จึงมีวัตถุประสงค์เพื่อพัฒนาโปรแกรมคำถามจากคลังข้อมูลวิกิพีเดียภาษาไทย โดยผลลัพธ์ของคำถามเป็นช่วงคำสั้น ๆ ที่สืบค้น ซึ่งแบ่งออกเป็น 2 ขั้นตอน ได้แก่ การค้นค้นเอกสารและการสกัดคำตอบ จากการทดลองวิธีการจับคู่สายอักขระมีผลลัพธ์ในการค้นคืนเอกสารมากที่สุด 43% และวิธีการคำนวณคะแนนจากตำแหน่งของคำโดยที่ K=10 และมีค่ากำหนด มีผลลัพธ์ในการค้นคืนคำตอบที่ถูกต้องเป็นอันดับแรก 18% ดังนั้นการรวมการค้นคืนเอกสารและการสกัดคำตอบเข้าด้วยกันสามารถตอบคำตอบถูกต้อง 5% |
Other Abstract: | Information plays an important role in the world since we are now in the information era. Hence, searching for data is important. Search engines on the internet do not directly give what users need. Users need to read through the documents to get the specific answer. To solve this problem, we have developed a question answering system which retrieves a short answer for a Thai question based on knowledge in Thai Wikipedia. The system consists of document retriever and answer extraction modules. From the experiment, the string matching method has the highest results in 43% of document retrieval. The result of calculating score from the position of the word, where k = 10 and set a threshold has the highest results in 18%. Thus, a question answering system extracts correct answer 5%. |
Description: | โครงงานเป็นส่วนหนึ่งของการศึกษาตามหลักสูตรปริญญาวิทยาศาสตรบัณฑิต สาขาวิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย ปีการศึกษา 2561 |
URI: | http://cuir.car.chula.ac.th/handle/123456789/64152 |
Type: | Senior Project |
Appears in Collections: | Sci - Senior Projects |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Naspa_C_Se_2561.pdf | 1.15 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.