Please use this identifier to cite or link to this item: http://cuir.car.chula.ac.th/handle/123456789/43743
Title: การนำการปรากฏร่วมกันของเทอมมาประยุกต์ในการการขยายข้อสอบถามแบบอัตโนมัติด้วยการจัดกลุ่มแบบลำดับชั้นในการค้นคืนสารสนเทศ
Other Titles: Applying Term Co-occurrence in Automatic Query Expansion with Hierarchical Clustering in Information Retrieval
Authors: พีรภัทร กุลประดิษฐ์
Advisors: อัษฎาพร ทรัพย์สมบูรณ์
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี
Advisor's Email: assadaporn@cbs.chula.ac.th
Subjects: ซอฟต์แวร์ -- การพัฒนา
ระบบการจัดเก็บและค้นข้อสนเทศ
Computer software -- Development
Information storage and retrieval systems
Issue Date: 2556
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: วิทยานิพนธ์นี้เสนอการนำการขยายข้อสอบถามด้วยการจัดกลุ่มคำจากเอกสารในคอร์ปัสเอกสาร (Document Corpus) ด้วยขั้นตอนวิธีการจัดกลุ่มแบบลำดับชั้น มาประยุกต์ใช้กับระบบการค้นคืนสารสนเทศภาษาไทย โดยที่ผู้วิจัยจะต้องศึกษาเปรียบเทียบประสิทธิภาพการค้นคืนก่อนและหลังการนำขยายข้อสอบถามมาประยุกต์ด้วยค่าความแม่นยำที่สิบ ค่าความแม่นยำที่ยี่สิบ ค่าความแม่นยำที่สามสิบ และค่ามาตรวัดเอฟ ทั้งนี้ผู้วิจัยจะต้องสร้างชุดทดสอบสำหรับภาษาไทย นอกจากนี้แล้วผู้วิจัยจะต้องพัฒนาระบบการค้นคืนสารสนเทศและระบบการขยายข้อสอบถามด้วยการจัดกลุ่มคำด้วยเครื่องมือการค้นคืนสารสนเทศลูซีนและเครื่องมือการทำเหมืองข้อมูลเวกก้า ผู้วิจัยได้นำบทคัดย่อของโครงงานชั้นปี 4 ที่จัดทำโดยนิสิตคณะพาณิชยศาสตร์และการบัญชี ภาควิชาสถิติ สาขาเทคโนโลยีสารสนเทศธุรกิจ ในช่วงปีการศึกษา 2552-2554 จำนวน 100 ฉบับ และนิสิตที่กำลังศึกษาชั้นปี 4 คณะพาณิชยศาสตร์และการบัญชี ภาควิชาสถิติ สาขาเทคโนโลยีสารสนเทศธุรกิจ ในปีการศึกษา 2555 จำนวน 25 คนเป็นผู้ประเมินความเกี่ยวข้องของเอกสารและข้อสอบถามในการสร้างชุดทดสอบสำหรับภาษาไทย จากการเปรียบประสิทธิภาพการค้นคืนด้วยค่าความแม่นยำที่สิบ ค่าความแม่นยำที่ยี่สิบ ค่าความแม่นยำที่สามสิบ และค่ามาตรวัดเอฟ สรุปได้ว่าการนำการขยายข้อสอบถามด้วยการจัดกลุ่มคำมาประยุกต์ใช้นั้น จะสามารถช่วยเพิ่มประสิทธิภาพการค้นคืน
Other Abstract: This thesis presents the application of query expansion using term clustering from hierarchical clustering, with information retrieval system for Thai language. The comparison of retrieval performance of before and after applying query expansion, with precision at 10 documents, precision at 20 documents, precision at 30 documents, and F-measure. In addition, an information retrieval system and a query expansion system is implemented using term clustering, with information retrieval toolkit, Lucene, and data mining toolkit, Weka This research includes 100 abstracts of Senior projects in the Bachelor program in Information Technology for Business at the Faculty of Commerce and Accountancy, Department of Statistics in the academic year 2009-2011 25 4th year-Students in the academic year 2012 at the Faculty of Commerce and Accountancy, Department of Statistics provide test collection. A query and assess relevency of each document. With Retrieval performance : precision at 10 documents, precision at 20 documents, precision at 30 documents, and F-measure, it can be concluded that applying query expansion with term clustering leads to better retrieval performance.
Description: วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2556
Degree Name: วิทยาศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: การพัฒนาซอฟต์แวร์ด้านธุรกิจ
URI: http://cuir.car.chula.ac.th/handle/123456789/43743
URI: http://doi.org/10.14457/CU.the.2013.1201
metadata.dc.identifier.DOI: 10.14457/CU.the.2013.1201
Type: Thesis
Appears in Collections:Acctn - Theses

Files in This Item:
File Description SizeFormat 
5381853026.pdf11.41 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.