Abstract:
วิทยานิพนธ์นี้เสนอการนำการขยายข้อสอบถามด้วยการจัดกลุ่มคำจากเอกสารในคอร์ปัสเอกสาร (Document Corpus) ด้วยขั้นตอนวิธีการจัดกลุ่มแบบลำดับชั้น มาประยุกต์ใช้กับระบบการค้นคืนสารสนเทศภาษาไทย โดยที่ผู้วิจัยจะต้องศึกษาเปรียบเทียบประสิทธิภาพการค้นคืนก่อนและหลังการนำขยายข้อสอบถามมาประยุกต์ด้วยค่าความแม่นยำที่สิบ ค่าความแม่นยำที่ยี่สิบ ค่าความแม่นยำที่สามสิบ และค่ามาตรวัดเอฟ ทั้งนี้ผู้วิจัยจะต้องสร้างชุดทดสอบสำหรับภาษาไทย นอกจากนี้แล้วผู้วิจัยจะต้องพัฒนาระบบการค้นคืนสารสนเทศและระบบการขยายข้อสอบถามด้วยการจัดกลุ่มคำด้วยเครื่องมือการค้นคืนสารสนเทศลูซีนและเครื่องมือการทำเหมืองข้อมูลเวกก้า
ผู้วิจัยได้นำบทคัดย่อของโครงงานชั้นปี 4 ที่จัดทำโดยนิสิตคณะพาณิชยศาสตร์และการบัญชี ภาควิชาสถิติ สาขาเทคโนโลยีสารสนเทศธุรกิจ ในช่วงปีการศึกษา 2552-2554 จำนวน 100 ฉบับ และนิสิตที่กำลังศึกษาชั้นปี 4 คณะพาณิชยศาสตร์และการบัญชี ภาควิชาสถิติ สาขาเทคโนโลยีสารสนเทศธุรกิจ ในปีการศึกษา 2555 จำนวน 25 คนเป็นผู้ประเมินความเกี่ยวข้องของเอกสารและข้อสอบถามในการสร้างชุดทดสอบสำหรับภาษาไทย
จากการเปรียบประสิทธิภาพการค้นคืนด้วยค่าความแม่นยำที่สิบ ค่าความแม่นยำที่ยี่สิบ ค่าความแม่นยำที่สามสิบ และค่ามาตรวัดเอฟ สรุปได้ว่าการนำการขยายข้อสอบถามด้วยการจัดกลุ่มคำมาประยุกต์ใช้นั้น จะสามารถช่วยเพิ่มประสิทธิภาพการค้นคืน