DSpace Repository

การค้นคืนสารสนเทศเชิงความหมายและการค้นคืนสารสนเทศข้ามภาษาของสมุนไพรไทยและยาแผนปัจจุบันด้วยเทคนิคการวิเคราะห์ความหมายแฝง

Show simple item record

dc.contributor.advisor นครทิพย์ พร้อมพูล
dc.contributor.author พิชชากร เอกวรานุกูลศิริ
dc.contributor.other จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
dc.date.accessioned 2017-03-22T10:04:45Z
dc.date.available 2017-03-22T10:04:45Z
dc.date.issued 2556
dc.identifier.uri http://cuir.car.chula.ac.th/handle/123456789/52689
dc.description วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2556 en_US
dc.description.abstract ปัจจุบันมีผู้ให้บริการข้อมูลหลายรายเกี่ยวกับสมุนไพรที่เป็นภาษาไทยและยาแผนปัจจุบันที่เป็นภาษาอังกฤษ ผู้วิจัยจึงเกิดแนวคิดที่จะพัฒนาเครื่องมือที่สามารถค้นคืนได้ทั้งข้อมูลสมุนไพรและข้อมูลยาแผนปัจจุบัน เพื่อที่จะเป็นประโยชน์แก่ผู้ที่สนใจค้นคืนข้อมูลในลักษณะนี้ โดยประยุกต์การใช้เทคนิคการวิเคราะห์ความหมายแฝงและเทคนิคคำศัพท์ควบคุม ในการที่จะให้เครื่องมือนั้นสามารถค้นคืนสารสนเทศข้ามภาษาระหว่างภาษาไทยกับภาษาอังกฤษและสามารถค้นคืนสารสนเทศเชิงความหมายได้ ซึ่งผู้วิจัยได้แบ่งการประเมินประสิทธิผลของการทดลองที่ได้จากการค้นคืนเพื่อหาวิธีการที่เหมาะสมไปใช้ในการสร้างเครื่องมือดังกล่าว ออกเป็นสามส่วนดังนี้ 1) การค้นคืนด้วยขนาดเมทริกซ์ที่ต่างกัน 2) การค้นคืนด้วยรูปแบบของข้อคำถามที่ต่างกัน แบบปกติและแบบที่ให้การขยายข้อคำถามด้วยการใช้คำศัพท์ควบคุม และ 3) การค้นคืนด้วยเทคนิคที่ต่างกันนั่นคือ เทคนิคแบบจำลองปริภูมิเวคเตอร์และเทคนิคการวิเคราะห์ความหมายแฝง โดยผลการทดลองที่ 1) พบว่าหากเพิ่มขนาดเมทริกซ์ให้มากขึ้น จะทำให้ค่าระลึกและค่าความแม่นยำเพิ่มขึ้นตามไปด้วย โดยที่ขนาดเมทริกซ์ของสมุนไพรและยาแผนปัจจุบันจะอยู่ที่ 90x90 และ 30x30 ตามลำดับ นอกจากนี้ในส่วนของข้อคำถามจากผู้ใช้งานในการทดลองที่ 2) ก็เป็นอีกปัจจัยหนึ่งในการค้นคืน โดยหากค้นคืนด้วยข้อคำถามที่ผ่านการขยายข้อคำถามจากคำศัพท์ควบคุม จะให้ค่าประสิทธิผลดีกว่าการค้นคืนด้วยข้อคำถามที่ไม่ผ่านการขยายข้อคำถาม โดยค่าความแม่นยำของสมุนไพรและยาแผนปัจจุบันมีอัตราการเพิ่มขึ้นร้อยละ 68.83 และ 70.04 ตามลำดับ และในการทดลองที่ 3) เมื่อเปรียบเทียบประสิทธิผลระหว่างสองเทคนิค พบว่าการค้นคืนสมุนไพรด้วยเทคนิคการวิเคราะห์ความหมายแฝงจะให้ประสิทธิผลดีกว่าแบบจำลองปริภูมิเวคเตอร์ร้อยละ 40.77 แต่การค้นคืนยาแผนปัจจุบันด้วยแบบจำลองปริภูมิเวคเตอร์จะให้ประสิทธิผลดีกว่าการวิเคราะห์ความหมายแฝงร้อยละ 30.95 จากการประเมินด้วยค่าความแม่นยำ en_US
dc.description.abstractalternative Nowadays there are many information providers providing herbal data and modern medicine data in Thai language and English language respectively. This research aims to develop a tool to retrieve both information types using Latent Semantic Analysis (LSA) and Controlled Vocabulary Technique (CVT) for semantic and cross-language information retrieval to serve the target audiences. In order to fine the suitable method for tool development, this research experiment was divided into three parts: 1) the retrieval based on the variation of the matrices dimensions, 2) the retrieval based on the difference forms of user query, normal query and query with terms expansion using CVT, and 3) the retrieval based on the two techniques, Vector Space Model (VSP) and LSA. From the first experiment, by varying the size of matrices used for LSA technique, we found that the size of matrices for herbal and modern medicine would be 90x90 and 30x30 respectively since each one yielded the highest result in both recall and precision in each repository. From the second experiment, query expansion technique outperformed the regular query by increasing the percentage of precision to 68.83% and 70.04% in herbal and modern medicine respectively. In addition, from the last experiment, using LSA in the retrieval of herbal repository gained 40.77% higher precision than VSM while using VSM in the retrieval of modern medicine repository yielded 70.04% higher precision than LSA. en_US
dc.language.iso th en_US
dc.publisher จุฬาลงกรณ์มหาวิทยาลัย en_US
dc.relation.uri http://doi.org/10.14457/CU.the.2013.1773
dc.rights จุฬาลงกรณ์มหาวิทยาลัย en_US
dc.subject การค้นคืนสารสนเทศ en_US
dc.subject การค้นคืนสารสนเทศข้ามภาษา en_US
dc.subject ระบบการจัดเก็บและค้นคืนสารสนเทศ -- เภสัชศาสตร์ en_US
dc.subject Information retrieval en_US
dc.subject Cross-language information retrieval en_US
dc.subject Information storage and retrieval systems -- Pharmacy en_US
dc.title การค้นคืนสารสนเทศเชิงความหมายและการค้นคืนสารสนเทศข้ามภาษาของสมุนไพรไทยและยาแผนปัจจุบันด้วยเทคนิคการวิเคราะห์ความหมายแฝง en_US
dc.title.alternative Semantic and cross-language information retrieval for Thai traditional medicine and modern medicine using latent semantic analysis en_US
dc.type Thesis en_US
dc.degree.name วิทยาศาสตรมหาบัณฑิต en_US
dc.degree.level ปริญญาโท en_US
dc.degree.discipline วิศวกรรมซอฟต์แวร์ en_US
dc.degree.grantor จุฬาลงกรณ์มหาวิทยาลัย en_US
dc.email.advisor Nakornthip.S@chula.ac.th
dc.identifier.DOI 10.14457/CU.the.2013.1773


Files in this item

This item appears in the following Collection(s)

Show simple item record