Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/64172
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorนฤมล ประทานวณิช-
dc.contributor.authorกรวิชญ์ กำปั่นทอง-
dc.contributor.authorอภิชัย สมนาม-
dc.contributor.otherจุฬาลงกรณ์มหาวิทยาลัย. คณะวิทยาศาสตร์-
dc.date.accessioned2020-02-15T15:28:34Z-
dc.date.available2020-02-15T15:28:34Z-
dc.date.issued2561-
dc.identifier.urihttp://cuir.car.chula.ac.th/handle/123456789/64172-
dc.descriptionโครงงานเป็นส่วนหนึ่งของการศึกษาตามหลักสูตรปริญญาวิทยาศาสตรบัณฑิต สาขาวิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย ปีการศึกษา 2561en_US
dc.description.abstractโครงการวิจัยในชั้นเรียน เรื่อง “โปรแกรมสรุปเนื้อหาข่าวกีฬาฟุตบอล” มีวัตถุประสงค์ คือ พัฒนาโปรแกรมสรุปเนื้อหาข่าวสารเกี่ยวกับกีฬาฟุตบอล โดยนำเทคนิคการเรียนรู้ของเครื่อง มาประยุกต์ใช้เริ่มจากการใช้ word embedding ซึ่งเป็นวิธีที่ใช้สำหรับเปลี่ยนคำเป็นเวกเตอร์จำนวนจริง หลังจากนั้นใช้ตัวแบบทางคณิตศาสตร์ sequence-to-sequence มาใช้ในการประมวลข้อมูลข่าวเพื่อสร้างสรุปข่าว ในส่วนของการวัดผลนั้น เพื่อเปรียบเทียบคะแนนที่ได้จากสรุปที่ได้จากตัวแบบทางคณิตศาสตร์และสรุปที่ได้จากการสุ่ม คณะผู้จัดทำใช้ BLEU scores ซึ่งวัดว่ามีจำนวนคำที่เหมือนกับสรุปข่าวจริงอยู่กี่คำ ทั้งแบบ 1-gram ที่พิจารณาคำแต่ละคำแยกกัน และแบบ 2-gram ที่พิจารณาสองคำที่อยู่ติดกัน ผลการวิจัยที่ได้แสดงให้เห็นว่า สรุปที่ได้จากตัวแบบทางคณิตศาสตร์นั้นดีกว่าสรุปที่ได้จากการสุ่มโดยเฉพาะเมื่อพิจารณาแบบสองคำที่อยู่ติดกัน นอกจากนี้สรุปที่ได้จากโมเดลสามารถอ่านแล้วพอเข้าใจได้ว่าทีมใดชนะen_US
dc.description.abstractalternativeThe objective of this project is to apply machine learning techniques for soccer’s news summarization. First, we used a word embedding technique which converts words into numerical vectors. Then, we applied a sequence-to-sequence model to learn the conversion of news scripts to their corresponding summaries. To evaluate the model performance, we used 1-gram and 2- gram BLEU scores to compute the number of words that the model and the random procedure recalled from the true summaries. Our results reveal that the summaries from the sequenceto- sequence model had higher BLEU scores than the output from random summarization, especially on the 2-gram BLEU scores, indicating more readability. Additionally, the model’s summaries were moderately understandable which team was the winner.en_US
dc.language.isothen_US
dc.publisherจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.rightsจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.subjectการเรียนรู้ของเครื่องen_US
dc.subjectข่าวกีฬาen_US
dc.subjectโปรแกรมประยุกต์en_US
dc.subjectMachine learningen_US
dc.subjectSports journalismen_US
dc.subjectApplication softwareen_US
dc.titleโปรแกรมสรุปเนื้อหาข่าวกีฬาฟุตบอลen_US
dc.title.alternativeSoccer News Summarizationen_US
dc.typeSenior Projecten_US
dc.email.advisornaruemon.p@chula.ac.th-
Appears in Collections:Sci - Senior Projects

Files in This Item:
File Description SizeFormat 
Korawitch_K_Se_2561.pdf1.24 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.