Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/64172
Title: | โปรแกรมสรุปเนื้อหาข่าวกีฬาฟุตบอล |
Other Titles: | Soccer News Summarization |
Authors: | กรวิชญ์ กำปั่นทอง อภิชัย สมนาม |
Advisors: | นฤมล ประทานวณิช |
Other author: | จุฬาลงกรณ์มหาวิทยาลัย. คณะวิทยาศาสตร์ |
Advisor's Email: | naruemon.p@chula.ac.th |
Subjects: | การเรียนรู้ของเครื่อง ข่าวกีฬา โปรแกรมประยุกต์ Machine learning Sports journalism Application software |
Issue Date: | 2561 |
Publisher: | จุฬาลงกรณ์มหาวิทยาลัย |
Abstract: | โครงการวิจัยในชั้นเรียน เรื่อง “โปรแกรมสรุปเนื้อหาข่าวกีฬาฟุตบอล” มีวัตถุประสงค์ คือ พัฒนาโปรแกรมสรุปเนื้อหาข่าวสารเกี่ยวกับกีฬาฟุตบอล โดยนำเทคนิคการเรียนรู้ของเครื่อง มาประยุกต์ใช้เริ่มจากการใช้ word embedding ซึ่งเป็นวิธีที่ใช้สำหรับเปลี่ยนคำเป็นเวกเตอร์จำนวนจริง หลังจากนั้นใช้ตัวแบบทางคณิตศาสตร์ sequence-to-sequence มาใช้ในการประมวลข้อมูลข่าวเพื่อสร้างสรุปข่าว ในส่วนของการวัดผลนั้น เพื่อเปรียบเทียบคะแนนที่ได้จากสรุปที่ได้จากตัวแบบทางคณิตศาสตร์และสรุปที่ได้จากการสุ่ม คณะผู้จัดทำใช้ BLEU scores ซึ่งวัดว่ามีจำนวนคำที่เหมือนกับสรุปข่าวจริงอยู่กี่คำ ทั้งแบบ 1-gram ที่พิจารณาคำแต่ละคำแยกกัน และแบบ 2-gram ที่พิจารณาสองคำที่อยู่ติดกัน ผลการวิจัยที่ได้แสดงให้เห็นว่า สรุปที่ได้จากตัวแบบทางคณิตศาสตร์นั้นดีกว่าสรุปที่ได้จากการสุ่มโดยเฉพาะเมื่อพิจารณาแบบสองคำที่อยู่ติดกัน นอกจากนี้สรุปที่ได้จากโมเดลสามารถอ่านแล้วพอเข้าใจได้ว่าทีมใดชนะ |
Other Abstract: | The objective of this project is to apply machine learning techniques for soccer’s news summarization. First, we used a word embedding technique which converts words into numerical vectors. Then, we applied a sequence-to-sequence model to learn the conversion of news scripts to their corresponding summaries. To evaluate the model performance, we used 1-gram and 2- gram BLEU scores to compute the number of words that the model and the random procedure recalled from the true summaries. Our results reveal that the summaries from the sequenceto- sequence model had higher BLEU scores than the output from random summarization, especially on the 2-gram BLEU scores, indicating more readability. Additionally, the model’s summaries were moderately understandable which team was the winner. |
Description: | โครงงานเป็นส่วนหนึ่งของการศึกษาตามหลักสูตรปริญญาวิทยาศาสตรบัณฑิต สาขาวิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย ปีการศึกษา 2561 |
URI: | http://cuir.car.chula.ac.th/handle/123456789/64172 |
Type: | Senior Project |
Appears in Collections: | Sci - Senior Projects |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Korawitch_K_Se_2561.pdf | 1.24 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.