Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/64172
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | นฤมล ประทานวณิช | - |
dc.contributor.author | กรวิชญ์ กำปั่นทอง | - |
dc.contributor.author | อภิชัย สมนาม | - |
dc.contributor.other | จุฬาลงกรณ์มหาวิทยาลัย. คณะวิทยาศาสตร์ | - |
dc.date.accessioned | 2020-02-15T15:28:34Z | - |
dc.date.available | 2020-02-15T15:28:34Z | - |
dc.date.issued | 2561 | - |
dc.identifier.uri | http://cuir.car.chula.ac.th/handle/123456789/64172 | - |
dc.description | โครงงานเป็นส่วนหนึ่งของการศึกษาตามหลักสูตรปริญญาวิทยาศาสตรบัณฑิต สาขาวิชาวิทยาการคอมพิวเตอร์ คณะวิทยาศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย ปีการศึกษา 2561 | en_US |
dc.description.abstract | โครงการวิจัยในชั้นเรียน เรื่อง “โปรแกรมสรุปเนื้อหาข่าวกีฬาฟุตบอล” มีวัตถุประสงค์ คือ พัฒนาโปรแกรมสรุปเนื้อหาข่าวสารเกี่ยวกับกีฬาฟุตบอล โดยนำเทคนิคการเรียนรู้ของเครื่อง มาประยุกต์ใช้เริ่มจากการใช้ word embedding ซึ่งเป็นวิธีที่ใช้สำหรับเปลี่ยนคำเป็นเวกเตอร์จำนวนจริง หลังจากนั้นใช้ตัวแบบทางคณิตศาสตร์ sequence-to-sequence มาใช้ในการประมวลข้อมูลข่าวเพื่อสร้างสรุปข่าว ในส่วนของการวัดผลนั้น เพื่อเปรียบเทียบคะแนนที่ได้จากสรุปที่ได้จากตัวแบบทางคณิตศาสตร์และสรุปที่ได้จากการสุ่ม คณะผู้จัดทำใช้ BLEU scores ซึ่งวัดว่ามีจำนวนคำที่เหมือนกับสรุปข่าวจริงอยู่กี่คำ ทั้งแบบ 1-gram ที่พิจารณาคำแต่ละคำแยกกัน และแบบ 2-gram ที่พิจารณาสองคำที่อยู่ติดกัน ผลการวิจัยที่ได้แสดงให้เห็นว่า สรุปที่ได้จากตัวแบบทางคณิตศาสตร์นั้นดีกว่าสรุปที่ได้จากการสุ่มโดยเฉพาะเมื่อพิจารณาแบบสองคำที่อยู่ติดกัน นอกจากนี้สรุปที่ได้จากโมเดลสามารถอ่านแล้วพอเข้าใจได้ว่าทีมใดชนะ | en_US |
dc.description.abstractalternative | The objective of this project is to apply machine learning techniques for soccer’s news summarization. First, we used a word embedding technique which converts words into numerical vectors. Then, we applied a sequence-to-sequence model to learn the conversion of news scripts to their corresponding summaries. To evaluate the model performance, we used 1-gram and 2- gram BLEU scores to compute the number of words that the model and the random procedure recalled from the true summaries. Our results reveal that the summaries from the sequenceto- sequence model had higher BLEU scores than the output from random summarization, especially on the 2-gram BLEU scores, indicating more readability. Additionally, the model’s summaries were moderately understandable which team was the winner. | en_US |
dc.language.iso | th | en_US |
dc.publisher | จุฬาลงกรณ์มหาวิทยาลัย | en_US |
dc.rights | จุฬาลงกรณ์มหาวิทยาลัย | en_US |
dc.subject | การเรียนรู้ของเครื่อง | en_US |
dc.subject | ข่าวกีฬา | en_US |
dc.subject | โปรแกรมประยุกต์ | en_US |
dc.subject | Machine learning | en_US |
dc.subject | Sports journalism | en_US |
dc.subject | Application software | en_US |
dc.title | โปรแกรมสรุปเนื้อหาข่าวกีฬาฟุตบอล | en_US |
dc.title.alternative | Soccer News Summarization | en_US |
dc.type | Senior Project | en_US |
dc.email.advisor | naruemon.p@chula.ac.th | - |
Appears in Collections: | Sci - Senior Projects |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Korawitch_K_Se_2561.pdf | 1.24 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.