Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/81940
Title: การพัฒนาการตรวจจับข่าวปลอมโดยการเรียนรู้ของเครื่องและการตรวจสอบข้อเท็จจริงของประชาชน : รายงานการวิจัยฉบับสมบูรณ์
Other Titles: Development of fake news detection using machine learning and people's fact checking
Authors: พนม คลี่ฉายา
พยุง มีสัจ
องอาจ อุ่นอนันต์
กมลรัตน์ กิจรุ่งไพศาล
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะนิเทศศาสตร์
Subjects: ข่าวปลอม
การเผยแพร่ข่าวสาร
Issue Date: 2564
Publisher: คณะนิเทศศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย
Abstract: การวิจัยครั้งนี้ มีวัตถุประสงค์เพื่อวิเคราะห์ข่าวปลอม สำรวจการรับรู้ การตรวจสอบ และการตอบสนองต่อข่าวปลอมของประชาชน และนำมาพัฒนาต้นแบบเว็บแอปพลิเคชันสำหรับการ ตรวจจับข่าวปลอม ดำเนินการวิจัย 3 ส่วน คือ 1) การวิเคราะห์ข่าวปลอมด้วยวิธีการวิเคราะห์เนื้อหา (Content Analysis) ข่าวที่ได้รับการตรวจสอบแล้วว่าเป็นข่าวปลอม ระหว่างเดือนธันวาคม 2562 ถึง มีนาคม 2563 รวมจำนวน 100 ชิ้น 2) การวิจัยเชิงสำรวจ (Survey Research) กลุ่มตัวอย่างคือ 6 กลุ่มวัย ได้แก่ กลุ่มอายุ 18-22 ปี กลุ่มอายุ 23-35 ปี กลุ่มอายุ 36-45 ปี กลุ่มอายุ 46-55 ปี กลุ่มอายุ 56-59 ปี และ กลุ่มอายุ 60 ปีขึ้นไป รวมทั้งสิ้น 1,120 คน จากกรุงเทพมหานครและปริมณฑล และ จากทุกภูมิภาคทั่วประเทศ ได้แก่ จังหวัดระยอง จังหวัดเชียงใหม่ จังหวัดนครสวรรค์ จังหวัด อุบลราชธานี จังหวัดสงขลา จังหวัดกาญจนบุรี ใช้แบบสอบถามเป็นเครื่องมือเก็บข้อมูลในช่วงกลางปี 2563 และ 3) การพัฒนาเว็บแอปพลิเคชันตรวจสอบข่าวปลอม โดยใช้วิธีการประมวลผล ภาษาธรรมชาติ (Natural Language Processing) วิธีการเรียนรู้ของเครื่องแบบระบบผู้เชี่ยวชาญ (Expert System based Machine Learning) แบบฐานกฎหรือความรู้ (Rule Base or Knowledge) ผลการวิเคราะห์ลักษณะของข่าวปลอมพบว่า ข่าวปลอมอยู่บนแพลตฟอร์มที่มีที่อยู่ (URL) ที่ใช้ชื่อคล้ายสำนักข่าว โดยทำให้คล้ายรายงานข่าวของสำนักข่าวทั่วไป พบบนสื่อสังคม ออนไลน์ในรูปแบบโพสต์ของบุคคล และบล็อกส่วนบุคคล ไม่มีการระบุชื่อผู้เขียนข่าว เนื้อหาสั้น ไม่ ยาวนัก การเขียนคล้ายข่าวแต่ไม่ถูกต้องตามหลักการเขียนข่าว พาดหัวข่าวและเนื้อหาข่าวไม่ สอดคล้องกัน ไม่ระบุข้อมูลตัวเลขที่ชัดเจน ภาษาที่ใช้ไม่ใช่ภาษาที่ผู้สื่อข่าวทั่วไปใช้ พิมพ์ผิด ตกหล่น วรรคตอนผิด ภาพประกอบข่าวไม่ใช่ภาพเดี่ยวแต่มักใช้ภาพซ้อนภาพ มักใช้คำยั่วให้สนใจ เกินความ จริง เช่น “ระวัง” “เตือนภัย” “ข่าวด่วน” “เพื่อน” “คนวงใน” “โปรดกระจายข่าว” “เปิดโปง” ผลการวิจัยเชิงสำรวจพบว่า กลุ่มตัวอย่างพบเห็นข่าวปลอมประเภทข่าว ให้ความรู้ และ โพสต์ ในระดับมาก ในขณะที่พบเห็นข่าวปลอมประเภทภาพ และ การแสดงท่าที ในระดับปานกลาง เมื่อพิจารณาจำแนกตามกลุ่มอายุพบว่า กลุ่มอายุ 18-22 ปี และ กลุ่ม 36-45 ปี พบเห็นข่าวปลอมทุก ประเภทในระดับมาก กลุ่มตัวอย่างอายุ 23-35 ปี และ กลุ่ม 46-55 ปี พบเห็นข่าวปลอมประเภทข่าว โพสต์ และให้ความรู้ในระดับมาก ทั้งนี้กลุ่มอายุ 56-59 ปี และ กลุ่มอายุ 60 ปีขึ้นไป พบเห็นข่าว ปลอมโดยรวมในระดับปานกลาง ด้านการตอบสนองต่อข่าวปลอมพบว่า กลุ่มตัวอย่างมีการตั้งคำถามกับข่าวปลอม อ่าน ข่าวปลอมด้วยความรู้สึกเป็นกลาง คิดว่าข่าวปลอมเป็นสิ่งที่สร้างความเสียหาย แจ้งให้คนอื่นทราบว่า เป็นข่าวปลอม ตรวจสอบข้อเท็จจริง แสดงความเห็นว่าอาจจะเป็นข่าวปลอม อย่างไรก็ตามกลุ่ม ตัวอย่างเคยหลงเชื่อข่าวปลอมเมื่ออ่านเฉพาะพาดหัวข่าว หรือส่วนนำข่าว เชื่อว่าข่าวปลอมนั้นอาจจะ เป็นจริงได้ เลือกอ่านเฉพาะข่าวที่ตนเองสนใจแล้วก็ปักใจเชื่อเลย ปักใจเชื่อแม้จะมีคนโต้แย้งว่าเป็น ข่าวปลอม และเคยส่งต่อข่าวปลอม แสดงความเห็นสนับสนุนข่าวปลอม ด้านการจัดการข่าวปลอมพบว่า กลุ่มตัวอย่างที่ระบุถูกต้องว่าเป็นข่าวปลอมประเภท โพสต์ของบุคคล พิจารณาจากข้อมูลรายละเอียด อาจจะมีอคติหรือมุ่งโจมตี บัญชีเจ้าของโพสต์ และ ตอบสนองโดย “ไม่ส่งต่อ” สำหรับกลุ่มตัวอย่างที่ระบุไม่ถูกต้องว่าเป็นข่าวปลอม พิจารณาจาก ภาพประกอบข่าว ข้อมูลรายละเอียด เรื่องราวเหตุการณ์ และตอบสนองโดย “ส่งต่อ” นอกจากนี้กลุ่ม ตัวอย่างที่ระบุว่าไม่แน่ใจ พิจารณาจากบัญชีเจ้าของโพสต์ ภาพประกอบข่าว และอาจจะมีอคติหรือ มุ่งโจมตี และตอบสนองโดย “ไม่ส่งต่อ” รองลงมาคือ “ตรวจสอบว่าจริงหรือไม่” การพัฒนาเว็บแอปพลิเคชันตรวจสอบ ได้จดโดเมนเนมชื่อ thaidimachine.org เปิดให้ ประชาชนใช้งานผ่าน www.thaidimachine.org สรุปจำนวนการใช้เว็บตรวจสอบข่าวระหว่างวันที่ 2 เมษายน ถึง 30 พฤษภาคม 2564 มีจำนวนการตรวจสอบข่าวรวม 67,825 ครั้ง เฉลี่ยวันละ 1,150 ครั้ง เรื่องที่ตรวจสอบเป็นเรื่องเกี่ยวกับการระบาดเชื้อไวรัสโควิด-19 เช่น สถานการณ์การระบาด วัคซีนโควิด-19 สมุนไพรและแพทย์แผนไทยในการรักษาโควิด-19 เรื่องผลิตภัณฑ์เสริมสุขภาพ เรื่อง เหตุการณ์และถานการณ์ที่มีการรายงานข่าวในช่วงเวลานั้น ๆ ทั้งข่าวการเมือง และข่าวทั่วไป
Other Abstract: This research study aims to analyze characteristic of fake news, to investigate how people respond to and deal with fake news and to develop web application for fake news investigating tool. Three research methods have been employed in the project. Firstly, content analysis of 100 fake news was used in investigating fake news characteristics. Secondary, survey research using 6 sample groups which are 18-22 years of age, 23-35 years of age, 36-45 years of age, 56-59 years of age, and 60 years of age and older, in a total number of 1,120 respondents. The participants were derived from all regions of Thailand including Bangkok and metropolitan area as well as other provinces such as Rayong, Chiang Mai, Nakhon Sawan, Ubon Ratchathani, Songkhla, and Kanchanaburi. The survey was conducted in the middle of 2020. Third, the web application was developed using natural language processing, expert system-based machine learning by rule base and knowledge based. The research study revealed that, fake news has been published on platform using imitated news agency URL, personal post on social media and personal weblog. They were organized in the same manner as news writing structure, however, fake news can be notified by these appearances, such as, no identification of writer name, short content, news writing disorganizing, irrelevance of head line and lead of news. The fake news language was not journalistic language and used click-bated words. The words usually found in fake news are as samples; “beware”, “caution”, “breaking news”, “news form friend, confidant” “please share”, “reveal secret”. The survey research found that the participants have encountered fake news in the forms of news, informative content, and posts at high level while they have encountered fake news in the visual-based and stance-based forms at moderate level. As regards the age of each sample group, the research found that the 18- 22- year-old and the 36-45-year-old age group have encountered fake news in all forms at the high level. The 23-35-year-old and the 46-55-year-old groups have encountered fake news in the forms of news, informative content, and posts at the high level. Finally, the 56 -59 -year-old and those older than 60 have overall encountered fake news at the moderate level. In terms of the participants’ response to fake news, the research found that the subject groups have questioned the fake news, read it with objectivity, thought that it would cause harm, informed others of the fake news, checked facts, and shared their opinion that the news might be fake. However, they have experienced falling for the fake news when only reading the headlines or the leads and believed the fake news to be true. They have also selected only the news they were interested in and believed in it right away even though it was also suggested to them that the news might be fake. Finally, they have shared fake news and given their opinion supporting fake news. In terms of dealing with fake news, the sample group who correctly identified fake news in the forms of personal posts considered details in the message possibly had bias against or had the intention to attack the post’s owner, responded by “not sharing” the fake news. For the sample group who incorrectly identified fake news, they considered the featured images, details in the message, and the event situations and responded by “sharing” the fake news. Finally, the same group who was unsure of the legitimacy of the news considered the post’s owner’s account and featured images that possibly had bias against or intention to attack the post’s owner, responded mostly by “not sharing,” followed by “checking the legitimacy.” The research project has completely developed web application for fake news investigation and registered in domain name “thaidimachine.org”. The web application has been launched to public. The record during April 2, and May 30, 2012 showed that there were 67,825 inquiries, averaging to 1,150 inquiries per day. The subjects of inquiries were pandemic of Covid-19 virus, vaccine preparation, folk medicine for Covid-19 treatment, supplement food and current situation reported in media including politics and interesting news.
Description: ข่าวปลอม -- การตรวจสอบข้อเท็จจริงของข่าว -- ปัจจัยที่เกี่ยวข้องกับการรับรู้ การตอบสนอง และการรู้เท่าทันข่าวปลอม -- ข่าวปลอมและกระบวนการประเมินความน่าเชื่อถือของเว็บไซด์ -- การค้นคืนสารสนเทศ -- การทำเหมืองข้อมูล -- การประมวลผลภาษาธรรมชาติ -- ระบบผู้เชี่ยวชาญ -- การตรวจสอบข่าวปลอมด้วยเทคนิคการเรียนรู้ของเครื่อง -- ข้อมูลขนาดใหญ่และการวิเคราะห์ข้อมูลขนาดใหญ่
URI: http://cuir.car.chula.ac.th/handle/123456789/81940
Type: Technical Report
Appears in Collections:Comm - Research Reports

Files in This Item:
File Description SizeFormat 
2564_Development of Fake News Detection_Research.pdfรายงานการวิจัยฉบับเต็ม (Fulltext)300.33 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.