Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/61568
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | ทวิตีย์ เสนีวงศ์ ณ อยุธยา | - |
dc.contributor.author | รัชกฤต อารีราษฎร์ | - |
dc.contributor.other | จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์ | - |
dc.date.accessioned | 2019-02-26T14:03:30Z | - |
dc.date.available | 2019-02-26T14:03:30Z | - |
dc.date.issued | 2561 | - |
dc.identifier.uri | http://cuir.car.chula.ac.th/handle/123456789/61568 | - |
dc.description | วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2561 | - |
dc.description.abstract | การสื่อสารผ่านสื่อสังคมออนไลน์ในปัจจุบันเป็นที่นิยมกันอย่างแพร่หลาย การแสดงความคิดเห็นหรือแบ่งปันข้อมูลที่มีเนื้อหาก้าวร้าว โจมตี หรือดูหมิ่นผู้ใช้งานคนอื่นบนสื่อสังคมออนไลน์ อาจส่งผลกระทบต่อสังคมในด้านลบ โดยเนื้อหาดังกล่าวอาจผิดกฎหมายอาญาหมวด 3 ความผิดฐานหมิ่นประมาท มาตรา 326 วิทยานิพนธ์นี้เสนอคุณลักษณะเพื่อใช้ในการจำแนกข้อมูลเข้าข่ายหมิ่นประมาทบนสื่อสังคมออนไลน์ด้วยขั้นตอนวิธีเพอเซ็ปตรอนหลายชั้น ซับพอร์ทเวคเตอร์แมชชีน และการถดถอยโลจิสติกส์ โดยเปรียบเทียบประสิทธิภาพแต่ละขั้นตอนวิธี ซึ่งการทดลองพบว่าเอ็น-แกรม คลังคำศัพท์จากศาลฎีกา และโครงสร้างไวยากรณ์แบบขึ้นต่อกันเป็นคุณลักษณะที่สามารถใช้ในการจำแนกข้อความหมิ่นประมาทได้โดยได้ค่าความเที่ยงสูง แต่ค่าเรียกคืนต่ำ แต่เมื่อมีการจัดการข้อมูลที่ไม่สมดุลด้วยแล้ว จะพบว่าการจำแนกมีประสิทธิภาพดีขึ้นโดยที่ขั้นตอนวิธีเพอเซ็ปตรอนหลายชั้นมีความสามารถในการจำแนกได้ดีที่สุดโดยมีค่าความเที่ยงเป็น 0.93 ค่าเรียกคืนเป็น 0.98 และค่าเอฟวันเป็น 0.95 นอกจากนี้จำนวนมิติของเอ็น-แกรมมีผลต่อประสิทธิภาพของการจำแนกข้อความ โดยจำนวนมิติที่เหมาะสมของเอ็น-แกรมแต่ละชนิดขึ้นอยู่กับขั้นตอนวิธีที่ใช้ | - |
dc.description.abstractalternative | Communication on online social media is popular nowadays. Expressing opinions and sharing information with offensive or defamatory contents that target other social media users may have negative societal impact. The contents may violate the criminal code, Chapter 3 Offence of Defamation, Section 326. In this thesis, features are proposed to classify defamatory text on online social media with machine learning algorithms, i.e. multi-layer perceptron, support vector machine, and logistic regression. The performance of these algorithms are compared. The experiment reveals that n-grams, dictionary of judgment terms, and dependency structure of sentence are features that can be used to classify defamatory text, yielding high precision but low recall. After the imbalanced data problem is handled, performance of the classifiers improves substantially. In particular, multi-layer perceptron has the best performance with precision of 0.93, recall of 0.98, and F1 of 0.95. Moreover, the number of n-grams dimension affects performance of classification. The best number of dimension for each type of n-grams dimension varies by the algorithms used. | - |
dc.language.iso | th | - |
dc.publisher | จุฬาลงกรณ์มหาวิทยาลัย | - |
dc.relation.uri | http://doi.org/10.58837/CHULA.THE.2018.1141 | - |
dc.rights | จุฬาลงกรณ์มหาวิทยาลัย | - |
dc.subject | หมิ่นประมาท -- กฎหมายและระเบียบข้อบังคับ -- ไทย | - |
dc.subject | การเรียนรู้ของเครื่อง | - |
dc.subject | สื่อสังคมออนไลน์ | - |
dc.subject | ซัพพอร์ตเวกเตอร์แมชชีน | - |
dc.subject | Libel and slander -- Law and legislation -- Thailand | - |
dc.subject | Machine learning | - |
dc.subject | Social media | - |
dc.subject | Support vector machines | - |
dc.subject.classification | Computer Science | - |
dc.title | การจำแนกข้อความเข้าข่ายหมิ่นประมาทบนสื่อสังคมออนไลน์ | - |
dc.title.alternative | Defamatory text classification on online social media | - |
dc.type | Thesis | - |
dc.degree.name | วิทยาศาสตรมหาบัณฑิต | - |
dc.degree.level | ปริญญาโท | - |
dc.degree.discipline | วิทยาศาสตร์คอมพิวเตอร์ | - |
dc.degree.grantor | จุฬาลงกรณ์มหาวิทยาลัย | - |
dc.subject.keyword | การเรียนรู้ของเครื่อง | - |
dc.subject.keyword | การจำแนกประเภท | - |
dc.subject.keyword | ซัพพอร์ตเวกเตอร์แมชชีน | - |
dc.subject.keyword | การถดถอยโลจิสติกส์ | - |
dc.subject.keyword | เพอร์เซ็ปตรอนหลายชั้น | - |
dc.subject.keyword | สื่อสังคมออนไลน์ | - |
dc.subject.keyword | ข้อความหมิ่นประมาท | - |
dc.subject.keyword | Machine learning | - |
dc.subject.keyword | Support vector machine | - |
dc.subject.keyword | Logistic regression | - |
dc.subject.keyword | Text classification | - |
dc.subject.keyword | Social media | - |
dc.subject.keyword | Defamatory text | - |
dc.subject.keyword | Multi layer perceptron | - |
dc.identifier.DOI | 10.58837/CHULA.THE.2018.1141 | - |
Appears in Collections: | Eng - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
5970292621.pdf | 1.82 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.