Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/72798
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Krung Sinapiromsaran | - |
dc.contributor.author | Kayyasit Singkarn | - |
dc.contributor.other | Chulalongkorn University. Faculty of Science | - |
dc.date.accessioned | 2021-03-12T03:08:31Z | - |
dc.date.available | 2021-03-12T03:08:31Z | - |
dc.date.issued | 2017 | - |
dc.identifier.uri | http://cuir.car.chula.ac.th/handle/123456789/72798 | - |
dc.description | Thesis (M.Sc.)--Chulalongkorn University, 2017 | en_US |
dc.description.abstract | The outlierness of an instance in this thesis is defined based on the distance between two instances. For some datasets, outliers may not be isolated and formed small clusters. C-anomalous assemblage is a group of associated outliers having the number of instances less than or equal to C percent of the total instances. This thesis presents the anomalous assemblage detection algorithm called CND using a nearest neighbor distance for an anomalous score. The algorithm computes the index k equal to floor function of C percent times the total number of instances and uses the k-nearest neighbor distance for representing an anomalous score. Then, the adjusted boxplot based on medcouple for skew distribution is used to generate the threshold for detecting outliers. The performance of CND is tested on two types of datasets which are synthetic and real-world datasets from UCI website comparing with WOF and LOF. The experimental results show that CND is better than WOF and LOF on datasets based on precision, recall, and F1-measure. | en_US |
dc.description.abstractalternative | ความผิดปกติของข้อมูลในงานวิจัยนี้ถูกนิยามด้วยระยะทางระหว่างข้อมูลสองตัว สำหรับบางเซตข้อมูล ข้อมูลผิดปกติอาจไม่แยกแบบโดดเดี่ยวและก่อตัวเป็นกลุ่มเล็ก ๆ กลุ่มผิดธรรมดา-ซี คือ กลุ่มของข้อมูลผิดปกติซึ่งสัมพันธ์กันโดยมีจำนวนข้อมูลในกลุ่มน้อยกว่าหรือเท่ากับซีเปอร์เซ็นของจำนวนข้อมูลทั้งหมด วิทยานิพนธ์นี้นำเสนอขั้นตอนวิธีการตรวจหากลุ่มผิดธรรมดาเรียกว่า ซีเอ็นดี โดยใช้ระยะห่างเพื่อนบ้านที่ใกล้ที่สุดแทนคะแนนความผิดปกติ ขั้นตอนวิธีนี้คำนวณดัชนีเคให้มีค่าเท่ากับฟังก์ชันพื้นของซีเปอร์เซ็นต์คูณจำนวนข้อมูลทั้งหมด และใช้ระยะทางเพื่อนบ้านใกล้สุดเคเพื่อแทนคะแนนของข้อมูลผิดปกติ หลังจากนั้น การปรับกราฟบ๊อกด้วยเมดคลับเปิลสำหรับการกระจายแบบเบ้ถูกใช้ในการคำนวณขีดแบ่งสำหรับการจับจุดผิดปกติ ประสิทธิภาพของซีเอ็นดีได้ถูกทดสอบกับชุดข้อมูลสองแบบ คือ เซตข้อมูลที่สังเคราะห์และเซตข้อมูลจริงจากเว็บไซต์ยูซีไอ เปรียบเทียบกับ ดับเบิ้ลยูโอเอฟ และ แอลโอเอฟ ผลการทดลองแสดงให้เห็นว่าประสิทธิภาพของ ซีเอ็นดี ดีกว่า ดับเบิ้ลยูโอเอฟ และ แอลโอเอฟ ภายใต้ความแม่นยำ การเรียกคืน และตัววัดเอฟหนึ่ง | en_US |
dc.language.iso | en | en_US |
dc.publisher | Chulalongkorn University | en_US |
dc.relation.uri | http://doi.org/10.58837/CHULA.THE.2017.328 | - |
dc.rights | Chulalongkorn University | en_US |
dc.title | Anomalous assemblage detection using nearest neighbor distance | en_US |
dc.title.alternative | การตรวจหากลุ่มผิดปกติโดยใช้ระยะทางเพื่อนบ้านใกล้สุด | en_US |
dc.type | Thesis | en_US |
dc.degree.name | Master of Science | en_US |
dc.degree.level | Master's Degree | en_US |
dc.degree.discipline | Mathematics | en_US |
dc.degree.grantor | Chulalongkorn University | en_US |
dc.email.advisor | Krung.S@Chula.ac.th | - |
dc.identifier.DOI | 10.58837/CHULA.THE.2017.328 | - |
Appears in Collections: | Sci - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
5871908723_Sc_2017.pdf | 1.58 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.