Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/42706
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorArthorn Luangsodsaien_US
dc.contributor.advisorKrung Sinapiromsaranen_US
dc.contributor.authorNattorn Buthongen_US
dc.contributor.otherChulalongkorn University. Faculty of Scienceen_US
dc.date.accessioned2015-06-24T06:11:22Z
dc.date.available2015-06-24T06:11:22Z
dc.date.issued2013en_US
dc.identifier.urihttp://cuir.car.chula.ac.th/handle/123456789/42706
dc.descriptionThesis (M.Sc.)--Chulalongkorn University, 2013en_US
dc.description.abstractOutlier detection is one of the widely studied topics in data mining. It can be applied to real world problems. A current active research in this field is to develop an outlier scoring algorithm to generate score which represents a degree of outlier for each instance. Local Outlier Factor or LOF is designed to score all instances in a dataset based on a local deviation of a given instance with respect to its k nearest neighbors. The LOF algorithm for computing LOF depends on this crucial parameter k. To avoid setting any parameter, this thesis proposes a new outlier score called the Ordered distance difference Outlier Factor or OOF. The OOF algorithm uses the ordered distance difference concept to compute outlier scores of all instances without any parameters. To compare the effectiveness between scores, we apply various outlier scores to five UCL datasets and a generated multivariate Guassian distribution dataset. We report instances from the top-10 ranks and count the number of instances within that top-10, then we compare the results with six other outlier techniques such as LOF, OOF, Connectivity-based Outlier Factor (COF), LOcal Correlation Integral score (LOCI), Local Outlier Probability (LoOP) and INFLuenced Outlierness (INFLO).en_US
dc.description.abstractalternativeการตรวจหาข้อมูลที่อยู่นอกกลุ่มเป็นหนึ่งในหัวข้อทางการทำเหมืองข้อมูลที่นักวิจัยสนใจศึกษา วิธีดังกล่าวสามารถประยุกต์ใช้กับปัญหาจริงในโลก งานวิจัยที่ดำเนินการอยู่ ณ ปัจจุบันในสาขานี้คือการพัฒนาขั้นตอนวิธีการคำนวณคะแนนที่อยู่นอกกลุ่มที่แทนด้วยดีกรีของการอยู่นอกกลุ่มสำหรับแต่ละตัวอย่าง โลคอลเอาท์ไลเออร์แฟคเตอร์ หรือ แอลโอเอฟถูกออกแบบมาเพื่อให้คะแนนทุกตัวอย่างในเซตข้อมูลตามความเบี่ยงเบนเฉพาะที่ของตัวอย่างเทียบกับเพื่อนบ้าน k ตัว ขั้นตอนวิธีแอลโอเอฟสำหรับคำนวณค่าแอลโอเอฟต้องขึ้นกับพารามิเตอร์ที่สำคัญหนึ่งตัวคือ k เพื่อหลีกเลี่ยงการกำหนดค่าพารามิเตอร์ วิทยานิพนธ์นี้นำเสนอค่าคะแนนที่อยู่นอกกลุ่ม เรียก ออร์เดอร์ดีสเตนดิฟเฟอร์เรนซ์เอาท์ไลเออร์แฟคเตอร์หรือ โอโอเอฟ ขั้นตอนวิธีโอโอเอฟใช้แนวคิดระยะที่เรียงลำดับเพื่อคำนวณค่าคะแนนสำหรับทุกตัวอย่างโดยไม่มีการกำหนดพารามิเตอร์ เพื่อเปรียบเทียบประสิทธิภาพระหว่างคะแนน เราใช้คะแนนทั้งหมดกับเซตข้อมูลยูซีไอห้าเซตและเซตข้อมูลที่จำลองจากการกระจายของเกาส์แบบหลายตัวแปร เรานำเสนอตัวอย่างจากหนึ่งในสิบตัวอย่างที่มีคะแนนสูงสุด และนับจำนวนตัวอย่างที่เหมือนกัน คะแนนทั้งหกรูปแบบคือ แอลโอเอฟ โอโอเอฟ ซีโอเอฟ แอลโอซีไอ แอลโอโอพี และไอเอ็นเอฟแอลโอen_US
dc.language.isoenen_US
dc.publisherChulalongkorn Universityen_US
dc.relation.urihttp://doi.org/10.14457/CU.the.2013.176-
dc.rightsChulalongkorn Universityen_US
dc.subjectData mining
dc.subjectMathematics -- Data processing
dc.subjectดาต้าไมนิง
dc.subjectคณิตศาสตร์ -- การประมวลผลข้อมูล
dc.titlePARAMETER-FREE OUTLIER DETECTION USING ORDERED DISTANCE DIFFERENCESen_US
dc.title.alternativeการตรวจหาข้อมูลที่อยู่นอกกลุ่มแบบไร้พารามิเตอร์โดยใช้ผลต่างของระยะทางที่เรียงลำดับen_US
dc.typeThesisen_US
dc.degree.nameMaster of Scienceen_US
dc.degree.levelMaster's Degreeen_US
dc.degree.disciplineApplied Mathematics and Computational Scienceen_US
dc.degree.grantorChulalongkorn Universityen_US
dc.email.advisorarthorn.l@chula.ac.then_US
dc.email.advisorkrung.s@chula.ac.th
dc.identifier.DOI10.14457/CU.the.2013.176-
Appears in Collections:Sci - Theses

Files in This Item:
File Description SizeFormat 
5571979023.pdf2 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.