Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/72794
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorPetarpa Boonserm-
dc.contributor.advisorKrung Sinapiromsaran-
dc.contributor.authorPanuruk Lisuwan-
dc.contributor.otherChulalongkorn University. Faculty of Science-
dc.date.accessioned2021-03-12T02:51:39Z-
dc.date.available2021-03-12T02:51:39Z-
dc.date.issued2017-
dc.identifier.urihttp://cuir.car.chula.ac.th/handle/123456789/72794-
dc.descriptionThesis (M.Sc.)--Chulalongkorn University, 2017en_US
dc.description.abstractA clustering algorithm is a process of dividing data points into disjoint clusters according to the similarity of the data points. Many researchers have presented and developed the clustering algorithms to be suitable for the different characteristics of the datasets. Therefore, the concept of the identifying anomaly data points in the dataset was adopted in this thesis to explain the similarity of the data points. The main idea is to calculate the minimum distance between data points to identify the extreme anomalous score of all data points. In this thesis, a novel clustering algorithm is proposed called the Extreme Anomalous Clustering algorithm or EAC. This algorithm specifies the extreme anomalous scores for all data points in the dataset and combines two data points with the smallest extreme anomalous score. Then the algorithm selects one data point within the cluster as the representative point which is used to consider the next combination. The experiments of this thesis are created to compare the performance of the EAC algorithm on the simulated datasets and UCI datasets with AGNES, k-means, and DBSCAN. The experimental results show that the EAC algorithm is better than the three algorithms according to the Silhouette and Rand index measurements.en_US
dc.description.abstractalternativeขั้นตอนวิธีเกาะกลุ่มข้อมูลคือขั้นตอนการแบ่งจุดข้อมูลออกเป็นกลุ่มที่แยกออกจากกันตามความคล้ายคลึงกันของจุดข้อมูล นักวิจัยจำนวนมากได้นำเสนอและพัฒนาขั้นตอนวิธีเกาะกลุ่มข้อมูลเพื่อให้เหมาะสมกับข้อมูล ที่มีลักษณะแตกต่างกัน ดังนั้นแนวคิดเรื่องการระบุจุดข้อมูลที่ผิดปกติในชุดข้อมูล จึงถูกนำมาใช้ ในวิทยานิพนธ์ นี้เพื่ออธิบายความคล้ายคลึงกันของข้อมูล โดยแนวคิดหลักคือการคำนวณระยะทางที่สั้นที่สุดระหว่าง จุดข้อมูลเพื่อหาคะแนนความผิดปกติสุดขีดของจุf ข้อมูลทั้งหมด ในวิทยานิพนธ์นี้เรานำเสนอขั้นตอนวิธี เกาะกลุ่มข้อมูลแบบใหม่เรียกว่าขั้นตอนวิธีเกาะกลุ่ม ข้อมูลแบบผิดปกติสุดขีด หรือ อีเอซี ขั้นตอนวิธีนี้ทำการระบุคะแนนความผิดปกติสุดขีดให้กับข้อมูลทั้งหมด และรวมจุดข้อมูลสองจุดที่มีคะแนนความผิดปกติสุดขีดน้อยที่สุด จากนั้นทำการเลือกจุดข้อมูลภายในกลุ่ม เป็นจุดตัวแทนซึ่งใช้เพื่อพิจารณาการรวมกลุ่มในครั้งต่อไป การทดลองของวิทยานิพนธ์นี้สร้างขึ้นเพื่อทดสอบ ประสิทธิภาพ ของขั้นตอนวิธีเกาะกลุ่มข้อมูลแบบผิดปกติสุดขีดบนชุดข้อมูลจำลองและชุดข้อมูลจริงจากยูซีไอ เปรียบเทียบกับขั้นตอนวิธีเกาะกลุ่มข้อมูลแบบรวมกัน ขั้นตอนวิธีเกาะกลุ่มข้อมูลแบบเคมีนและขั้นตอน วิธีเกาะกลุ่มข้อมูลแบบดีบีสแกน ผลการทดลองแสดงให้เห็นว่าขั้นตอนวิธีเกาะกลุ่มข้อมูลแบบผิดปกติสุดขีดดี กว่าขั้นตอน วิธีเกาะกลุ่มข้อมูลทั้งสามแบบโดยการประเมินด้วยการวัดแบบซิลูเอ็ตและการวัดดัชนีของแรนด์en_US
dc.language.isoenen_US
dc.publisherChulalongkorn Universityen_US
dc.relation.urihttp://doi.org/10.58837/CHULA.THE.2017.329-
dc.rightsChulalongkorn Universityen_US
dc.titleExtreme anomalous clustering algorithmen_US
dc.title.alternativeขั้นตอนวิธีเกาะกลุ่มข้อมูลแบบผิดปกติสุดขีดen_US
dc.typeThesisen_US
dc.degree.nameMaster of Scienceen_US
dc.degree.levelMaster's Degreeen_US
dc.degree.disciplineMathematicsen_US
dc.degree.grantorChulalongkorn Universityen_US
dc.email.advisorPetarpa.B@Chula.ac.th,petarpa.B@Chula.ac.th-
dc.email.advisorkrung.s@chula.ac.th-
dc.identifier.DOI10.58837/CHULA.THE.2017.329-
Appears in Collections:Sci - Theses

Files in This Item:
File Description SizeFormat 
5772100023_Sc_2017.pdf1.09 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.