Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/59309
Title: Median-difference window subseries score for contextual anomaly on time series
Other Titles: ค่าคะแนนความแตกต่างมัธยฐานของหน้าต่างอนุกรมย่อยสำหรับค่าผิดปกติแบบบริบทบนอนุกรมเวลา
Authors: Artit Sagoolmuang
Advisors: Krung Sinapiromsaran
Other author: Chulalongkorn University. Faculty of Science
Advisor's Email: Krung.S@Chula.ac.th
Subjects: Anomaly detection (Computer security)
Time-series analysis
การตรวจจับสิ่งผิดปกติ (ความปลอดภัยในระบบคอมพิวเตอร์)
การวิเคราะห์อนุกรมเวลา
Issue Date: 2016
Publisher: Chulalongkorn University
Abstract: Anomaly detection on time series is one of the exciting topics in data mining. The aim is to find a data point which is different from the majority, called an anomaly. In this thesis, a novel anomaly score called Median-Difference Window subseries Score (MDWS) is proposed with its algorithm together with the parameter of the recommended window length for detecting the contextual anomalies on time series data. It is computed as the subtraction of the middle-window point with the median of all data points within the current window. The proposed MDWS algorithm is implemented as the median-update of the current window subseries to maintain the linear time complexity. Two anomaly thresholds are applied from interquartile range rule. The experimental results show that the MDWS has the highest performance on both synthetic and real world benchmark datasets from Yahoo! and Numenta comparing with others existing anomaly detection methods. Moreover, MDWS algorithm is also faster than other algorithm on the large dataset.
Other Abstract: การตรวจจับค่าผิดปกติบนอนุกรมเวลาเป็นหนึ่งในหัวข้อที่น่าสนใจในการทำเหมืองข้อมูล โดยมีจุดประสงค์เพื่อค้นหาค่าข้อมูลซึ่งมีความแตกต่างจากข้อมูลส่วนใหญ่เรียกว่าค่าผิดปกติ ในวิทยานิพนธ์ฉบับนี้ คะแนนค่าผิดปกติแบบใหม่เรียกว่า ค่าคะแนนความแตกต่างมัธยฐานของหน้าต่างอนุกรมย่อย (เอ็มดีดับเบิลยูเอส) ถูกนำเสนอกับขั้นตอนวิธี พร้อมกับพารามิเตอร์ของความยาวหน้าต่างแนะนำ เพื่อตรวจจับค่าผิดปกติแบบบริบทบนอนุกรมเวลา การคำนวณทำได้โดยการลบกันของ ค่ากลาง-หน้าต่างกับค่ามัธยฐานของทุกค่าข้อมูลในหน้าต่างปัจจุบัน ขั้นตอนวิธีเอ็มดีดับเบิลยูเอสที่นำเสนอใช้การปรับมัธยฐานของหน้าต่างอนุกรมย่อย ณ ขณะนั้นเพื่อคงความซับซ้อนของเวลาเชิงเส้น สองเกณฑ์ค่าผิดปกติถูกประยุกต์มาจากกฎพิสัยระหว่างควอร์ไทล์ ผลการทดลองแสดงให้เห็นว่าเอ็มดีดับเบิลยูเอสมีประสิทธิภาพที่สุดทั้งบนชุดข้อมูลเกณฑ์มาตรฐานสังเคราะห์และชุดข้อมูลเกณฑ์มาตรฐานโลกจริงจากยะฮู้ (Yahoo) และนูเมนต้า (Numenta) เปรียบเทียบกับวิธีตรวจจับค่าผิดปกติอื่นๆที่มีอยู่ นอกจากนั้น ขั้นตอนวิธีเอ็มดีดับเบิลยูเอสยังคงมีความเร็วกว่าขั้นตอนวิธีอื่นอย่างมากบนชุดข้อมูลขนาดใหญ่
Description: Thesis (M.Sc.)--Chulalongkorn University, 2016
Degree Name: Master of Science
Degree Level: Master's Degree
Degree Discipline: Applied Mathematics and Computational Science
URI: http://cuir.car.chula.ac.th/handle/123456789/59309
URI: http://doi.org/10.58837/CHULA.THE.2016.1298
metadata.dc.identifier.DOI: 10.58837/CHULA.THE.2016.1298
Type: Thesis
Appears in Collections:Sci - Theses

Files in This Item:
File Description SizeFormat 
5872096223.pdf2.11 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.