Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/27513
Title: | การจัดกลุ่มตามรูปร่างสำหรับข้อมูลอนุกรมเวลา |
Other Titles: | Shape-based clustering for time series data |
Authors: | วริศรา มีศรีกมลกุล |
Advisors: | โชติรัตน์ รัตนามหัทธนะ |
Other author: | จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์ |
Advisor's Email: | Chotirat.R@Chula.ac.th |
Subjects: | การวิเคราะห์อนุกรมเวลา |
Issue Date: | 2554 |
Publisher: | จุฬาลงกรณ์มหาวิทยาลัย |
Abstract: | การจัดกลุ่มข้อมูลอนุกรมเวลา เป็นหนึ่งในการทำเหมืองข้อมูลของข้อมูลอนุกรมเวลาที่นักวิจัยส่วนใหญ่ให้ความสนใจ โดยอัลกอริทึมที่นิยมนำมาใช้ คือ การจัดกลุ่มแบบเคมีนส์ (K-means Clustering) ร่วมกับมาตรวัดระยะยุคลิด และหาตัวแทนกลุ่มด้วยวิธีการหาค่าเฉลี่ย หรือการเฉลี่ยแบบแอมพลิจูด ซึ่งเป็นวิธีที่ไม่เหมาะกับลักษณะของข้อมูลอนุกรมเวลา เพราะเป็นข้อมูลที่มีการเลื่อนในแนวแกนเวลา งานวิจัยนี้จึงนำเสนอการจัดกลุ่มตามรูปร่างสำหรับข้อมูลอนุกรมเวลา โดยมีแนวคิดในการนำระยะไดนามิกไทม์วอร์ปปิง ซึ่งเป็นมาตรวัดที่เหมาะกับลักษณะของข้อมูลอนุกรมเวลามากกว่า มาใช้ร่วมกับการจัดกลุ่มแบบเคมีนส์แทนระยะยุคลิด และได้เสนอวิธี Ranking Shape-based Template Matching Framework (RSTMF) ซึ่งเป็นการหาตัวแทนกลุ่มโดยใช้ระยะไดนามิกไทม์วอร์ปปิง เพื่อนำมาใช้แทนการเฉลี่ยแบบแอมพลิจูด นอกจากนี้ยังได้ทำการวัดผลโดยการเปรียบเทียบความแม่นยำระหว่างการจัดกลุ่มแบบเคมีนส์แบบทั่วไปที่ใช้ระยะยุคลิดและการเฉลี่ยแบบแอมพลิจูดกับวิธีการจัดกลุ่มตามรูปร่าง ซึ่งเป็นการจัดกลุ่มแบบเคมีนส์ร่วมกับระยะไดนามิกไทม์วอร์ปปิงและการหาตัวแทนกลุ่มด้วยวิธี RSTMF ซึ่งให้ผลการจัดกลุ่มข้อมูลอนุกรมเวลาที่แม่นยำมากขึ้น เมื่อเทียบกับการจัดกลุ่มแบบเคมีนส์แบบทั่วไป |
Other Abstract: | Time series data clustering is one of the most active tasks in time series mining. K-means clustering using Euclidean distance as a similarity measure is a popular clustering algorithm and a representative or a new cluster center is usually calculated using an amplitude averaging function. However, Euclidean distance metric and amplitude averaging are not suitable for time series data because time shifting can be occurred in time series data. In this research, the Shape-based Clustering for Time Series Data (SCTS) which incorporates k-means clustering and DTW distance measure, together with our new averaging method, called Ranking Shape-based Template Matching Framework (RSTMF) as an averaging function, which can provide a new cluster center that preserves the overall characteristics of time series data. In the experiment, our proposed method outperforms the traditional k-means clustering technique in term of accuracy. |
Description: | วิทยานิพนธ์ (วศ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2554 |
Degree Name: | วิศวกรรมศาสตรมหาบัณฑิต |
Degree Level: | ปริญญาโท |
Degree Discipline: | วิศวกรรมคอมพิวเตอร์ |
URI: | http://cuir.car.chula.ac.th/handle/123456789/27513 |
URI: | http://doi.org/10.14457/CU.the.2011.1412 |
metadata.dc.identifier.DOI: | 10.14457/CU.the.2011.1412 |
Type: | Thesis |
Appears in Collections: | Eng - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
warissara_me.pdf | 2.44 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.