Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/50447
Title: | การหาแผ่นแบบเฉลี่ยสำหรับการจำแนกประเภทข้อมูลอนุกรมเวลาที่รวดเร็วและแม่นยำ |
Other Titles: | Fast and accurate template averaging for time series classification |
Authors: | พงศกร เสถียรวิริยคุณ |
Advisors: | โชติรัตน์ รัตนามหัทธนะ |
Other author: | จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์ |
Advisor's Email: | Chotirat.R@Chula.ac.th,chotirat@gmail.com,chotirat.r@chula.ac.th |
Subjects: | การวิเคราะห์อนุกรมเวลา การวิเคราะห์อนุกรมเวลา -- โปรแกรมคอมพิวเตอร์ Time-series analysis Time-series analysis -- Computer programs |
Issue Date: | 2558 |
Publisher: | จุฬาลงกรณ์มหาวิทยาลัย |
Abstract: | ข้อมูลอนุกรมเวลาเป็นข้อมูลที่น่าสนใจในการทำเหมืองข้อมูลอันเนื่องจากข้อมูลมีลำดับอย่างชัดเจนในตัวเอง การจำแนกประเภทข้อมูลอนุกรมเวลาเป็นวิธีการหนึ่งของการทำเหมืองข้อมูลอนุกรมเวลาที่ใช้อย่างแพร่หลายในหลากหลายสาขาวิชา เช่น สาขาการแพทย์ สาขาการเงิน หรือด้านอุตสาหกรรม งานวิจัยมากมายจึงได้เกิดขึ้นเพื่อพัฒนาการจำแนกประเภทข้อมูลอนุกรมเวลาให้มีความถูกต้องแม่นยำมากยิ่งขึ้น วิธีการหนึ่งที่ได้รับความนิยมและสามารถจำแนกประเภทได้ความแม่นยำสูงคือ การจำแนกประเภทข้อมูลแบบเพื่อนบ้านใกล้สุดลำดับที่ 1 โดยใช้การวัดระยะทางแบบไดนามิกไทม์วอร์ปปิง วิธีการนี้เป็นการเปรียบเทียบระยะทางข้อมูลเรียนรู้กับข้อมูลสอบถาม เพื่อกำหนดคลาสให้กับข้อมูลสอบถาม อย่างไรก็ตามการคำนวณระยะทางแบบไดนามิกไทม์วอร์ปปิงใช้เวลาสูงดังนั้นหากข้อมูลมีจำนวนมากจะทำให้เกิดข้อจำกัดในการทำงาน จากข้อจำกัดที่เกิดขึ้นทำให้มีงานวิจัยเกี่ยวกับการลดเวลาที่ใช้ในการคำนวณโดยลดจำนวนข้อมูลเรียนรู้ที่ใช้ในการวิเคราะห์ลง วิธีหนึ่งที่น่าสนใจคือการสร้างแผ่นแบบเฉลี่ยขึ้นเพื่อเป็นตัวแทนข้อมูลเรียนรู้ ส่งผลให้ลดข้อมูลเรียนรู้ที่ใช้ในการวิเคราะห์ลงได้มาก อย่างไรก็ตามแผ่นแบบเฉลี่ยเพียงแผ่นแบบเดียวต่อคลาสไม่เพียงพอต่อการได้ความแม่นยำสูง จึงมีงานวิจัยที่ใช้การจัดกลุ่มข้อมูลเข้ามาช่วยในการแยกข้อมูลในคลาสออกเป็นกลุ่มย่อยแล้วทำการสร้างแผ่นแบบหลายแผ่นแบบต่อหนึ่งคลาส แต่ทว่าการจัดกลุ่มข้อมูลเพื่อแยกข้อมูลออกเป็นกลุ่มย่อยนั้นมีความยากในการปรับค่าตัวแปรให้เหมาะสม และใช้เวลาในการจัดกลุ่มสูงเพื่อให้ได้ความแม่นยำที่สูง งานวิจัยนี้จึงมีแนวคิดที่จะนำเสนอวิธีการสร้างแผ่นแบบเฉลี่ยที่ปรับปรุงการจัดกลุ่มข้อมูลนั้นให้เหลือเพียงค่าตัวแปรเดียวที่ปรับได้ง่ายและใช้เวลาในการจัดกลุ่มน้อยลง ซึ่งจากผลการทดลองวิธีการที่นำเสนอสามารถลดเวลาที่ใช้ในการจัดกลุ่มข้อมูลก่อนสร้างแผ่นแบบลงได้มากเปรียบเทียบกับวิธีการล่าสุดในปัจจุบัน และยังคงความแม่นยำในการจำแนกประเภทข้อมูลไว้ได้ |
Other Abstract: | Time series data is an interested data for data mining fields because the data have specific order within itself. Time series data classification is one of the data mining techniques that is used in many domains such as medical, financial, and industrial. Therefore, many researches have been focused on improving accuracy for time series data classification. One of the popular and accurate methods of time series data classification is one-nearest neighbor classification using Dynamic Time Warping (DTW) as a distance measure. This method calculates a distance between training data and testing data with an objective to assign class to unknown instances in the test data. However, Dynamic Time Warping distance measure requires large computation time, becoming a limitation for large datasets. Hence, many researches have attempted to reduce computation time by reducing the size of the training dataset. One of the methods is to build an average template to represent each class of the training data, so that it can reduce the number of training data for classification. Nevertheless, one template per class is insufficient to achieve high accuracy. As a remedy, some researches have attempted to use clustering techniques to split the data and build multiple templates per class. However, those algorithms still suffer from many predefined and hard-to-set parameters, while some require high computation time for high accuracy results. Therefore, this thesis work proposed a faster template averaging method that improves the data splitting process, and has only one easy-to-set parameter. From the experiments, the proposed method can reduce computation time in building templates compared to the state-of-the-art method and still have high accuracy. |
Description: | วิทยานิพนธ์ (วศ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2558 |
Degree Name: | วิศวกรรมศาสตรมหาบัณฑิต |
Degree Level: | ปริญญาโท |
Degree Discipline: | วิศวกรรมคอมพิวเตอร์ |
URI: | http://cuir.car.chula.ac.th/handle/123456789/50447 |
URI: | http://doi.org/10.14457/CU.the.2015.577 |
metadata.dc.identifier.DOI: | 10.14457/CU.the.2015.577 |
Type: | Thesis |
Appears in Collections: | Eng - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
5770236321.pdf | 6.11 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.