DSpace Repository

Data-throwaway learning for streaming chunk data classification by applying a versatile elliptic basis function (vebf) to single-class-wise computation

Show simple item record

dc.contributor.advisor Suphakant Phimoltares
dc.contributor.advisor Chidchanok Lursinsap
dc.contributor.author Prem Junsawang
dc.contributor.other Chulalongkorn University. Faculty of Science
dc.date.accessioned 2021-12-02T04:30:20Z
dc.date.available 2021-12-02T04:30:20Z
dc.date.issued 2013
dc.identifier.uri http://cuir.car.chula.ac.th/handle/123456789/77941
dc.description.abstract Recently, the large data and streaming chunk data classification problems are the interesting and challenging problems in many real world applications such as finance, medical diagnosis, pattern recognition, and data mining. In most cases, a complete set of database for building a classifier is not provided in advance. In this work, the Data-throwaway Learning for Streaming Chunk data classification (DLSC) by applying a Versatile Elliptic Basis Function (VEBF) to single-class-wise computation is proposed. The proposed learning method is based on incremental learning and one-pass-thrownaway learning concepts. In this work, the experiment is conducted in two scenarios based on the pattern of given training data including complete training data and streaming training data. The experimental results of the proposed method are compared with both of batch learning and incremental learning algorithms on various data sets with different sizes from 150 to 581,012 samples and attributes from 4 to 1,558. The experimental results show that the DLSC yields the highest classification accuracies In most cases with faster incremental learning, fewer number of used hidden neurons and more flexible structure than the compared methods. The proposed method is suitable for coping with big data classification problem and handling streaming data as well.
dc.description.abstractalternative ปัญหาการจำแนกประเภทกลุ่มข้อมูลขนาดใหญ่และข้อมูลที่เข้าทีละชุดถือว่าเป็นปัญหาที่น่าสนใจและท้าทายซึ่งจะพบได้ในการประยุกต์ใช้งานจริง เช่น ข้อมูลด้านการเงิน ข้อมูลการวินิจฉัยทางการแพทย์ งานทางด้านการรู้จำรูปแบบและเหมือนข้อมูล โดยในหลายกรณีการที่จะได้มาซึ่งฐานข้อมูลที่สมบูรณ์สำหรับนำ มาใช้เป็นข้อมูลสำหรับการสร้างตัวแบบในการจำแนกนั้นเป็นไปได้ยาก ดังนั้นในงานนี้ ผู้วิจัยนำเสนอวิธีการเรียนรู้แบบโยนแล้วทิ้งสำหรับการจำแนกประเภทกลุ่มข้อมูลที่เข้าทีละชุด (Data-throwaway Learning for Streaming Chunk, DLSC) โดยการประยุกต์เวอร์ซะไทล์อัลลิปติกเบซิสฟังก์ชัน (Versatile Elliptic Basis Function, VEBF) ในการคำนวณแบบทีละกลุ่มข้อมูล ซึ่งแนวคิดของวิธีการเรียนรู้ที่นำเสนอนี้อาศัยหลักการ การเรียนรู้แบบเพิ่มขึ้นและการเรียนรู้แบบที่ข้อมูลที่ใช้ในการเรียนรู้เพียงครั้งเดียว ในงานนี้ ผู้วิจัยดำเนินการทดลองในลักษณะตามรูปแบบของข้อมูลชุดสอนที่ได้มา ประกอบด้วยกาณีข้อมูลชุดสอนที่สมบูรณ์และข้อมูล ชุดสอนที่เข้ามาที่ละชุด โดยทำการเปรียบเทียบผลของวิธีการเรียนรู้ที่นำเสนอกับกลุ่มวิธีการเรียนรู้ทั้งแบบการ เรียนรู้แบบแบทซ์และการเรียนรู้แบบเพิ่มขึ้น และชุดข้อมูลที่นำมาใช้ทดสอบประสิทธิภาพนั้นมีความหลายทั้งในแง่ของจำนวนข้อมูลซึ่งมีค่าตั้งแต่ 150 ถึง 581,012 ข้อมูลและจำนวนคุณลักษณะประจำตั้งแต่ 4 ถึง1,558 คุณลักษณะ จากผลการทดลองสรุปได้ว่าขั้นตอนวิธีการเรียนรู้ที่นำเสนอให้ค่าความถูกต้องสูงสุดในหลาย ๆ กรณี นอกจากนั้นยังใช้เวลาในการเรียนรู้ จำนวนโหนดในชั้นซ่อน และความยืดหยุ่นของโครงสร้าง ของตัวแบบที่ดีกว่าวิธีการที่นำมาเปรียบเทียบ วิธีการที่นำเสนอสามารถจัดการกับปัญหาการจำแนกข้อมูลที่มี ขนาดใหญ่และข้อมูลที่เข้ามาทีละชุดได้
dc.language.iso en en_US
dc.publisher Chulalongkorn University. en_US
dc.relation.uri http://doi.org/10.14457/CU.the.2013.1976
dc.rights Chulalongkorn University en_US
dc.subject Data -- Classification en_US
dc.subject Streaming technology (Telecommunications) en_US
dc.subject ข้อมูล -- การจำแนก en_US
dc.subject เทคโนโลยีสตรีมมิง (โทรคมนาคม) en_US
dc.title Data-throwaway learning for streaming chunk data classification by applying a versatile elliptic basis function (vebf) to single-class-wise computation en_US
dc.title.alternative การเรียนรู้แบบโยนแล้วทิ้งสำหรับการจำแนกประเภทกลุ่มข้อมูลที่เข้าทีละชุดโดยการประยุกต์เวอร์ซะไทล์อัลลิปติกเบซิสฟังก์ชันในการคำนวณแบบทีละกลุ่มข้อมูล en_US
dc.type Thesis en_US
dc.degree.name Doctor of Philosophy en_US
dc.degree.level Doctoral Degree en_US
dc.degree.discipline Computer Science and Information Technology en_US
dc.degree.grantor Chulalongkorn University en_US
dc.identifier.DOI 10.14457/CU.the.2013.1976


Files in this item

This item appears in the following Collection(s)

Show simple item record