DSpace Repository

Attributes scaling for K-means algorithm controlled by misclassification of all clusters

Show simple item record

dc.contributor.advisor Krung Sinapiromsaran
dc.contributor.author Wacharasak Siriseriwan
dc.contributor.other Chulalongkorn University. Faculty of Science
dc.date.accessioned 2013-01-15T03:59:44Z
dc.date.available 2013-01-15T03:59:44Z
dc.date.issued 2008
dc.identifier.uri http://cuir.car.chula.ac.th/handle/123456789/28440
dc.description Thesis (M.Sc.) -- Chulalongkorn University, 2008 en
dc.description.abstract K-means clustering, one of the well-known distance-based clustering methods, is a very popular unsupervised machine learning using in various applications. Researchers try to integrate the concept of supervised learning to K-means clustering via attribute-scaling vector. With addition of this vector, K-means clustering can be supervised by the information of target class provided in the training set. In this thesis, we explore and determine the optimal attribute-scaled vector that minimizes the misclassification rate of the target class. This thesis uses the non-linear unconstrained optimization techniques in attribute-scaled space, called cyclic coordinate method and Hooke and Jeeves method. Our experiments show that both methods can provide the optimal scaling vectors which effectively reduce the misclassification error of supervised K-means clustering and lead to the effective supervised clustering in some data sets. For other data sets, the improvement of misclassification error is still achievable, but the error is too high suggesting that those datasets are not suitable to apply supervised clustering. en
dc.description.abstractalternative การแบ่งกลุ่มค่าเฉลี่ยเค ซึ่งเป็นหนึ่งในวิธีที่รู้จักโดยทั่วไปในการแบ่งกลุ่มด้วยระยะทาง เป็นวิธีการเรียนรู้ของเครื่องแบบไม่มีผู้สอนที่เป็นที่นิยมมาก และใช้ในงานประยุกต์ต่างๆอย่างหลากหลาย มีงานวิจัยในอดีตที่จะรวมแนวคิดของการเรียนรู้แบบมีผู้สอนเข้าไปในการแบ่งกลุ่มแบบค่าเฉลี่ยเค โดยผ่านเวกเตอร์ที่สเกลลักษณะประจำ ด้วยการเพิ่มเวกเตอร์นี้ การแบ่งกลุ่มแบบค่าเฉลี่ยสามารถกำกับดูแลด้วยข้อมูลของชั้นเป้าหมายซึ่งได้จัดเตรียมไว้ในข้อมูลสอน ในวิทยานิพนธ์นี้ เราค้นและเสาะหาเวกเตอร์สเกลลักษณะประจำที่เหมาะสมที่มีความผิดพลาดจากการจำแนกประเภทจากชั้นเป้าหมายต่ำที่สุด วิทยานิพนธ์นี้ใช้เทคนิคการหาค่าเหมาะที่สุดไม่เชิงเส้นแบบไม่มีเงื่อนไขบังคับในปริภูมิของสเกลลักษณะประจำสองแบบคือ วิธีการพิกัดวัฐจักรและวิธีของฮุคและจีพส์ การทดลองของเราแสดงให้เห็นว่าทั้งสองวิธีให้เวกเตอร์สเกลที่เหมาะสม ซึ่งสามารถลดความผิดพลาดจากการจำแนกประเภทของการแบ่งกลุ่มค่าเฉลี่ยเคแบบมีผู้สอนได้อย่างมีประสิทธิภาพ และยังนำไปสู่การจัดกลุ่มแบบมีผู้สอนที่ได้ผลกับข้อมูลบางชุด แต่ในบางชุดข้อมูล ความผิดพลาดไม่เปลี่ยนไปอย่างมีนัยสำคัญ ซึ่งสะท้อนให้เห็นว่าชุดข้อมูลดังกล่าว ไม่เหมาะสมในการที่จะทำการแบ่งกลุ่มแบบมีผู้สอน en
dc.format.extent 2066597 bytes
dc.format.mimetype application/pdf
dc.language.iso en es
dc.publisher Chulalongkorn University en
dc.relation.uri http://doi.org/10.14457/CU.the.2008.1492
dc.rights Chulalongkorn University en
dc.subject Algorithms Controlled en
dc.subject Data mining en
dc.subject Machine learning en
dc.subject Cluster analysis en
dc.title Attributes scaling for K-means algorithm controlled by misclassification of all clusters en
dc.title.alternative วิธีสเกลลักษณะประจำสำหรับขั้นตอนวิธีค่าเฉลี่ยเคควบคุมด้วยความผิดพลาดจากการจำแนกประเภทของทุกกลุ่ม en
dc.type Thesis es
dc.degree.name Master of Science es
dc.degree.level Master's Degree es
dc.degree.discipline Computational Science es
dc.degree.grantor Chulalongkorn University en
dc.email.advisor Krung.S@Chula.ac.th
dc.identifier.DOI 10.14457/CU.the.2008.1492


Files in this item

This item appears in the following Collection(s)

Show simple item record