Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/43669
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorสุกรี สินธุภิญโญen_US
dc.contributor.authorสุรพงษ์ เชี่ยวสกุลวัฒนาen_US
dc.contributor.otherจุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์en_US
dc.date.accessioned2015-06-24T06:43:47Z
dc.date.available2015-06-24T06:43:47Z
dc.date.issued2556en_US
dc.identifier.urihttp://cuir.car.chula.ac.th/handle/123456789/43669
dc.descriptionวิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2556en_US
dc.description.abstractการจำแนกต้นไม้ติดสินใจสำหรับชุดข้อมูลไม่สมดุล โดยใช้น้ำหนักต่างกันบนข้อมูลสังเคราะห์ เป็นวิธีการที่ใช้เทคนิค SMOTE ในการเพิ่มจำนวนตัวอย่างกลุ่มน้อยด้วยการสังเคราะห์ข้อมูลกลุ่มน้อยขึ้น เพื่อให้จำนวนตัวอย่างกลุ่มน้อยที่เพิ่มขึ้นมีจำนวนใกล้เคียงกับตัวอย่างกลุ่มมาก และปรับการหาเอนโทรปีใหม่ ซึ่งใช้วิธี C4.5เป็นพื้นฐาน เพื่อจำแนกข้อมูลกลุ่มน้อยได้ดีขึ้น สำหรับการจำแนกข้อมูลแบบสองกลุ่ม ทำการทดสอบแบบไขว้ข้ามสิบกลุ่ม โดยเลือกชุดข้อมูลไม่สมดุลจำนวน 16 ชุดข้อมูลมาทำการทดลอง และเปรียบเทียบผลการทดลองกับอัลกอริทึม C4.5 ที่ใช้เทคนิค SMOTE การทดสอบพบว่าวิธีการที่นำเสนอสามารถจำแนกข้อมูลกลุ่มน้อยได้ดีกว่าวิธีอื่นๆ เมื่อใช้น้ำหนักที่ต่างกันบนข้อมูลสังเคราะห์en_US
dc.description.abstractalternativeOur classification method for an imbalanced data set is based on the decision tree techniques with SMOTE technique. In general, the SMOTE technique will increase the number of minorities by synthesizing new set of the minority class data and augmenting this new data set to the original data set. With the SMOTE technique, the data set becomes almost balanced. We adjust the original entropy function of C4.5 to better handle the newly synthesized data in the augmented data set. In our experiment, we tested our method using standard 10-fold cross validation on 16 imbalanced data sets. All of data sets are two-class data set. The results showed that the presented method performed better than other methods tested in our experiments.en_US
dc.language.isothen_US
dc.publisherจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.relation.urihttp://doi.org/10.14457/CU.the.2013.1125-
dc.rightsจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.subjectโปรแกรมคอมพิวเตอร์
dc.subjectเอนโทรปี
dc.subjectComputer programs
dc.subjectEntropy
dc.titleการจำแนกต้นไม้ตัดสินใจสำหรับชุดข้อมูลไม่สมดุลโดยใช้น้ำหนักต่างกันบนข้อมูลสังเคราะห์en_US
dc.title.alternativeDECISION TREE CLASSIFICATION OF IMBALANCED DATA SETS USING DIFFERENT WEIGHTS ON SYNTHESIZED DATAen_US
dc.typeThesisen_US
dc.degree.nameวิทยาศาสตรมหาบัณฑิตen_US
dc.degree.levelปริญญาโทen_US
dc.degree.disciplineวิทยาศาสตร์คอมพิวเตอร์en_US
dc.degree.grantorจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.email.advisorsukree.s@chula.ac.then_US
dc.identifier.DOI10.14457/CU.the.2013.1125-
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
5370371021.pdf3.86 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.