Please use this identifier to cite or link to this item: http://cuir.car.chula.ac.th/handle/123456789/16946
Title: กลุ่มก้อนตัวจำแนกประเภทกำหนดการพันธุกรรมสำหรับข้อมูลไมโครอาร์เรย์
Other Titles: Ensemble genetic programming classifier for microarray data
Authors: สุพจน์ เฮงพระพรหม
Advisors: ประภาส จงสถิตย์วัฒนา
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Advisor's Email: Prabhas.C@chula.ac.th
Subjects: ดีเอ็นเอไมโครแอเรย์
การแสดงออกของยีน
พันธุกรรม
นิวรัลเน็ตเวิร์ค (คอมพิวเตอร์)
ปริญญาดุษฎีบัณฑิต
Issue Date: 2551
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: วิทยานิพนธ์นี้ได้นำเสนอวิธีการสร้างกลุ่มก้อนของตัวจำแนกประเภทกำหนดการพันธุกรรมสำหรับการจำแนกประเภทข้อมูลไมโครอาร์เรย์ ซึ่งเป็นข้อมูลที่มีจำนวนข้อมูลน้อย ขณะที่จำนวนคุณลักษณะมีจำนวนมาก ในการสร้างสมาชิกของกลุ่มก้อนนั้น จะมุ่งสร้างตัวจำแนกประเภทที่มีประสิทธิภาพในการจำแนกประเภทข้อมูลที่ดี ในขณะที่ตัวจำแนกประเภทแต่ละตัวจะต้องมีความแตกต่างจากสมาชิกตัวอื่น ๆ ในกลุ่มก้อน วิธีการที่นำเสนอจะใช้เทคนิคการจัดกลุ่มข้อมูลแบบ K-Means เพื่อจัดกลุ่มของคุณลักษณะของข้อมูลที่มีลักษณะคล้ายกันให้อยู่ในกลุ่มเดียวกัน และการเลือกคุณลักษณะแบบ SNR (Signal-to-Noise Ratio) โดยจะนำคุณลักษณะที่มีค่า SNR สูงที่สุดลำดับที่ i ของแต่ละกลุ่ม มาสร้างเป็นเซตย่อยของคุณลักษณะเพื่อใช้ในการสอน เพื่อสร้างตัวจำแนกประเภทกำหนดการพันธุกรรมตัวที่ i ซึ่งวิธีการนี้สามารถสร้างตัวจำแนกประเภทกำหนดการพันธุกรรมที่มีประสิทธิภาพที่ดี และมีความแตกต่างจากตัวจำแนกประเภทตัวอื่น ๆ เนื่องจากการใช้คุณลักษณะที่แตกต่างกัน ทำให้ประสิทธิภาพของกลุ่มก้อนดีขึ้นตามไปด้วย
Other Abstract: This thesis presents an algorithm for generating an ensemble of Genetic Programming classifiers for microarray data. The number of data is small and it has high dimensions. In order to construct an ensemble, each classifier must have high efficiency and at the same time it must be different from other classifiers. The proposed method uses K-Means clustering for grouping the features of data which are similar into the same group. The SNR (Signal-to-Noise Ratio) feature selection is used to select informative features. The feature with the ith best SNR score in each group is selected to form a set of features. This feature set is used to train the ith Genetic Programming classifier. The proposed method creates a good Genetic Programming classifier where each classifier is different from the others. They contain different set of features. As a result, the performance of the ensemble is improved
Description: วิทยานิพนธ์ (วศ.ด.)--จุฬาลงกรณ์มหาวิทยาลัย, 2551
Degree Name: วิศวกรรมศาสตรดุษฎีบัณฑิต
Degree Level: ปริญญาเอก
Degree Discipline: วิศวกรรมคอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/16946
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
Supoj_He.pdf2.15 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.