Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/16967
Title: | A mathematical algorithm to study the complex diseases :|ba case study of beta [superscript 0]-thalassemia/HB E'S and crohn's diseases |
Other Titles: | ขั้นตอนวิธีทางคณิตศาสตร์เพื่อใช้ศึกษาโรคที่มีความซับซ้อน : กรณีศึกษาโรคบีตา[superscript 0]-ธาลัสซีเมียฮีโมโกบินอีและโรคโครน |
Authors: | Khantharat Anekboon |
Advisors: | Chidchanok Lursinsap Suphakant Phimoltares |
Other author: | Chulalongkorn University. Faculty of Science |
Advisor's Email: | lchidcha@chula.ac.th suphakant.p@chula.ac.th |
Subjects: | Genetic algorithms Bootstrap (Statistics) Thalassemia |
Issue Date: | 2009 |
Publisher: | Chulalongkorn University |
Abstract: | After the human genome project, case-control association studies have been used to extract knowledge of disease association from SNPs. Costs and time in genotyping SNPs are reduced, genotyping SNPs or whole genome is now possible to study the association in a particular disease. However, increasing a number of SNPs affects a number of all possible cases which grows exponentially. A new feature selection and classification called IFGA with BoostMode-SVM is proposed. Two real data sets of case-control association study of Beta-0/Hb E Thalassemia and Crohn's disease from a given set of genotype data are evaluated. The IFGA for feature selection with the BoostMode-SVM classification performs well in both Thalassemia and Crohn's diseases compared with the previous techniques: Optimum Random Forest and CART. We used 6 features as biomarkers for Thalassemia with 71.57% accuracy and 8 features for Crohn's disease with 71.06% accuracy by 10-fold cross validation. |
Other Abstract: | หลังจากโครงการจีโนมมนุษย์เสร็จสิ้นลง การศึกษาความสัมพันธ์ของกลุ่มผู้ป่วยกับกลุ่มควบคุม ถูกนำมาใช้เพื่อสกัดความรู้ด้านความสัมพันธ์ของโรค ในขณะนี้ค่าใช้จ่ายและเวลาที่ใช้ในการหาจีโนไทป์ของสนิปส์ได้ลดลงกว่าอดีต การหาจีโนไทป์ของสนิปส์บางตัวหรือทั้งจีโนม เพื่อที่จะศึกษาความสัมพันธ์ของโรคสามารถทำได้ อย่างไรก็ตามการเพิ่มจำนวนสนิปส์ในการศึกษาความสัมพันธ์ของโรค จะส่งผลให้มีจำนวนคำตอบของตำแหน่งของยีนที่ไวกับการเกิดโรคที่เป็นไปได้ทั้งหมดเพิ่มขึ้นสูงอย่างมาก วิทยานิพนธ์ฉบับนี้ได้นำเสนอวิธีการเลือกตำแหน่งที่สำคัญสำหรับใช้ในการแบ่งกลุ่มใหม่ชื่อว่า IFGA พร้อมด้วย BoostMode-SVM ข้อมูลจีโนไทป์ของโรคบีตา0-ธาลัสซีเมียฮีโมโกลบินอีและโรคโครนถูกนำมาทดสอบ ผลการทดลองพบว่าวิธี IFGA พร้อมด้วย BoostMode-SVM ให้ความถูกต้องมากกว่าทั้งในโรคบีตา[superscript 0]-ธาลัสซีเมียฮีโมโกลบินอีและโรคโครน เมื่อเปรียบเทียบกับวิธี Optimum Random Forest และ CART โรคบีตา0-ธาลัสซีเมียฮีโมโกลบินอีใช้ 6 ตำแหน่งในการแบ่งกลุ่มระหว่างกลุ่มผู้ป่วยกับกลุ่มควบคุมด้วยความถูกต้อง 71.57% และใช้ 8 ตำแหน่งสำหรับการแบ่งกลุ่มระหว่างกลุ่มผู้ป่วยกับกลุ่มควบคุมของโรคโครนด้วยความถูกต้อง 71.06% ด้วยการเฉลี่ยจากการทดสอบ 10 ครั้ง |
Description: | Thesis (Ph.D.)--Chulalongkorn University, 2009 |
Degree Name: | Doctor of Philosophy |
Degree Level: | Doctoral Degree |
Degree Discipline: | Computer Science |
URI: | http://cuir.car.chula.ac.th/handle/123456789/16967 |
URI: | http://doi.org/10.14457/CU.the.2009.1726 |
metadata.dc.identifier.DOI: | 10.14457/CU.the.2009.1726 |
Type: | Thesis |
Appears in Collections: | Sci - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Khantharat_An.pdf | 669.6 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.