การประยุกต์ใช้การทำเหมืองข้อความเพื่อจำแนกประเภทโรคจากอาการ

พรรณาภรณ์ เกตุภู่พงษ์

Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/60861

Title:	การประยุกต์ใช้การทำเหมืองข้อความเพื่อจำแนกประเภทโรคจากอาการ
Other Titles:	Applying text mining for classifying disease from symptoms
Authors:	พรรณาภรณ์ เกตุภู่พงษ์
Advisors:	เกริก ภิรมย์โสภา กฤษณ์ เจริญลาภ
Other author:	จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Subjects:	การวินิจฉัยโรค เหมืองข้อมูล การวิเคราะห์การจำแนกประเภท Diagnosis Data mining Discriminant analysis
Issue Date:	2561
Publisher:	จุฬาลงกรณ์มหาวิทยาลัย
Abstract:	การวินิจฉัยโรคที่คลาดเคลื่อนถือเป็นปัญหาสำคัญในวงการแพทย์ โดยปัจจุบันการวินิจฉัยโรคของแพทย์แต่ละคนจะแตกต่างกันไปตามความรู้ ความชำนาญ และประสบการณ์ที่ได้สั่งสมมา รวมทั้งการวินิจฉัยโรคในบางครั้งแพทย์อาจลืมนึกถึงโรคบางโรคไป เนื่องจากเป็นโรคที่พบเจอได้ยากหรือไม่ค่อยพบเจอในผู้ป่วย ส่งผลให้การวินิจฉัยโรคเกิดความคลาดเคลื่อน โดยหลังจากที่แพทย์ได้ทำการวินิจฉัยโรคแล้ว ขั้นตอนต่อมาคือการจำแนกรหัสไอซีดีเทนซีเอ็มให้กับคำวินิจฉัยนั้น ซึ่งถือเป็นขั้นตอนที่ยุ่งยากสำหรับแพทย์ส่วนใหญ่ ดังนั้นในงานวิจัยนี้จึงมีแนวคิดที่จะนำเสนอแบบจำลองสำหรับจำแนกประเภทโรคจากอาการ โดยการประยุกต์ใช้การทำเหมืองข้อความ เพื่อช่วยแพทย์ในการวินิจฉัยโรคและจำแนกรหัสไอซีดีเทนซีเอ็มได้ด้วยข้อมูลอาการของผู้ป่วย ซึ่งการสร้างแบบจำลองในงานวิจัยนี้จะเลือกใช้ตัวจำแนกประเภทที่นิยมใช้ในการทำเหมืองข้อความ ได้แก่ ต้นไม้ตัดสินใจ การเรียนรู้เบส์อย่างง่าย ซัพพอร์ตเวกเตอร์แมชชีน และโครงข่ายประสาทเทียม มาเปรียบเทียบกันโดยใช้ระยะเวลาที่ใช้ในการสร้างแบบจำลอง ระยะเวลาที่แบบจำลองใช้ในการทำนาย กราฟเส้นโค้งอาร์โอซี อัตราผลบวกจริง อัตราผลบวกเท็จ ค่าความเที่ยง และค่าความแม่นมาเป็นตัวชี้วัด ซึ่งผลลัพธ์ที่ได้พบว่าการใช้โครงข่ายประสาทเทียมเป็นตัวจำแนกประเภทในการสร้างแบบจำลองมีความเหมาะสมที่สุดสำหรับงานวิจัยนี้ เนื่องจากให้อัตราผลบวกจริงสูงสุดที่ร้อยละ 89.03 และมีพื้นที่ใต้เส้นโค้งของกราฟเส้นโค้งอาร์โอซีมากที่สุด
Other Abstract:	Nowadays, misdiagnoses account for a significant portion of medical errors. This is due to the fact that each physician’s diagnosis is different depending on the physician’s knowledge, skill, and experience. In several cases, physicians may ignore uncommon diseases. Also, after the diagnosis, the physician has to provide ICD-10-CM code. This is a difficult process for most (if not all) physicians. We propose a predictive model for classifying disease from symptoms by applying text mining technique. Our research technique allows physician to diagnose and to access an ICD-10-CM code directly from symptoms. Our models are based on several classifiers such as Decision Tree, Naïve Bayes, Support Vector Machine, and Neural Network. Models from each classifier were compared using training time, predicting time, Receiver Operating Characteristic (ROC) curve, True Positive Rate (TPR), False Positive Rate (FPR), precision and accuracy. The result suggests that Neural Network gives the best TPR at 89.03%.
Description:	วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2561
Degree Name:	วิทยาศาสตรมหาบัณฑิต
Degree Level:	ปริญญาโท
Degree Discipline:	วิทยาศาสตร์คอมพิวเตอร์
URI:	http://cuir.car.chula.ac.th/handle/123456789/60861
URI:	http://doi.org/10.58837/CHULA.THE.2018.1139
metadata.dc.identifier.DOI:	10.58837/CHULA.THE.2018.1139
Type:	Thesis
Appears in Collections:	Eng - Theses

Files in This Item:

File	Description	Size	Format
5970261121.pdf		2.56 MB	Adobe PDF	View/Open

Show full item record