dc.contributor.advisor |
นัท กุลวานิช |
en_US |
dc.contributor.author |
อารยา หลงชวน |
en_US |
dc.contributor.other |
จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี |
en_US |
dc.date.accessioned |
2015-06-24T06:24:13Z |
|
dc.date.available |
2015-06-24T06:24:13Z |
|
dc.date.issued |
2556 |
en_US |
dc.identifier.uri |
http://cuir.car.chula.ac.th/handle/123456789/43118 |
|
dc.description |
วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2556 |
en_US |
dc.description.abstract |
การวิจัยในครั้งนี้ มีวัตถุประสงค์เพื่อเปรียบเทียบประสิทธิภาพของเทคนิคการลดมิติข้อมูลเข้า(input data) ระหว่างเทคนิคการวิเคราะห์องค์ประกอบหลัก(Principle Component Analysis, PCA) วิธีกำลังสองน้อยสุดเชิงส่วน (Partial Least Squares, PLS)และSliced Average Variance Estimator (SAVE) สำหรับการพยากรณ์ด้วยซัพพอร์ตเวกเตอร์แมชชีน กรณีที่แบ่งตัวแปรตามออกเป็น 2 กลุ่ม ซึ่งดำเนินการภายใต้ขอบเขตของจำนวนตัวแปรอิสระที่ทำการศึกษาคือ 5, 10, 20 และ 40 ตัว โดยทำการจำลองข้อมูลและวิเคราะห์ผลด้วยโปรแกรม R 2.15.3 ทั้งนี้จะใช้ Receiver Operating Characteristic (ROC) เป็นเครื่องมือวัดประสิทธิภาพความแม่นยำในการพยากรณ์จำแนกประเภทของข้อมูล โดยใช้พื้นที่ใต้โค้ง ROC (Area Under ROC Curve : AUC) และใช้อัตราความผิดพลาดในการจำแนกประเภทข้อมูล (Misclassification Rate : MCR)
การศึกษาภายใต้ขอบเขตดังกล่าวผลปรากฏว่ากรณีที่จำนวนตัวแปรอิสระเท่ากับ 5 เมื่อขนาดตัวอย่างของทั้งสองกลุ่มเท่ากับ 30 และจำนวนตัวแปรอิสระเท่ากับ 10 เมื่อขนาดตัวอย่างทั้งหมดไม่เกิน 120 ให้ผลเหมือนกัน การลดข้อมูลด้วยวิธี PLS ให้ประสิทธิภาพความแม่นยำในการพยากรณ์จำแนกประเภทของข้อมูลดีที่สุด แต่เมื่อเพิ่มขนาดตัวอย่างการลดข้อมูลด้วยวิธี SAVE จะให้ประสิทธิภาพความแม่นยำในการพยากรณ์จำแนกประเภทของข้อมูลดีกว่าวิธี PLS และ PCA และเมื่อเพิ่มจำนวนตัวแปรอิสระเป็น 20 และ 40 การลดข้อมูลด้วยวิธี PLS ให้ประสิทธิภาพความแม่นยำในการพยากรณ์จำแนกประเภทของข้อมูลดีที่สุด |
en_US |
dc.description.abstractalternative |
The purpose of this study is to compare the effectiveness of dimension reduction techniques between Principle Component Analysis (PCA), Partial Least Squares (PLS) and Sliced Average Variance Estimator (SAVE) for input data of Support Vector Machine. The datasets from four different number of independent variables (p=5, 10, 20 and 40) were simulated in this study. Simulating and analyzing data in this study use R 2.15.3.The area under ROC curve (AUC) and misclassification rate (MCR) were used to evaluate and compare the prediction performance in forecasting classification data.
In case of 5 independent variables on a sample size of both groups equal to 30 and 10 independent variables when sample size is less than 120. The results are the same, PLS is the most effective dimension reduction technique. On the other hand, when we increase the sample size, SAVE clearly performs better overall PLS than and PCA. And when we increase the number of independent variables , PLS is the most effective dimension reduction technique. |
en_US |
dc.language.iso |
th |
en_US |
dc.publisher |
จุฬาลงกรณ์มหาวิทยาลัย |
en_US |
dc.relation.uri |
http://doi.org/10.14457/CU.the.2013.591 |
|
dc.rights |
จุฬาลงกรณ์มหาวิทยาลัย |
en_US |
dc.subject |
การลดมิติ (สถิติ) |
|
dc.subject |
ซัพพอร์ตเวกเตอร์แมชชีน |
|
dc.subject |
Dimension reduction (Statistics) |
|
dc.subject |
Support vector machines |
|
dc.title |
การเปรียบเทียบประสิทธิภาพของเทคนิคการลดมิติสำหรับข้อมูลเข้าที่ใช้ในวิธีซัพพอร์ตเวกเตอร์แมชชีน : กรณีศึกษาการแจกแจงแบบเกาส์เซียน |
en_US |
dc.title.alternative |
COMPARISON THE EFFICIENCY OF DIMENSION REDUCTION TECHNIQUES FOR INPUT DATA IN SUPPORT VECTOR MACHINE: A CASE STUDY IN GAUSSIAN DISTRIBUTION |
en_US |
dc.type |
Thesis |
en_US |
dc.degree.name |
วิทยาศาสตรมหาบัณฑิต |
en_US |
dc.degree.level |
ปริญญาโท |
en_US |
dc.degree.discipline |
สถิติ |
en_US |
dc.degree.grantor |
จุฬาลงกรณ์มหาวิทยาลัย |
en_US |
dc.email.advisor |
nat.kulvanich@gmail.com |
en_US |
dc.identifier.DOI |
10.14457/CU.the.2013.591 |
|