Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/74020
Title: การเปรียบเทียบตัวประมาณอัตราความผิดพลาด ในการวิเคราะห์การจำแนกกลุ่ม
Other Titles: Comparison on error rate estimators in discriminant analysis
Authors: ลลนา ทวีรุ่งโรจน์
Advisors: สรชัย พิศาลบุตร
Other author: จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย
Advisor's Email: ไม่มีข้อมูล
Subjects: การวิเคราะห์การจำแนกประเภท
การวิเคราะห์ความคลาดเคลื่อน (คณิตศาสตร์)
Discriminant analysis
Error analysis (Mathematics)
Issue Date: 2534
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: การวิจัยครั้งนี้มีวัตถุประะสงค์ที่จะมีศึกษา และนำเอาตัวประมาณ 4 วิธี ดังนี้ 1.วิธี DS หรือ SHRUNKEN-D ́ ESTIMATOR 2. วิธี R หรือ RESUBSTITUTION ESTIMATOR 3. วิธี บ หรือ Leave -one -out ESTIMATOR 4. วิธี B หรือ BOOTSTRAP ESTIMATOR มาประมาณอัตราความผิดพลาดที่มีเงื่อนไขที่เกิดจากการใช้กฎการจำแนกกลุ่ม สำหรับการเปรียบเทียบประสิทธิภาพของตัวประมาณนั้นจะพิจารณา จากค่าความ คลาดเคลื่อนกำลังสองเฉลี่ยของตัวประมาณ ข้อมูลที่ใช้ในการวิจัยได้จากการจำลอง ด้วยโปรแกรมคอมพิวเตอร์ โดยใช้เทคนิค มอนติคาร์โล เมื่อขนาดตัวอย่างมีขนาด 10, 20, 25, 50 และ 100 ขนาดของตัวแปรอิสระ( K ) 3 5 7 และ 9 ลักษณะการแยกจากกันของประชากร หรือค่ารากที่สองของ Mahalanobis distance (∆) ) มีขนาด 0.0 , 0.5 , 1.0 , 1.5 , 2.0 , 2.5 และ 3.0 โดยในแต่ละการทดลองกระทำซ้ำ 500 ครั้ง และการสุ่มตัวอย่างแบบใส่คืน โดยวิธี Bootstrap กระทำ 100 ครั้ง ผลการศึกษาสรุปได้ดังนี้ 1. ขนาดตัวอย่าง จำนวนตัวแปรอิสระ และลักษณะการแยกจากกันของประชากรมีผลต่อ ความ คลาดเคลื่อนกำลังสอง เฉลี่ยของตัวประมาณ 2. ในกรรณีที่ขนาดตัวแปรอิสระในค่าสังเกตเพิ่มขึ้น วิธี U มีประสิทธิภาพดีกว่า วิธี R วิธี DS และวิธี B 3. โดยส่วนใหญ่วิธี R ให้ประสิทธิภาพในการประมาณต่ำกว่าตัวประมาณตัวอื่น 4. ค่ารากนี้สองของ Mahalanobis distance เป็นปัจจัยหลักที่สำคัญในการเลือกใช้ตัวประมาณอัตราความผิดพลาดที่มีเงื่อนไข 5. เมื่อ ∆ ≤ 0 5 ควรเลือกใช้ตัวประมาณโดยวิธี B 6. เมื่อ ∆> 0 .5 ถ้า k ≤ 7 ควรใช้ตัวประมาณโดยวิธี DS แต่ถ้าk > 7 ควรใช้ตัวประมาณโดยวิธี U
Other Abstract: The purpose of this study is to investigate the four estimation methods in Discriminant Analysis namely, 1. Shrunken-D ́ estimator or DS 2. Leave-one-out estimator or U method 3. Resubstitutionestimator or R method 4. Bootstrap estimator or B mathod, using mean square errors method as maens of comparison. The data for each experiment were obtained through simulation using the Monte Carlo technique. The computer program was designed to calculate the mean square error for each methods in different situations with varying sample size 10, 20, 25, 50, 100; number of independent variables (k) 3, 5, 7, 9 and square root of Mahalanobis distance (∆) 0.0, 0.5, 1.0, 1.5, 2.0, 2.5, 3.0. For each case the experiment was repeated 500 times and bootstrap sampling was repeated 100 times. Results of the study are as follows: 1. Sample size number of independent variables and square root of Mahalanobis distance had affected to mean square errors. 2. when number of independent variable was increased, U method is better than R method DS method and B method. 3. For almost cases, R method gave low efficiency. 4. The importance factor, which estimators should estimate the conditional error rate, is square root of Mahalanobis distance. 5. When ∆> 0.5, B method should be used to estimate the conditional error rate. 6. When A > 0.5, if k ≤ 7 then DS method should be used to estimate the conditional error rate, otherwise using U method.
Description: วิทยานิพนธ์ (สต.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2534
Degree Name: สถิติศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: สถิติ
URI: http://cuir.car.chula.ac.th/handle/123456789/74020
ISBN: 9745785598
Type: Thesis
Appears in Collections:Grad - Theses

Files in This Item:
File Description SizeFormat 
Lalana_th_front_p.pdf1.4 MBAdobe PDFView/Open
Lalana_th_ch1_p.pdf911.76 kBAdobe PDFView/Open
Lalana_th_ch2_p.pdf1.6 MBAdobe PDFView/Open
Lalana_th_ch3_p.pdf1.73 MBAdobe PDFView/Open
Lalana_th_ch4_p.pdf3.71 MBAdobe PDFView/Open
Lalana_th_ch5_p.pdf839.22 kBAdobe PDFView/Open
Lalana_th_back_p.pdf1.12 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.