Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/73515
Title: การศึกษาเปรียบเทียบการจำแนกกลุ่ม 2 กลุ่มระหว่างการวิเคราะห์การถดถอยทวิ และการวิเคราะห์จำแนกประเภทเมื่อตัวแปรอิสระมีการแจกแจงแบบเบ้
Other Titles: Comparative study between binary regression discrimination and discriminant analysis in classifying two groups havings skewed independent variables distribution
Authors: บุญกอง ทะกลโยธิน
Advisors: สรชัย พิศาลบุตร
Other author: จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย
Advisor's Email: ไม่มีข้อมูล
Subjects: การวิเคราะห์การถดถอย
Regression analysis
Issue Date: 2535
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: การวิจัยครั้งนี้มีวัตถุประสงค์ที่จะศึกษาเปรียบเทียบการจำแนกกลุ่ม 2 กลุ่มระหว่างการวิเคราะห์การถดถอยทวิและการวิเคราะห์จำแนกประเภท เมื่อตัวแปรอิสระมีการแจกแจงแบบเบ้ สำหรับข้อมูลประกอบด้วยสัดส่วนของค่า 1 และ 0 ของตัวแปรตามสองด้านแบบต่าง ๆ คือ 0.50:0.50, 0.55 :0.45, 0.60:0.40 . 0.65:0.35, 0.70:0.30, 0.75 :0.25, 0.80:0.20, 0.85 :0.15, 0.90:0.10 และ 0.95:0.05 โดยที่สัดส่วนแต่ละแบบใช้ขนาดตัวอย่าง 10. 30 และ 60 จำนวนตัวแปรอิสระเท่ากับ 1 และ 2 การแจกแจงของตัวแปรอิสระที่ศึกษาคือ การแจกแจงแบบเบ้ ซึ่งจะใช้การแจกแจง แบบไวบูลส์ แบบแกมมา และแบบลอกนอร์มอล นอกจากนี้ยังได้พิจารณาในกรณีของการแจกแจงแบบปกติด้วย สำหรับแต่ละการแจกแจงที่นำมา เปรียบเทียบกำหนดให้มีค่าเฉลี่ยและความแปรปรวนใกล้เคียงกันมากที่สุด เกณฑ์ที่ใช้ในการเปรียบเทียบคือ ค่าเฉลี่ย ของร้อยละที่พยากรณ์หรือจำแนกกลุ่มได้ถูกต้อง ส่วนข้อมูลลักษณะต่าง ๆ ที่ใช้ในการทดลองนั้น จำลองด้วยโปรแกรมคอมพิวเตอร์ โดยใช้เทคนิคมอนติคาร์โลและกระทำซ้ำกันจำนวน 500 ค่าในแต่ละกรณีผลจากการศึกษาพบว่าสัดส่วนของตัวแปรตาม ความน่าจะเป็นโดยหลักเกณฑ์ และการแจกแจงของ ตัวแปรอิสระ มีอิทธิพลต่อวิธีการจำแนกกลุ่ม ทำให้ผลในการจำแนกกลุ่มมีความแตกต่างกันใน 2 กรณี คือ กรณีแรกสัดส่วนของตัวแปรตามเท่ากับ 0.50 จะพบว่า ประสิทธิภาพในการจำแนกกลุ่มทุก ๆ กรณีที่ศึกษาจะมี ลักษณะใกล้เคียงกันทั้งสองวิธี สำหรับกรณีที่สองสัดส่วนของตัวแปรตามมากกว่า 0.50 การวิเคราะห์จำแนกประเภทจะให้ผลดีกว่าการวิเคราะห์การถดถอยแบบทวิ ถ้าพิจารณาค่าความน่าจะเป็นไปโดยหลักเกณฑ์ประกอบใน การจำแนกกลุ่มจะให้ผลดีกว่า ซึ่งถือว่าเป็นวิธีที่ควรเลือกใช้มากที่สุด แต่อย่างไรก็ตามการวิเคราะห์การถดถอย แบบทวิที่มีการแปลงค่าพยากรณ์ด้วยเส้นโค้งปกติจะให้ผลดีกว่าวิธีอื่นในกรณีของการวิเคราะห์การถดถอยด้วยกันในกรณีที่สัดส่วนของตัวแปรดามมีค่าเข้าใกล้ 1 การแจกแจงแบบปกติจะให้ผลดีกว่าและประสิทธิภาพ มีความคงเส้นคงวามากกว่าการแจกแจงแบบเบ้ ซึ่งการแจกแจงประเภทหลังนี้จะให้ผลไม่แตกต่างกัน แต่จะให้ ประสิทธิภาพลดลงในลักษณะเดียวกันทั้ง 3 การแจกแจง เมื่ออยู่ในกรณีเดียวกันกับการแจกแจงประเภทแรก
Other Abstract: The objective of this thesis is to study the comparison on binary regression discrimination and discriminant analysis in classifying two groups having a skewed independent variable distribution. The data consist of various types of proportion of value 1. and 0 of dichotomous dependent variables. Types of proportion are 0.50:0.50, 0.55:0.45, 0.60:0.40, 0.65:0.35, 0.70:0.30, 0.75: 0.25, 0.80:0.20, 0.85:0.15, 0.90:0.10 and 0.95:0.05 each of which is the sample size of 10, 30 and 60. This study is used the number of independent variables of 1. and 2 for all sample size. The distributions of independent variables of skewed distribution are Weibull, Lognormal and Gamma distribution. Moreover, normal distribution is specially studied. All distributions are compared with the similarity of means and variances, by using the average of correctly classified percent. Data is obtained through simulation using Monte Carlo techniques, repeated 500 times for each case. The results of this study are found that proportion of dichotomous dependent variables, prior probability and independent variables distribution effect the difference of classifications in two cases. First, if the proportion is equal to 0.50 the results of both analyses are analogous. Second, if the proportion is greater than 0.50 the discriminant analysis contributes better results than the binary regression. Moreover, the discriminant analysis, evaluated in terms of unequal prior probabilities contributes the best results, which is suggested to be used whenever possible. However, the binary regression with predicted value transformations by normal curve gives the best result in the regression analysis, In case of the proportion of dependent variables converge to 1, the normal distribution contributes more consistency and efficiency than the skewed distribution. Nevertheless, it has been discovered that among the varieties of skewed distribution; Weibull, Lognormal and Gamma distribution, they give similar results but decreased efficiency.
Description: วิทยานิพนธ์ (สต.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2535
Degree Name: สถิติศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: สถิติ
URI: http://cuir.car.chula.ac.th/handle/123456789/73515
ISBN: 9745815888
Type: Thesis
Appears in Collections:Grad - Theses

Files in This Item:
File Description SizeFormat 
Boonkong_dh_front_p.pdf1.06 MBAdobe PDFView/Open
Boonkong_dh_ch1_p.pdf864.57 kBAdobe PDFView/Open
Boonkong_dh_ch2_p.pdf1.05 MBAdobe PDFView/Open
Boonkong_dh_ch3_p.pdf856.07 kBAdobe PDFView/Open
Boonkong_dh_ch4_p.pdf919.42 kBAdobe PDFView/Open
Boonkong_dh_ch5_p.pdf923.94 kBAdobe PDFView/Open
Boonkong_dh_back_p.pdf4.99 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.