DSpace Repository

การคัดเลือกตัวแปรและการประมาณค่าสัมประสิทธิ์แบบเบย์เชิงประจักษ์สำหรับตัวแบบ Cox’s proportional hazard ที่ข้อมูลมีมิติสูง

Show simple item record

dc.contributor.advisor วิฐรา พึ่งพาพงศ์
dc.contributor.author อรณิชา ห่อนบุญเหิม
dc.contributor.other จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี
dc.date.accessioned 2015-09-07T07:10:18Z
dc.date.available 2015-09-07T07:10:18Z
dc.date.issued 2555
dc.identifier.uri http://cuir.car.chula.ac.th/handle/123456789/45033
dc.description วิทยานิพนธ์ (วท.ม.) --จุฬาลงกรณ์มหาวิทยาลัย, 2555 en_US
dc.description.abstract ในการคัดเลือกตัวแปรและประมาณค่าสัมประสิทธิ์สำหรับตัวแบบ Cox’s proportional hazard ที่ข้อมูลมีมิติสูง สามารถวิเคราะห์ได้หลายวิธี ในการศึกษาครั้งนี้เราจะใช้วิธีการคัดเลือกตัวแปรและประมาณค่าสัมประสิทธิ์แบบเบส์เชิงประจักษ์ร่วมกับวิธีการทำซ้ำแบบมีเงื่อนไขฐานนิยมและมัธยฐาน ซึ่งเป็นเทคนิคที่สามารถคำนวณได้ง่ายและรวดเร็ว งานวิจัยนี้มีวัตถุประสงค์เพื่อศึกษาผลกระทบของอัตราส่วนของขนาดตัวอย่างต่อจำนวนตัวแปรอิสระ, ร้อยละของข้อมูลเซ็นเซอร์และค่าสัมประสิทธิ์ถดถอยเริ่มต้นจากค่าอัตราความผิดพลาดในการตรวจจับเชิงบวกและเชิงลบ ข้อมูลที่ใช้ในการศึกษาคือเวลาในการอยู่รอดที่มีการแจกแจงแบบไวบูลล์ ที่ค่าสัมประสิทธิ์ส่วนใหญ่เป็นศูนย์กำหนดให้ขนาดตัวอย่างเท่ากับ100 ต่อตัวแปรอิสระ 300, 500และ1,000 ที่ร้อยละของข้อมูลเซ็นเซอร์10%, 50%และ70% พบว่า i) อัตราความผิดพลาดในการตรวจจับเชิงบวกและเชิงลบจะต่ำเมื่อระดับของข้อมูลเซ็นเซอร์ต่ำ ii) อัตราความผิดพลาดในการตรวจจับเชิงบวกและเชิงลบจะต่ำเมื่อจำนวนตัวแปรอิสระน้อย และiii) อัตราความผิดพลาดในการตรวจจับเชิงบวกและเชิงลบจะต่ำเมื่อค่าสัมประสิทธิ์ถดถอยเริ่มต้นเป็นค่าจริง vi) วิธีแบบเบส์เชิงประจักษ์ดีกว่าวิธีแบบ penalized lasso en_US
dc.description.abstractalternative Cox’s proportional hazard model with high-dimensional data cans analyses in several ways. In this study we will use empirical Bayes variable selection methods combined with iterated conditional modes/medians (ICM/M) algorithm which is empirically faster and easy to implement. The objective of this dissertation is to study the effects from the ratio of sample size to the number of independent variables, the percentages of censored data and the value of initial coefficient by comparing false positive and false negative rate. The data in this study is survival times with Weibull distribution. Simulate sparse data with 100 sample size and 300, 500and1000 independent variables. The levels of percentages of censored data are 10%, 50% and 70%. Based on the false positive and false negative rate, the finding are following: i) the false positive and false negative rate will decrease as low percentage of censored data, ii) false positive and false negative rate will decrease as the number of variables is small and iii) false positive and false negative will decrease as the initial value of coefficients is true coefficients iv) empirical Bayes method is better than the Lasso method. en_US
dc.language.iso th en_US
dc.publisher จุฬาลงกรณ์มหาวิทยาลัย en_US
dc.relation.uri http://doi.org/10.14457/CU.the.2012.1756
dc.rights จุฬาลงกรณ์มหาวิทยาลัย en_US
dc.subject ทฤษฎีการประมาณค่า en_US
dc.subject การวิเคราะห์การถดถอย en_US
dc.subject Estimation theory en_US
dc.subject Regression analysis en_US
dc.title การคัดเลือกตัวแปรและการประมาณค่าสัมประสิทธิ์แบบเบย์เชิงประจักษ์สำหรับตัวแบบ Cox’s proportional hazard ที่ข้อมูลมีมิติสูง en_US
dc.title.alternative Empirical bayes variable selection and estimation for the COX's proportional hazard model with high dimensional data en_US
dc.type Thesis en_US
dc.degree.name วิทยาศาสตรมหาบัณฑิต en_US
dc.degree.level ปริญญาโท en_US
dc.degree.discipline สถิติ
dc.degree.grantor จุฬาลงกรณ์มหาวิทยาลัย en_US
dc.email.advisor vitara@cbs.chula.ac.th
dc.identifier.DOI 10.14457/CU.the.2012.1756


Files in this item

This item appears in the following Collection(s)

Show simple item record