Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/43132
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorณัฏฐภรณ์ หลาวทองen_US
dc.contributor.authorพนิดา พานิชวัฒนะen_US
dc.contributor.otherจุฬาลงกรณ์มหาวิทยาลัย. คณะครุศาสตร์en_US
dc.date.accessioned2015-06-24T06:24:21Z
dc.date.available2015-06-24T06:24:21Z
dc.date.issued2556en_US
dc.identifier.urihttp://cuir.car.chula.ac.th/handle/123456789/43132
dc.descriptionวิทยานิพนธ์ (ค.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2556en_US
dc.description.abstractการวิจัยครั้งนี้มีวัตถุประสงค์เพื่อ 1) เพื่อเปรียบเทียบสถิติบูทสแตรป (bootstrapped statistics) ของการออกแบบการปรับเทียบคะแนนแบบสอบรูปแบบผสมโดยใช้ข้อสอบร่วมสำหรับกลุ่มไม่เท่าเทียมกัน (NEAT) ระหว่างวิธีการตรวจที่แตกต่างกัน 2) เพื่อเปรียบเทียบค่ารากที่สองของค่าเฉลี่ยความแตกต่างยกกำลังสอง (RMSD) ของการออกแบบการปรับเทียบคะแนนแบบสอบรูปแบบผสมโดยใช้ข้อสอบร่วมสำหรับกลุ่มไม่เท่าเทียมกัน (NEAT) ระหว่างวิธีของเลอวิน (Levine method) และวิธี CLE (Chained Linear Equating) กลุ่มตัวอย่างเป็นนักเรียนระดับชั้นมัธยมศึกษาปีที่ 4 สำนักงานเขตพื้นที่การศึกษามัธยมศึกษาเขต 1 กรุงเทพมหานคร จำนวน 1,609 คน โดยสุ่มกลุ่มตัวอย่างด้วยวิธีการสุ่มแบบหลายขั้นตอน เครื่องมือที่ใช้ใน การวิจัยครั้งนี้ ได้แก่ 1) แบบสอบวิชาฟิสิกส์รูปแบบผสม เรื่องงานและพลังงาน ระดับชั้นมัธยมศึกษาปีที่ 4 จำนวน 2 ฉบับ ซึ่งเป็นแบบสอบคู่ขนาน ได้แก่ แบบสอบฉบับใหม่ ประกอบด้วยข้อสอบแบบหลายตัวเลือกจำนวน 16 ข้อ และข้อสอบแบบสร้างคำตอบจำนวน 8 ข้อ ที่มีค่าความเที่ยงเป็น .634 และ .824 ตามลำดับ และแบบสอบฉบับอ้างอิง ประกอบด้วยข้อสอบแบบหลายตัวเลือกจำนวน 16 ข้อ และข้อสอบแบบสร้างคำตอบจำนวน 8 ข้อ ที่มีค่าความเที่ยงเป็น .602 และ .872 ตามลำดับ ซึ่งแบบสอบทั้งสองฉบับมีข้อสอบร่วมจำนวน 12 ข้อ 2) เกณฑ์การให้คะแนนที่ใช้ในการตรวจข้อสอบแบบสร้างคำตอบในแบบสอบฉบับใหม่และฉบับอ้างอิง ที่มีความเที่ยงระหว่างผู้ประเมิน มีค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน (r) คือ .96 และ .97 อย่างมีนัยสำคัญทางสถิติที่ระดับ .05 ตามลำดับ 3) ผู้ตรวจให้คะแนน 2 คน ที่มีความสอดคล้องในการให้คะแนนระหว่าง ผู้ประเมินเป็นรายข้อสำหรับแบบสอบทั้ง 2 ฉบับ มีค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน (r) ในแต่ละข้ออยู่ระหว่าง .86 - .99 และ .84 – 1.00 อย่างมีนัยสำคัญทางสถิติที่ระดับ .05 ตามลำดับ โดยวิธีการตรวจทั้ง 3 วิธี คือ 1) วิธีตรวจข้อสอบร่วมแบบสร้างคำตอบ โดยไม่มีการตรวจให้คะแนนข้ามกลุ่ม 2) วิธีตรวจข้อสอบร่วมแบบสร้างคำตอบ โดยมีการตรวจให้คะแนนข้ามกลุ่มทั้งหมดของข้อสอบร่วม 3) วิธีตรวจข้อสอบร่วมแบบสร้างคำตอบ โดยมีการตรวจให้คะแนนข้ามกลุ่มครึ่งหนึ่งของข้อสอบร่วม การปรับเทียบคะแนนด้วยวิธีการปรับเทียบเชิงเส้นตรงทั้ง 2 วิธี และการวิเคราะห์ค่าสถิติบูทสแตรปจะใช้โปรแกรม R ส่วนการวิเคราะห์ค่ารากที่สองของค่าเฉลี่ยความแตกต่างยกกำลังสองใช้โปรแกรม Microsoft excel ผลการวิจัยพบว่า 1) วิธีตรวจข้อสอบร่วมแบบสร้างคำตอบ โดยมีการตรวจให้คะแนนข้ามกลุ่มครึ่งหนึ่งของข้อสอบร่วม เมื่อใช้วิธี CLE (Chained Linear Equating) มีค่ารากที่สองของค่าเฉลี่ยความคลาดเคลื่อนยกกำลังสอง (RMSE) ค่าความคลาดเคลื่อนในการปรับเทียบ (equating error) และ ค่าความลำเอียง (bias) ต่ำที่สุด คือ .802, .251 และ .840 ตามลำดับ 2) ในบริบทของการวิจัยนี้วิธี CLE (Chained Linear Equating) มีค่ารากที่สองของค่าเฉลี่ยความแตกต่างยกกำลังสอง (RMSD) จากวิธีการตรวจวิธีที่ 1, 2 และ 3 คือ 1.421, 1.481 และ 1.481 ตามลำดับ ซึ่งเป็นค่าที่ต่ำกว่าวิธีของเลอวิน (Levine method) จากวิธีการตรวจวิธีที่ 1, 2 และ 3 คือ 1.717, 1.804 และ 1.793 ตามลำดับen_US
dc.description.abstractalternativeThe purposes of this research were 1) to compare bootstrapped statistics of equating mixed-format test of nonequivalent groups with anchor test equating design among scoring methods 2) to compare root mean squared difference (RMSD) of equating mixed-format test of nonequivalent groups with anchor test equating design between Levine method and CLE (Chained linear equating) method. The sample were 1,607 students obtained by multi-stage random sampling from Matayomsuksa 4 student of Office of Bangkok Educational Service Area Zone I. They were used for data collecting with 1) two parallel mixed - format tests of the Physics, the work and energy for Matayomsuksa 4. There were new form and reference form. New form consisted 16 multiple-choice items and 8 construct-response items, their reliability values were .634 and .824. Reference form consisted 16 multiple-choice items and 8 construct-response items, with reliability value of .602 and .872. Those form had 8 multiple-choice items and 4 construct-response items in anchor test. 2) rubric scoring used for constructed-response items in Physics test, new and reference forms, had inter-rater reliability with Pearson’s product moment correlation were .96 and .97 at the .05 level of significance. 3) two raters, who had consistency between two raters of two tests with Pearson’s product moment correlation were .86 - .99 and .84 – 1.00 at the .05 level of significance. Three scoring methods were 1) constructed-response anchor items scoring methods with no trend scoring method 2) constructed-response anchor items scoring methods with full anchor test trend scoring method 3) constructed-response anchor items scoring methods with half anchor test trend scoring method. Equating score with linear equating method and analyzing bootstrapped statistics employed program R and analyzing Root Mean Squared Difference employed Microsoft excel. The results of the study revealed that 1) constructed-response anchor items scoring methods with half anchor test trend scoring method with CLE (Chained linear equating) method resulted in smallest Root Mean Squared Error (RMSE), Equating error and Bias were .802, .251 and .840. 2) For this study, CLE (Chained linear equating) method had Root Mean Squared Difference (RMSD) from scoring methods of 1, 2 and 3 method were 1.421, 1.481 and 1.481, which lower than those of equating with Levine method were 1.717, 1.804 and 1.793.en_US
dc.language.isothen_US
dc.publisherจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.relation.urihttp://doi.org/10.14457/CU.the.2013.603-
dc.rightsจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.subjectสถิติ -- การประมวลผลข้อมูล
dc.subjectการประเมินผลทางการศึกษา
dc.subjectStatistics -- Data processing
dc.subjectEducational evaluation
dc.titleการเปรียบเทียบสถิติบูทสแตรปของการออกแบบการปรับเทียบสำหรับแบบสอบรูปแบบผสมระหว่างวิธีการที่ต่างกันen_US
dc.title.alternativeA COMPARISION OF BOOTSTRAPPED STATISTICS IN EQUATING DESIGNS FOR MIXED FORMAT TEST AMONG DIFFERENT METHODSen_US
dc.typeThesisen_US
dc.degree.nameครุศาสตรมหาบัณฑิตen_US
dc.degree.levelปริญญาโทen_US
dc.degree.disciplineการวัดและประเมินผลการศึกษาen_US
dc.degree.grantorจุฬาลงกรณ์มหาวิทยาลัยen_US
dc.email.advisorNuttaporn.l@chula.ac.then_US
dc.identifier.DOI10.14457/CU.the.2013.603-
Appears in Collections:Edu - Theses

Files in This Item:
File Description SizeFormat 
5583327827.pdf12.43 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.