Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/18664
Title: การเปรียบเทียบผลจากการใช้รูปแบบการเทียบมาตรา ที่ต่างกันเมื่อแบบสอบร่วมมีความยาวต่างกัน
Other Titles: A comparision of results from the application of different equating models at different length of anchor tests
Authors: ภาวิณี ศรีสุขวัฒนานันท์
Advisors: สวัสดิ์ ประทุมราช
เยาวดี วิบูลย์ศรี
ชูศักดิ์ ธัมภลิขิต
Other author: จุฬาลงกรณ์มหาวิทยาลัย. บัณฑิตวิทยาลัย
Advisor's Email: ไม่มีข้อมูล
ไม่มีข้อมูล
ไม่มีข้อมูล
Subjects: ข้อสอบ
กาารวัดผลทางการศึกษา
Issue Date: 2529
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: การวิจัยครั้งนี้มีวัตถุประสงค์หลักเพื่อศึกษาเปรียบเทียบผลของการใช้รูปแบบการเทียบมาตราที่ต่างกันสามรูปแบบ คือ 1) รูปแบบอีควิเปอร์เซนไตล์ 2) รูปแบบเชิงเส้นตรง และ 3) รูปแบบอิงทฤษฎีการตอบข้อสอบแบบโลจจิสติคสามพารามิเตอร์ ด้วยการออกแบบเทียบมาตราโดยมีแบบสอบร่วมชนิดภายในที่มีความยาวต่างกันสามขนาด ซึ่งคิดเป็นร้อยละของแบบสอบเทียบมาตรา (35 ข้อ) คือ มีขนาดร้อยละ 60 (21 ข้อ) ขนาดร้อยละ 40 (14 ข้อ) และขนาดร้อยละ 20 (7 ข้อ) การประเมินผลการเทียบมาตรากระทำโดยการวิเคราะห์ความคลาดเคลื่อนมาตรฐานของการเทียบมาตรา ซึ่งเป็นเกณฑ์ภายในเพื่อเปรียบเทียบความแม่นยำระหว่างวิธีเทียบภายในรูปแบบเดียวกัน และการวิเคราะห์กลุ่มสอบทานผล ซึ่งเป็นเกณฑ์ภายนอกเพื่อเปรียบเทียบความเพียงพอ ระหว่างวิธีเทียบมาตราโดยตรงกับผลสุดท้ายของการเทียบมาตรา ประชากรที่ใช้ในการศึกษาครั้งนี้มีสองกรณี คือ กรณีแบบสอบคัดเลือก และกรณีแบบสอบวัดผลสัมฤทธิ์ สำหรับกรณีแรกประชากรผู้สอบ คือ ผู้เข้าสอบแข่งขันเพื่อบรรจุเข้าทำงาน จำนวน 15,875 คน ส่วนกรณีหลังประชากร คือ ผู้ลงทะเบียนวิชาที่เลือกมาใช้ในการวิจัยระดับปริญญาตรีจำนวน 12,383 คน ในแต่ละกรณีใช้กลุ่มตัวอย่างกลุ่มละ 1500 คน จำนวน 2 กลุ่ม สำหรับแบบสอบที่ใช้ในการเทียบมาตราแบ่ง เป็นชุด X และชุด Y ซึ่งมีจำนวนชุดละ 35 ข้อ และแบบสอบร่วม V ซึ่งมีสามขนาด ได้แก่ 21 ข้อ 14 ข้อ และ 7 ข้อนั้น ทำหน้าที่วัดความรู้หรือความสามารถเชิงจิตวิทยาที่ใกล้เคียงกัน ข้อสอบเหล่านี้สุ่มเลือกจากแบบสอบชนิดเลือกตอบเดิม 100 ข้อ ของสถานการณ์การสอบจริงทั้งสองกรณี แบบสอบร่วมขนาดร้อยละ 20 เป็นซับเซทของขนาดร้อยละ 40 และต่างก็เป็นซับเซทของขนาดร้อยละ 60 ภายหลังการผนวกแบบสอบร่วมเข้ากับแบบสอบเทียบมาตราแล้วได้แบบสอบที่ใช้ในการวิจัยรวม 3 คู่ คือ XV60-YV60 XV40-YV40 และ XV20-YV20 ความเที่ยงของแบบสอบแต่ละคู่ใกล้เคียงกัน (คู่ที่มีความเที่ยงต่างกันมากที่สุดต่างกันอยู่ .05) ส่วนการออกแบบการวิจัยนั้นได้ออกแบบให้กลุ่มแรก ∝ ทำแบบสอบชุด X กับแบบสอบร่วม (V) กลุ่มหลัง β ทำแบบสอบชุด Y กับแบบสอบร่วม (V) ในแต่ละกรณีใช้รูปแบบการเทียบมาตรา 3 รูปแบบ สร้างตารางแปลงคะแนนสมมูลจากคะแนนชุด Y ไปยังชุด X แล้ววิเคราะห์ความคลาดเคลื่อนมาตรฐานของการเทียบมาตรา คำนวณค่าดัชนีประสิทธิภาพสัมพัทธ์ (RE) การวิเคราะห์กลุ่มสอบทานผลนั้น กระทำโดยคำนวณค่าดัชนีเปรียบเทียบความแตกต่าง (C) ซึ่งเป็นความคลาดเคลื่อนรวมและทดสอบความแตกต่างของค่าอันดับของดัชนีด้วยการทดสอบรายคู่ ผลการวิจัยสรุปได้ดังนี้ 1. การเทียบมาตราแบบสอบชุดที่คล้ายกันโดยมีกลุ่มผู้สอบสองกลุ่มที่สุ่มจากประชากรเดียวกันทั้งกรณีแบบสอบคัดเลือก และแบบสอบวัดผลสัมฤทธิ์ ให้ผลการเทียบมาตราที่อยู่ในระดับที่ยอมรับได้ทั้ง 9 วิธี ทั้งที่เกิดจากการใช้รูปแบบการเทียบมาตราที่ต่างกัน และใช้แบบสอบร่วมที่มีความยาวต่างกัน 2. ความยาวของแบบสอบร่วมเป็นปัจจัยหนึ่งที่มีผลกระทบโดยตรงต่อความแม่นยำ และความเพียงพอของวิธีเทียบมาตรา เมื่อความยาวแบบสอบร่วมเพิ่มขึ้นความคลาดเคลื่อนมาตรฐานของการเทียบมาตราลดลง และความคลาดเคลื่อนรวมจากการวิเคราะห์กลุ่มสอบทานผลก็ลดลงด้วย แต่เมื่อแบบสอบเทียบมาตราทั้งคู่มีค่าความเที่ยงสูงใกล้เคียงกันอยู่แล้ว ผลกระทบที่เกิดจากการเพิ่มความยาวของแบบสอบร่วมเห็นได้ไม่ชัดเจน 3. ในสถานการณ์ของการสอบคัดเลือก และการสอบเพื่อวัดผลสัมฤทธิ์ทางการเรียนนั้น การเทียบมาตราด้วยรูปแบบเดียวกัน ให้ผลที่แตกต่างกันเมื่อประเมินด้วยความคลาดเคลื่อนรวม กล่าวคือ ในกรณีแบบสอบคัดเลือก รูปแบบที่ให้ผลดีตามลำดับ คือ อีควิเปอร์เซนไตล์ รูปแบบอิงทฤษฎีการตอบข้อสอบ และรูปแบบเชิงเส้นตรง ส่วนในกรณีแบบสอบวัดผลสัมฤทธิ์ รูปแบบที่ให้ผลดีตามลำดับ คือ รูปแบบเชิงเส้นตรง รูปแบบอีควิเปอร์เซนไตล์ และรูปแบบอิงทฤษฎีการตอบข้อสอบ
Other Abstract: The main purpose of this study was to compare the results from an application of three equating models, viz. Equi-percentile model, Linear model and the IRT three-parameter Logistic model, when three different lengths of internal anchor test, viz. Its 60% (a 21-item test), its 40% (a 14-item test) and its 20% (a 7-items test) of the equated test of 35 items were utilized. The results were evaluated basing on an internal criterion and an external one. The internal criterion was to use standard errors of equating to compare their precisions among equating methods within the same models while the external criterion was to use a cross-validation technique to compare their equating adequacies. In this study, two cases of testing situations, a selective test and an achievement test, were investigated. For case I, two groups of 1,500 examines each from 15,875 examines taking a selective test were randomized and used as the samples whereas two more groups of 1,500 examines each from 12,383 examines taking an achievement test were used for case II. Both tests were administered in actual situations. In each case, three main tests, a 35-item test (Form X), a 35-item test (Form Y) and three anchor tests of a 21-item, 14-item and 7-item test (Form V) were drawn from a 100 item multiple-choice test. These tests were assumed to measure the same knowledge and psychological ability. The anchor test was then constructed into three forms: a 20%-anchor test (V20), a 40%-anchor test (V40) and a 60%-anchor test (V60). Items of the first two tests were subsets of the third test, while the first test was subset of the second. In each case, when the anchor tests were added, the reliability coefficients of three pairs of the equating tests viz. XV60-YV60, XV40-YV40 and XV20-YV20, were slightly different. The first group of examinees (∝) was assigned to take Form X and Form V, while the second group (β) to take Form Y and Form V. Finally, tables of equivalent scores were then constructed for the three models in two cases. The findings can be summarized as follows: 1. When the tests were similar and examines were from the same population, the outcomes of all the score equating techniques were acceptable in both cases. 2. The anchor tests had direct effects on the precision and adequacy of equating scores. As the length of an anchor test was increased, its standard error of equating and total error decreased. However, such a phenomenon was not vivid when any pair of tests with approximately high reliability coefficients were used. 3. In both cases, the same equating models yielded different results. Basing on their total errors, it was found that, for the selective test, Equi-percentile model, three-parameter Logistic model and Linear model were respectively ranked as first, second and third good techniques. However, for the achievement test, the ranks of Linear model, Equi-percentile model and three-parameter Logistic model were first, second and third, respectively.
Description: วิทยานิพนธ์ (ค.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2529
Degree Name: ครุศาสตรดุษฎีบัณฑิต
Degree Level: ปริญญาเอก
Degree Discipline: การวัดและประเมินผลการศึกษา
URI: http://cuir.car.chula.ac.th/handle/123456789/18664
ISBN: 9745665878
Type: Thesis
Appears in Collections:Grad - Theses

Files in This Item:
File Description SizeFormat 
Pawinee_Sr_front.pdf411.66 kBAdobe PDFView/Open
Pawinee_Sr_ch1.pdf514.94 kBAdobe PDFView/Open
Pawinee_Sr_ch2.pdf1.53 MBAdobe PDFView/Open
Pawinee_Sr_ch3.pdf573.44 kBAdobe PDFView/Open
Pawinee_Sr_ch4.pdf1.42 MBAdobe PDFView/Open
Pawinee_Sr_ch5.pdf538.61 kBAdobe PDFView/Open
Pawinee_Sr_back.pdf837.38 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.