Abstract:
การวิจัยครั้งนี้ มีวัตถุประสงค์เพื่อเปรียบเทียบคุณสมบัติทางจิตมิติของแบบสอบถูกผิดหลายตัวเลือกที่มีวิธีการให้คะแนนความรู้บางส่วน 4 วิธี ประกอบด้วย วิธีการนับ 2 (Count-2) วิธีการให้คะแนนบางส่วน 50 (PS50) วิธีการเพิ่มคะแนนตัวเลือกที่เว้นไว้ (LO) และวิธีประยุกต์การเพิ่มคะแนนตัวเลือกที่เว้นไว้ (MLO) ตัวอย่างวิจัย ได้แก่ นักเรียนชั้นมัธยมศึกษาปีที่ 6 แผนการเรียนคณิตศาสตร์ -วิทยาศาสตร์ จำนวน 1,178 คน เครื่องมือวิจัย ได้แก่ แบบสอบถูกผิดหลายตัวเลือก เรื่องเคมีอินทรีย์ จำนวน 20 ข้อ การวิเคราะห์ข้อมูลประกอบด้วยการวิเคราะห์สถิติพื้นฐานของคะแนนสอบ ด้วยโปรแกรม Microsoft Excel และ SPSS การวิเคราะห์คุณสมบัติทางจิตมิติ ได้แก่ ความยาก (b) อำนาจจำแนก (a) ฟังก์ชันสารสนเทศของข้อสอบ (IIF) ฟังก์ชันสารสนเทศของแบบสอบ (TIF) สัมประสิทธิ์ความเที่ยง โดยวิเคราะห์ตามทฤษฎีการตอบสนองข้อสอบ โมเดล G-PCM ด้วยโปรแกรม R วิเคราะห์เปรียบเทียบคุณสมบัติทางจิตมิติ สัมประสิทธิ์ความเที่ยงแอลฟาของครอนบาค และความสัมพันธ์ระหว่างคะแนนสอบที่ได้จากการตรวจให้คะแนนทั้ง 4 วิธีกับเกรดวิชาเคมี การเรียนพิเศษวิชาเคมี และความรู้สึกต่อวิชาเคมี ด้วยโปรแกรม SPSS
ผลการวิจัยสรุปได้ ดังนี้
1. ผลการวิเคราะห์สถิติพื้นฐานของคะแนน พบว่า เมื่อตรวจให้คะแนนด้วยวิธี MLO คะแนนจะมีค่าเฉลี่ยสูงสุด (12.05) และเมื่อวิเคราะห์ความสัมพันธ์ระหว่างคะแนนเมื่อตรวจให้คะแนนทั้ง 4 วิธี พบว่า คะแนนที่ได้เมื่อตรวจให้คะแนนแต่ละวิธีมีความสัมพันธ์กันอย่างมีนัยสำคัญทางสถิติที่ระดับ .01 โดยมีความสัมพันธ์กันสูงถึงสูงมาก
2. ผลการวิเคราะห์และเปรียบเทียบความยากและอำนาจจำแนก พบว่า ข้อสอบมีความยากเฉลี่ยและอำนาจจำแนกเฉลี่ยสูงสุดเมื่อตรวจให้คะแนนด้วย PS50 (b = 0.39, a = 0.95) รองลงมาคือ วิธี Count-2 (b = 0.39, a = 0.64) วิธี MLO (b = -1.06 , a = 0.25) และ LO (b = -0.66, a = 0.27) ตามลำดับ เมื่อเปรียบเทียบความยากและอำนาจจำแนก พบว่า ทั้งความยากและอำนาจจำแนกของข้อสอบแตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ .01 ระหว่าง Count-2 และ LO, Count-2 และ MLO, PS50 และ LO, PS50 และ MLO
3. ผลการวิเคราะห์ฟังก์ชันสารสนเทศของข้อสอบ พบว่า วิธี Count-2 และ PS50 ข้อสอบส่วนใหญ่ให้สารสนเทศสูงสุดในช่วงระดับความสามารถปานกลาง ส่วนวิธี LO และ MLO ข้อสอบส่วนใหญ่ให้สารสนเทศสูงสุดในช่วงระดับความสามารถต่ำถึงปานกลาง ข้อสอบที่ให้สารสนเทศสูงสุดคือ ข้อที่ 5 และข้อสอบที่ให้สารสนเทศต่ำสุดคือ ข้อที่ 20 เช่นเดียวกันทั้ง 4 วิธี ข้อสอบส่วนใหญ่ให้สารสนเทศสูงสุดเมื่อตรวจให้คะแนนด้วยวิธี Count-2 เมื่อเปรียบเทียบสารสนเทศข้อสอบ พบว่า ที่ระดับความสามารถต่ำมีข้อสอบ 8 ข้อ ที่ระดับความสามารถปานกลางมีข้อสอบ 14 ข้อ และที่ระดับความสามารถสูงมีข้อสอบ 7 ข้อ ที่มีวิธีการตรวจให้คะแนนอย่างน้อย 1 คู่ที่มีค่าฟังก์ชันสารสนเทศแตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ .01
4. ผลการวิเคราะห์และเปรียบเทียบความเที่ยง พบว่า ทั้งสัมประสิทธิ์ความเที่ยงแอลฟาของครอนบาคและสัมประสิทธิ์ความเที่ยง IRT ของแบบสอบเมื่อตรวจให้คะแนนทั้ง 4 วิธี มีค่าสูงกว่า .70 โดยวิธี Count-2 มีสัมประสิทธิ์ความเที่ยงสูงที่สุด และค่าสัมประสิทธิ์แอลฟาของครอนบาคของแต่ละวิธีไม่แตกต่างกันที่ระดับนัยสำคัญทางสถิติ .01
5. ผลการวิเคราะห์และเปรียบเทียบฟังก์ชันสารสนเทศของแบบสอบ พบว่า ที่ระดับความสามารถต่ำ (θ < -1) TIF มีค่าสูงสุดเมื่อตรวจให้คะแนนด้วยวิธี MLO ที่ระดับความสามารถปานกลาง (-1 ≤ θ ≤ 1) TIF มีค่าสูงสุดเมื่อตรวจให้คะแนนด้วยวิธี Count-2 และที่ระดับความสามารถสูง (θ > 1) TIF มีค่าสูงสุดเมื่อตรวจให้คะแนนด้วยวิธี PS50 แต่เมื่อเปรียบเทียบ TIF เมื่อตรวจให้คะแนนทั้ง 4 วิธีพบว่า ไม่แตกต่างกันทุกระดับความสามารถ และไม่พบปฏิสัมพันธ์ระหว่างวิธีการตรวจให้คะแนนและระดับความสามารถของผู้สอบ ที่ระดับนัยสำคัญทางสถิติ .01