Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/50094
Title: การเปรียบเทียบคุณสมบัติทางจิตมิติของแบบสอบที่บูรณาการระหว่างตัวชี้วัดความสามารถในการอ่าน คิดวิเคราะห์ และเขียน กับตัวชี้วัดสาระการเรียนรู้วิทยาศาสตร์ชั้นมัธยมศึกษาปีที่ 3 ที่มีวิธีการทบทวนข้อสอบที่แตกต่างกัน
Other Titles: Comparison of psychometric properties integrating indicators of reading analytical thinking and writing abilities and indicators of content science of nine grade using the different item review methods
Authors: พิมพิศา สว่างศรี
Advisors: โชติกา ภาษีผล
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะครุศาสตร์
Advisor's Email: Aimorn.J@chula.ac.th,aimornj@hotmail.com
Subjects: การวัดทางจิตวิทยา
ทฤษฎีการตอบสนองข้อสอบ
การวัดผลทางการศึกษา
Psychometrics
Item response theory
Educational tests and measurements
Issue Date: 2558
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: งานวิจัยนี้มีวัตถุประสงค์เพื่อเปรียบเทียบคุณสมบัติทางจิตมิติของแบบสอบที่บูรณาการระหว่างตัวชี้วัดความสามารถในการอ่าน คิดวิเคราะห์ และเขียน กับตัวชี้วัดสาระการเรียนรู้วิทยาศาสตร์ชั้นมัธยมศึกษาปีที่3 ทีมีวิธีการทบทวนข้อสอบที่แตกต่างกัน ตัวอย่างที่ใช้ในการวิจัยครั้งนี้เป็นนักเรียนชั้นมัธยมศึกษาปีที่ 3 จำนวน 750 คน เครื่องมือที่ใช้ในการวิจัย คือ แบบสอบบูรณาการระหว่างตัวชี้วัดความสามารถในการอ่าน คิดวิเคราะห์ และเขียน กับตัวชี้วัดสาระการเรียนรู้วิทยาศาสตร์ชั้นมัธยมศึกษาปีที่ 3 แบ่งเป็นข้อสอบชุด A (ทบทวนข้อสอบด้วยตนเอง) และข้อสอบชุด B (ทบทวนข้อสอบร่วมกับกลุ่มคณะกรรมการ) เก็บข้อมูลโดยนำแบบสอบไปวัดกับนักเรียนในโรงเรียนขนาดเล็ก ขนาดกลาง และขนาดใหญ่ วิเคราะห์ข้อมูลโดยการตรวจสอบคุณสมบัติทางจิตมิติของแบบสอบ คือ ความตรงเชิงเนื้อหา ความเที่ยง ฟังก์ชันสารสนเทศของข้อสอบ ฟังก์ชันสารสนเทศของแบบสอบ ความยาก และอำนาจจำแนก ผลการวิจัยสรุปได้ดังนี้ 1) ผลการวิเคราะห์ความตรงเชิงเนื้อหาของข้อคำถามที่สร้างและผ่านการทบทวนทั้งหมด โดยใช้เกณฑ์การตรวจสอบที่กำหนด พบว่า แบบสอบทั้งหมดมีความสอดคล้องกับเกณฑ์การประเมินในระดับมาก แสดงว่าข้อคำถามทั้งหมดมีความตรงเชิงเนื้อหา 2) ผลการวิเคราะห์ความเที่ยงโดยใช้วิธีสัมประสิทธิ์แอลฟ่าครอนบาค พบว่า โรงเรียนขนาดเล็ก มีค่าความเที่ยงของแบบสอบชุด A และแบบสอบชุด B อยู่ในระดับต่ำ ทั้ง 2 ชุด เมื่อทดสอบความแตกต่างของค่าสัมประสิทธิ์แอลฟ่าเป็นรายคู่ พบว่า ค่าสัมประสิทธิ์แอลฟ่าของแบบสอบทั้ง 2 ชุด ไม่แตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ .05 โรงเรียนขนาดกลาง มีค่าความเที่ยงของแบบสอบชุด A และแบบสอบชุด B อยู่ในระดับสูง ทั้ง 2 ชุด เมื่อทดสอบความแตกต่างของค่าสัมประสิทธิ์แอลฟ่าเป็นรายคู่ พบว่า ค่าสัมประสิทธิ์แอลฟ่าของแบบสอบทั้ง 2 ชุด ไม่แตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ .05 และโรงเรียนขนาดใหญ่ มีค่าความเที่ยงของแบบสอบชุด A และแบบสอบชุด B อยู่ในระดับต่ำ ทั้ง 2 ชุด เมื่อทดสอบความแตกต่างของค่าสัมประสิทธิ์แอลฟ่าเป็นรายคู่ พบว่า ค่าสัมประสิทธิ์แอลฟ่าของแบบสอบทั้ง 2 ชุด ไม่แตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ .05 3) ผลการวิเคราะห์ค่าฟังก์ชันสารสนเทศของข้อสอบโดยเฉลี่ย ของแบบสอบชุด A และแบบสอบชุด B พบว่า แบบสอบทั้ง 2 ชุด ในโรงเรียนขนาดเล็ก โรงเรียนขนาดกลาง และในโรงเรียนขนาดใหญ่ มีค่าฟังก์ชันสารสนเทศของข้อสอบโดยเฉลี่ยไม่แตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ .05 ทั้งหมด และการวิเคราะห์ค่าฟังก์ชันสารสนเทศของแบบสอบโดยเฉลี่ย ของแบบสอบชุด A และแบบสอบชุด B พบว่า ในโรงเรียนขนาดเล็ก ค่าฟังก์ชันสารสนเทศโดยเฉลี่ยของแบบสอบทั้ง 2 ชุด แตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ .05 โรงเรียนขนาดกลาง ค่าฟังก์ชันสารสนเทศโดยเฉลี่ยของแบบสอบทั้ง 2 ชุด แตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ .05 และในโรงเรียนขนาดใหญ่ ค่าฟังก์ชันสารสนเทศโดยเฉลี่ยของแบบสอบทั้ง 2 ชุด ไม่แตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ .05 4) การวิเคราะห์ข้อสอบตามทฤษฏีการทดสอบแบบดั้งเดิม และทฤษฎีการทดสอบแนวใหม่ พบว่า คะแนนสอบของนักเรียนที่สอบแบบสอบชุด A และแบบสอบชุด B โดยแบ่งตามขนาดโรงเรียนเล็ก ขนาดกลาง และขนาดใหญ่ แบบสอบทั้ง 2 ชุด มีค่าความยากและค่าอำนาจจำแนก ไม่แตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ .05
Other Abstract: The purposes of this research was to compare psychometric properties integrating indicators of reading, analytical thinking and wiring abilities and indicators of content science of ninth grade using different item review methods. Participants of this research comprised of 750 ninth grade students. Data were collected using the test integrating indicators of reading, analytical thinking and writing abilities and indictors of content science of ninth grade. The items were classified into Item Form A for self-review of item and Item Form B for expert group review of item. In addition, data was collected using test for measurement of students in small-sized, medium-sized and large-sized schools. Content validity, reliability, item information, test information, difficulty and discrimination were employed to analyze the data. Research findings were as follows: 1) The result of content validity analysis on constructed questions and entirely passed review using determined check criteria described that all tests were congruent with assessment criteria in high level, indicating that all questions had content validity. 2) The result of reliability analysis using Cronbach’s alpha coefficient for internal consistency revealed that in a small-sized school, the reliability of both Test Form A and Test Form B were in a low level. The Cronbach’s alpha coefficient values of the Test Form A and Test Form B were not statistically significant different at .05. For a medium-sized school, the reliability of both Test Form A and Test Form B were in a high level. The Cronbach’s alpha coefficient values of the Test Form A and Test Form B were not statistically significant different at .05. As for a large-sized school, the reliability of both Test Form A and Test Form B were in a low level. The Cronbach’s alpha coefficient values of the Test Form A and Test Form B were not statistically significant different at .05. 3) The result of average item information function analysis for Test Form A and Test Form B indicated that average item information function values for both forms of tests in a small-sized school, a medium-sized school, and a large-sized school, entirely had no statistically significance at the level of .05. Moreover, the result of the average test information function value analysis for Test Form A and Test Form B indicated that the average test information function values for both forms of tests in a small-sized school and a medium-sized school were statistically significance level of .05, whereas the average test information function values for both forms of tests in a large-sized school were not statistically significant different at the level of .05. 4) The result of the tests analysis according to a classical test theory and an item response theory indicated that students’ scores who took the Test Form A and the Test Form B in the three different school sizes (i.e., small-sized, medium-sized, and large-sized schools) were not statistically significant different at the level of .05 in terms of difficulty and discrimination.
Description: วิทยานิพนธ์ (ค.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2558
Degree Name: ครุศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: การวัดและประเมินผลการศึกษา
URI: http://cuir.car.chula.ac.th/handle/123456789/50094
URI: http://doi.org/10.14457/CU.the.2015.1137
metadata.dc.identifier.DOI: 10.14457/CU.the.2015.1137
Type: Thesis
Appears in Collections:Edu - Theses

Files in This Item:
File Description SizeFormat 
5683366327.pdf5.14 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.