ระบบการวิเคราะห์และการประเมินคุณภาพแบบทดสอบออนไลน์

บทคัดย่อ

ในปัจจุบันได้มีการประยุกต์ใช้เทคโนโลยีคอมพิวเตอร์มาช่วยในการจัดทำธนาคารข้อทดสอบ และแบบทดสอบออนไลน์มากขึ้น ซึ่งช่วยให้สามารถเก็บข้อทดสอบได้เป็นจำนวนมาก และมีความสะดวกรวดเร็วในการสร้างแบบทดสอบชุดใหม่ตามที่ต้องการ อย่างไรก็ตามควรมีการวิเคราะห์และประเมินคุณภาพของแบบทดสอบเพื่อเป็นการตรวจสอบคุณภาพ และความถูกต้องของข้อสอบ อีกทั้งยังช่วยให้ทราบถึงภาพรวมของความสามารถของผู้เรียน และสามารถนำไปเป็นแนวทางในการพัฒนาการเรียนการสอนให้มีประสิทธิมากยิ่งขึ้นได้

งานวิจัยนี้จึงนำเสนอระบบการวิเคราะห์และประเมินคุณภาพของแบบทดสอบออนไลน์ โดยเป็นการวิเคราะห์แบบประเมินทักษะด้านเทคโนโลยีสารสนเทศ เพื่อตรวจสอบคุณภาพและความน่าเชื่อถือของแบบทดสอบ โดยดำเนินการวิจัยด้วยการพัฒนาโปรแกรมด้วยภาษา พีเอชพี (PHP) และใช้โปรแกรมจัดการฐานข้อมูลเอสคิวแอลเซิร์ฟเวอร์ (SQL Server) ในการจัดเก็บข้อมูลการทำแบบทดสอบออนไลน์ของนักศึกษา และนำข้อมูลที่ได้มาวิเคราะห์เพื่อประเมินคุณภาพของแบบทดสอบใน 3 ประเด็น คือ ความเชื่อมั่น (Reliability) ความยากง่าย (Difficulty) และอำนาจจำแนก (Discrimination) และพัฒนาระบบเพื่อนำเสนอผลประเมินในรูปแบบตารางและกราฟที่อาจารย์สามารถสืบค้นข้อมูลได้ตามต้องการ และอาจารย์สามารถปรับเกณฑ์ในการสุ่มเลือกข้อสอบใหม่ได้ตามระดับความยากง่ายเพื่อความยุติธรรมของแบบทดสอบแต่ละชุด

จากผลการวิจัยพบว่าแบบทดสอบออนไลน์สำหรับประเมินทักษะด้านเทคโนโลยีสารสนเทศเป็นแบบทดสอบมีค่าความเชื่อมั่นที่เหมาะสม (0.96) หรือมีความคงที่ของผลการวัด และโดยเฉลี่ยข้อสอบมีค่าอำนาจจำแนกอยู่ในระดับดีมาก (0.87) หรือสามารถจำแนกผู้เรียนออกเป็นกลุ่มต่างๆได้อย่างดี และเมื่อพิจารณาคุณสมบัติด้านความยากง่ายพบว่าโดยเฉลี่ยข้อสอบถูกจำแนกอยู่ในระดับค่อนข้างยาก (0.34) เนื่องจากข้อสอบมีความหลากหลายของคำถาม ทั้งที่เป็นคำศัพท์พื้นฐานและคำศัพท์เทคนิค อีกทั้งยังมีข้อสอบแบบปฏิบัติซึ่งต้องมีการปฏิบัติหลายขั้นตอนเพื่อให้ได้ผลลัพธ์ตามที่โจทย์กำหนด ทั้งนี้ระดับความยากของข้อสอบอาจเกิดจากคุณสมบัติของข้อสอบเอง รวมถึงความพร้อมในการสอบและความแตกต่างของผู้เข้ารับการทดสอบด้วย

นอกจากนี้ในงานวิจัยชิ้นนี้ยังได้เสนอแนะการปรับปรุงคุณภาพของแบบทดสอบโดยการวิเคราะห์ค่าความยากง่ายเฉลี่ยของแบบทดสอบแต่ละชุดที่ผู้เข้ารับการทดสอบได้รับซึ่งเป็นข้อสอบที่เกิดจากการสุ่มเลือก ซึ่งพบว่าแบบทดสอบบางชุดมีระดับความยากง่ายอยู่ในระดับค่อนข้างยากในขณะที่แบบทดสอบบางชุดอยู่ในระดับปานกลางเท่านั้นซึ่งไม่ยุติธรรมสำหรับผู้เข้ารับการทดสอบ ผู้วิจัยจึงนำเสนอวิธีการปรับการสุ่มเลือกข้อสอบตามอัตราส่วนระดับความยากง่าย และผลการวิเคราะห์ด้วยค่าสถิติ t-test พบว่าการสุ่มเลือกแบบใหม่มีค่าความแตกต่างของระดับความยากง่ายลดลงกว่าการสุ่มแบบเดิมอย่างมีนัยสำคัญทางสถิติที่ระดับ 0.05 และทำให้เชื่อมั่นได้ว่าแบบทดสอบที่ได้จากการสุ่มเลือกแบบใหม่เป็นแบบทดสอบที่มีค่าความยากง่ายเฉลี่ยอยู่ในระดับเดียวกัน

Abstract

The information technology has been implemented for examination test bank including online assessment system. This can lead to collection of large amount of test suite. It also facilitates to create the assessment sets when the test was requested. However, the analysis and the evaluation for test quality are needed for quality control and correctness of the test. In additions, the quality can determine learner’s abilities and can be applied as a guideline for improving the efficiency of the teaching development.

This research proposes the analysis and the evaluation system for quality of the online examination. The examination was focused on the assessment of information technology subjects in order to measure the quality and reliability of the test suite. The research methodology is a development of online assessment application based on PHP using SQL Server as a database management system. The data was collected from student’s examination and was used to analyze for quality evaluation of the examination sets in 3 aspects which are reliability, difficulty and discrimination. After that, the system showed the result in graphical and tabular forms. The instructor can change the random criteria according to the test difficulties for improving more appropriate new test suite.

The research results show that the online information technology examination has a suitable reliability (0.96) or it has a stable measurement. On the average, the test has a good discrimination (0.87) or it can classify the learner into appropriate different groups. When considering the difficulty property, on the average, the test is classified to quite difficult level (0.34) because there are many various questions including foundation terms and technical terms. Moreover, it contains practical examinations which have many steps to satisfy the questions. However, the difficulty level of the test may be due to the properties of the test itself and also the preparedness and the differences of the examinees.

In addition, this research also proposes the methodology to improve the test quality. By analyzing the average difficulty of each random test set, we found that some test sets are in the quite difficult level while some test sets are in the medium difficult level. There is an inequality for examinees. Therefore, this research proposed the methodology for adjusting of random criteria selection regarding to the difficulty of test level. The results using t-test were presented that the difference of the difficulty level would be decreased with significant level at 0.05. It can conclude that each test suite from the proposed method has the similar level of difficulty simultaneously.