Thứ Hai, 9 tháng 11, 2015

TRỪ ĐIỂM ĐOÁN MÒ TRONG TRẮC NGHIỆM THÀNH QUẢ HỌC TẬP

NÊN HAY KHÔNG NÊN ÁP DỤNG CÔNG THỨC TRỪ ĐIỂM ĐOÁN MÒ TRONG TRẮC NGHIỆM THÀNH QUẢ HỌC TẬP

Tóm tắt
Khoa học đo lường trong tâm lý -giáo dục đã tồn tại, phát triển như là tất yếu của sự phát triển giáo dục và ngày càng đầy đủ hơn các cơ sở khoa học, các công cụ đo lường để đảm bảo sự chính xác trong việc đo lường đánh giá giáo dục, trong đó có đo lường đánh giá thành quả học tập. Bài viết này đề cập đến một số vấn đề về việc trừ điểm đoán mò trong đo lường và đánh giá thành quả học tập của người học. Trong kiểm tra đánh giá thành quả học tập ở bất cứ cấp học/bậc học/môn học,v.v.. trong bất kỳ lĩnh vực giáo dục nào cũng đòi hỏi người thầy phải có một trình độ nhất định trong việc tính toán thống kê để có thể sử dụng hiệu quả các dạng trắc nghiệm khác nhau. Ngoài việc cần nắm các chỉ số thống kê cơ bản có liên quan đến các dạng thức trắc nghiệm khác nhau, khi đề cập đến việc điều chỉnh đoán mò trong chấm thi TNKQ cũng cần hết sức thận trọng nhằm đảm bảo điểm số cuối cùng phản ánh khách quan, chính xác năng lực người học.
Từ khóa: đo lường đánh giá; thành quả học tập; trừ điểm đoán mò.

1.  Một số vấn đề về công thức trừ điểm đoán mò
Khoa học đo lường trong giáo dục có thể xem như bắt đầu cách đây khoảng một thế kỷ (Thorndike,1904)[2], trong đó bao gồm sự hình thành, phát triển của khoa học đo lường và đánh giá thành quả học tập. Trong lịch sử quá trình phát triển giáo dục, đã có nhiều công trình nghiên cứu về các dạng trắc nghiệm thành quả học tập, và có các quan điểm khác nhau về vấn đề đoán mò trong trắc nghiệm khách quan (TNKQ). Để thuận tiện hơn trong việc quyết định nên hay không nên sử dụng công thức điều chỉnh đoán mò trong chấm thi TNKQ, bài viết sẽ khái lượt một số quan điểm có liên quan và đi kèm với đó là các nhận định, đánh giá.
Theo Willam wiersma Stephen G.Jurs (1990)[6], bất cứ thí sinh nào khi tham gia các bài tets TNKQ nhiều lựa chọn đều có cơ hội đoán mò. Trong đó, đối với câu đúng/sai thì cơ hội đoán đúng là ½ (xác suất là 50/50), khả năng đoán đúng ở câu hỏi có 4 lựa chọn là ¼ (xác suất là 25/100), câu 5 lựa chọn là 1/5 (xác suất là 20/100). Với câu hỏi ghép đôi có 10 ý thì khả năng đoán đúng là 1/10.
Điều đặc biệt lưu ý ở đây, khi chúng ta khẳng định thí sinh đoán mò là dựa trên giả thiết rằng những thí sinh trả lời sai là hoàn toàn không có kiến thức. Nếu xét theo thang Bloom[1] trong phạm trù nhận thức thì thí sinh đó hoàn toàn không biết, không hiểu hoặc không có khả năng vận dụng/phân tích/tổng hợp hay đánh giá vấn đề được hỏi. Với giả thiết như vậy và các xác suất đoán đúng một câu trả lời trong các dạng thức câu hỏi TNKQ đã được đề cập ở trên, thì không khó để ước lượng được điểm số thí sinh kỳ vọng sẽ có được do đoán mò.  
Thí dụ, cơ hội đoán đúng trong 100 câu hỏi TNKQ có 4 lựa chọn là 100*1/4 (25%).  Biến dao động của điểm số do đoán mò là N*p*q, mà trong đó N là số câu hỏi trắc nghiệm, p là xác suất đoán đúng 1 câu hỏi, và q là xác suất trả lời sai. Lúc này ta có công thức tính điểm số đoán mò mong đợi tất cả các câu hỏi của một test là: N*p. Trong đó, N là số câu hỏi trắc nghiệm, p là xác suất đoán đúng một câu trắc nghiệm.
Tuy nhiên, cũng chính vì cách tính cơ hội đoán đúng hoàn toàn 25 câu trong 100 câu hỏi với 4 phương án chọn như trên là không hợp lý, dẫn đến tâm lý người sử dụng các dạng TNKQ khác nhau trong đo lường đánh giá thành quả học tập sẽ trừ điểm đoán mò của người học. Nhưng để có thể đoán đúng 25% trong tổng số 100 câu TNKQ với 4 lựa chọn là điều hầu như khó xảy ra, và chúng ta có thể lý giải điều này qua một số tính toán cụ thể sau:
Ở đây, có thể áp dụng công thức Bernoulli để tính xác suất đoán mò trong 100 câu trắc nghiệm với 4 phương án lựa chọn. Vì nếu giả định rằng thí sinh thực hiện n phép thử độc lập (n lần đoán mò, và kết quả của lần lựa chọn này hoàn toàn không ảnh hưởng đến kết quả của lần lựa chọn khác). Trong mỗi phép thử (mỗi lần đoán) chỉ xảy ra 1 trong 2 khả năng: chọn đúng đáp án với xác suất p = ¼ hoặc chọn sai đáp án với xác suất q = ¾ . Xác suất chọn đúng trong mỗi phép thử đều bằng p. Như vậy, dễ thấy rằng xác suất làm đúng mỗi câu hỏi trong một đề thi là một biến cố độc lập, lúc này xác suất làm đúng các câu hỏi (các biến cố độc lập) trong một đề thi là tích xác suất của các biến cố độc lập (các câu hỏi ấy), và cần áp dụng công thức Bernoulli để tính xác suất:
Công thức Bernoulli: 
Thí dụ: Một đề thi có 10 câu trắc nghiệm 4 lựa chọn, nếu thí sinh làm hoàn toàn là dựa vào đoán mò. Tính xác suất để thí sinh đó đoán mò đúng được: 8 câu, 9 câu và 10 câu là bao nhiêu? Xác suất đoán đúng ít nhất một câu là bao nhiêu? Kết quả là:
Với câu trắc nghiệm 04 lựa chọn, kí hiệu xác suất đoán đúng một câu là p = 1/4, xác suất đoán sai là q = 3/4, theo công thức Becnoulli ta có:
-  Xác suất đoán đúng 8 câu là:
-  Xác suất đoán đúng 9 câu là:
-  Xác suất đoán đúng 10 câu là:
-  Xác suất ít nhất đoán đúng một câu là:
P(ít nhất đoán đúng 1 câu) = 1 – P(10 câu hoàn toàn đoán sai)  =
Ưu điểm của công thức xác suất nhị thức Bernoulli là nó có thể tính nhanh chóng đơn giản xác suất của bất kì điểm số nào đã định hoặc lớn hơn điểm số đã định. Có thể thấy rằng, nếu thí sinh hoàn toàn dựa vào đoán, thì xác suất đoán đúng ít nhất 9 câu là:
Tức là trong 100 000 lần thì chỉ có 3 lần đoán đúng, điều này được hiểu là một việc gần như không thể xảy ra.
Nhưng chung quy lại, bởi vì về tính toán thì đoán mò đúng vẫn tồn tại với một xác suất dù rất nhỏ như đã được chỉ ra ở trên, nên trong khoa học đo lường đánh giá thành quả học tập người ta vẫn điều chỉnh điểm số nhằm loại trừ điểm đoán mò trong điểm bài làm của thí sinh (trong một số kỳ thi tốc độ)[3] với việc sử dụng công thức sau:[6]
Trong đó:     
+ Nd là số câu trả lời đúng
            + Ns là số câu trả lời sai
            + K là số phương án lựa chọn trong một câu hỏi
Vận dụng công thức vào các trường hợp cụ thể:  
-  Trường hợp 1:  
Thí sinh A trả lời 50 câu trắc nghiệm, mỗi câu có 5 lựa chọn. Nếu A chắc chắn trả lời đúng 30 câu hỏi (được 30 điểm), 20 câu hỏi còn lại A hoàn toàn đoán mò và đúng 10 câu (10 điểm) kết quả điểm bài làm của thí sinh A là 40 điểm, nếu áp dụng công thức điều chỉnh điểm đoán mò và có điểm bài làm của thí sinh A sau khi trừ điểm đoán mò như sau:
 điểm
-  Trường hợp 2: 
Thí sinh A trả lời 50 câu trắc nghiệm, mỗi câu có 5 lựa chọn. Nếu A chắc chắn trả lời đúng 10 câu hỏi (được 10 điểm), 40 câu hỏi còn lại A hoàn toàn đoán mò và tất cả điều sai, kết quả điểm bài làm của thí sinh A là10 điểm, nếu áp dụng công thức để điều chỉnh điểm đoán mò, có điểm bài làm của thí sinh A sau khi trừ điểm đoán mò như sau:
-  Trường hợp 3: 
Thí sinh A trả lời 50 câu trắc nghiệm, mỗi câu có 5 lựa chọn. Nếu A chắc chắn trả lời đúng 5 câu hỏi (được 5 điểm), 45 câu hỏi còn lại A hoàn toàn đoán mò và tất cả điều sai, kết quả điểm bài làm của thí sinh A là 5 điểm, nếu áp dụng công thức để điều chỉnh điểm đoán mò, có điểm bài làm của thí sinh A sau khi trừ điểm đoán mò là như sau:
-  Trường hợp 4: 
A trả lời 50 câu trắc nghiệm, mỗi câu có 2 lựa chọn. Nếu A đoán mò hoàn toàn 50 câu và đúng 25 câu hỏi (xác suất trả lời đúng với câu hỏi 2 lựa chọn là 50/50), nếu  áp dụng công thức để điều chỉnh điểm đoán mò, có điểm bài làm của thí sinh A sau khi trừ điểm đoán mò là như sau:
-  Trường hợp 5: 
A trả lời 50 câu trắc nghiệm, mỗi câu có 2 lựa chọn. Nếu A đoán mò hoàn toàn 50 câu và đúng 20 câu hỏi (xác suất trả lời đúng với câu hỏi 2 lựa chọn là 50/50), nếu áp dụng công thức để điều chỉnh điểm đoán mò, có điểm bài làm của thí sinh A sau khi trừ điểm đoán mò là như sau:
Theo Willam wiersma Stephen G.Jurs (1990), trước đó và cho đến thời điểm của ông thì nhiều tác giả đã khẳng định việc áp dụng công thức trừ điểm đoán mò là không cần thiết.
Chúng ta cũng cần lưu ý là theo tác giả Thorndike & Hagen [5], trong công thức trừ điểm đoán mò đã chỉ rõ ràng rằng những câu hỏi mà thí sinh không đưa ra phương án trả lời (bỏ trống) là hoàn toàn không được tính đến trong công thức. Nếu như vậy, không cẩn thận khi áp dụng công thức trừ điểm đoán mò sẽ dẫn đến đánh đồng giữa việc thí sinh trả lời sai do đoán mò với những thí sinh không trả lời.
Thí dụ qua trường hợp sau: Một bài test có 50 câu hỏi, thí sinh A trả lời đúng 40/50 câu và bỏ trống không trả lời 10 câu hỏi (vì thí sinh không biết và không đoán mò), thí sinh B trả lời đúng 40/50 câu và trả lời sai 10 câu hỏi ( thí sinh không biết nhưng vẫn đoán mò). Khi đó, nếu điều chỉnh điểm đoán mò mà không tính đến việc thí sinh làm sai do đoán mò hay thí sinh bỏ trống câu trả lời, dẫn đến việc trừ điểm đoán mò sẽ làm sai lệch điểm số thực của thí sinh, kết quả bài thi không đánh giá đúng năng lực người học.
2.  Nên hay không nên áp dụng công thức đoán mò
 Theo tác giả Dương Thiệu Tống (1995)[3], hầu như những ai mới sử dụng TNKQ cũng thường áp dụng việc trừ điểm để ngăn chặn đoán mò. Tác giả đã khẳng định “đây là một quan điểm sai lầm trong lĩnh vực trắc nghiệm, nhất là với những trắc nghiệm ở lớp học”. Vì trắc nghiệm trong đánh giá lớp học là loại trắc nghiệm khác hoàn toàn với trắc nghiệm tốc độ (speed test). Trong trắc nghiệm lớp học, thời gian trả lời một bài trắc nghiệm là đủ dài và khá thỏa mái để mọi thí sinh có thể đọc và trả lời các câu hỏi với kỳ vọng mình có thể đạt điểm số cao nhất (phân bố điểm ở đỉnh cao nhất). Với tính chất như vậy, những sự khác biệt về năng lực giữa các thí sinh sẽ được giảm thiểu.
Ngược lại, trong trắc nghiệm tốc độ, thí sinh phải đưa ra câu trả lời nhanh chóng trong một khoảng thời gian rất hạn chế, mà kể cả những thí sinh nhanh nhất cũng không thể trả lời hết các câu hỏi. Trong trường hợp này, nếu ta chỉ căn cứ vào những câu trả lời đúng để cho điểm thì khi đó chỉ có lợi cho các em làm nhanh mà đôi khi không cần đọc câu hỏi. Vì ở đây, có thể thí sinh trông chờ vào yếu tố may rủi để đạt được điểm số cao và khi đó việc trừ điểm đoán mò là hợp lý.
Tác giả Dương Thiệu Tống cũng khẳng định, công thức này chỉ nên áp dụng với loại trắc nghiệm tốc độ như đã đề cập ở trên. Việc trừ điểm đoán mò hoàn toàn  không có giá trị thực tiễn nào với các loại trắc nghiệm dùng trong lớp học hay các trắc nghiệm trong các kỳ thi, khi tất cả thí sinh đều có cơ hội đọc và trả lời mọi câu hỏi.
Theo tác giả Norman E Gronlund (1982)[4], trong các bài kiểm tra thành quả học tập mà giáo viên sử dụng để kiểm tra kiến thức, kỹ năng cũng như thái độ của người học là không nên điều chỉnh điểm đoán mò. Vì các vấn đề được kiểm tra trong bài kiểm tra luôn phải liên quan đến nội dung cần kiểm tra và có quan hệ chặt chẽ với thí sinh, cùng với thời gian là đủ để mọi thí sinh có thể xem xét cẩn thận tất cả các câu hỏi của một bài kiểm tra. Việc thí sinh lựa chọn một phương án trả lời (có thể sai) là luôn luôn dựa vào một hay nhiều khía cạnh của vấn đề được hỏi. Do vậy, tác giả Norman E Gronlund đã khẳng định “việc đoán mò không hoàn toàn bị phản đối theo quan điểm giáo dục”.
Nên hay không nên điều chỉnh điểm do đoán mò, nếu muốn áp dụng thì trước hết chúng ta cần quan tâm, xem xét đến một số điểm lợi và bất lợi của việc áp dụng công thức trừ điểm đoán mò như sau[3]:
-       Thứ nhất: Thứ hạng của thí sinh được xếp hạng theo điểm đã trừ điểm đoán mò là thay đổi không đáng kể so với thứ hạng điểm khi không trừ điểm đoán mò.
-       Thứ hai: Xác suất để có được điểm số cao hoàn toàn bằng lối đoán mò trên một bài trắc nghiệm là rất nhỏ nhoi.
-       Thứ ba: Nếu có đủ thời gian làm bài, thì hầu như mọi thí sinh đều cố gắng hết mức có thể để có thể đạt được điểm số cao nhất dựa vào năng lực của bản thân. Nếu có đoán thì cũng phải suy luận ở mức độ nhất định với một số câu hỏi không đáng kể.
-       Thứ tư: Những phỏng đoán có tính toán của thí sinh trong việc lựa chọn một phương án trả lời cho một câu hỏi (mặc dù trả lời sai) vẫn cung cấp những thông tin hữu ích về mức độ đạt thành quả học tập của người học.
-       Thứ năm: Việc áp dụng công thức trừ điểm đoán mò chỉ làm rắc rối thêm cách tính điểm và làm sai lệch đi kết quả bài làm của người học.
-       Thứ sáu: Với loại trắc nghiệm tốc độ, việc áp dụng công thức trừ điểm đoán mò sẽ hạn chế được việc đoán mò của người học mà nhất là những em chậm. Nhưng lưu ý là phải công khai và thông báo trước cho mọi thí sinh biết là họ sẽ bị trừ điểm nếu không biết mà vẫn đoán mò.
3.  Kết luận
Mặc dù hành vi đoán mò là đáng chê trách trong giáo dục, tuy nhiên trong chừng mực nhất định nào đó khi đưa ra một quyết định trả lời thì các thí sinh luôn luôn căn cứ vào một hay nhiều khía cạnh của vấn đề mà câu hỏi đặt ra, và dựa vào năng lực của bản thân. Việc thí sinh trả lời sai có thể do thí sinh nhận thức chưa đầy đủ vấn đề câu hỏi đặt ra chứ không hẳn thí sinh đoán mò. Hơn nữa, trong trắc nghiệm lớp học, nếu khẳng định thí sinh kỳ vọng để có được điểm số cao nhờ vào đoán mò là hết sức thiếu thuyết phục. Có thể thí sinh trả lời sai một câu hỏi dựa trên sự hiểu biết, sự suy đoán dựa vào cơ sở không vững chắc, trong trường hợp này vẫn có thể cung cấp các thông tin hữu ích trong chẩn đoán mức độ hoàn thành khối lượng học tập của nguời học, và cũng như giúp định hướng cho các hoạt động giảng dạy, nghiên cứu tiếp theo.
Từ những phân tích trên, bài viết cho rằng chúng ta cần hết sức cẩn trọng khi quyết định điều chỉnh điểm đoán mò trong chấm thi trắc nghiệm. Vì việc trừ điểm đoán mò có thể làm sai lệch kết quả bài làm, và không đánh giá đúng năng lực của người học.




TÀI LIỆU THAM KHẢO




Thứ Năm, 5 tháng 11, 2015

Hướng dẫn sử dụng phần mềm phân tích đề thi IATA (16 References_Convert to PDF to Word full)



16 References

--------. 2010. PISA Results: What Students Know and Can Do Student Performance in Reading, Mathematics and Science, Vol.1. Paris: Author
 --------. eds. 2012. Implementing a National Assessment of Educational Achievement.
Washington, DC: World Bank
Adams, R., and Wu, M. (eds). (2003). PISA 2000 Technical Report. Organisation for Economic Cooperation and Development: Paris.
Anderson, P., and G. Morgan. 2008. Developing Tests and Questionnaires for a National Assessment of Educational Achievement. Washington, DC: World Bank.
Brennan R. L. (Ed.). (2006). Educational Measurement, 4th Edition. Westport, CT: Praeger.
Cizek, Gregory J. and Bunch, Michael B.. (2006). A Guide to Establishing and Evaluating Performance Standards on Tests. Retrieved from http://www.sagepub.com/cizek/.
Crocker, L., and J. Algina. 2006. Introduction to classical and modern test theory.
Pacific Grove, CA: Wadsworth.
De Ayala, R.J. (2009). The theory and practice of item response theory. Guilford Press: New York.
DeMars, C. (2010). Item Response Theory. Oxford University Press: New York.
Greaney, V., and T. Kellaghan. 2008. Assessing National Achievement Levels in Education. Washington, DC: World Bank
Haladyna, T. M. (2004). Developing and Validating Multiple-choice Test Items, 3rd
Edition. Lawrence Erlbaum Associates: New Jersey.
Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of item response theory. Newbury Park, CA: Sage Publications.
Hutcheson , G., and Sofroniou, N. (1999). The Multivariate Social Scientist. London: Sage
Karantonis, A., & Sireci, S. G. (2006). The Bookmark standard setting method: A literature review. Educational Measurement: Issues and Practice, 25(1), 4-12.
Kellaghan, T., and V. Greaney. 2001. Using Assessment to Improve the Quality of Education. Paris: UNESCO International Institute for Educational Planning.
Kellaghan, T., V. Greaney, and T. S. Murray. 2009. Using the Results of a National Assessment of Educational Achievement. Washington DC: World Bank.
Lord, F. M., & Novick, M. R. (1968). Statistical theories of mental test scores. Reading, MA: Addison-Wesley.
MacDonald, R. (1999). Test Theory: a unified treatment. Lawrence Erlbaum Associates: New Jersey.
Martin, M.O., Mullis, I.V.S., & Foy, P. (with Olson, J.F., Erberber, E., Preuschoff, C., & Galia, J.). (2008). TIMSS 2007 International Science Report: Findings from IEA’s Trends in International Mathematics and Science Study at the Fourth and Eighth Grades Chestnut Hill, MA: TIMSS & PIRLS International Study Center, Boston College.
Mislevy, R. J. (1992). Linking educational assessments: Concepts, issues, methods, and prospects. Policy Information Center, Educational Testing Service: New Jersey.
Murray, T. S., Kirsch, I. A., and Jenkins, L. (Eds.). (1998). Adult Literacy in OECD Countries: Technical Report on the First International Adult Literacy Survey, National Centre for Education Statistics, Office of Educational Research and Improvement: Washington DC.
National Center for Education Statistics. 2011. The Nation’s Report Card: Mathematics 2011. Washington, DC : Institute of Education Sciences, US Department of Education.
OECD (Organisation for Economic Co-operation and Development). 2007. Science Competencies for Tomorrow’s World, Vol. 1: Analysis. Paris: Author.
Samejima, F. (1974). Normal ogive model on the continuous response level in the multidimensional latent space. Psychometrika, 39, 111-121.
Snijders, T.A.B., and R.J. Bosker. 1999. Multilevel Analysis: An Introduction to Basic and Advanced Multilevel Modeling. London: Sage.