1. Độ khó của câu hỏi kiểm tra
Độ khó của câu hỏi thi kiểm
tra (P) là tỷ lệ thí sinh trả lời đúng so với tổng số thí sinh tham gia trả lời
câu hỏi đó.
Một câu hỏi có thể quá
dễ đối với nhóm thí sinh này nhưng lại quá khó đối với nhóm thí sinh khác. Vì vậy,
người viết câu hỏi thi kiểm tra cần quan tâm đến giới hạn thích hợp của P
đối với mỗi nhóm thí sinh nhất định.
Kết quả phân tích số liệu
được thể hiện ở bảng thống kê dưới đây:
Bảng 1.Độ
khó câu hỏi kiểm tra
Phương án trả lời
|
Câu 1
|
Câu 2
|
Câu 3
|
Câu 4
|
Câu 5
|
Câu 6
|
Câu 7
|
Câu 8
|
Câu 9
|
Câu 10
|
A (%)
|
74.40
|
81.60
|
6.80
|
7.47
|
12.40
|
14.53
|
43.33
|
5.47
|
20.80
|
13.47
|
B (%)
|
9.07
|
6.40
|
11.47
|
6.53
|
79.20
|
12.67
|
16.80
|
79.20
|
15.20
|
20.27
|
C (%)
|
9.07
|
7.73
|
22.40
|
14.93
|
4.53
|
60.00
|
23.47
|
5.73
|
48.13
|
52.67
|
D (%)
|
7.20
|
4.00
|
58.80
|
70.93
|
3.87
|
11.87
|
15.73
|
8.80
|
15.07
|
13.33
|
Bỏ sót (%)
|
0.27
|
0.27
|
0.53
|
0.13
|
0.00
|
0.93
|
0.67
|
0.80
|
0.80
|
0.27
|
Độ khó, P
|
0.74
|
0.82
|
0.59
|
0.71
|
0.79
|
0.13
|
0.43
|
0.79
|
0.48
|
0.53
|
Phương án trả lời
|
Câu 11
|
Câu 12
|
Câu 13
|
Câu 14
|
Câu 15
|
Câu 16
|
Câu 17
|
Câu 18
|
Câu 19
|
Câu 20
|
A (%)
|
63.60
|
79.60
|
4.27
|
3.60
|
78.13
|
6.13
|
5.60
|
19.73
|
5.60
|
11.60
|
B (%)
|
13.07
|
7.07
|
24.67
|
4.00
|
7.20
|
78.40
|
5.33
|
7.33
|
2.13
|
58.13
|
C (%)
|
12.93
|
6.53
|
59.60
|
3.60
|
4.53
|
8.67
|
4.27
|
64.13
|
6.13
|
17.60
|
D (%)
|
10.27
|
6.53
|
11.07
|
88.80
|
9.20
|
6.80
|
84.53
|
8.13
|
85.87
|
12.53
|
Bỏ sót (%)
|
0.13
|
0.27
|
0.40
|
0.00
|
0.93
|
0.00
|
0.27
|
0.67
|
0.27
|
0.13
|
Độ khó, P
|
0.64
|
0.80
|
0.60
|
0.89
|
0.78
|
0.78
|
0.85
|
0.64
|
0.86
|
0.58
|
Phương án trả lời
|
Câu 21
|
Câu 22
|
Câu 23
|
Câu 24
|
Câu 25
|
Câu 26
|
Câu 27
|
Câu 28
|
Câu 29
|
Câu 30
|
A (%)
|
10.67
|
2.93
|
16.00
|
3.47
|
76.93
|
6.53
|
79.73
|
11.07
|
69.20
|
3.73
|
B (%)
|
4.13
|
7.87
|
63.47
|
13.20
|
4.13
|
16.00
|
9.33
|
18.67
|
6.80
|
72.67
|
C (%)
|
73.60
|
75.47
|
13.60
|
3.73
|
3.20
|
14.00
|
5.33
|
10.40
|
16.53
|
3.87
|
D (%)
|
11.60
|
13.73
|
6.13
|
79.47
|
15.73
|
63.07
|
4.93
|
59.73
|
6.13
|
19.07
|
Bỏ sót (%)
|
0.00
|
0.00
|
0.80
|
0.13
|
0.00
|
0.40
|
0.67
|
0.13
|
1.33
|
0.67
|
Độ khó, P
|
0.74
|
0.75
|
0.63
|
0.79
|
0.77
|
0.63
|
0.80
|
0.60
|
0.69
|
0.73
|
Phương án trả lời
|
Câu 31
|
Câu 32
|
Câu 33
|
Câu 34
|
Câu 35
|
Câu 36
|
Câu 37
|
Câu 38
|
Câu 39
|
Câu 40
|
A (%)
|
5.47
|
21.07
|
5.73
|
3.47
|
3.33
|
78.40
|
2.80
|
10.80
|
3.07
|
6.00
|
B (%)
|
82.80
|
55.73
|
75.60
|
23.07
|
5.07
|
9.07
|
14.27
|
18.93
|
21.33
|
50.27
|
C (%)
|
6.27
|
5.33
|
4.67
|
3.47
|
85.87
|
5.60
|
77.47
|
58.53
|
14.80
|
36.80
|
D (%)
|
4.93
|
17.20
|
13.33
|
69.47
|
5.47
|
6.27
|
5.20
|
10.93
|
60.00
|
5.87
|
Bỏ sót (%)
|
0.53
|
0.67
|
0.67
|
0.53
|
0.27
|
0.67
|
0.27
|
0.80
|
0.80
|
1.07
|
Độ khó, P
|
0.83
|
0.56
|
0.76
|
0.69
|
0.86
|
0.78
|
0.77
|
0.59
|
0.60
|
0.50
|
Bảng 1.1. Thống kê phân bổ độ khó
Độ khó
|
>0.8
|
>0.7
|
>0.65
|
>=
0.6
|
<0.6
|
<0.55
|
<0.5
|
<0.45
|
<0.4
|
Số câu
|
6
|
22
|
24
|
29
|
11
|
5
|
3
|
2
|
1
|
(%)
|
15
|
55
|
60
|
72.5
|
27.5
|
12.5
|
7.5
|
5
|
2.5
|
Thống kê dữ liệu cho thấy độ khó trung bình của của 40 câu hỏi kiểm
tra là 0,69 và rải từ 0.13 đến 0.89. Trong đó, số câu có độ khó lớn hơn 0.8 là 6 câu (chiếm tỷ lệ 15%)
và có đến 29 câu có độ khó từ 0.6 trở lên (chiếm tỷ lệ 72.5%) trong tổng số câu
của đề kiểm tra. Theo Osterlind (1989),
thì giá trị độ khó (P) càng lớn cho thấy câu hỏi càng dễ, độ khó của câu
hỏi nằm trong khoảng 0.4 đến 0.8 là chấp nhận được. Trong khi đó, bài test có đến
29 câu có độ khó P >0.6, chỉ có 11
câu có độ khó dưới 0.6 (chiếm 27.5%). Có một trường hợp đặc biệt là câu
6 có độ khó là 0.13 (vượt quá xa
ngưỡng cho phép của Osterlind ). Như vậy, hầu hết các câu hỏi của bài
test này thuộc loại dễ đối với nhóm thí sinh tham gia kỳ kiểm tra.
Nhận xét: Đề kiểm
tra có quá nhiều câu hỏi dễ và thiếu các câu hỏi khó. Trong các lần kiểm tra
sau cần tăng cường, bổ sung các câu hỏi khó để đánh giá đúng, đầy đủ năng lực của
các nhóm thí sinh khác nhau. Các câu 2, 14,17, 19, 31, 35 có độ khó > 0,80
có thể loại bỏ hoặc cần phải điều chỉnh trước khi chọn vào ngân hàng câu hỏi thi
kiểm tra.
2. Các khả năng nhầm đáp án
Một thuộc tính bổ ích khác của P
là giúp xác định những câu hỏi bị nhầm đáp án. Những câu hỏi kiểm tra bị nhầm
đáp án thường bị phát hiện khi người soạn câu hỏi kiểm tra xem bảng P và
thấy có sự khác biệt lớn giữa dự định và thực tế trả lời của thí sinh. Độ khó P
đưa ra một thông tin nhắc người soạn câu hỏi kiểm tra xem lại có phải nhầm đáp
án hay không.
Bảng
2. Độ khó P của câu hỏi 6 ( nhầm đáp án)
Phương án trả lời
|
A
|
B*
|
C
|
D
|
Bỏ sót
|
Tổng
|
Số lượng
|
109
|
95
|
450
|
89
|
7
|
750
|
Độ khó P
|
0.15
|
0.13
|
0.60
|
0.12
|
0.01
|
|
Ghi chú: * ký hiệu phương án trả lời
đúng.
Người
soạn câu hỏi cho rằng phương án B là đáp án của câu hỏi nhưng thực tế đa số thí
sinh đều chọn phương án C. Tuy đây là câu hỏi tốt vì các phương án A, B và D có
P tương đối gần nhau và cùng khác biệt với P của phương án C, nhưng đây lại là một câu hỏi nhầm đáp án. Người
soạn câu hỏi cần nghiên cứu lại vì thông tin thống kê cho thấy phương án C mới
là đáp án đúng.
Nhận xét: Trường
hợp nhầm đáp án ở câu 6 được xem là một nhược điểm lớn của bài test
và cần nghiêm túc xem xét rút kinh
nghiệm cho những lần xây dựng đề kiểm tra tiếp theo.
3. Chất lượng của các phương án sai (mồi nhử)
Phương
án gây
nhiễu hay còn gọi là mồi nhử đó là các phương án sai. Phương án gây nhiễu tốt là phương
án có tỷ lệ lựa chọn gần với tỷ lệ mong muốn được tính theo
công thức:
I
= (1 – P)/(k – 1) x 100
%.
|
Trong đó: I là tỷ lệ mông muốn.
P là độ khó của câu hỏi kiểm
tra.
K là
tổng số phương án trả lời.
Ví dụ: Câu
hỏi 5 (4 lựa chon) có giá trị độ khó là 0.79
với 3 phương án trả lời sai thì tỷ
lệ
% mong muốn là:
I = (1 – 0.79)/(4-1) x 100% = 7%
cho
mỗi phương án gây nhiễu. Như vậy, ở đây ta có
thể quy ước được một phương án gây
nhiễu kém là phương án có tỉ lệ % thí sinh
lựa chọn nhỏ hơn hoặc bằng 50% so với tỷ
lệ mà phương án đó mong muốn.
Từ dữ liệu
thống kê được ta thấy bài test có đến 12 câu xuất hiện mồi nhử rất kém (gồm các
câu: 3, 13, 19, 21, 22, 25, 30, 32, 34, 37, 39,40). Trong đó, có nhiều câu có các phương án mồi nhử quá lộ liễu và rất
ít thí sinh lựa chọn nên hầu như có tác dụng không đáng kể để đánh giá đúng
năng lực người học. Những phương án sai nhưng thu hút được
nhiều thí sinh lựa chọn chắc chắn là những phương án thiên về đánh lừa thí sinh
và đều cần phải chỉnh sửa.
Ví dụ: Câu 39 là một câu hỏi trắc nghiệm
kém chất lượng
Phương án trả lời
|
A
|
B
|
C
|
D*
|
Bỏ sót
|
Tổng
|
Số lượng
|
23
|
160
|
111
|
450
|
6
|
750
|
(%)
|
3.07
|
21.33
|
14.80
|
60.00
|
0.80
|
|
Ghi
chú: * ký hiệu phương án trả lời đúng.
Trong
trường hợp này, số thí sinh tham gia trả lời đã chỉ ra một
số lỗi của câu hỏi kiểm tra; thí sinh bị nhầm lẫn khi trả lời câu hỏi này, phương
án A chỉ có 3.07 % thí sinh
lựa chọn, chứng tỏ đây là phương án sai quá lộ liễu, phương án nhiễu B lại thu
hút đến 21.33% thí sinh lựa chọn chắc chắn là phương án thiên về đánh lừa thí
sinh.
Những điều trên chỉ ra rằng câu hỏi này sai sót rất nghiêm trọng, cần phải được
chỉnh sửa hoặc loại bỏ.
Các
phương án sai có thể rất tốt đối với nhóm thí sinh có năng lực cao nhưng đôi
khi không thật hiệu quả để đánh giá các thí sinh có năng lực thấp. Các phương
án sai được so sánh giữa nhóm trên (27% số thí sinh có kết quả điểm toàn bài kiểm
tra cao nhất = Nh. trên) với nhóm dưới (27% số thí sinh có kết quả điểm toàn
bài kiểm tra thấp nhất = Nh. dưới), hoặc chia làm 5 nhóm bằng nhau được sắp xếp
theo thứ tự của kết quả điểm toàn bài kiểm tra.
Dưới đây
là bảng thống kê độ lệch giữa nhóm trên
(27%) với nhóm dưới (27%):
Bảng 3: Phân bố độ
lệch nhóm trên với nhóm dưới
Câu
hỏi
|
Câu 1
|
Câu 2
|
Câu 3
|
Câu 4
|
Câu 5
|
Câu 6
|
Câu 7
|
Câu 8
|
Câu 9
|
Câu 10
|
|
Độ
khó, P
|
0.74
|
0.82
|
0.59
|
0.71
|
0.79
|
0.13
|
0.43
|
0.79
|
0.48
|
0.53
|
|
A
|
Nh. trên
|
0.92
|
0.91
|
0.01
|
0.01
|
0.01
|
0.09
|
0.81
|
0.00
|
0.21
|
0.01
|
Nh. dưới
|
0.56
|
0.58
|
0.15
|
0.21
|
0.25
|
0.17
|
0.15
|
0.16
|
0.20
|
0.29
|
|
Ch. Lệch
|
0.36
|
0.33
|
-0.13
|
-0.20
|
-0.24
|
-0.08
|
0.66
|
-0.16
|
0.01
|
-0.28
|
|
B
|
Nh. trên
|
0.02
|
0.04
|
0.01
|
0.00
|
0.94
|
0.02
|
0.04
|
0.98
|
0.02
|
0.11
|
Nh. dưới
|
0.18
|
0.13
|
0.23
|
0.07
|
0.59
|
0.26
|
0.24
|
0.45
|
0.34
|
0.25
|
|
Ch. Lệch
|
-0.16
|
-0.09
|
-0.21
|
-0.07
|
0.35
|
-0.24
|
-0.20
|
0.53
|
-0.32
|
-0.14
|
|
C
|
Nh. trên
|
0.01
|
0.03
|
0.02
|
0.02
|
0.01
|
0.83
|
0.10
|
0.00
|
0.71
|
0.83
|
Nh. dưới
|
0.22
|
0.22
|
0.44
|
0.33
|
0.10
|
0.35
|
0.37
|
0.12
|
0.19
|
0.24
|
|
Ch. Lệch
|
-0.21
|
-0.19
|
-0.42
|
-0.30
|
-0.08
|
0.48
|
-0.28
|
-0.12
|
0.52
|
0.59
|
|
D
|
Nh. trên
|
0.04
|
0.02
|
0.95
|
0.97
|
0.03
|
0.06
|
0.05
|
0.01
|
0.05
|
0.05
|
Nh. dưới
|
0.03
|
0.06
|
0.16
|
0.39
|
0.06
|
0.21
|
0.23
|
0.24
|
0.26
|
0.21
|
|
Ch. Lệch
|
0.01
|
-0.04
|
0.79
|
0.58
|
-0.03
|
-0.15
|
-0.17
|
-0.23
|
-0.21
|
-0.16
|
|
Câu
hỏi
|
Câu 11
|
Câu 12
|
Câu 13
|
Câu 14
|
Câu 15
|
Câu 16
|
Câu 17
|
Câu 18
|
Câu 19
|
Câu 20
|
|
Độ
khó, P
|
0.64
|
0.80
|
0.60
|
0.89
|
0.78
|
0.78
|
0.85
|
0.64
|
0.86
|
0.58
|
|
A
|
Nh. trên
|
0.93
|
0.98
|
0.00
|
0.01
|
0.98
|
0.00
|
0.01
|
0.04
|
0.01
|
0.00
|
Nh. dưới
|
0.32
|
0.54
|
0.09
|
0.09
|
0.41
|
0.14
|
0.12
|
0.28
|
0.15
|
0.29
|
|
Ch. Lệch
|
0.61
|
0.43
|
-0.09
|
-0.08
|
0.57
|
-0.14
|
-0.11
|
-0.23
|
-0.14
|
-0.28
|
|
B
|
Nh. trên
|
0.01
|
0.01
|
0.05
|
0.00
|
0.00
|
0.99
|
0.02
|
0.00
|
0.00
|
0.93
|
Nh. dưới
|
0.24
|
0.14
|
0.44
|
0.10
|
0.19
|
0.49
|
0.09
|
0.13
|
0.05
|
0.20
|
|
Ch. Lệch
|
-0.23
|
-0.13
|
-0.39
|
-0.10
|
-0.19
|
0.50
|
-0.07
|
-0.13
|
-0.05
|
0.73
|
|
C
|
Nh. trên
|
0.03
|
0.01
|
0.91
|
0.00
|
0.00
|
0.00
|
0.01
|
0.93
|
0.00
|
0.04
|
Nh. dưới
|
0.24
|
0.14
|
0.24
|
0.09
|
0.13
|
0.21
|
0.07
|
0.44
|
0.16
|
0.30
|
|
Ch. Lệch
|
-0.21
|
-0.13
|
0.67
|
-0.09
|
-0.13
|
-0.21
|
-0.05
|
0.49
|
-0.16
|
-0.25
|
|
D
|
Nh. trên
|
0.02
|
0.00
|
0.04
|
0.99
|
0.01
|
0.01
|
0.95
|
0.02
|
0.99
|
0.02
|
Nh. dưới
|
0.20
|
0.16
|
0.22
|
0.71
|
0.25
|
0.17
|
0.70
|
0.13
|
0.63
|
0.22
|
|
Ch. Lệch
|
-0.17
|
-0.16
|
-0.17
|
0.27
|
-0.24
|
-0.16
|
0.25
|
-0.11
|
0.36
|
-0.19
|
|
Câu
hỏi
|
Câu 21
|
Câu 22
|
Câu 23
|
Câu 24
|
Câu 25
|
Câu 26
|
Câu 27
|
Câu 28
|
Câu 29
|
Câu 30
|
|
Độ
khó, P
|
0.74
|
0.75
|
0.63
|
0.79
|
0.77
|
0.63
|
0.80
|
0.60
|
0.69
|
0.73
|
|
A
|
Nh. trên
|
0.00
|
0.00
|
0.08
|
0.00
|
0.95
|
0.01
|
0.91
|
0.01
|
0.94
|
0.01
|
Nh. dưới
|
0.30
|
0.07
|
0.33
|
0.08
|
0.50
|
0.15
|
0.60
|
0.22
|
0.32
|
0.09
|
|
Ch. Lệch
|
-0.30
|
-0.07
|
-0.25
|
-0.07
|
0.45
|
-0.14
|
0.31
|
-0.21
|
0.62
|
-0.08
|
|
B
|
Nh. trên
|
0.01
|
0.01
|
0.90
|
0.01
|
0.01
|
0.05
|
0.05
|
0.08
|
0.01
|
0.95
|
Nh. dưới
|
0.05
|
0.19
|
0.27
|
0.24
|
0.09
|
0.29
|
0.16
|
0.34
|
0.14
|
0.47
|
|
Ch. Lệch
|
-0.03
|
-0.18
|
0.63
|
-0.22
|
-0.08
|
-0.24
|
-0.11
|
-0.26
|
-0.13
|
0.48
|
|
C
|
Nh. trên
|
0.97
|
0.90
|
0.00
|
0.02
|
0.01
|
0.04
|
0.02
|
0.00
|
0.04
|
0.01
|
Nh. dưới
|
0.41
|
0.52
|
0.26
|
0.07
|
0.07
|
0.20
|
0.11
|
0.06
|
0.33
|
0.07
|
|
Ch. Lệch
|
0.56
|
0.38
|
-0.26
|
-0.05
|
-0.06
|
-0.16
|
-0.09
|
-0.06
|
-0.29
|
-0.05
|
|
D
|
Nh. trên
|
0.01
|
0.08
|
0.02
|
0.96
|
0.03
|
0.90
|
0.02
|
0.91
|
0.01
|
0.02
|
Nh. dưới
|
0.24
|
0.21
|
0.12
|
0.61
|
0.34
|
0.34
|
0.11
|
0.37
|
0.17
|
0.36
|
|
Ch. Lệch
|
-0.23
|
-0.13
|
-0.10
|
0.35
|
-0.31
|
0.56
|
-0.09
|
0.54
|
-0.16
|
-0.34
|
|
Câu
hỏi
|
Câu 31
|
Câu 32
|
Câu 33
|
Câu 34
|
Câu 35
|
Câu 36
|
Câu 37
|
Câu 38
|
Câu 39
|
Câu 40
|
|
Độ
khó, P
|
0.83
|
0.56
|
0.76
|
0.69
|
0.86
|
0.78
|
0.77
|
0.59
|
0.60
|
0.50
|
|
A
|
Nh. trên
|
0.01
|
0.07
|
0.01
|
0.01
|
0.00
|
0.90
|
0.02
|
0.01
|
0.02
|
0.00
|
Nh. dưới
|
0.13
|
0.31
|
0.14
|
0.08
|
0.12
|
0.64
|
0.06
|
0.24
|
0.06
|
0.16
|
|
Ch. Lệch
|
-0.11
|
-0.24
|
-0.13
|
-0.06
|
-0.12
|
0.26
|
-0.03
|
-0.23
|
-0.03
|
-0.16
|
|
B
|
Nh. trên
|
0.97
|
0.93
|
0.95
|
0.04
|
0.00
|
0.03
|
0.05
|
0.10
|
0.15
|
0.90
|
Nh. dưới
|
0.61
|
0.20
|
0.42
|
0.47
|
0.18
|
0.14
|
0.33
|
0.29
|
0.21
|
0.28
|
|
Ch. Lệch
|
0.36
|
0.72
|
0.53
|
-0.43
|
-0.18
|
-0.11
|
-0.28
|
-0.19
|
-0.06
|
0.63
|
|
C
|
Nh. trên
|
0.01
|
0.00
|
0.00
|
0.00
|
1.00
|
0.03
|
0.91
|
0.88
|
0.05
|
0.10
|
Nh. dưới
|
0.16
|
0.09
|
0.14
|
0.05
|
0.56
|
0.10
|
0.54
|
0.29
|
0.23
|
0.38
|
|
Ch. Lệch
|
-0.15
|
-0.08
|
-0.13
|
-0.04
|
0.44
|
-0.07
|
0.37
|
0.59
|
-0.18
|
-0.29
|
|
D
|
Nh. trên
|
0.00
|
0.00
|
0.03
|
0.94
|
0.00
|
0.03
|
0.01
|
0.00
|
0.77
|
0.00
|
Nh. dưới
|
0.09
|
0.39
|
0.28
|
0.38
|
0.14
|
0.09
|
0.07
|
0.17
|
0.47
|
0.14
|
|
Ch. Lệch
|
-0.08
|
-0.39
|
-0.25
|
0.56
|
-0.14
|
-0.06
|
-0.05
|
-0.16
|
0.30
|
-0.14
|
Qua kết quả thống kê ở bảng 3
cho thấy có đến 24 câu (60%
) là các phương án sai không hiệu quả trong việc phân biệt hai nhóm thí sinh có năng lực khác nhau (bao gồm các câu 1, 2, 4, 5, 6,9, 13, 14, 17, 19, 21, 22, 23, 24, 25 27, 28, 30, 31, 32, 34, 36, 37, 39). Trong đó có nhiều phương án mồi nhử là rất kém như trường hợp câu 1, phương án D là phương án sai nhưng có số thí sinh nhóm trên trả lời sai nhiều hơn so với thí sinh nhóm dưới, hay trường hợp câu 39 ở phương án A hầu như không có sự phân biệt năng lực nhóm trên và nhóm dưới.
) là các phương án sai không hiệu quả trong việc phân biệt hai nhóm thí sinh có năng lực khác nhau (bao gồm các câu 1, 2, 4, 5, 6,9, 13, 14, 17, 19, 21, 22, 23, 24, 25 27, 28, 30, 31, 32, 34, 36, 37, 39). Trong đó có nhiều phương án mồi nhử là rất kém như trường hợp câu 1, phương án D là phương án sai nhưng có số thí sinh nhóm trên trả lời sai nhiều hơn so với thí sinh nhóm dưới, hay trường hợp câu 39 ở phương án A hầu như không có sự phân biệt năng lực nhóm trên và nhóm dưới.
Nhận
xét: Đề kiểm tra có chất lượng các phương án sai (mồi nhử) là không cao
vì có rất nhiều phương án sai mà cả sinh viên kém và sinh viên giỏi đều có tỷ lệ
trả lời sai gần nhau. Có nhiều câu cả nhóm trên và nhóm dưới đều rất ít thí
sinh chọn, cho thấy những mồi nhử ấy thật sự là mồi nhử kém chất lượng. Sau
đánh giá có thể loại bỏ hoặc nhất định cần phải chỉnh sửa mồi nhử trước khi đưa
vào ngân hàng câu hỏi thi kiểm tra.
4. Độ phân biệt của câu hỏi kiểm tra
Độ phân
biệt của câu hỏi kiểm tra là mức độ khác nhau về kết quả trả lời giữa hai nhóm
trên và dưới khi làm bài kiểm tra. Câu hỏi quá khó hoặc quá dễ thì không thể có
độ phân biệt tốt. Câu hỏi có chỉ số phân biệt nhỏ hơn hoặc bằng 0 cần được loại
bỏ. Theo Ebel (1956) đề xuất rằng các câu hỏi của bài test trong lớp học nên có
chỉ số phân biệt bằng 0,30 hoặc cao hơn. Một số tác giả khác cho rằng độ phân
biệt nên nằm trong khoảng 0,25-0,75. Tuy nhiên, trong các kỳ kiểm tra có quy mô
lớn, việc sử dụng một số câu hỏi kiểm tra quá dễ hoặc quá khó sẽ dẫn đến độ
phân biệt của câu hỏi kiểm tra có thể có giá trị quá thấp hoặc quá cao.
Độ phân
biệt của từng câu hỏi trong đề kiểm tra được tính toán và đưa vào bảng dưới
đây.
Bảng 4. Độ phân biệt câu hỏi kiểm
tra
Câu hỏi
|
Độ PB
|
Câu hỏi
|
Độ PB
|
Câu hỏi
|
Độ PB
|
Câu hỏi
|
Độ PB
|
1
|
0.36
|
11
|
0.61
|
21
|
0.56
|
31
|
0.36
|
2
|
0.33
|
12
|
0.43
|
22
|
0.38
|
32
|
0.72
|
3
|
0.79
|
13
|
0.67
|
23
|
0.63
|
33
|
0.53
|
4
|
0.58
|
14
|
0.27
|
24
|
0.35
|
34
|
0.56
|
5
|
0.35
|
15
|
0.57
|
25
|
0.45
|
35
|
0.44
|
6
|
0.48
|
16
|
0.50
|
26
|
0.56
|
36
|
0.26
|
7
|
0.66
|
17
|
0.25
|
27
|
0.31
|
37
|
0.37
|
8
|
0.53
|
18
|
0.49
|
28
|
0.54
|
38
|
0.59
|
9
|
0.52
|
19
|
0.36
|
29
|
0.62
|
39
|
0.30
|
10
|
0.59
|
20
|
0.73
|
30
|
0.48
|
40
|
0.63
|
Từ số liệu
thống kê bảng 4 cho thấy các câu hỏi có độ phân biệt trung bình là 0.49 và rải
từ 0.25 đến 0.79. Có 21 câu (chiếm 52.5%) đạt độ phân biệt từ 0.5 trở lên, điều
này cho thấy đề kiểm tra có độ phân biệt không cao. Các câu có độ phân biệt từ
0.25 đến dưới 0.5 gồm 19 câu (47.5%). Trong đó có 04 câu có độ phân biệt thấp từ
0.25 đến 0.30 đó là các câu câu 14, 17, 36, 39.
Lưu ý: Với thực
tế kết quả làm bài của thí sinh cho thấy ở trường hợp câu 6 mặc dù là một câu
nhầm đáp án, nhưng vẫn thể hiện tương đối
chính xác năng lực của nhóm trên và nhóm dưới trong việc lựa chọn phương án C
là câu đúng. Vì vậy ta vẫn có thể tính toán được độ phân biệt của câu 6 là
0.48.
Nhận
xét: Đề kiểm tra có khá nhiều câu có
mồi nhử kém, có 21 câu (chiếm 52.5%) có độ phân biệt tương đối tốt được
thể hiện qua kết quả bài làm, chứng tỏ độ phân biệt của đề kiểm tra là đảm bảo.
Tuy nhiên cần chỉnh sửa một số câu có độ phân biệt thấp như câu 14, 17, 36, 39.
Riêng câu 6, mặc dù là một câu nhầm đáp án,
nhưng với thực tế kết quả trả lời của thí sinh đã cho thấy đây hoàn toàn
là một câu hỏi có độ phân biệt tốt.
5. Hệ số tương quan giữa điểm của câu hỏi kiểm tra với điểm toàn bài kiểm tra
Pt-Biserial là mối
tương quan giữa số lượng thí sinh lựa chọn từng phương án trả lời với tổng điểm của bài thi kiểm tra. Pt-Biserial cần phải có
giá trị dương đối với phương án trả lời đúng và có giá trị âm đối với phương án
trả lời sai. Với câu hỏi tốt, Pt-Biserial nằm trong khoảng 0.35 và 0.75 (Griffin,
1998). Theo
Dương Thiệu Tống-Thống Kê Ứng Dụng Trong Nghiên Cứu Khoa Học Giáo Dục có mức tương quan dưới 0.20 là tương quan không
đáng kể hay tương quan may rủi.
Mối
tương quan chặt chẽ giữa số lượng thí sinh lựa chọn từng phương
án trả lời với toàn bài kiểm tra góp phần làm tăng độ tin cậy
của bài test. Cần giữ lại những câu hỏi kiểm tra có mối tương quan cao và loại
bỏ những câu hỏi có mối tương quan thấp hoặc dưới 0 để làm tăng độ tin cậy của
đề kiểm tra.
Bảng 5.
Hệ số tương quan các câu hỏi kiểm tra
Câu
|
HSTQ
Pt-Biserial
|
Câu
|
HSTQ
Pt-Biserial
|
Câu
|
HSTQ
Pt-Biserial
|
Câu
|
HSTQ
Pt-Biserial
|
1
|
0.30
|
11
|
0.49
|
21
|
0.52
|
31
|
0.43
|
2
|
0.42
|
12
|
0.43
|
22
|
0.37
|
32
|
0.55
|
3
|
0.62
|
13
|
0.54
|
23
|
0.50
|
33
|
0.52
|
4
|
0.54
|
14
|
0.39
|
24
|
0.36
|
34
|
0.48
|
5
|
0.36
|
15
|
0.55
|
25
|
0.44
|
35
|
0.56
|
6
|
-0.29
|
16
|
0.54
|
26
|
0.50
|
36
|
0.25
|
7
|
0.50
|
17
|
0.32
|
27
|
0.35
|
37
|
0.37
|
8
|
0.57
|
18
|
0.42
|
28
|
0.43
|
38
|
0.47
|
9
|
0.40
|
19
|
0.47
|
29
|
0.57
|
39
|
0.24
|
10
|
0.41
|
20
|
0.56
|
30
|
0.44
|
40
|
0.45
|
Bảng 5.1. Thống kê HSTQ câu hỏi kiểm tra
Min
|
Mean
|
Max
|
0.24
|
0.45
|
0.63
|
Bảng 5
cho thấy, ngoại trừ trường hợp nhầm đáp án ở câu 6 thì hệ số tương quan giữa điểm
của các câu hỏi còn lại với điểm toàn bài kiểm tra đều dương. Hệ số tương quan (point-biserial) đều lớn hơn
hoặc bằng 0.24, cao nhất là 0.63 và hệ số tương quan trung bình là 0.45.
Nhận
xét: Với hệ số tương quan trung bình là 0.45 chứng tỏ các câu hỏi có mối
tương tốt và quan thuận chiều với điểm chung của bài kiểm tra. Cần loại bỏ
câu 6 vì có hệ số tương quan âm, nên xem
lại một số câu có tương quan yếu như các câu: 1, 17, 36, 39.
6. Độ tin cậy của đề kiểm tra
Độ tin cậy
của đề kiểm tra thể hiện được tính theo nhiều công thức khác nhau. Tuy nhiên, độ
tin cậy được xác định dựa trên tính ổn định bên trong của đề kiểm tra thường được
sử dụng. Kết quả tính toán bằng phần mềm QUEST cho thấy độ tin cậy của đề kiểm
tra đạt 0.98. Đây là một đề kiểm tra có độ tin cậy cao.
7. Kết luận
ü
Có sai sót trong đề kiểm
tra và cần phải điều chỉnh đáp án đối với câu 6, nhìn chung đề kiểm tra
với các câu hỏi trắc nghiệm có chất lượng không cao.
ü Đề
kiểm tra quá nhiều câu hỏi dễ và thiếu những câu hỏi khó để đánh giá đúng năng
lực nhóm thí sinh khá với nhóm thí sinh giỏi. Cần xem xét và điều chỉnh một số
câu có độ khó không cao như các câu; 2, 14, 17, 19, 31, 35 (có giá trị độ khó P > 0.80) trước
khi chọn vào ngân hàng đề kiểm tra.
ü Chất lượng
của các phương án sai (mồi nhử) không cao vì cả sinh viên kém và sinh viên giỏi
đều có tỷ lệ trả lời sai gần nhau. Trong đó có nhiều câu cả nhóm trên và nhóm
dưới đều rất ít thí sinh lựa chọn, cho thấy những mồi nhử ấy thật sự là mồi nhử
kém và cần phải chỉnh sửa trước khi đưa vào ngân hàng câu hỏi hoặc có thể loại
bỏ.
ü
Số câu đạt độ phân biệt tương
đối tốt giữa nhóm trên và nhóm dưới chiếm 52.5% tổng số câu hỏi của đề kiểm
tra, chứng tỏ độ phân biệt của đề kiểm tra là đảm bảo. Tuy nhiên cần chỉnh sửa
một số câu có độ phân biệt thấp như các câu 14, 17, 36, 39.
ü
Riêng câu 6, mặc dù là một câu nhầm đáp
án, nhưng với thực tế kết quả trả lời của
thí sinh đã cho thấy đây là một câu hỏi có độ phân biệt tốt và nhiễu tốt nên chỉ
cần điều chỉnh đáp án cho phù hợp. Trường hợp
câu 14 và câu 17 là 2 câu nên chỉnh sửa vì vừa là câu có độ khó (P) lớn (0.89
và 0.85), độ phân biệt thấp (0.27 và 0.25), độ lệch giữa nhóm trên và nhóm dưới
nhỏ hơn 0.1,