Thứ Tư, 30 tháng 4, 2014

PHÂN TÍCH ĐỀ KIỂM TRA BẰNG LÝ THUYẾT CỔ ĐIỂN


1. Độ khó của câu hỏi kiểm tra
Độ khó của câu hỏi thi kiểm tra (P) là tỷ lệ thí sinh trả lời đúng so với tổng số thí sinh tham gia trả lời câu hỏi đó.
Một câu hỏi có thể quá dễ đối với nhóm thí sinh này nhưng lại quá khó đối với nhóm thí sinh khác. Vì vậy, người viết câu hỏi thi kiểm tra cần quan tâm đến giới hạn thích hợp của P đối với mỗi nhóm thí sinh nhất định.
Kết quả phân tích số liệu được thể hiện ở bảng thống kê dưới đây:
Bảng 1.Độ khó câu hỏi kiểm tra
Phương án trả lời
Câu 1
Câu 2
Câu 3
Câu 4
Câu 5
Câu 6
Câu 7
Câu 8
Câu 9
Câu 10
A (%)
74.40
81.60
6.80
7.47
12.40
14.53
43.33
5.47
20.80
13.47
B (%)
9.07
6.40
11.47
6.53
79.20
12.67
16.80
79.20
15.20
20.27
C (%)
9.07
7.73
22.40
14.93
4.53
60.00
23.47
5.73
48.13
52.67
D (%)
7.20
4.00
58.80
70.93
3.87
11.87
15.73
8.80
15.07
13.33
Bỏ sót (%)
0.27
0.27
0.53
0.13
0.00
0.93
0.67
0.80
0.80
0.27
Độ khó, P
0.74
0.82
0.59
0.71
0.79
0.13
0.43
0.79
0.48
0.53
Phương án trả lời
Câu 11
Câu 12
Câu 13
Câu 14
Câu 15
Câu 16
Câu 17
Câu 18
Câu 19
Câu 20
A (%)
63.60
79.60
4.27
3.60
78.13
6.13
5.60
19.73
5.60
11.60
B (%)
13.07
7.07
24.67
4.00
7.20
78.40
5.33
7.33
2.13
58.13
C (%)
12.93
6.53
59.60
3.60
4.53
8.67
4.27
64.13
6.13
17.60
D (%)
10.27
6.53
11.07
88.80
9.20
6.80
84.53
8.13
85.87
12.53
Bỏ sót (%)
0.13
0.27
0.40
0.00
0.93
0.00
0.27
0.67
0.27
0.13
Độ khó, P
0.64
0.80
0.60
0.89
0.78
0.78
0.85
0.64
0.86
0.58
Phương án trả lời
Câu 21
Câu 22
Câu 23
Câu 24
Câu 25
Câu 26
Câu 27
Câu 28
Câu 29
Câu 30
A (%)
10.67
2.93
16.00
3.47
76.93
6.53
79.73
11.07
69.20
3.73
B (%)
4.13
7.87
63.47
13.20
4.13
16.00
9.33
18.67
6.80
72.67
C (%)
73.60
75.47
13.60
3.73
3.20
14.00
5.33
10.40
16.53
3.87
D (%)
11.60
13.73
6.13
79.47
15.73
63.07
4.93
59.73
6.13
19.07
Bỏ sót (%)
0.00
0.00
0.80
0.13
0.00
0.40
0.67
0.13
1.33
0.67
Độ khó, P
0.74
0.75
0.63
0.79
0.77
0.63
0.80
0.60
0.69
0.73
Phương án trả lời
Câu 31
Câu 32
Câu 33
Câu 34
Câu 35
Câu 36
Câu 37
Câu 38
Câu 39
Câu 40
A (%)
5.47
21.07
5.73
3.47
3.33
78.40
2.80
10.80
3.07
6.00
B (%)
82.80
55.73
75.60
23.07
5.07
9.07
14.27
18.93
21.33
50.27
C (%)
6.27
5.33
4.67
3.47
85.87
5.60
77.47
58.53
14.80
36.80
D (%)
4.93
17.20
13.33
69.47
5.47
6.27
5.20
10.93
60.00
5.87
Bỏ sót (%)
0.53
0.67
0.67
0.53
0.27
0.67
0.27
0.80
0.80
1.07
Độ khó, P
0.83
0.56
0.76
0.69
0.86
0.78
0.77
0.59
0.60
0.50

Bảng 1.1. Thống kê phân bổ độ khó
Độ khó
>0.8
>0.7
>0.65
>= 0.6
<0.6
<0.55
<0.5
<0.45
<0.4
Số câu
6
22
24
29
11
5
3
2
1
(%)
15
55
60
72.5
27.5
12.5
7.5
5
2.5

Thống kê dữ liệu cho thấy độ khó trung bình của của 40 câu hỏi kiểm tra là 0,69 và rải từ 0.13 đến 0.89. Trong đó, số câu có độ khó lớn hơn 0.8 là 6 câu (chiếm tỷ lệ 15%) và có đến 29 câu có độ khó từ 0.6 trở lên (chiếm tỷ lệ 72.5%) trong tổng số câu của đề kiểm tra. Theo Osterlind (1989),  thì giá trị độ khó (P) càng lớn cho thấy câu hỏi càng dễ, độ khó của câu hỏi nằm trong khoảng 0.4 đến 0.8 là chấp nhận được. Trong khi đó, bài test có đến  29 câu có độ khó P >0.6, chỉ có 11 câu có độ khó dưới 0.6 (chiếm 27.5%). Có một trường hợp đặc biệt là câu 6 có độ khó là 0.13 (vượt quá xa ngưỡng cho phép của Osterlind ). Như vậy, hầu hết các câu hỏi của bài test này thuộc loại dễ đối với nhóm thí sinh tham gia kỳ kiểm tra.
Nhận xét: Đề kiểm tra có quá nhiều câu hỏi dễ và thiếu các câu hỏi khó. Trong các lần kiểm tra sau cần tăng cường, bổ sung các câu hỏi khó để đánh giá đúng, đầy đủ năng lực của các nhóm thí sinh khác nhau. Các câu 2, 14,17, 19, 31, 35 có độ khó > 0,80 có thể loại bỏ hoặc cần phải điều chỉnh trước khi chọn vào ngân hàng câu hỏi thi kiểm tra.

        2. Các khả năng nhầm đáp án

Một thuộc tính bổ ích khác của P là giúp xác định những câu hỏi bị nhầm đáp án. Những câu hỏi kiểm tra bị nhầm đáp án thường bị phát hiện khi người soạn câu hỏi kiểm tra xem bảng P và thấy có sự khác biệt lớn giữa dự định và thực tế trả lời của thí sinh. Độ khó P đưa ra một thông tin nhắc người soạn câu hỏi kiểm tra xem lại có phải nhầm đáp án hay không.
Bảng 2.  Độ khó P của câu hỏi 6 ( nhầm đáp án)
Phương án trả lời
A
B*
C
D
Bỏ sót
Tổng
Số lượng
109
95
450
89
7
750
Độ khó P
0.15
0.13
0.60
0.12
0.01

Ghi chú: * ký hiệu phương án trả lời đúng.
Người soạn câu hỏi cho rằng phương án B là đáp án của câu hỏi nhưng thực tế đa số thí sinh đều chọn phương án C. Tuy đây là câu hỏi tốt vì các phương án A, B và D có P tương đối gần nhau và cùng khác biệt với P của phương án C, nhưng đây lại là một câu hỏi nhầm đáp án. Người soạn câu hỏi cần nghiên cứu lại vì thông tin thống kê cho thấy phương án C mới là đáp án đúng.
Nhận xét: Trường hợp nhầm đáp án ở câu 6 được xem là mt nhược điểm lớn ca bài test và cần nghiêm túc xem xét rút kinh nghiệm cho những lần xây dựng đề kiểm tra tiếp theo.

3. Chất lượng của các phương án sai (mồi nhử)

        Phương án gây nhiễu hay còn gọi là mi nh đó là các phương án sai. Phương án gây nhiễu tt là phương án tl la chn gn vi tl mong muốn được tính theo công thc:
I = (1 P)/(k 1) x 100 %.
 
Trong đó:            I là tỷ lệ mông muốn.
P là đ khó ca câu hi kiểm tra.
K là tổng sphương án trả li.
        Ví dụ: Câu hi 5 (4 lựa chon) có giá trị đ khó là 0.79 với 3 phương án trả lời sai thì tl % mong muốn là:  I = (1 0.79)/(4-1) x 100% =  7% cho mi phương án gây nhiễu. Như vậy, ở đây ta có thể quy ước được một phương án gây nhiễu kém là phương án có tỉ lệ % thí sinh lựa chọn  nh hơn hoặc bằng 50% so với tlệ mà phương án đó mong muốn.
Từ dữ liệu thống kê được ta thấy bài test có đến 12 câu xuất hiện mồi nhử rất kém (gồm các câu: 3, 13, 19, 21, 22, 25, 30, 32, 34, 37, 39,40). Trong đó, có nhiều câu có các phương án mồi nhử quá lộ liễu và rất ít thí sinh lựa chọn nên hầu như có tác dụng không đáng kể để đánh giá đúng năng lực người học. Những phương án sai nhưng thu hút được nhiều thí sinh lựa chọn chắc chắn là những phương án thiên về đánh lừa thí sinh và đều cần phải chỉnh sửa.
Ví dụ: Câu 39 là một câu hỏi trắc nghiệm kém chất lượng
Phương án trả lời
A
B
C
D*
Bỏ sót
Tổng
Số lượng
23
160
111
450
6
750
(%)
3.07
21.33
14.80
60.00
0.80

Ghi chú: * ký hiệu phương án trả lời đúng.
Trong trường hợp  này, số thí sinh tham gia trả lời đã chỉ ra một số lỗi của câu hỏi kiểm tra; thí sinh bị nhầm lẫn khi trả lời câu hỏi này, phương án A chỉ có 3.07 % thí sinh lựa chọn, chứng tỏ đây là phương án sai quá lộ liễu, phương án nhiễu B lại thu hút đến 21.33% thí sinh lựa chọn chắc chắn là phương án thiên về đánh lừa thí sinh. Những điều trên chỉ ra rằng câu hỏi này sai sót rất nghiêm trọng, cần phải được chỉnh sửa hoặc loại bỏ.
Các phương án sai có thể rất tốt đối với nhóm thí sinh có năng lực cao nhưng đôi khi không thật hiệu quả để đánh giá các thí sinh có năng lực thấp. Các phương án sai được so sánh giữa nhóm trên (27% số thí sinh có kết quả điểm toàn bài kiểm tra cao nhất = Nh. trên) với nhóm dưới (27% số thí sinh có kết quả điểm toàn bài kiểm tra thấp nhất = Nh. dưới), hoặc chia làm 5 nhóm bằng nhau được sắp xếp theo thứ tự của kết quả điểm toàn bài kiểm tra.
Dưới đây là bảng  thống kê độ lệch giữa nhóm trên (27%) với nhóm dưới (27%):
Bảng 3:  Phân bố độ lệch  nhóm trên với nhóm dưới
Câu hỏi
Câu 1
Câu 2
Câu 3
Câu 4
Câu 5
Câu 6
Câu 7
Câu 8
Câu 9
Câu 10
Độ khó, P
0.74
0.82
0.59
0.71
0.79
0.13
0.43
0.79
0.48
0.53
A
Nh. trên
0.92
0.91
0.01
0.01
0.01
0.09
0.81
0.00
0.21
0.01
Nh. dưới
0.56
0.58
0.15
0.21
0.25
0.17
0.15
0.16
0.20
0.29
Ch. Lệch
0.36
0.33
-0.13
-0.20
-0.24
-0.08
0.66
-0.16
0.01
-0.28
B
Nh. trên
0.02
0.04
0.01
0.00
0.94
0.02
0.04
0.98
0.02
0.11
Nh. dưới
0.18
0.13
0.23
0.07
0.59
0.26
0.24
0.45
0.34
0.25
Ch. Lệch
-0.16
-0.09
-0.21
-0.07
0.35
-0.24
-0.20
0.53
-0.32
-0.14
C
Nh. trên
0.01
0.03
0.02
0.02
0.01
0.83
0.10
0.00
0.71
0.83
Nh. dưới
0.22
0.22
0.44
0.33
0.10
0.35
0.37
0.12
0.19
0.24
Ch. Lệch
-0.21
-0.19
-0.42
-0.30
-0.08
0.48
-0.28
-0.12
0.52
0.59
D
Nh. trên
0.04
0.02
0.95
0.97
0.03
0.06
0.05
0.01
0.05
0.05
Nh. dưới
0.03
0.06
0.16
0.39
0.06
0.21
0.23
0.24
0.26
0.21
Ch. Lệch
0.01
-0.04
0.79
0.58
-0.03
-0.15
-0.17
-0.23
-0.21
-0.16
Câu hỏi
Câu 11
Câu 12
Câu 13
Câu 14
Câu 15
Câu 16
Câu 17
Câu 18
Câu 19
Câu 20
Độ khó, P
0.64
0.80
0.60
0.89
0.78
0.78
0.85
0.64
0.86
0.58
A
Nh. trên
0.93
0.98
0.00
0.01
0.98
0.00
0.01
0.04
0.01
0.00
Nh. dưới
0.32
0.54
0.09
0.09
0.41
0.14
0.12
0.28
0.15
0.29
Ch. Lệch
0.61
0.43
-0.09
-0.08
0.57
-0.14
-0.11
-0.23
-0.14
-0.28
B
Nh. trên
0.01
0.01
0.05
0.00
0.00
0.99
0.02
0.00
0.00
0.93
Nh. dưới
0.24
0.14
0.44
0.10
0.19
0.49
0.09
0.13
0.05
0.20
Ch. Lệch
-0.23
-0.13
-0.39
-0.10
-0.19
0.50
-0.07
-0.13
-0.05
0.73
C
Nh. trên
0.03
0.01
0.91
0.00
0.00
0.00
0.01
0.93
0.00
0.04
Nh. dưới
0.24
0.14
0.24
0.09
0.13
0.21
0.07
0.44
0.16
0.30
Ch. Lệch
-0.21
-0.13
0.67
-0.09
-0.13
-0.21
-0.05
0.49
-0.16
-0.25
D
Nh. trên
0.02
0.00
0.04
0.99
0.01
0.01
0.95
0.02
0.99
0.02
Nh. dưới
0.20
0.16
0.22
0.71
0.25
0.17
0.70
0.13
0.63
0.22
Ch. Lệch
-0.17
-0.16
-0.17
0.27
-0.24
-0.16
0.25
-0.11
0.36
-0.19
Câu hỏi
Câu 21
Câu 22
Câu 23
Câu 24
Câu 25
Câu 26
Câu 27
Câu 28
Câu 29
Câu 30
Độ khó, P
0.74
0.75
0.63
0.79
0.77
0.63
0.80
0.60
0.69
0.73
A
Nh. trên
0.00
0.00
0.08
0.00
0.95
0.01
0.91
0.01
0.94
0.01
Nh. dưới
0.30
0.07
0.33
0.08
0.50
0.15
0.60
0.22
0.32
0.09
Ch. Lệch
-0.30
-0.07
-0.25
-0.07
0.45
-0.14
0.31
-0.21
0.62
-0.08
B
Nh. trên
0.01
0.01
0.90
0.01
0.01
0.05
0.05
0.08
0.01
0.95
Nh. dưới
0.05
0.19
0.27
0.24
0.09
0.29
0.16
0.34
0.14
0.47
Ch. Lệch
-0.03
-0.18
0.63
-0.22
-0.08
-0.24
-0.11
-0.26
-0.13
0.48
C
Nh. trên
0.97
0.90
0.00
0.02
0.01
0.04
0.02
0.00
0.04
0.01
Nh. dưới
0.41
0.52
0.26
0.07
0.07
0.20
0.11
0.06
0.33
0.07
Ch. Lệch
0.56
0.38
-0.26
-0.05
-0.06
-0.16
-0.09
-0.06
-0.29
-0.05
D
Nh. trên
0.01
0.08
0.02
0.96
0.03
0.90
0.02
0.91
0.01
0.02
Nh. dưới
0.24
0.21
0.12
0.61
0.34
0.34
0.11
0.37
0.17
0.36
Ch. Lệch
-0.23
-0.13
-0.10
0.35
-0.31
0.56
-0.09
0.54
-0.16
-0.34
Câu hỏi
Câu 31
Câu 32
Câu 33
Câu 34
Câu 35
Câu 36
Câu 37
Câu 38
Câu 39
Câu 40
Độ khó, P
0.83
0.56
0.76
0.69
0.86
0.78
0.77
0.59
0.60
0.50
A
Nh. trên
0.01
0.07
0.01
0.01
0.00
0.90
0.02
0.01
0.02
0.00
Nh. dưới
0.13
0.31
0.14
0.08
0.12
0.64
0.06
0.24
0.06
0.16
Ch. Lệch
-0.11
-0.24
-0.13
-0.06
-0.12
0.26
-0.03
-0.23
-0.03
-0.16
B
Nh. trên
0.97
0.93
0.95
0.04
0.00
0.03
0.05
0.10
0.15
0.90
Nh. dưới
0.61
0.20
0.42
0.47
0.18
0.14
0.33
0.29
0.21
0.28
Ch. Lệch
0.36
0.72
0.53
-0.43
-0.18
-0.11
-0.28
-0.19
-0.06
0.63
C
Nh. trên
0.01
0.00
0.00
0.00
1.00
0.03
0.91
0.88
0.05
0.10
Nh. dưới
0.16
0.09
0.14
0.05
0.56
0.10
0.54
0.29
0.23
0.38
Ch. Lệch
-0.15
-0.08
-0.13
-0.04
0.44
-0.07
0.37
0.59
-0.18
-0.29
D
Nh. trên
0.00
0.00
0.03
0.94
0.00
0.03
0.01
0.00
0.77
0.00
Nh. dưới
0.09
0.39
0.28
0.38
0.14
0.09
0.07
0.17
0.47
0.14
Ch. Lệch
-0.08
-0.39
-0.25
0.56
-0.14
-0.06
-0.05
-0.16
0.30
-0.14

Qua kết quả thống kê ở bảng 3 cho thấy có đến 24 câu (60%
)  là các phương án sai  không hiệu quả trong việc phân biệt hai nhóm thí sinh có năng lực khác nhau (bao gồm các câu 1, 2, 4, 5, 6,9, 13, 14, 17, 19, 21, 22, 23, 24, 25 27, 28, 30, 31, 32, 34, 36, 37, 39). Trong đó có nhiều phương án mồi nhử là rất kém như trường hợp câu 1, phương án D là phương án sai nhưng có số thí sinh nhóm trên trả lời sai nhiều hơn so với thí sinh nhóm dưới, hay trường hợp câu 39 ở phương án A hầu như không có sự phân biệt năng lực nhóm trên và nhóm dưới.
Nhận xét: Đề kiểm tra có chất lượng các phương án sai (mồi nhử) là không cao vì có rất nhiều phương án sai mà cả sinh viên kém và sinh viên giỏi đều có tỷ lệ trả lời sai gần nhau. Có nhiều câu cả nhóm trên và nhóm dưới đều rất ít thí sinh chọn, cho thấy những mồi nhử ấy thật sự là mồi nhử kém chất lượng. Sau đánh giá có thể loại bỏ hoặc nhất định cần phải chỉnh sửa mồi nhử trước khi đưa vào ngân hàng câu hỏi thi kiểm tra.

4. Độ phân biệt của câu hỏi kiểm tra

Độ phân biệt của câu hỏi kiểm tra là mức độ khác nhau về kết quả trả lời giữa hai nhóm trên và dưới khi làm bài kiểm tra. Câu hỏi quá khó hoặc quá dễ thì không thể có độ phân biệt tốt. Câu hỏi có chỉ số phân biệt nhỏ hơn hoặc bằng 0 cần được loại bỏ. Theo Ebel (1956) đề xuất rằng các câu hỏi của bài test trong lớp học nên có chỉ số phân biệt bằng 0,30 hoặc cao hơn. Một số tác giả khác cho rằng độ phân biệt nên nằm trong khoảng 0,25-0,75. Tuy nhiên, trong các kỳ kiểm tra có quy mô lớn, việc sử dụng một số câu hỏi kiểm tra quá dễ hoặc quá khó sẽ dẫn đến độ phân biệt của câu hỏi kiểm tra có thể có giá trị quá thấp hoặc quá cao.
Độ phân biệt của từng câu hỏi trong đề kiểm tra được tính toán và đưa vào bảng dưới đây.
Bảng 4. Độ phân biệt câu hỏi kiểm tra
Câu hỏi
Độ PB
Câu hỏi
Độ PB
Câu hỏi
Độ PB
Câu hỏi
Độ PB
1
0.36
11
0.61
21
0.56
31
0.36
2
0.33
12
0.43
22
0.38
32
0.72
3
0.79
13
0.67
23
0.63
33
0.53
4
0.58
14
0.27
24
0.35
34
0.56
5
0.35
15
0.57
25
0.45
35
0.44
6
0.48
16
0.50
26
0.56
36
0.26
7
0.66
17
0.25
27
0.31
37
0.37
8
0.53
18
0.49
28
0.54
38
0.59
9
0.52
19
0.36
29
0.62
39
0.30
10
0.59
20
0.73
30
0.48
40
0.63

Từ số liệu thống kê bảng 4 cho thấy các câu hỏi có độ phân biệt trung bình là 0.49 và rải từ 0.25 đến 0.79. Có 21 câu (chiếm 52.5%) đạt độ phân biệt từ 0.5 trở lên, điều này cho thấy đề kiểm tra có độ phân biệt không cao. Các câu có độ phân biệt từ 0.25 đến dưới 0.5 gồm 19 câu (47.5%). Trong đó có 04 câu có độ phân biệt thấp từ 0.25 đến 0.30 đó là các câu câu 14, 17, 36, 39.
Lưu ý: Với thực tế kết quả làm bài của thí sinh cho thấy ở trường hợp câu 6 mặc dù là một câu nhầm đáp án,  nhưng vẫn thể hiện tương đối chính xác năng lực của nhóm trên và nhóm dưới trong việc lựa chọn phương án C là câu đúng. Vì vậy ta vẫn có thể tính toán được độ phân biệt của câu 6 là 0.48.
Nhận xét: Đề kiểm tra có khá nhiều câu có  mồi nhử kém, có 21 câu (chiếm 52.5%) có độ phân biệt tương đối tốt được thể hiện qua kết quả bài làm, chứng tỏ độ phân biệt của đề kiểm tra là đảm bảo. Tuy nhiên cần chỉnh sửa một số câu có độ phân biệt thấp như câu 14, 17, 36, 39. Riêng câu 6, mặc dù là một câu nhầm đáp án,  nhưng với thực tế kết quả trả lời của thí sinh đã cho thấy đây hoàn toàn là một câu hỏi có độ phân biệt tốt.

5. Hệ số tương quan giữa điểm của câu hỏi kiểm tra với điểm toàn bài kiểm tra

Pt-Biserial là mối tương quan giữa số lượng thí sinh lựa chọn từng phương án trả lời  với tổng điểm của bài thi kiểm tra. Pt-Biserial cần phải có giá trị dương đối với phương án trả lời đúng và có giá trị âm đối với phương án trả lời sai. Với câu hỏi tốt, Pt-Biserial nằm trong khoảng 0.35 và 0.75 (Griffin, 1998). Theo Dương Thiệu Tống-Thống Kê Ứng Dụng Trong Nghiên Cứu Khoa Học Giáo Dục có  mức tương quan dưới 0.20 là tương quan không đáng kể hay tương quan may rủi.
Mối tương quan chặt chẽ giữa số lượng thí sinh lựa chọn từng phương án trả lời với toàn bài kiểm tra góp phần làm tăng độ tin cậy của bài test. Cần giữ lại những câu hỏi kiểm tra có mối tương quan cao và loại bỏ những câu hỏi có mối tương quan thấp hoặc dưới 0 để làm tăng độ tin cậy của đề kiểm tra.
Bảng 5. Hệ số tương quan các câu hỏi kiểm tra
Câu
HSTQ
Pt-Biserial
Câu
HSTQ
Pt-Biserial
Câu
HSTQ
Pt-Biserial
Câu
HSTQ
Pt-Biserial
1
0.30
11
0.49
21
0.52
31
0.43
2
0.42
12
0.43
22
0.37
32
0.55
3
0.62
13
0.54
23
0.50
33
0.52
4
0.54
14
0.39
24
0.36
34
0.48
5
0.36
15
0.55
25
0.44
35
0.56
6
-0.29
16
0.54
26
0.50
36
0.25
7
0.50
17
0.32
27
0.35
37
0.37
8
0.57
18
0.42
28
0.43
38
0.47
9
0.40
19
0.47
29
0.57
39
0.24
10
0.41
20
0.56
30
0.44
40
0.45

Bảng 5.1.  Thống kê HSTQ câu hỏi kiểm tra
Min
Mean
Max
0.24
0.45
0.63

Bảng 5 cho thấy, ngoại trừ trường hợp nhầm đáp án ở câu 6 thì hệ số tương quan giữa điểm của các câu hỏi còn lại với điểm toàn bài kiểm tra đều dương.  Hệ số tương quan (point-biserial) đều lớn hơn hoặc bằng 0.24, cao nhất là 0.63 và hệ số tương quan trung bình là 0.45.
Nhận xét: Với hệ số tương quan trung bình là 0.45 chứng tỏ các câu hỏi có mối tương tốt và quan thuận chiều với điểm chung của bài kiểm tra. Cần loại bỏ câu 6 vì có hệ số tương quan âm,  nên xem lại một số câu có tương quan yếu như các câu: 1, 17, 36, 39.

        6. Độ tin cậy của đề kiểm tra

Độ tin cậy của đề kiểm tra thể hiện được tính theo nhiều công thức khác nhau. Tuy nhiên, độ tin cậy được xác định dựa trên tính ổn định bên trong của đề kiểm tra thường được sử dụng. Kết quả tính toán bằng phần mềm QUEST cho thấy độ tin cậy của đề kiểm tra đạt 0.98. Đây là một đề kiểm tra có độ tin cậy cao.

7. Kết luận 

ü   Có sai sót trong đề kiểm tra và cần phải điều chỉnh đáp án đối với câu 6, nhìn chung đề kiểm tra với các câu hỏi trắc nghiệm có chất lượng không cao.
ü   Đề kiểm tra quá nhiều câu hỏi dễ và thiếu những câu hỏi khó để đánh giá đúng năng lực nhóm thí sinh khá với nhóm thí sinh giỏi. Cần xem xét và điều chỉnh một số câu có độ khó không cao như các câu; 2, 14, 17, 19, 31, 35 (có giá trị độ khó P > 0.80) trước khi chọn vào ngân hàng đề kiểm tra.
ü   Chất lượng của các phương án sai (mồi nhử) không cao vì cả sinh viên kém và sinh viên giỏi đều có tỷ lệ trả lời sai gần nhau. Trong đó có nhiều câu cả nhóm trên và nhóm dưới đều rất ít thí sinh lựa chọn, cho thấy những mồi nhử ấy thật sự là mồi nhử kém và cần phải chỉnh sửa trước khi đưa vào ngân hàng câu hỏi hoặc có thể loại bỏ.
ü   Số câu đạt độ phân biệt tương đối tốt giữa nhóm trên và nhóm dưới chiếm 52.5% tổng số câu hỏi của đề kiểm tra, chứng tỏ độ phân biệt của đề kiểm tra là đảm bảo. Tuy nhiên cần chỉnh sửa một số câu có độ phân biệt thấp như các câu 14, 17, 36, 39.
ü   Riêng câu 6, mặc dù là một câu nhầm đáp án,  nhưng với thực tế kết quả trả lời của thí sinh đã cho thấy đây là một câu hỏi có độ phân biệt tốt và nhiễu tốt nên chỉ cần điều chỉnh đáp án cho phù hợp. Trường hợp câu 14 và câu 17 là 2 câu nên chỉnh sửa vì vừa là câu có độ khó (P) lớn (0.89 và 0.85), độ phân biệt thấp (0.27 và 0.25), độ lệch giữa nhóm trên và nhóm dưới nhỏ hơn 0.1,