Khoa học đo lường
trong giáo dục có thể xem như bắt đầu cách đây khoảng một thế kỷ
(Thorndike,1904). Ở châu Âu và đặc biệt là ở Mỹ, lĩnh vực khoa học này phát triển
mạnh vào thời kỳ trước và sau thế chiến thứ hai với vài dấu mốc quan trọng như:
Trắc nghiệm trí tuệ Stanford - Binet xuất bản năm 1916, bộ trắc nghiệm thành quả
học tập tổng hợp đầu tiên Stanford Achievement Test ra đời vào 1923. Cho đến
1953 việc chấm bài trắc nghiệm đã được thực hiện bằng máy của IBM, kế đến là việc
thành lập National Council on Measurement in Education (NCME) vào thập niên
1950 và ra đời Educational Testing Services (ETS) năm 1947, sau đó là American
Testing Service (ACT). [7] Từ đó đến nay khoa học về đo lường trong tâm lý và giáo dục vẫn tồn
tại, phát triển như là tất yếu của sự phát triển giáo dục. Thực tế là khoa học
đo lường trong giáo dục ngày càng đầy đủ hơn các cơ sở khoa học để điều chỉnh
những gì còn thiếu sót và khuyết điểm.
Ở một khía cạnh khác,
cùng với sự phát triển của công nghệ tính toán, các lý thuyết về đo lường trong
giáo dục (cũng như trong tâm trắc học) cũng phát triển rất nhanh bao gồm Lý thuyết Trắc nghiệm cổ điển
(Classical Test theory - CTT), Lý thuyết Ứng đáp Câu hỏi (Item Response
Theory - IRT), trong đó có mô hình Rasch. Các lý thuyết
này phát triển từ chính các nhu cầu của việc đo lường trong giáo dục[12]. Sự ra đời của các lý thuyết này đã đánh dấu những thành tựu quan
trọng trong việc nâng cao độ chính xác của trắc nghiệm, là cơ sở quan trọng cho
việc nghiên cứu các phản ứng của con người trong các khoa học hành vi. Vì vậy
mà ở các nước phát triển, đặc biệt là Mỹ, các công ty trắc nghiệm ETS, ACT áp dụng
IRT cho các kỳ thi quan trọng để có kết quả xét tuyển vào đại học (SAT, ACT),
sau đại học (GRE, GMAT…), tuyển dụng giáo viên (NTE); Viện Ý kiến công chúng Mỹ
Gallup thiết kế các bản hỏi dùng để thăm dò ý kiến công chúng; các doanh nghiệp
thiết kế công cụ để thăm dò ý kiến khách hàng v.v... Ở Mỹ, trắc nghiệm thực sự
trở thành một ngành công nghiệp lớn.[7]
Khoa học về đo lường
và đánh giá trong giáo dục ở nước ta trước đây trong tình trạng khá lạc hậu và
chậm phát triển. Trước năm 1975, ở Miền Nam chỉ có một vài cá nhân được đào tạo
về khoa học này từ các nước phương Tây. Trong số đó, điển hình có giáo sư Dương
Thiệu Tống (1925-2008) là người đã đưa lý thuyết testing ứng dụng vào ngành
giáo dục Việt Nam nhưng không thành công. Sau đó ông chỉ áp dụng ngân hàng câu
hỏi vào việc thi kiểm tra đánh giá và đặc biệt áp dụng vào việc thi tuyển sinh
đại học. Trường Đại học áp dụng mô hình thi trắc nghiệm đầu tiên ở nước ta là
trường Đại học Đà Lạt. Vào năm 1974, kỳ thi tú tài lần đầu tiên được tổ chức ở
Miền Nam bằng phương pháp TNKQ. Vào những năm sau 1975, ở miền Bắc cũng có một
số cán bộ nghiên cứu về khoa học đo lường trong tâm lý. Đến năm 1993, Bộ GD
& ĐT đã mời một số chuyên gia nước ngoài để phổ biến về khoa học này, đồng
thời cử cán bộ ra nước ngoài học tập. Từ đó một số trường đại học có tổ chức
các nhóm nghiên cứu áp dụng các phương pháp đo lường trong giáo dục để thiết kế
các công cụ đánh giá, soạn thảo các phần mềm hỗ trợ, mua máy quét quang học
chuyên dụng (OMR) để chấm thi. Kỳ thi tuyển đại học thí điểm được tổ chức tại
trường Đại học Đà Lạt vào tháng 7 năm 1996 bằng phương pháp TNKQ. Kỳ thi này có
7200 thí sinh dự tuyển, 2 loại đề TNKQ và TL được sử dụng để thí sinh tự chọn.
Có khoảng 70% lượt thí sinh chọn đề TNKQ, bài thi được chấm bằng máy Opscan-7,
trong khoảng 60 trường hợp vi phạm kỷ luật thi do quay cóp thì chỉ có 4 thí
sinh từ nhóm làm đề TNKQ. [6]
Từ sau năm 1997 các hoạt động đổi mới phương pháp đo lường
và đánh giá trong giáo dục ở các trường đại học lắng xuống. Cho đến mùa thi tuyển
đại học năm 2002 Bộ Giáo dục và Đào tạo tổ chức kỳ thi tuyển đại học “3 chung”.
Đến năm 2003, Bộ Giáo dục và Đào tạo đã thành lập “Cục Khảo thí và Kiểm định chất
lượng” để cải tiến việc thi cử và đánh giá chất lượng các trường đại học, và đã
dùng phương pháp trắc nghiệm khách quan để làm đề thi tuyển đại học cho môn Tiếng
Anh vào mùa thi 2005-2006. Bắt đầu từ năm học 2006 – 2007, song song với việc đổi
mới phương pháp giảng dạy và học tập, Bộ GD&ĐT đã có chủ trương đổi mới quá
trình KTĐG KQHT của người học. Hiện nay, một vấn đề nhận được rất nhiều sự quan
tâm của dư luận cũng như giới học thuật đó chính là vấn đề thay đổi như thế nào
để có một kỳ thi quốc gia đảm bảo tính trung thực, ít tốn kém, giảm áp lực lên
xã hội và hiệu quả nhưng vẫn đảm bảo đánh giá đúng năng lực người học.