Trước khi thấy đề thi [môn tiếng Anh] của năm 2019 trong vài ngày tới, tôi nhắc lại một điểm rất đáng lưu ý trong đề thi tốt nghiệp THPT quốc gia năm 2018.


Đề thi năm 2018 bao gồm 50 câu hỏi dạng trắc nghiệm [4 lựa chọn] và chia ra 24 mã đề. Ban đầu, tôi cứ nghĩ là chỉ có 1 đề và các mã đề khác nhau thì thứ tự câu hỏi [hoặc cả các lựa chọn] được trộn lại để tránh việc thí sinh xem bài nhau.

Tuy nhiên, khi tôi xem kĩ một chút thì phát hiện một số mã đề (401424) có cả những câu hỏi khác nhau hoàn toàn. Xem qua thì thấy 24 mã đề của kì thi năm 2018 được tạo ra từ một ngân hàng đề thi [hoặc từ nhiều đề thi] chứ không phải từ 1 đề thi.

Tôi ví dụ, đề thi có một phần 12 câu hỏi ngữ pháp và từ vựng [theo kiểu truyền thống]. Đối với phần này, những người ra đề soạn một ngân hàng vài chục câu hỏi, sau đó phân chia ra mỗi mã đề nhận 12 câu hỏi. Cụ thể, mã đề 401 sẽ có 12 câu, mã đề 402 cũng có 12 câu và mã đề 403 có 12 câu khác nữa. Có một số mã đề có câu hỏi trùng nhau, một số khác. Thứ tự các câu hỏi này cũng sẽ khác nhau và có cả sự trộn lẫn giữa các câu hỏi, lần lượt như thế cho hết 24 mã đề. Thông thường thì dùng phần mềm trộn đề, hoặc nếu đủ nhân lực và thời gian thì làm thủ công vẫn được.

Một ví dụ khác, trong tổng số 24 mã đề nêu trên, có tất cả 12 [trích] đoạn văn bản từ một số giáo khoa khoa học, sách luyện thi và cả báo chí. Mỗi đề sẽ có 3 đoạn được sử dụng, bao gồm:

  1. The Official Cambridge Guide to IELTS (P. Cullen, Amanda French & Vanessa Jakeman)
  2. Select Readings Intermediate (Linda Lee & Erik Gundersen)
  3. Ready for Advanced (Roy Norris, Amanda French & Miles Hordern)
  4. IELTS Testbuilder 2 (Sam McCarter)
  5. Life (John Hughes, Helen Stephenson & Paul Dummett)
  6. https://www.newscientist.com
  7. Skillful Reading & Writing 4 (Mike Boyle & Lindsay Warwick)
  8. Reading Academic English (Judy Rapoport, Ronit Broder & Sarah Feingold)
  9. Advanced Reading Power (Beatrice S. Mikulecky & Linda Jeffries)
  10. Eye on Editing 2 (Royce S. Cain)
  11. Expert First (Jan Bell & Roger Gower)
  12. New English File Advanced (Will Maddox)

Tôi không biết, người ra đề có đảm bảo chất lượng ngôn ngữ của 12 đoạn trích trong bài thi hay không?


Bỏ qua yếu tố chất lượng của ngân hàng đề thi này [mà thật ra càng nói thì càng thấy sai], tôi muốn nói một chút về tính công bằng trong đề thi.

Việc tạo ra một đề thi từ một ngân hàng đề có sẵn là rất phổ biến trong lĩnh vực khảo thí. Nhiều trường hợp, 2 thí sinh cùng thi TOEFL® iBT vào cùng một đợt thi (trùng ngày, trùng giờ), nhưng 2 người này sẽ gặp những câu hỏi khác nhau. Đối với phiên bản thi trên máy tính (computer-delivered) của bài thi IELTS™ thì chuyện “2 người – 2 đề” chắc chắn diễn ra, cũng tương tự đối với các bài thi SAT® hay GRE® hay GMAT™ nếu thi trên máy vi tính.

Đây là một điểm hạn chế, rất cơ bản. Những đề thi khác nhau [dù dựa trên cùng một ngân hàng đề] cũng không thể nào đánh giá kiến thức và kĩ năng của thí sinh chính xác như nhau được. Người ra đề lấy gì để đảm bảo rằng 2 câu hỏi cùng dạng, cùng điểm ngữ pháp, nhưng từ vựng khác nhau trong 2 đề thi có khả năng định lượng [và định tính] kiến thức và kĩ năng của thí sinh một cách chính xác như nhau.

Chúng ta chắc đã từng nghe được câu nói “nếu tôi được làm đề của anh thì điểm của tôi có thể đã cao hơn rồi“. Cho nên, cùng một đợt thi, tốt nhất là tất cả các thí sinh làm chung 1 đề [và không xáo trộn thứ tự câu hỏi gì cả], chỉ có như vậy thì sự công bằng mới đạt [tương đối] cao nhất.

Đối với những bài chuẩn hóa [quốc tế] như TOEFL® iBT hay IELTS (computer-delivered), dĩ nhiên là cũng không có tính công bằng ở khía cạnh này. Tuy nhiên, cái hay là những bài thi này được tổ chức liên tục mỗi tuần, thậm chí có khi được tổ chức 2 lần/ tuần vào mùa cao điểm. Chính vì điều này, nếu thí sinh cảm thấy không có sự công bằng, thấy đề thi đợt này khó quá thì có thể thi lại vào đợt tiếp theo [ngay vào tuần sau]. Thi cho đến khi nào thấy đề thi công bằng và đạt đủ điểm thì thôi. Cơ hội để cả thí sinh và tổ chức khảo thí sửa sai là rất lớn; và khi cơ hội sửa sai rất lớn thì sai sót cũng dễ dàng được chấp nhận. Thực chất, điểm TOEFL® iBT hay IELTS cũng không quá quan trọng. Nó chỉ là một trong rất nhiều tiêu chí của hồ sơ xin nhập học hay xin thị thực v.v. và thậm chí có thể xin “nợ” điểm để trả sau cũng được.

Với những kì thi như trên, hoặc những kì thi mà điểm số không phải là chuyện quá hệ hệ trọng và cơ hội sửa sai cho cả thí sinh lẫn tổ chức ra đề là dễ dàng thì việc sử dụng một ngân hàng đề thi để xáo trộn, và sử dụng cho mỗi đợt thi là điều bình thường.

Tuy nhiên, đối với bài thi tốt nghiệp THPT quốc gia, thì đây là chuyện hoàn toàn khác. Kết quả bài thi THPT quốc gia được dùng để xét tuyển vào đại học. Ở một nước mà chuyện vào đại học là điều còn rất “hệ trọng” [dù chỉ cần trường đó hơi có chút danh tiếng], thì phải đảm bảo tính công bằng ở đề thi, càng cao càng tốt. Một năm mới có một kì thi THPT quốc gia; cho nên, rất mất nhiều thời gian cho việc sửa sai (điều chắc chắn xảy ra) ở cả người tổ chức thi lẫn thí sinh.

Hồi tôi học phổ thông, tôi còn nhớ câu nói “nhiều khi 1/4 điểm cũng thay đổi cuộc đời“. Quãng thời gian một năm [tuổi trẻ] là rất dài đối với một thí sinh trượt đại học vì xui xẻo gặp phiên bản đề thi khó. Ở một đất nước mà thành tích học tập luôn được đặt nặng quá mức, thì việc tạo ra nhiều phiên bản đề thi cho một kì thi quan trọng như kì thi THPT là chuyện… (dấu ba chấm).


Tôi đưa thêm một ví dụ, đề thi năm THPT quốc gia năm 2018 có phần câu hỏi chọn từ có nghĩa gần giống (closet meaning) với từ gạch chân trong câu. Ở đây có một ngân hàng 8 câu hỏi, chia cho 24 mã đề, mỗi mã đề 2 câu, như bên dưới:

Nếu so sánh theo khung tham chiếu châu Âu, các từ gạch chân ở đây không có sự tương về đồng giá trị và nếu phân tích trong ngữ liệu (corpus) thì tần suất xuất hiện cũng rất khác nhau. Cụ thể, trong ngữ liệu Anh – Mỹ, mỗi từ có tần suất xuất hiện như sau: sophisticated (13,090 lần), disseminate (785 lần), prevalence (6,931 lần), contaminate (581 lần), postpone (1,497 lần), ignite (1,196 lần), initiate (3,399 lần), sound (85,778 lần) thì có thể kết luận rằng độ khó và sự phổ biến của những từ này rất khác nhau.

Có công bằng không hai thí sinh có trình độ ngang nhau đi thi, trong đó, một thí sinh gặp phải cặp từ postpone (1,497 lần) và ignite (1,196 lần); và thí sinh kia khác gặp cặp từ initiate (3,399 lần) và sound (85,778 lần).

Điều cần thiết nhất cho thí sinh lúc này là sự may mắn.


Tham khảo bài viết


(*) nếu cho rằng sử dụng nhiều đề thi sẽ giúp tránh việc thí sinh xem bài lẫn nhau thì điều này thể hiện rằng kỷ luật phòng thi đang rất yếu kém và khâu tổ chức thi [nói chung] có vấn đề.