Ngân hàng câu hỏi trắc nghiệm là gì

1MỤC LỤC MỞ ĐẦU 1 1. Lý do chọn đề tài 1 2. Mục đích nghiên cứu của đề tài 6 3. Giới hạn, phạm vi nghiên cứu đề tài 6 4. Câu hỏi nghiên cứu và giả thiết nghiên cứu của đề tài 6 5. Khách thể và đối tượng nghiên cứu 6 6. Phương pháp nghiên cứu 6 7. Nhiệm vụ nghiên cứu 7 8. Cấu trúc của luận văn 8 CHƯƠNG 1. CƠ SỞ LÍ LUẬN VÀ THỰC TIỄN 9 1.1. Đo lường và đánh giá trong giáo dục 9 1.1.1. Khái niệm về đo lường và đánh giá trong giáo dục 9 1.1.2. Phân loại các mục tiêu giáo dục và các mức độ của lĩnh vực nhận thức 10 1.1.2.1. Mục tiêu dạy học 10 1.1.2.2. Các mức độ của lĩnh vực nhận thức 10 1.1.3. Đánh giá kết quả học tập của học sinh 12 1.1.3.1. Kết quả học tập của học sinh 12 1.1.3.2. Mục đích của việc đánh giá kết quả học tập 12 1.1.3.3. Cơ sở của việc đánh giá kết quả học tập 13 1.1.4. Phương pháp trắc nghiệm đánh giá kết quả học tập của học sinh 14 1.1.5. Công cụ đo lường kết quả học tập 15 1.1.5.1. Phân loại công cụ đo 15 1.1.5.2. So sánh phương pháp trắc nghiệm khách quan và tự luận 16 1.1.6. Yêu cầu của công cụ đo lường và đánh giá trong giáo dục 18 1.1.7. Đánh giá câu hỏi trắc nghiệm khách quan 18 1.1.7.1. Tiêu chí để đánh giá câu hỏi trắc nghiệm khách quan 18 1.1.7.2. Phân tích câu hỏi trắc nghiệm khách quan 19 1.1.8. Đánh giá bài trắc nghiệm khách quan 21 1.1.9. Lý thuyết khảo thí hiện đại 21 1.1.10. Ngân hàng câu hỏi trắc nghiệm khách quan 24 1.1.11. Quy trình thiết kế câu hỏi trắc nghiệm khách quan 25 1.1.12. Quy trình chuẩn bị và triển khai một kỳ thi trắc nghiệm khách quan tiêu chuẩn hoá 26 1.2. Tình hình nghiên cứu về khoa học đo lường đánh giá trên thế giới và Việt Nam 28 1.3. Công tác đánh giá trong trường THPT hiện nay 30 21.3.1. Những bất cập trong đo lường và đánh giá ở trường THPT 30 1.3.2. Một số giải pháp cho những bất cập 31 1.4. Đổi mới kiểm tra đánh giá trong trường THPT 32 1.4.1. Mục đích đánh giá 32 1.4.2. Quá trình đánh giá 32 1.4.3. Kỹ thuật đánh giá 33 1.4.3.1. Biện pháp đánh giá 33 1.4.3.2. Công cụ đánh giá 33 1.5. Tình hình công tác kiểm tra đánh giá tại trường THPT Bến Tre tỉnh Vĩnh Phúc 34 Kết luận chương 1 36 CHƯƠNG 2. XÂY DỰNG NGÂN HÀNG CÂU HỎI TRẮC NGHIỆM KHÁCH QUAN MÔN TOÁN 12 37 2.1. Chương trình Toán 12 37 2.1.1. Nội dung chương trình 37 2.1.2. Phân phối chương trình 37 2.2. Thực hiện quy trình thiết kế câu hỏi trắc nghiệm khách quan 39 2.2.1. Mục đích đánh giá 39 2.2.2. Mức độ kiến thức dùng để đo lường 41 2.2.3. Xác định nội dung chi tiết bài kiểm tra. Lập bảng trọng số 42 2.2.4. Thiết kế câu hỏi trắc nghiệm khách quan 48 2.2.4.1. Lựa chọn dạng câu hỏi thi 48 2.2.4.2. Viết câu hỏi thi 49 2.2.4.3. Rà soát, chỉnh sửa câu hỏi 49 2.2.5. Lập đề thi 50 2.2.6. Thử nghiệm 50 2.2.6.1. Chọn mẫu 50 2.2.6.2. Tổ chức thi-kiểm tra 51 2.2.7. Nhập số liệu. Phân tích câu hỏi 51 Kết luận chương 2 61 CHƯƠNG 3. KẾT QUẢ NGHIÊN CỨU 62 3.1. Xây dựng ngân hàng câu hỏi trắc nghiệm khách quan môn Toán 12 62 3.2. Sử dụng ngân hàng câu hỏi trắc nghiệm khách quan 76 3.3. Nâng cao kỹ năng ra đề kiểm tra của giáo viên 76 3.4. Đổi mới công tác đánh giá 77 KẾT LUẬN VÀ KHUYẾN NGHỊ 78 TÀI LIỆU THAM KHẢO 80 PHỤ LỤC 82 3 CÁC CHỮ VIẾT TẮT HH: Hình học HK: Học kỳ IRT: Lý thuyết hồi đáp GT: Giải tích GTLN: Giá trị lớn nhất GTNN: Giá trị nhỏ nhất NHCH: Ngân hàng câu hỏi TNKQ: Trắc nghiệm khách quan TL: Tự luận THPT: Trung học phổ thông 4MỞ ĐẦU 1. Lý do chọn đề tài Một trong những mục tiêu của công cuộc cải cách giáo dục ở nước ta là đổi mới giáo dục phổ thông trong đó có đổi mới giáo dục trung học phổ thông. “Mục tiêu của việc đổi mới chương trình giáo dục phổ thông là xây dựng nội dung chương trình, phương pháp giáo dục, sách giáo khoa phổ thông mới nhằm nâng cao chất lượng giáo dục toàn diện thế hệ trẻ, đáp ứng yêu cầu phát triển nguồn nhân lực phục vụ công nghiệp hóa, hiện đại hóa đất nước, phù hợp với thực tiễn và truyền thống Việt Nam; tiếp cận trình độ giáo dục phổ thông ở các nước phát triển trong khu vực và thế giới” [Nghị quyết số 40/2000/Quốc hội 10, ngày 9/12/2000]. Đổi mới chương trình giáo dục phổ thông phải là một quá trình từ đổi mới mục tiêu, nội dung, phương pháp đến phương tiện giáo dục, đánh giá chất lượng giáo dục. Điều này được thể hiện trong Luật giáo dục: “Chương trình giáo dục phổ thông thể hiện mục tiêu giáo dục; quy định chuẩn kiến thức, kỹ năng, phạm vi và cấu trúc nội dung giáo dục phổ thông; phương pháp và hình thức tổ chức hoạt động giáo dục, cách thức đánh giá kết quả giáo dục đối với mỗi môn học ở mỗi lớp và mỗi cấp học của giáo dục phổ thông” [Điều 29, mục II - Luật Giáo dục - 2005]. Vai trò của kiểm tra đánh giá trong tiến trình đổi mới nền giáo dục nhằm nâng cao chất lượng đào tạo đã được khẳng định như một chiến lược, một chính sách giáo dục quốc gia. Thực tiễn công tác kiểm tra, đánh giá ở trường phổ thông hiện nay cho ta thấy tình trạng đánh đồng việc cho điểm với đánh giá năng lực học sinh; có xu hướng chú trọng kiến thức ghi nhớ hơn là rèn kỹ năng và năng lực học sinh; công tác kiểm tra, đánh giá chịu sức ép của thi cử và bệnh thành tích; các kết quả kiểm tra thường để xếp loại học sinh hơn là tìm ra điểm mạnh yếu của học sinh để giúp học sinh tiến bộ và định hướng cho giáo viên trong việc cải tiến nội dung và phương pháp giảng dạy; giáo viên và nhà quản lý còn yếu về năng lực đánh giá trong giáo dục. Các giải pháp cải tiến thực trạng trên đang được tập trung vào các vấn đề lớn là: xây dựng cơ chế đào tạo đội ngũ chuyên gia về đánh giá trong giáo dục và bồi dưỡng năng lực đánh giá cho giáo viên; tạo sự thay đổi mạnh mẽ về nhận thức đối với công tác kiểm tra đánh giá; cải tiến phương pháp kiểm tra đánh giá phù hợp với những định hướng của giáo dục Việt Nam. 5 Đánh giá trong giáo dục là công cụ để xác định năng lực nhận thức người học, điều chỉnh quá trình dạy học. Đổi mới phương pháp dạy học được chú trọng để đáp ứng những yêu cầu mới của mục tiêu giáo dục nên việc kiểm tra, đánh giá phải chuyển biến mạnh theo hướng phát triển trí thông minh, sáng tạo của học sinh, khuyến khích vận dụng linh hoạt các kiến thức, kỹ năng đã học vào những tình huống thực tế, làm bộc lộ khả năng của học sinh. Đánh giá không chỉ thực hiện ở thời điểm cuối cùng của mỗi giai đoạn giáo dục mà trong cả quá trình giáo dục. Hướng tới yêu cầu kiểm tra đánh giá công bằng, khách quan kết quả học tập của học sinh, ngoài phương pháp đánh giá bằng quan sát và vấn đáp, trong phương pháp viết người ta bổ sung các hình thức đánh giá khác như đưa thêm các dạng câu hỏi trắc nghiệm khách quan; chú ý hơn tới việc đánh giá cả quá trình lĩnh hội tri thức của học sinh, quan tâm tới việc tích cực hoá hoạt động học tập của học sinh. Trên cơ sở nắm chắc kiến thức đo lường và đánh giá trong giáo dục, cần tiến hành xây dựng ngân hàng câu hỏi trắc nghiệm [gồm cả câu hỏi TNKQ và TL] chuẩn hoá cho từng môn học của mỗi cấp học hay bậc học. Sử dụng ngân hàng này, học sinh có thể tự ôn tập kiểm tra kiến thức, giáo viên có thể sử dụng để kiểm tra đánh giá học sinh. Để làm được điều này, phải bắt đầu từ việc đào tạo đội ngũ chuyên gia về đánh giá trong giáo dục và bồi dưỡng các kiến thức về khoa học đo lường đánh giá trong giáo dục cho giáo viên ở mọi cấp học, bậc học. Công cuộc đổi mới công tác kiểm tra đánh giá ở THPT hiện nay đang được ngành giáo dục đặc biệt quan tâm, các giáo viên THPT được tập huấn về đổi mới phương pháp kiểm tra đánh giá, tuy nhiên hiệu quả chưa cao. Đa số giáo viên chưa có nhận thức đúng đắn về công tác kiểm tra đánh giá, phần lớn vẫn quan niệm rằng kiểm tra chỉ để cho điểm và xếp hạng học sinh. Các câu hỏi trắc nghiệm khách quan do giáo viên soạn không được phân tích, đánh giá nên các đề kiểm tra do giáo viên soạn cũng chưa có hiệu quả. Các trường THPT có đội ngũ giáo viên đông đảo giảng dạy ở từng bộ môn, nếu có kiến thức chuyên môn sâu sắc cộng với kiến thức về đo lường đánh giá, chắc chắn việc cùng nhau góp phần thành lập ngân hàng câu hỏi trắc nghiệm dùng để kiểm tra đánh giá kết quả học tập của học sinh là việc làm không khó, nhưng sẽ mất nhiều thời gian và công sức. Trước tình hình như vậy, là một giáo viên dạy Toán THPT, tôi chọn đề tài luận văn: “Nghiên cứu, xây dựng ngân hàng câu hỏi trắc nghiệm khách quan dùng để kiểm tra đánh giá kết quả học tập môn Toán lớp 12 tại trường THPT Bến Tre, Vĩnh Phúc”. Kết quả nghiên cứu của luận văn sẽ là tài liệu cần thiết góp 6phần vào quá trình đổi mới phương pháp kiểm tra đánh giá kết quả học tập của học sinh ở bậc THPT, đồng thời nâng cao kỹ năng của giáo viên trong việc thiết kế câu hỏi TNKQ dùng để kiểm tra đánh giá kết quả học tập của học sinh. 2. Mục đích nghiên cứu của đề tài • Nghiên cứu để xây dựng ngân hàng câu hỏi trắc nghiệm khách quan môn Toán lớp 12 dùng trong kiểm tra đánh giá kết quả học tập của học sinh. 3. Giới hạn, phạm vi nghiên cứu • Đề tài nghiên cứu, xây dựng khoảng 400 câu hỏi TNKQ nhiều lựa chọn đưa vào ngân hàng câu hỏi TNKQ dùng để kiểm tra, đánh giá kết quả học tập môn Toán 12 tại trường THPT Bến Tre - Tỉnh Vĩnh Phúc. • Nghiên cứu thử nghiệm sử dụng câu hỏi TNKQ vào kiểm tra đánh giá kết quả học tập môn Toán cho học sinh lớp 12A1 trường THPT Bến Tre, Tỉnh Vĩnh Phúc. 4. Câu hỏi nghiên cứu/ giả thuyết nghiên cứu của đề tài. 4.1. Câu hỏi nghiên cứu • Làm thế nào để xây dựng ngân hàng câu hỏi TNKQ cho môn Toán 12? • Định hướng sử dụng ngân hàng câu hỏi TNKQ trong kiểm tra đánh giá kết quả học tập của học sinh như thế nào? 4.2. Giả thuyết nghiên cứu • Việc xây dựng, thử nghiệm và phân tích câu hỏi trong ngân hàng câu hỏi trắc nghiệm khách quan môn Toán dựa trên cơ sở khoa học đo lường đánh giá sẽ góp phần xây dựng được bộ câu hỏi trắc nghiệm khách quan phục vụ hiệu quả cho công tác kiểm tra đánh giá kết quả học tập môn Toán của học sinh. • Có thể sử dụng các câu hỏi trong ngân hàng câu hỏi TNKQ môn Toán để thiết kế các đề kiểm tra đánh giá kết quả học tập của học sinh. 5. Khách thể và đối tượng nghiên cứu 5.1. Khách thể nghiên cứu • Học sinh lớp 12A1 trường THPT Bến Tre thuộc Sở GD – ĐT Vĩnh Phúc. 5.2 . Đối tượng nghiên cứu • Nghiên cứu xây dựng ngân hàng câu hỏi trắc TNKQ môn Toán 12. 6. Phương pháp nghiên cứu 6.1. Nghiên cứu lý thuyết 7• Nghiên cứu các tài liệu về đường lối giáo dục, phương hướng phát triển giáo dục, các Nghị quyết, chỉ thị của Bộ GD&ĐT về đổi mới chương trình giáo dục phổ thông. • Nghiên cứu các tài liệu về đo lường đánh giá trong giáo dục. • Nghiên cứu bộ sách giáo khoa môn Toán bậc trung học phổ thông chương trình phân ban và không phân ban. 6.2. Nghiên cứu thực nghiệm • Quan sát: quan sát quá trình thực hiện đổi mới kiểm tra đánh giá của giáo viên và học sinh, quá trình thử nghiệm xây dựng ngân hàng câu hỏi TNKQ. • Điều tra: bằng phiếu hỏi và phỏng vấn để tìm hiểu ý kiến của học sinh về môn học và các hình thức kiểm tra đánh giá mà giáo viên đang sử dụng giúp giáo viên kịp thời điều chỉnh phương pháp dạy học và kiểm tra đánh giá. • Thực nghiệm: góp phần đổi mới phương pháp đánh giá ở bậc THPT thông qua việc thiết kế và thử nghiệm công cụ đánh giá: thiết kế câu hỏi TNKQ, đề kiểm tra TNKQ; tổ chức thi-kiểm tra; đánh giá câu hỏi TNKQ, đề TNKQ; thiết lập ngân hàng câu hỏi TNKQ. • Phân tích và tổng kết kinh nghiệm. • Phương pháp chuyên gia: tiếp thu ý kiến của các chuyên gia, đồng nghiệp, học sinh trong quá trình thiết kế, thử nghiệm, phân tích đánh giá câu hỏi TNKQ. 6.3. Phương pháp Toán học • Sử dụng phần mềm SPSS phân tích số liệu thống kê. • Sử dụng phần mềm chuyên dụng Quest, ConQuest. • Sử dụng phần mềm trộn câu hỏi trắc nghiệm McMIX . 7. Nhiệm vụ nghiên cứu • Nghiên cứu cơ sở lý luận để lựa chọn phương pháp xây dựng ngân hàng câu TNKQ dùng trong việc kiểm tra đánh giá kết quả học tập của học sinh. • Xây dựng ngân hàng câu hỏi TNKQ dùng để kiểm tra đánh giá kết quả học tập của học sinh trường THPT Bến Tre - Vĩnh Phúc. 8• Thử nghiệm các câu hỏi TNKQ đã xây dựng để phân tích chọn lựa các câu hỏi có chất lượng. • Đánh giá câu hỏi TNKQ để bổ sung vào ngân hàng câu hỏi TNKQ. 8. Cấu trúc của luận văn Mở đầu Chương 1. Cơ sở lý luận và thực tiễn Chương 2. Xây dựng ngân hàng câu hỏi trắc nghiệm khách quan môn Toán 12 Chương 3. Kết quả nghiên cứu Kết luận và khuyến nghị Tài liệu tham khảo Phụ lục 9CHƯƠNG 1. CƠ SỞ LÍ LUẬN VÀ THỰC TIỄN 1.1. Đo lường và đánh giá trong giáo dục 1.1.1. Khái niệm về đo lường và đánh giá trong giáo dục Đánh giá là một khâu quan trọng trong quá trình giáo dục. Quá trình giáo dục nào mà một con người tham gia cũng nhằm tạo ra những biến đổi nhất định trong con người đó. Muốn biết những biến đổi đó xảy ra ở mức độ nào phải đánh giá hành vi của người đó trong một tình huống nhất định. Sự đánh giá cho phép chúng ta xác định mục tiêu giáo dục được đặt ra có phù hợp hay không và có đạt được hay không, việc giảng dạy có thành công hay không, người học có tiến bộ hay không [16]. - Đo lường [Measurement] là quá trình thu thập thông tin một cách định lượng [số đo] về các đại lượng đặc trưng của đào tạo năng lực [nhận thức, tư duy, kỹ năng và phẩm chất nhân văn] trong quá trình giáo dục [12]. - Kiểm tra/Lượng giá [Assessment] là việc đánh giá năng lực hoặc phẩm chất của sản phẩm đào tạo trong quá trình giáo dục theo các hệ thống quy tắc hoặc tiêu chuẩn nào đó, căn cứ vào các thông tin định tính hoặc định lượng [số đo]. Lượng giá có thể thực hiện đầu quá trình giảng dạy để giúp tìm hiểu và chẩn đoán [diagnostic] về đối tượng giảng dạy, có thể triển khai trong tiến trình [formative] giảng dạy để tạo những thông tin phản hồi giúp điều chỉnh quá trình dạy và học, cũng có thể thực hiện lúc kết thúc [summative] để tổng kết. Trong giảng dạy ở nhà trường, các đo lường trong tiến trình thường gắn chặt với người dạy, tuy nhiên các đo lường kết thúc thường bám sát vào mục tiêu dạy học đã được đề ra, và có thể tách khỏi người dạy. - Đánh giá [Evaluation] là việc căn cứ vào các số đo và các tiêu chí xác định, đánh giá năng lực và phẩm chất của sản phẩm đào tạo để nhận định, phán đoán và đề xuất các quyết định nhằm nâng cao không ngừng chất lượng đào tạo. Đánh giá có thể là định lượng dựa vào các con số hoặc định tính dựa vào các ý kiến và giá trị [16]. Trong giáo dục, có 6 loại đánh giá chính [12]: 1- Đánh giá mục tiêu đào tạo đáp ứng với yêu cầu của kinh tế-xã hội. 2- Đánh giá chương trình/nội dung đào tạo. 3- Đánh giá sản phẩm đào tạo đáp ứng mục tiêu đào tạo. 4- Đánh giá quá trình đào tạo [bao gồm đánh giá chuẩn đoán, đánh giá hình thành, đánh giá tổng kết]. 5- Đánh giá tuyển dụng. 10 6- Đánh giá kiểm định công nhận cơ sở đào tạo. 1.1.2. Phân loại các mục tiêu dạy học và các mức độ của lĩnh vực nhận thức 1.1.2.1. Mục tiêu dạy học Benjamin S. Bloom và các cộng tác viên đã xây dựng một hệ thống phân loại các mục tiêu của quá trình giáo dục. Ba lĩnh vực của các hoạt động giáo dục đã được xác định đó là: + Lĩnh vực nhận thức thể hiện ở khả năng suy nghĩ, lập luận, bao gồm việc thu thập các sự kiện, giải thích, lập luận theo kiểu diễn dịch và quy nạp và sự đánh giá có phê phán. + Lĩnh vực hành động liên quan đến những kỹ năng đòi hỏi sự khéo léo về chân tay, sự phối hợp các cơ bắp từ đơn giản đến phức tạp. + Lĩnh vực cảm xúc liên quan đến những đáp ứng về mặt tình cảm, bao hàm cả những mối quan hệ như yêu ghét, thái độ nhiệt tình, thờ ơ, cũng như sự cam kết với một nguyên tắc và sự tiếp thu các ý tưởng [16]. Mục tiêu dạy học là những gì học sinh cần đạt được sau khi học xong môn học, bao gồm: - Hệ thống kiến thức khoa học và cả phương pháp nhận thức chung. - Hệ thống các kĩ năng. - Khả năng vận dụng vào thực tế. - Thái độ, tình cảm đối với khoa học và xã hội. 1.1.2.2. Các mức độ của lĩnh vực nhận thức Bloom cũng xây dựng nên các cấp độ của các mục tiêu giáo dục trong lĩnh vực nhận thức được chia thành các mức độ hành vi từ đơn giản nhất đến phức tạp nhất như sau: - Biết [Knowledge]: là sự nhớ lại các dữ liệu đã học được trước đây. Điều đó có nghĩa là một người có thể nhắc lại một loạt dữ liệu, từ các sự kiện đơn giản đến các lý thuyết phức tạp, tái hiện trong trí nhớ những thông tin cần thiết. Đây là cấp độ thấp nhất của kết quả học tập trong lĩnh vực nhận thức. - Hiểu [Comprehension]: là khả năng nắm được ý nghĩa của tài liệu. Điều đó có thể thể hiện bằng việc chuyển tài liệu từ dạng này sang dạng khác [từ các từ sang số liệu], bằng cách giải thích tài liệu [giải thích hoặc tóm tắt] và bằng cách ước lượng xu hướng tương lai [dự báo các hệ quả hoặc ảnh hưởng]. Kết quả học tập ở cấp độ này cao hơn so với nhớ, và là mức thấp nhất của việc thấu hiểu sự vật. 11- Vận dụng [Application]: là khả năng sử dụng các tài liệu đã học vào một hoàn cảnh cụ thể mới. Điều đó có thể bao gồm việc áp dụng các quy tắc, phương pháp, khái niệm, nguyên lý, định luật và lý thuyết. Kết quả học tập trong lĩnh vực này đòi hỏi cấp độ thấu hiểu cao hơn so với cấp độ hiểu trên đây. - Phân tích [Analysis]: là khả năng phân chia một tài liệu ra thành các phần của nó sao cho có thể hiểu được các cấu trúc tổ chức của nó. Điều đó có thể bao gồm việc chỉ ra đúng các bộ phận, phân tích mối quan hệ giữa các bộ phận, và nhận biết được các nguyên lý tổ chức được bao hàm. Kết quả học tập ở đây thể hiện một mức độ trí tuệ cao hơn so với mức hiểu và áp dụng vì nó đòi hỏi một sự thấu hiểu cả nội dung và hình thái cấu trúc của tài liệu. - Tổng hợp [Synthesis]: là khả năng sắp xếp các bộ phận lại với nhau để hình thành một tổng thể mới. Điều đó có thể bao gồm việc tạo ra một cuộc giao tiếp đơn nhất [chủ đề hoặc bài phát biểu], một kế hoạch hành động [dự án nghiên cứu], hoặc một mạng lưới các quan hệ trừu tượng [sơ đồ để phân lớp thông tin]. Kết quả học tập trong lĩnh vực này nhấn mạnh các hành vi sáng tạo, đặc biệt tập trung chủ yếu vào việc hình thành các mô hình hoặc cấu trúc mới. - Đánh giá [Evaluation]: là khả năng xác định giá trị của tài liệu [tuyên bố, tiểu thuyết, thơ, báo cáo nghiên cứu]. Việc đánh giá dựa trên các tiêu chí nhất định. Đó có thể là các tiêu chí bên trong [cách tổ chức] hoặc các tiêu chí bên ngoài [phù hợp với mục đích], và người đánh giá phải tự xác định hoặc được cung cấp các tiêu chí [16]. Bảng tóm tắt dưới đây cho biết các mức độ của mục tiêu giáo dục trong lĩnh vực nhận thức. Giáo dục có thể nhằm vào các mục tiêu rất thấp như giúp người học nhận biết sự vật hiện tượng cho đến đánh giá tức là có năng lực phán xét, phê phán... Bảng 1.1. Bảng tóm tắt các mức nhận thức theo quan niệm của Bloom Các mức Nội dung của các mức Đánh giá Phán xét, phê phán, so sánh, phân biệt, biện luận, đưa ra kết luận, hỗ trợ. Tổng hợp Kết hợp, sáng tạo, công thức hoá, thiết kế, sáng tác, xây dựng, sắp xếp lại, sửa chữa. Phân tích Phân biêt, biểu đồ hoá, ước lượng, phân chia, suy luận, sắp xếp trật tự, chia nhỏ ra. Áp dụng Trình diễn, tính toán, giải quyết, điều chỉnh nhỏ, sắp Nhận thức cao 12xếp đơn giản, thao tác, liên hệ. Hiểu Phân loại, giải thích, tổng hợp lại, biến đổi, dự đoán, phân biệt sự khác nhau giữa hai sự vật, hiện tượng hay vấn đề. Nhận biết Định dạng, gọi tên, xác định, mô tả, liệt kê, kết nối, lựa chọn, phác thảo. Nhận thức thấp Ngày nay, nhiều nhà khoa học còn đề nghị bổ sung hai mức nhận thức là khả năng chuyển giao và khả năng sáng tạo. Tuy nhiên, đối với giáo dục Việt Nam thì 6 mức nhận thức trên đủ để đánh giá nhận thức của học sinh [14]. Các công cụ đánh giá có hiệu quả phải giúp xác định được kết quả học tập ở mọi cấp độ nói trên để đưa ra một nhận định chính xác về năng lực của người được đánh giá về chuyên môn liên quan. 1.1.3. Đánh giá kết quả học tập của học sinh 1.1.3.1. Kết quả học tập của học sinh Có thể được hiểu theo hai cách khác nhau về kết quả học tập của học sinh tuỳ theo mục đích của việc đánh giá. • Kết quả học tập được coi là mức độ thành công trong học tập của học sinh, được xem xét trong mối quan hệ với mục tiêu đã xác định, chuẩn kiến thức và kĩ năng cần đạt được và thời gian bỏ ra. • Kết quả học tập cũng được coi là mức độ thành tích đã đạt được của một học sinh so với các bạn cùng học. Đánh giá kết quả học tập là quá trình thu thập và xử lí thông tin về trình độ, khả năng thực hiện mục tiêu học tập của học sinh, về tác động và nguyên nhân của tình hình đó nhằm tạo cơ sở cho những quyết định sư phạm của giáo viên và nhà trường, cho bản thân học sinh để họ học tập ngày một tiến bộ hơn. 1.1.3.2. Mục đích của việc đánh giá kết quả học tập Theo Popham [1999], đánh giá kết quả học tập của học sinh nhằm các mục đích sau: Đối với giáo viên: - Dự đoán những điểm mạnh và điểm yếu của học sinh nhằm để giáo viên có cơ hội giúp học sinh khắc phục những yếu kém của họ và tránh giảng dạy lại hoặc giảng dạy quá kỹ những điều học sinh đã biết. 13- Giám sát quá trình tiến bộ của học sinh và giúp giáo viên thấy được sự tiến bộ đó có tương xứng với mục tiêu đề ra hay không. - Giúp giáo viên có cơ sở cho điểm hay xếp loại học sinh. Đối với học sinh: - Làm cho học sinh hiểu rõ mục tiêu cụ thể của việc học tập. - Giúp học sinh phát huy điểm mạnh và khắc phục những điểm yếu. - Phát huy tính tích cực trong học tập. Đối với nhà quản lý: - Xác định tính hiệu quả của chương trình học tập và cung cấp thông tin phản hồi cho nhà quản lý và những người thiết kế chương trình. - Khẳng định với xã hội về chất lượng hiệu quả giáo dục. - Hỗ trợ việc đánh giá giáo viên thông qua kết quả giảng dạy [29]. 1.1.3.3. Cơ sở của việc đánh giá kết quả học tập Đánh giá kết quả học tập là quá trình đo lường mức độ đạt được của học sinh về các mục tiêu và nhiệm vụ của quá trình dạy học, là mô tả một cách định tính và định lượng: tính đầy đủ, tính đúng đắn, tính chính xác, tính vững chắc của kiến thức, mối liên hệ của kiến thức với đời sống, các khả năng vận dụng kiến thức vào thực tiễn, mức độ thông hiểu, khả năng diễn đạt bằng lời nói, bằng văn viết, bằng chính ngôn ngữ chuyên môn của học sinh v.v và cả thái độ của học sinh trên cơ sở phân tích các thông tin phản hồi từ việc quan sát, kiểm tra, đánh giá mức độ hoàn thành nhiệm vụ được giao, đối chiếu với những chỉ tiêu, yêu cầu dự kiến, mong muốn đạt được của môn học. Quy trình đánh giá gồm những công đoạn sau: 1- Phân tích mục tiêu học tập qua các kiến thức, kĩ năng trang bị cho người học. 2- Đặt ra các yêu cầu về mức độ đạt được các kiến thức, kĩ năng dựa trên những dấu hiệu có thể đo lường hoặc quan sát được. 3- Tiến hành đo lường các dấu hiệu đó để đánh giá mức độ đạt được về các yêu cầu đặt ra, biểu thị bằng điểm số. 4- Phân tích, so sánh các thông tin nhận được với các yêu cầu đặt ra rồi đánh giá, xem xét kết quả học tập của học sinh, xem xét mức độ thành công của phương pháp giảng dạy của giáo viên để từ đó cải tiến, khắc phục những nhược điểm. Điều quan trọng trong đánh giá là quán triệt nguyên tắc vừa sức, bám sát yêu cầu của chương trình. Đánh giá kết quả học tập dựa trên tiêu chí của mục tiêu dạy 14học sẽ nhận những thông tin phản hồi chính xác nhằm bổ sung, hoàn thiện quá trình dạy học. 1.1.4. Phương pháp trắc nghiệm đánh giá kết quả học tập của học sinh Trắc nghiệm là một loại công cụ đo lường, là phép lượng giá cụ thể mức độ khả năng thể hiện hành vi của một người nào đó, trong một lĩnh vực nào đó. Theo tác giả Lâm Quang Thiệp [16], có thể phân chia các phương pháp trắc nghiệm theo các hình thức sau: Về cách thực hiện trắc nghiệm, có thể phân chia các phương pháp trắc nghiệm ra làm ba loại lớn: loại quan sát, loại vấn đáp và loại viết. - Loại quan sát giúp đánh giá các thao tác, các hành vi, các phản ứng vô thức, các kỹ năng thực hành và cả một số kỹ năng về nhận thức, chẳng hạn cách giải quyết vấn đề trong một tình huống đang được nghiên cứu. - Loại vấn đáp có tác dụng tốt để đánh giá khả năng đáp ứng các câu hỏi được nêu một cách tự phát trong một tình huống cần kiểm tra, cũng thường được sử dụng khi sự tương tác giữa người hỏi và người đối thoại là quan trọng, chẳng hạn để xác định thái độ người đối thoại. - Loại viết thường được sử dụng nhiều nhất. Trắc nghiệm viết lại được chia thành hai nhóm chính: + Nhóm các câu hỏi tự luận [essay test]: Các câu hỏi buộc phải trả lời theo dạng mở, thí sinh phải tự mình trình bày ý kiến, đưa ra câu trả lời trong một bài viết để giải quyết vấn đề mà câu hỏi nêu ra. + Nhóm các câu hỏi trắc nghiệm khách quan [objective test]: Đề thi thường bao gồm rất nhiều câu hỏi, mỗi câu nêu lên vấn đề và những thông tin cần thiết để thí sinh có thể lựa chọn câu trả lời cho từng câu một cách ngắn gọn. Về cách chuẩn bị đề trắc nghiệm, có thể phân chia trắc nghiệm tiêu chuẩn hoá và trắc nghiệm dùng ở lớp học. - Trắc nghiệm tiêu chuẩn hoá thường do các chuyên gia trắc nghiệm soạn thảo, thử nghiệm, tu chỉnh, do đó mỗi câu trắc nghiệm được gắn với các chỉ số cho biết thuộc tính và chất lượng của nó [độ khó, độ phân biệt, phản ánh nội dung và mức độ kỹ năng nào], mỗi đề thi trắc nghiệm có gắn với một độ tin cậy xác định, ngoài ra có những chỉ dẫn cụ thể về cách triển khai trắc nghiệm và giải thích kết quả trắc nghiệm. - Trắc nghiệm dùng ở lớp học [hoặc trắc nghiệm do giáo viên soạn] là trắc nghiệm do giáo viên tự viết để sử dụng trong quá trình giảng dạy, có thể chưa được 15thử nghiệm và tu chỉnh công phu, thường chỉ sử dụng trong các kỳ kiểm tra với số lượng học sinh không lớn và không thật quan trọng. Về việc đảm bảo thời gian để làm trắc nghiệm, có thể phân chia loại trắc nghiệm theo tốc độ và trắc nghiệm không theo tốc độ. - Trắc nghiệm theo tốc độ thường hạn chế thời gian, chỉ một ít thí sinh làm nhanh mới có thể làm hết số câu của bài trắc nghiệm, nhằm đánh giá khả năng làm nhanh của thí sinh. - Trắc nghiệm không theo tốc độ thường cung cấp đủ thời gian cho phần lớn sinh có thể kịp suy nghĩ để làm hết bài trắc nghiệm. Về phương hướng sử dụng kết quả trắc nghiệm, có thể phân chia ra trắc nghiệm theo chuẩn [norm-referrenced test] và trắc nghiệm theo tiêu chí [criterion-referrenced test]. - Trắc nghiệm theo chuẩn: là trắc nghiệm được sử dụng để xác định mức độ thực hiện của một cá nhân nào đó so với các các nhân khác cùng làm một bài trắc nghiệm. - Trắc nghiệm theo tiêu chí: là trắc nghiệm được sử dụng để xác định mức độ thực hiện của một cá nhân nào đó so với tiêu chí xác định cho trước. 1.1.5. Công cụ đo lường kết quả học tập 1.1.5.1. Phân loại công cụ đo Các nhà giáo dục phân chia câu hỏi kiểm tra thành hai dạng: - Dạng câu hỏi yêu cầu lựa chọn câu trả lời có sẵn gọi là câu hỏi TNKQ, thường gọi tắt là câu hỏi trắc nghiệm. TNKQ là phương pháp kiểm tra đánh giá kết quả học tập của học sinh bằng hệ thống câu hỏi TNKQ, gọi là “khách quan” vì cách cho điểm khách quan không phụ thuộc vào người chấm. Đề thi sử dụng toàn câu hỏi TNKQ được gọi là đề TNKQ hoặc gọi tắt là đề trắc nghiệm. - Dạng câu hỏi yêu cầu trả lời theo cấu trúc, câu trả lời không có sẵn thí sinh phải viết câu trả lời gọi là câu hỏi trắc nghiệm tự luận, thường gọi tắt là câu hỏi tự luận. Trắc nghiệm tự luận là phương pháp đánh giá kết quả học tập bằng việc sử dụng công cụ đo lường là các câu hỏi đóng hoặc mở, học sinh trả lời dưới dạng bài viết bằng chính ngôn ngữ của học sinh trong một khoảng thời gian đã định trước. Đề thi sử dụng toàn câu hỏi tự luận được gọi là đề trắc nghiệm tự luận hay gọi tắt là đề TL. Trong thực tế ngoài việc sử dụng đề TNKQ và đề TL, người ta còn sử dụng dạng đề hỗn hợp gồm cả câu hỏi TNKQ và câu hỏi tự luận. 16Tuỳ theo mục đích sử dụng mà các câu hỏi cũng được phân chia thành hai nhóm: - Nhóm câu hỏi nhằm mục đích đo lường, đánh giá kiến thức. - Nhóm câu hỏi nhằm mục đích đo lường, đánh giá kỹ năng [14]. Bảng 1.2. Bảng phân loại câu hỏi trắc nghiệm dùng để đo lường và đánh giá trong giáo dục Dạng câu hỏi TNKQ Dạng câu hỏi TL Câu hỏi nhằm mục đích đo lường, đánh giá kiến thức 1. Nhiều lựa chọn. 2. Ghép đôi. 3. Lựa chọn đúng sai. 4. Bộ câu hỏi dựa vào hoàn cảnh cụ thể. 1. Điền câu trả lời: + Tự luận trả lời ngắn. + Tự luận trả lời dài. 2. Tự luận miệng. 3. Tự luận làm ở nhà. Câu hỏi nhằm mục đích đo lường, đánh giá kỹ năng Bộ câu hỏi dựa vào hoàn cảnh cụ thể. Câu hỏi yêu cầu thao tác hay trình diễn. 1.1.5.2. So sánh phương pháp trắc nghiệm khách quan và tự luận Cả hai phương pháp, TNKQ và TL, đều là những phương pháp hữu hiệu để đánh giá kết quả học tập. Cần nắm vững bản chất từng phương pháp và công nghệ triển khai cụ thể để có thể sử dụng mỗi phương pháp đúng lúc, đúng chỗ [14]. Bảng 1.3. So sánh phương pháp TNKQ và TL Đề thi TNKQ Đề thi TL Hình thức câu hỏi / đề thi - Một bộ câu hỏi trong đó mỗi câu hỏi đều kèm theo các phương án trả lời cho sẵn để học sinh lựa chọn phương án trả lời. - Một bộ câu hỏi trong đó mỗi câu hỏi không kèm theo các phương án trả lời mà học sinh phải tự luận để đưa ra câu trả lời. - Khó soạn câu hỏi. - Dễ soạn câu hỏi. - Dễ sai về diễn đạt, nội dung câu hỏi thiếu chính xác [vì có nhiều câu hỏi nên khó rà soát]. - Ít bị sai sót về diễn đạt, nội dung rõ ràng. Mức độ phức tạp khi viết câu hỏi và tổ hợp đề - Dễ chuẩn bị đáp án, hướng dẫn chấm. - Khó xây dựng đáp án, hướng dẫn chấm, xây dựng đáp án phức tạp. 17- Có nhiều câu hỏi nên khó nhớ, dễ bảo mật. - Khó bảo mật đề thi do có ít câu hỏi. - Tốn ít thời gian làm bài, đề kiểm tra có thể phủ toàn bộ chương trình. - Phải dành nhiều thời gian cho học sinh làm bài, khó kiểm tra toàn bộ chương trình. - Tốn nhiều thời gian cho việc in ấn, nhân đề. - Không tốn nhiều công sức in ấn đề. Mức độ phức tạp khi tổ chức thi-kiểm tra - Học sinh khó sử dụng tài liệu, loại trừ tiêu cực trong thi cử. - Học sinh dễ quay cóp sử dụng tài liệu, tiêu cực trong thi cử. Vấn đề đoán mò phương án trả lời đúng - Học sinh có thể đoán mò. - Học sinh không đoán được câu trả lời đúng. Độ tin cậy của đề thi - Độ tin cậy cao hơn. - Độ tin cậy thấp. - Có thể đánh giá đầy đủ các mức nhận thức nếu các câu hỏi được soạn kỹ. - Dễ đánh giá được các mức nhận thức cao [phân tích, tổng hợp, đánh giá]. Tính giá trị của đề thi - Bao quát toàn bộ chương trình nên đánh giá chính xác hơn, có thể có độ giá trị cao hơn. - Không bao quát toàn bộ chương trình nên độ giá trị có thể không cao. Sự phức tạp của việc chấm điểm - Chấm điểm khách quan, công bằng. - Chấm điểm phụ thuộc vào ý chủ quan của người chấm. Mức độ phức tạp khi phân tích, đánh giá câu hỏi thi - Có nhiều phần mềm để phân tích, đánh giá câu hỏi, lựa chọn những câu hỏi có chất lượng. - Khó phân tích, đánh giá câu hỏi. 181.1.6. Yêu cầu của công cụ đo lường và đánh giá trong giáo dục Các đề thi-kiểm tra là công cụ để đo lường thành quả học tập của học sinh. Theo Gronlund [1998] và Linn & Gronlund [1995], bộ công cụ để đo lường đánh giá trong giáo dục cần phải đảm bảo các yêu cầu sau: - Có các khái niệm rõ ràng về các kết quả học tập dự định đánh giá [mong muốn học sinh đạt được mức kiến thức kỹ năng nào, phân bậc các kiến thức và kỹ năng đó, các tiêu chí đánh giá]. - Đề thi-kiểm tra đáp ứng được mục tiêu của kỳ thi-kiểm tra. - Sử dụng các dạng thức thi-kiểm tra khác nhau để loại trừ được nhược điểm của từng dạng thức. - Dạng thức thi-kiểm tra phải phù hợp với các kết quả học tập dự định đo lường, với các thông tin dự định phản hồi với học sinh. - Có số lượng câu hỏi – bài tập thích hợp để đánh giá đầy đủ và chính xác nhận thức của học sinh. - Quy trình thi-kiểm tra phải công bằng với học sinh. - Có các tiêu chí cụ thể để phân tích, lý giải các kết quả đạt được của học sinh. - Có thông tin phản hồi kịp thời cho học sinh, nhấn mạnh những điểm mạnh cần phát huy và điểm yếu cần khắc phục. - Kết quả đo lường phải hỗ trợ cho việc chấm điểm [đối với người học] và hỗ trợ hệ thống báo cáo của nhà trường. 1.1.7. Đánh giá câu hỏi trắc nghiệm khách quan 1.1.7.1. Tiêu chí để đánh giá câu hỏi trắc nghiệm khách quan Để có thể đo được chính xác kết quả học tập của học sinh thì cần phải có bộ công cụ đo lường - các đề thi đảm bảo độ tin cậy và có tính giá trị, điều đó chỉ có thể thực hiện được khi các câu hỏi trắc nghiệm được thiết kế, thử nghiệm và đánh giá bằng khoa học đo lường. Đánh giá câu hỏi trắc nghiệm dựa trên các tiêu chí sau: - Mục đích chính của kỳ thi - kiểm tra và mục tiêu kiểm tra của từng câu hỏi cần được xác định rõ. - Mỗi câu hỏi phải nhằm đạt được mục đích chính của kỳ thi - kiểm tra. - Dạng thức của câu hỏi phải phù hợp với kỳ thi - kiểm tra. - Mỗi câu hỏi phải đảm bảo tính đồng nhất [sự ổn định] và tính độc lập cục bộ [độ phân biệt]. - Các câu hỏi phải được diễn đạt rõ ràng, đúng chính tả. - Mỗi câu hỏi phải đảm bảo tính hợp pháp và phù hợp với văn hoá, đạo đức. 191.1.7.2. Phân tích câu hỏi trắc nghiệm khách quan Phân tích câu hỏi thi là một quá trình xem xét chúng một cách kỹ lưỡng có phê phán. Phân tích câu hỏi thi nhằm làm tăng chất lượng của chúng, loại bỏ những câu quá tồi, sửa chữa những câu hỏi có thể sửa được và giữ lại những câu đáp ứng yêu cầu. Phân tích câu hỏi thi có thể thực hiện theo hai phương pháp: phương pháp chuyên gia và phương pháp định lượng [phân tích số liệu] [14]. Một số thống kê có thể chỉ ra những thuộc tính của câu hỏi thi, qua đó chúng ta biết được câu hỏi tốt và chưa tốt. Các nhà nghiên cứu [Crocker & Algina, 1986] đã phân loại các chỉ số thường được sử dụng trong phân tích định lượng như sau: 1- Những chỉ số mô tả sự phân bố trả lời của các thí sinh về một câu hỏi cụ thể [trung bình cộng và phương sai]. 2- Những chỉ số mô tả mức độ của mối quan hệ giữa sự trả lời của học sinh về một câu hỏi và những tiêu chí cụ thể đang được quan tâm. 3- Những chỉ số liên quan đến phương sai của câu hỏi thi kiểm tra và mối liên hệ với những tiêu chí cụ thể. Một thống kê thường được sử dụng để mô tả các thông số trên câu hỏi thi kiểm tra là giá trị p [độ khó của câu hỏi], phương sai, một số chỉ số phân biệt như hệ số tương quan poin-biserial, hệ số tương quan biserial, hệ số tương quan phi. Mỗi chỉ số thống kê này đều quan trọng với những mục tiêu cụ thể khi phân tích câu hỏi thi kiểm tra. Trong những bài kiểm tra TNKQ dùng trong lớp học, giáo viên thường quan tâm đánh giá câu hỏi qua hai đại lượng độ khó và độ phân biệt của câu trắc nghiệm. Khi soạn xong một câu hoặc một bài trắc nghiệm người soạn chỉ có thể ước lượng độ khó hoặc độ phân biệt của nó bằng cảm tính. Độ lớn của các đại lượng đó chỉ có thể tính được cụ thể bằng phương pháp thống kê sau lần trắc nghiệm thử trên một mẫu thí sinh, dựa vào kết quả thu được từ các câu trắc nghiệm và bài làm của thí sinh. Để xác định độ khó, độ phân biệt thường được tiến hành như sau: chia mẫu học sinh tham gia làm bài kiểm tra thành 3 nhóm : + Nhóm điểm cao H: Từ 25% đến 27% số học sinh đạt điểm cao nhất. + Nhóm điểm thấp L: Từ 25% đến 27% số học sinh đạt điểm thấp nhất. + Nhóm điểm trung bình M: Từ 46% đến 50% số học sinh còn lại. 20 Tuy nhiên, nếu trong lớp học với số lượng học sinh không đông, có thể chỉ chia thành hai nhóm: nhóm điểm thấp [50%] và nhóm điểm cao [50%]. Thống kê độ khó: Độ khó của câu hỏi [giá trị p] bằng tỷ số phần trăm thí sinh làm đúng câu trắc nghiệm đó trên tổng số thí sinh tham gia trả lời câu hỏi. [%]100×++=NNNNpLMH Trong đó: N: tổng số học sinh tham gia làm bài kiểm tra NH: tổng số học sinh ở nhóm giỏi trả lời đúng câu hỏi. NL: tổng số học sinh ở nhóm kém trả lời đúng câu hỏi. NM : tổng số học sinh ở nhóm trung bình trả lời đúng câu hỏi. Các chuyên gia biên soạn câu hỏi TNKQ thường lựa chọn câu hỏi có hệ số p với 0,25 ≤ p ≤ 0,75 đối với các bài trắc nghiệm dùng trong lớp học. Thống kê độ phân biệt: Khi ra một câu hoặc một bài trắc nghiệm cho một nhóm thí sinh nào đó, người ta thường muốn phân biệt trong nhóm ấy những người có năng lực khác nhau [giỏi, trung bình, kém v.v], khả năng của câu trắc nghiệm thực hiện được sự phân biệt ấy được gọi là độ phân biệt. Độ phân biệt của một câu hỏi được tính bằng công thức: NNNDLH−= D: độ phân biệt. [ -1 ≤ D ≤ 1] Các chuyên gia biên soạn câu hỏi TNKQ thường lựa chọn câu hỏi có hệ số phân biệt D với 0,25 ≤ D ≤ 0,75, tuy nhiên cũng có thể xem xét các câu hỏi có D≥0,2. Độ phân biệt của một câu liên quan đến độ khó. Thật vậy, nếu một câu trắc nghiệm dễ đến mức mọi thí sinh đều làm tốt, thì độ phân biệt của nó rất kém, vì mọi thí sinh đều có phản ứng như nhau đối với câu trắc nghiệm đó. Cũng vậy, nếu một câu trắc nghiệm khó đến mức mọi thí sinh đều làm không được, các điểm số đạt được chụm ở phần điểm thấp, thì độ phân biệt của nó cũng rất kém. Muốn có độ phân biệt tốt thì câu trắc nghiệm nên có độ khó ở mức trung bình. 211.1.8. Đánh giá bài trắc nghiệm khách quan Hai đại lượng đặc trưng rất quan trọng để đánh giá chất lượng bài trắc nghiệm đó là độ tin cậy và độ giá trị của bài trắc nghiệm. Độ tin cậy: Trắc nghiệm là một phép đo mà thước đo là bài trắc nghiệm dùng để đo lường một năng lực nào đó của thí sinh. Độ tin cậy của bài trắc nghiệm chính là đại lượng biểu thị mức độ chính xác của phép đo nhờ bài trắc nghiệm [6]. Các phương pháp ước lượng độ tin cậy là: phương pháp thi hai lần; dùng các bài trắc nghiệm tương đương; phương pháp dùng phép tính phương sai; phương pháp phân đôi bài trắc nghiệm; phương pháp Kuder – Richardson [6]. Độ giá trị: Yêu cầu quan trọng nhất của bài trắc nghiệm với tư cách là một phép đo lường trong giáo dục là phép đo ấy đo được cái cần đo. Nói cách khác, phép đo ấy cần phải đạt được mục tiêu đề ra cho nó. Độ giá trị của bài trắc nghiệm là đại lượng biểu thị mức độ đạt được mục tiêu đề ra cho phép đo nhờ bài trắc nghiệm. Các loại tính chất giá trị: giá trị tiên đoán; giá trị so với tiêu chí cho sẵn; giá trị nội dung. Để bài trắc nghiệm có độ giá trị cao, cần phải xác định tỉ mỉ mục tiêu cần đo qua bài trắc nghiệm và bám sát mục tiêu đó trong quá trình xây dựng ngân hàng câu hỏi trắc nghiệm cũng như khi tổ chức triển khai kỳ thi. Nếu thực hiện các quá trình nói trên không đúng thì có khả năng kết quả của phép đo sẽ phản ánh một cái gì khác chứ không phải cái mà ta muốn đo nhờ bài trắc nghiệm. Qua định nghĩa về độ tin cậy và độ giá trị ta có thể thấy rõ mối tương quan giữa chúng. Khi bài trắc nghiệm không có độ thi cậy, tức là phép đo nhờ bài trắc nghiệm rất kém chính xác, thì chúng ta không thể nói đến độ giá trị của nó. Nói cách khác, khi bài trắc nghiệm không có độ tin cậy thì nó cũng không thể có độ giá trị. Đôi khi phép đo nhờ bài trắc nghiệm có thể đo chính xác, nhưng nó đo một cái gì khác chứ không phải cái nó cần đo, trong trường hợp đó thì bài trắc nghiệm có độ tin cậy cao nhưng độ giá trị rất thấp [16]. 1.1.9. Lý thuyết khảo thí hiện đại Người ta thường phân chia lý thuyết trắc nghiệm ra làm hai loại, lý thuyết khảo thí cổ điển và lý thuyết khảo thí hiện đại với việc sử dụng lý thuyết hồi đáp IRT [viết tắt của Item Response Theory]. Trong luận văn này, ta quan tâm đến các vấn đề về lý thuyết khảo thí hiện đại. Lý thuyết hồi đáp được xây dựng trên khoa 22học về xác suất và thống kê. Các công trình quan trọng của lý thuyết này ra đời vào 3 thập niên cuối của thế kỷ vừa qua và đạt được nhiều thành tựu quan trọng, được công nhận và áp dụng phổ biến trong thực tiễn. IRT đã đạt những thành tựu quan trọng nâng cao độ chính xác của trắc nghiệm Lý thuyết hồi đáp bao gồm một hệ thống các định đề liên quan đến từng cá nhân trả lời câu hỏi: 1- Đại lượng cần đo được hình dung như một đường nào đó [thẳng hoặc cong] và kết quả đo lường được mô tả như một điểm đặt trên đường đó. Do đó, đại lượng cần đo được giả thiết là phân bố liên tục. Tuy nhiên, chưa có một dạng phân bố cụ thể nào được chỉ ra. 2- Điều kiện cốt yếu để thí sinh trả lời được câu hỏi được xem xét qua hai đại lượng: - Năng lực của thí sinh [tham biến năng lực hay tham biến thí sinh]. - Độ khó của câu hỏi [tham biến độ khó hay tham biến câu hỏi]. Năng lực của thí sinh và độ khó của câu hỏi là những đại lượng được phân bố trên đường đặc trưng có tính liên tục bao gồm các giá trị của đại lượng cần đo. Thông thường, với các câu hỏi được sử dụng để định cỡ, thì độ khó của các câu hỏi giữ vai trò thang giá trị thể hiện dọc theo đường đặc trưng của đại lượng cần đo. 3- Lý thuyết hồi đáp quan tâm đến xác suất trả lời đúng đối với một câu hỏi. Xác suất đó được thể hiện là một hàm số của năng lực thí sinh và độ khó câu hỏi và có thể có thêm một số tham biến khác [ví dụ: mức độ đoán mò]. Những hàm số xác suất khác nhau [thể hiện mối quan hệ giữa năng lực thí sinh và độ khó câu hỏi] dẫn đến những mô hình lý thuyết hồi đáp khác nhau, ví dụ: mô hình logistic đơn giản – mô hình Rasch một thông số, mô hình Rasch hai thông số, mô hình Rasch ba thông số, mô hình Partial credit. 4- Xác suất trả lời đúng một câu hỏi được biểu thị bằng một hàm số liên quan đến năng lực của thí sinh θ là hàm P[θ] – một đường cong đặc trưng của câu hỏi [Item Characteristic Curves - ICC]. - Đường cong đi lên khi θ tăng [năng lực của thí sinh θ tăng thì xác suất trả lời đúng P[θ] tăng]. - Đường cong nằm giữa hai đường thẳng y=0 và y=1. - Đường cong nhận hai đường thẳng y=0 và y=1 làm tiệm cận ngang. P[θ] tiến đến 0 khi θ → - ∞ và P[θ] tiến đến 1 khi θ→+∞ 5- Xác suất biểu thị hàm số độ khó câu hỏi cho đường cong đặc trưng thí sinh là P[δ] [Person Characteristic Curves - PCC]. 236- Ở trên đã giả thiết xác suất trả lời là một hàm số đặc trưng đơn giản cho năng lực thí sinh. Để IRT có thể áp dụng được với các bài test, các câu hỏi phải là các đơn thứ nguyên [unidimensional]. 7- Nếu năng lực θ của thí sinh i đã được xác định, khi đó sự hiểu biết của thí sinh i để trả lời câu hỏi j không ảnh hưởng đến khả năng có được câu trả lời đúng đối với câu hỏi khác. P[ xij = 1 | θ, xik = 1 ] = P[ xij = 1 | θ ] Nếu điều đó sai, nghĩa là câu trả lời đối với câu hỏi j phụ thuộc vào điều gì đó ngoài năng lực θ. Sự không phụ thuộc này được gọi là sự độc lập cục bộ hay sự độc lập có điều kiện, và là kết quả của tính đơn thứ nguyên. Điều đó có nghĩa là: P[ xij = 1, i=1,2,…,I | θ] = ] | 1 xP[1ij∏==Iiθ 8- Hầu hết các mô hình lý thuyết hồi đáp sử dụng xác suất như một hàm số của sự khác nhau giữa tham số năng lực θ và tham số độ khó δ, tức là θ - δ. Trong mô hình logistic đơn giản [mô hình Rasch]: Xác suất để thí sinh i trả lời đúng câu j là: P[ xij = 1 | θ ] ]exp[1]exp[δθδθ−+−= 9- Các kết quả làm bài của thí sinh [kết quả trả lời câu hỏi] có được sau khi tổ chức làm một bài kiểm tra được sử dụng để tính tham biến năng lực và độ khó. Phương pháp sử dụng để tính các tham biến đó là phương pháp có khả năng tối đa [Maximum likelihood]. 10- Sự tính toán đã cố định những vị trí tương đối của các tham số, nhưng đó không phải là những vị trí thực [ θ - δ ] = [ θ + c ] – [ δ + c] Sai số của sự tính toán này có thể tính được. So với lý thuyết khảo thí cổ điển, lý thuyết khảo thí hiện đại với IRT có những ưu việt quan trọng. Trong lý thuyết trắc nghiệm cổ điển, độ khó và độ phân biệt của các câu hỏi tính được sẽ phụ thuộc vào mẫu thí sinh được chọn để thử nghiệm, và năng lực xác định được của thí sinh phụ thuộc vào đề trắc nghiệm mà thí sinh làm [14]. Với IRT, các tham số đặc trưng của câu hỏi [liên quan đến độ khó, độ phân biệt, mức độ đoán mò] không phụ thuộc mẫu thử để định cỡ câu hỏi [sample-free] 24và năng lực đo được của thí sinh không phụ thuộc vào bài trắc nghiệm cụ thể [item-free] được lấy từ NHCH đã được định cỡ. Theo IRT, mỗi câu hỏi có các thuộc tính đặc trưng cho nó, và mỗi thí sinh ở một trình độ nào đó có một năng lực tiềm ẩn xác định, các thuộc tính và đặc trưng này không phụ thuộc vào phép đo, hoặc nói cách khác, chúng là các bất biến [invariance]. IRT cho phép tính các hàm thông tin của từng câu hỏi và của cả đề trắc nghiệm và sai số chuẩn của phép đo theo các mức năng lực tiềm ẩn chứ không phải một sai số chuẩn trung bình chung cho cả phép đo như trắc nghiệm cổ điển. Từ đó có thể thiết kế một đề trắc nghiệm cho phép đo chính xác khoảng năng lực nào mà ta mong muốn. Hơn nữa, IRT cho phép thiết kế các đề trắc nghiệm với mức độ tương đương rất cao để đảm bảo các đề trắc nghiệm khác nhau có thể cho cùng một kết quả như nhau khi đánh giá năng lực của một thí sinh nào đó. Áp dụng lý thuyết khảo thí hiện đại, ứng dụng công nghệ thông tin, hiện nay có rất nhiều các phần mềm toán học có thể giúp ta nhanh chóng phân tích câu hỏi trắc nghiệm. Hiện nay chúng ta thường sử dụng phần mềm Quest [phiên bản mới có tên ConQuest] được soạn thảo ở Úc. Phần mềm này có thể tính toán cho ra kết quả về độ khó, độ phân biệt của câu trắc nghiệm và khả năng của người làm trắc nghiệm, phân tích sự phù hợp của câu trắc nghiệm và của người làm trắc nghiệm, đồng thời cũng có thể chỉ ra kết quả bất thường của người làm câu trắc nghiệm nếu có. Hiện nay ở Việt Nam có chương trình VITESTA là một chương trình hỗ trợ phương pháp trắc nghiệm được phát triển bởi Công ty trách nhiệm hữu hạn EDTECHDP. Đây là một chương trình phân tích đánh giá câu hỏi thi, soạn đề thi, chấm thi trắc nghiệm v.v được xây dựng dựa trên lý thuyết hồi đáp IRT. Các thành tựu quan trọng đó của IRT đã nâng độ chính xác của phép đo lường trong giáo dục lên một tầm cao mới về chất so với các lý thuyết đo lường cổ điển. Từ thành tựu tổng quát đó của IRT, người ta có thể đưa ra các quy trình để xây dựng NHCH [item banking], phân tích các kết quả TNKQ để hiệu chỉnh NHCH, chủ động thiết kế các đề trắc nghiệm theo các mục đích đặt ra [16]. 1.1.10. Ngân hàng câu hỏi trắc nghiệm khách quan Ngân hàng câu hỏi TNKQ là một tập hợp các câu hỏi TNKQ và đáp án. Nó sẽ là một công cụ để đổi mới phương pháp dạy học, kiểm tra đánh giá và quản lý chất lượng đào tạo. 25- Trong giảng dạy: giáo viên căn cứ vào NHCH để thực hiện phương pháp dạy học tích cực trong quá trình dạy thu thập thông tin, dạy năng lực xử lý thông tin và năng lực giải quyết vấn đề. - Trong học tập: giúp học sinh xác định kiến thức chuẩn môn học mình cần phải nắm; giúp học sinh tự học và tự kiểm tra nhận thức của mình, mở rộng kiến thức qua các tài liệu tham khảo khác nhau; giúp học sinh có thể học nhóm, trao đổi thảo luận trên cơ sở các câu hỏi có sẵn trong ngân hàng. - Trong kiểm tra đánh giá: sử dụng ngân hàng câu hỏi TNKQ có sẵn giúp tiện lợi cho việc ra đề thi kiểm tra; hạn chế tiêu cực trong thi cử. - Sử dụng ngân hàng câu hỏi TNKQ cũng là giải pháp đa dạng hoá các loại hình đào tạo [tại chức, từ xa, e-learning v.v], nhằm mở rộng quy mô đào tạo mà vẫn giữ vững và từng bước nâng cao chất lượng đào tạo [12]. 1.1.11. Quy trình thiết kế câu hỏi trắc nghiệm khách quan Bước 1: Xác định mục đích sử dụng đề thi-kiểm tra - Sử dụng vào việc theo dõi, giám sát kết quả học tập. - Để phân loại học sinh. - Để tuyển sinh v.v. Bước 2: Xác định cấu trúc đo - Cấu trúc kết quả học tập. - Cấu trúc năng lực. Bước 3: Chọn mẫu - Đánh giá tất cả học sinh. - Đánh giá một mẫu đại diện [kỹ thuật chọn mẫu: ngẫu nhiên đơn giản, phân nhóm, phân tầng v.v]. Bước 4: Xác định nội dung chi tiết của bài thi-kiểm tra STT Các nội dung cần đánh giá Biết Hiểu Vận dụng Phân tích Tổng hợp Đánh giá 1 2 ...

Video liên quan

Chủ Đề