Điểm thi của sinh viên cho chúng tôi biết thêm về cộng đồng Họ sống trong những gì họ biết

Hàng năm, các nhà hoạch định chính sách trên khắp Hoa Kỳ đưa ra quyết định thay đổi cuộc sống dựa trên kết quả của các bài kiểm tra tiêu chuẩn. Những quyết định cao này bao gồm, nhưng không giới hạn, thăng cấp học sinh lên cấp lớp tiếp theo, học sinh đủ điều kiện tham gia các khóa học nâng cao, đủ điều kiện để tốt nghiệp trung học và giáo viên. Ở các bang 40, giáo viên được đánh giá một phần dựa trên kết quả từ các bài kiểm tra tiêu chuẩn của học sinh, cũng như các quản trị viên trường học ở hầu hết các bang 30.

Tuy nhiên, nghiên cứu cho thấy rằng kết quả của các bài kiểm tra tiêu chuẩn không phản ánh chất lượng giảng dạy, như họ dự định. Các đồng nghiệp và tôi đã tiến hành nghiên cứu trong New Jersey, Connecticut, Massachusetts, IowaMichigan.

Kết quả cho thấy có thể dự đoán tỷ lệ phần trăm học sinh sẽ đạt điểm thành thạo hoặc cao hơn trong một số bài kiểm tra tiêu chuẩn. Chúng ta có thể làm điều này chỉ bằng cách xem xét một số đặc điểm quan trọng của cộng đồng, thay vì các yếu tố liên quan đến chính các trường, như tỷ lệ giáo viên-học sinh hoặc chất lượng giáo viên.

Điều này làm tăng khả năng có những lỗ hổng nghiêm trọng được xây dựng trong các hệ thống trách nhiệm giáo dục và các quyết định về các nhà giáo dục và học sinh được đưa ra trong các hệ thống đó.

Kiểm tra tiêu chuẩn

Điểm của học sinh trong các bài kiểm tra tiêu chuẩn bắt buộc đã được sử dụng để đánh giá các nhà giáo dục, học sinh và trường học Hoa Kỳ kể từ khi Tổng thống George W. Bush ký Không có đứa trẻ nào bị bỏ lại phía sau (NCLB) trong 2002.

Mặc dù nhiều quốc gia 20 trước đây đã tiến hành thử nghiệm trạng thái ở một số cấp lớp bởi các 1990 muộn, NCLB đã bắt buộc thử nghiệm tiêu chuẩn hàng năm ở tất cả các bang 50. Nó yêu cầu các bài kiểm tra toán học và nghệ thuật tiếng Anh chuẩn hóa từ lớp ba đến lớp tám và một lần ở trường trung học. Các quan chức giáo dục tiểu bang cũng phải thực hiện một bài kiểm tra khoa học tiêu chuẩn ở lớp bốn, lớp tám và một lần ở trường trung học.


đồ họa đăng ký nội tâm


Chính quyền Obama đã mở rộng thử nghiệm tiêu chuẩn hóa thông qua các yêu cầu trong Cuộc đua đến chương trình tài trợ hàng đầu và bằng cách tài trợ cho việc phát triển hai thử nghiệm tiêu chuẩn hóa quốc gia liên quan đến Các tiêu chuẩn chung của Tiểu bang: Hiệp hội đánh giá cân bằng thông minh hơn (SBAC) và Quan hệ đối tác để đánh giá sự sẵn sàng của trường đại học và nghề nghiệp (PARCC).

Bốn mươi lăm tiểu bang ban đầu chấp nhận Lõi chung dưới một số hình thức. Khoảng 20 hiện là một phần của tập đoàn PARCC hoặc SBAC. Các phần chính của Cuộc đua đến các ứng dụng hàng đầu yêu cầu các tiểu bang sử dụng kết quả kiểm tra của học sinh để đánh giá giáo viên và hiệu trưởng.

Dự đoán điểm số

đã được thiết lập tốt các biến số ngoài trường học, nhân khẩu học cộng đồng và cấp độ gia đình ảnh hưởng mạnh mẽ đến thành tích của học sinh trong các bài kiểm tra tiêu chuẩn quy mô lớn.

Ví dụ, thu nhập gia đình trung bình là một yếu tố dự báo mạnh mẽ về kết quả SAT. Các yếu tố khác liên quan mạnh mẽ đến thành tích trong các bài kiểm tra tiêu chuẩn của tiểu bang bao gồm trình độ học vấn của phụ huynh, tỷ lệ phụ huynh đơn độc trong cộng đồng nhà trường và tỷ lệ gia đình sống trong nghèo đói trong cộng đồng.

Chúng tôi quyết định xem liệu chúng tôi có thể dự đoán điểm kiểm tra tiêu chuẩn dựa trên các yếu tố nhân khẩu học liên quan đến cộng đồng nơi sinh viên sống hay không. Bằng cách xem xét ba đến năm biến số nhân khẩu học của cộng đồng và gia đình từ dữ liệu Điều tra dân số Hoa Kỳ, chúng tôi đã có thể dự đoán chính xác tỷ lệ phần trăm học sinh đạt điểm thành thạo hoặc cao hơn trong điểm kiểm tra tiêu chuẩn cho các lớp ba thông qua 12. Những dự đoán này được thực hiện mà không cần xem xét các yếu tố dữ liệu của khu học chánh như quy mô trường học, kinh nghiệm của giáo viên hoặc chi tiêu của học sinh.

Các mô hình của chúng tôi có thể xác định mức độ một biến số cụ thể ảnh hưởng đến điểm số của học sinh. Điều đó cho phép chúng tôi xác định các đặc điểm nhân khẩu học quan trọng nhất vì chúng liên quan đến kết quả kiểm tra. Ví dụ, bằng cách chỉ nhìn vào một đặc điểm - tỷ lệ phần trăm các gia đình trong một cộng đồng nhất định sống trong nghèo đói - chúng ta có thể giải thích gần như 58 phần trăm điểm kiểm tra trong môn nghệ thuật tiếng Anh lớp tám.

Nghiên cứu gần đây nhất của chúng tôi khám phá ba năm điểm kiểm tra từ lớp sáu đến tám trong hơn các trường 300 New Jersey. Chúng tôi đã xem xét tỷ lệ gia đình trong cộng đồng có thu nhập trên US $ 200,000 một năm, tỷ lệ người dân trong cộng đồng nghèo và tỷ lệ người trong cộng đồng có bằng cử nhân. Chúng tôi thấy rằng chúng tôi có thể dự đoán tỷ lệ phần trăm học sinh đạt điểm thành thạo hoặc cao hơn trong 75 phần trăm các trường chúng tôi đã lấy mẫu.

Một nghiên cứu trước đó tập trung vào điểm kiểm tra của lớp năm ở New Jersey đã dự đoán kết quả chính xác cho phần trăm trường học của 84 trong thời gian ba năm.

Đánh giá thông minh hơn

Rõ ràng, điều này không có nghĩa là tiền quyết định số lượng sinh viên có thể học. Đó không thể là sự thật. Trên thực tế, kết quả của chúng tôi chứng minh rằng các bài kiểm tra tiêu chuẩn không thực sự đo lường số lượng học sinh học, hoặc giáo viên dạy tốt như thế nào, hoặc các nhà lãnh đạo trường học hiệu quả dẫn dắt trường học của họ như thế nào. Các xét nghiệm như vậy là các công cụ cùn rất dễ đo lường các yếu tố ngoài trường học.

Mặc dù một số người đề xuất đánh giá tiêu chuẩn cho rằng điểm số có thể được sử dụng để đo lường sự cải thiện, chúng tôi thấy rằng đơn giản là có quá nhiều tiếng ồn. Sự thay đổi điểm thi từ năm này sang năm khác có thể được quy cho sự tăng trưởng bình thường trong năm học, cho dù học sinh có một ngày tồi tệ hay cảm thấy mệt mỏi, mệt mỏi, trục trặc máy tính hoặc các yếu tố không liên quan khác.

Theo các hướng dẫn kỹ thuật được công bố bởi những người tạo ra các đánh giá tiêu chuẩn, không có bài kiểm tra nào hiện đang được sử dụng để đánh giá hiệu quả của giáo viên hoặc quản trị viên trường học hoặc thành tích học sinh đã được xác nhận cho những sử dụng đó. Ví dụ, không có nghiên cứu nào của PARCC, như do PARCC cung cấp, giải quyết những vấn đề này trực tiếp. Các bài kiểm tra đơn giản là không được thiết kế để chẩn đoán học tập. Chúng chỉ đơn giản là các thiết bị giám sát, bằng chứng là các báo cáo kỹ thuật của chúng.

Điểm mấu chốt là đây: Cho dù bạn đang cố gắng đo lường mức độ thành thạo hay tăng trưởng, các bài kiểm tra tiêu chuẩn không phải là câu trả lời.

Mặc dù kết quả của chúng tôi ở một số tiểu bang đã hấp dẫn, chúng tôi cần nghiên cứu thêm ở cấp quốc gia để xác định điểm kiểm tra bị ảnh hưởng bởi các yếu tố ngoài trường.

Nếu những kết quả kiểm tra tiêu chuẩn hóa này có thể được dự đoán với mức độ chính xác cao bởi các yếu tố cộng đồng và gia đình, thì nó sẽ có ý nghĩa chính sách lớn. Theo tôi, nó gợi ý chúng ta nên vứt bỏ toàn bộ nền tảng chính sách sử dụng các kết quả kiểm tra như vậy để đưa ra quyết định quan trọng về nhân viên và học sinh của trường. Rốt cuộc, những yếu tố này nằm ngoài tầm kiểm soát của học sinh và nhân viên nhà trường.

Mặc dù có những tranh chấp về ý thức hệ về giá trị của kết quả kiểm tra tiêu chuẩn, khoa học đã trở nên rõ ràng hơn. Kết quả cho thấy kết quả kiểm tra tiêu chuẩn cho biết nhiều hơn về cộng đồng mà học sinh sống hơn số lượng học sinh đã học hoặc sự phát triển học tập, xã hội và cảm xúc của học sinh trong một năm học.

Mặc dù một số có thể không muốn chấp nhận nó, theo thời gian, đánh giá của giáo viên là những chỉ số tốt hơn về thành tích của học sinh so với các bài kiểm tra tiêu chuẩn. Ví dụ, điểm trung bình GPA, dựa trên các đánh giá trong lớp học, là một yếu tố dự đoán tốt hơn về thành công của học sinh trong năm đầu đại học so với SAT.

ConversationThay đổi này sẽ đi một chặng đường dài để cung cấp thông tin quan trọng về việc giảng dạy hiệu quả, so với điểm kiểm tra ít liên quan đến giáo viên.

Lưu ý

Christopher Tienken, Phó Giáo sư Chính sách và Quản lý Lãnh đạo Giáo dục, Đại học Seton Hall

Bài viết này ban đầu được xuất bản vào Conversation. Đọc ban đầu bài viết.

Sách của tác giả này

at Thị trường InnerSelf và Amazon