La inteligencia artificial calificará los ensayos en los nuevos exámenes estatales de NJ. Algunos maestros dicen que es arriesgado

Artículo Subido al Latino Spirit: 10 de Marzo del 2026

Por Liz Rosenberg, NJ.com

Se utilizará inteligencia artificial (IA) para calificar la mayoría de los escritos que realizan los estudiantes de Nueva Jersey en las nuevas pruebas estandarizadas estatales que se lanzarán esta primavera, dijeron funcionarios de educación del estado.

El sistema de IA se utilizará para calificar los ensayos y respuestas cortas de los estudiantes en la sección de Lengua y Literatura en Inglés de los exámenes estatales, según una propuesta de evaluación aprobada por el estado. La inteligencia artificial se entrenará con las puntuaciones generadas por evaluadores humanos en los exámenes de práctica que se realizaron a los estudiantes en octubre y noviembre.

Nueva Jersey estrena esta primavera un nuevo tipo de prueba estatal, denominada New Jersey Student Learning Assessments-Adaptive, o Evaluación Adaptativa del Aprendizaje Estudiantil de Nueva Jersey. Va a ser presentada por estudiantes de los grados 3 al 10 para evaluar sus conocimientos de inglés, matemáticas y ciencias.

También habrá una nueva versión del examen de egreso de la escuela secundaria del estado para los estudiantes del tercer año de secundaria, ahora llamado New Jersey Graduation Proficiency Assessment–Adaptive (Evaluación de Competencia de Graduación de Nueva Jersey–Adaptativa).

Al igual que la versión anterior del examen, conocida como NJSLA, los exámenes se realizarán por computadora. Sin embargo, la nueva versión será «adaptativa», lo que significa que los estudiantes recibirán preguntas diferentes según sus respuestas anteriores, una práctica que busca aumentar la precisión en la calificación de los exámenes.

Se utilizará un sistema de inteligencia artificial para calificar los ensayos y las preguntas escritas, pero todavía habrá algunos calificadores humanos, dijo el portavoz del Departamento de Educación del estado, Michael Yaple.

Si la respuesta escrita de un estudiante se identifica como «inusual» o «en el límite», será «marcada para revisión humana», explicó Yaple.

«El sistema realiza periódicamente controles de garantía de calidad para garantizar que las puntuaciones asignadas por el motor de puntuación automatizado coincidan con las puntuaciones humanas a través de estrictos controles de calidad», añadió.

Cambium, la empresa que supervisa las nuevas pruebas, no utiliza IA generativa, la versión de inteligencia artificial utilizada en plataformas tipo Chat GPT que pueden crear algo nuevo y que a veces generan alucinaciones con información falsa o inexacta, dijo Yaple.

En cambio, el sistema de puntuación automatizado tendrá parámetros estrictos «con una consistencia comprobada, y la puntuación humana sigue siendo la base del proceso, validando la precisión en múltiples puntos de control a lo largo del flujo de trabajo de puntuación», dijeron los funcionarios de educación del estado en un comunicado.

La calificación computarizada de los exámenes estatales de Nueva Jersey no es nueva. El año pasado, aproximadamente el 90% de los ensayos de los estudiantes en la NJSLA y los exámenes estatales de egreso de la escuela secundaria se calificaron únicamente mediante un sistema de calificación automatizado, según Yaple.

Sin embargo, algunos educadores expresan su preocupación por el uso generalizado de IA para calificar la nueva versión de las pruebas que eventualmente realizarán casi todos los 1.3 millones de estudiantes de las escuelas públicas de Nueva Jersey.

Usar una versión de IA para calificar los escritos de los estudiantes es riesgoso, dijo Steve Beatty, presidente de la Asociación de Educación de Nueva Jersey (NJEA, por sus siglas en inglés), el sindicato de docentes más grande del estado.

Diverse Voices Link
Plataforma cultural que amplifica voces diversas a través de arte, narrativa y pensamiento contemporáneo.

Dijo que odiaría ver «a algún estudiante suspender un examen calificado por computadora y luego descubrir que hubo algún tipo de error».

La NJEA se opone a las pruebas de alto riesgo en general, afirmó Beatty. Pero si las pruebas van a continuar, «queremos que educadores capacitados —humanos— se encarguen de la evaluación».

Si un estudiante no aprueba las secciones de los exámenes calificados por IA, debería haber un plan para que un humano vuelva a evaluar la redacción, dijo.

«Deben volver a una persona para verificarlo», dijo Beatty.

Nuevo contrato con compañía de exámenes

Los estudiantes de Nueva Jersey comenzarán a tomar los nuevos exámenes NJSLA-Adaptive durante un periodo de prueba de un mes, entre el 27 de abril y el 29 de mayo. Los exámenes generalmente se realizan durante varios días consecutivos.

La ventana de prueba para el nuevo examen de egreso de escuela secundaria adaptativo NJGPA para estudiantes del tercer año de secundaria será del 16 de marzo al 1 de abril, según un cronograma de pruebas del Departamento de Educación del estado.

Las nuevas pruebas estatales NJSLA y NJGPA fueron desarrolladas por Cambium Assessment, una empresa que ganó un contrato de dos años por $58.7 millones con el estado.

Según la propuesta de Cambium, Measurement Incorporated, una empresa ubicada en Durham, Carolina del Norte, será responsable de proporcionar y capacitar a las personas que realizarán la «calificación manual» humana cuando las puntuaciones de los ensayos y las respuestas escritas generadas por IA se marquen para su revisión.

En su propuesta al estado, Cambium dijo que la compañía asume que «el 25% de las respuestas generales serán enviadas a una evaluación manual capacitada».

USA Top Latinos
Noticias, comunidad y liderazgo latino en EE.UU.

Los funcionarios de Nueva Jersey dijeron que no se utilizó IA para crear elementos de prueba en la nueva versión de los exámenes y que no se utilizará inteligencia artificial para determinar qué preguntas ven los estudiantes en las evaluaciones adaptativas.

Jeffrey Hauger, quien se desempeñó como director de evaluaciones del Departamento de Educación estatal de 2010 a 2018, afirmó que Nueva Jersey tiene una larga trayectoria en el uso de computadoras para la calificación de la parte escrita de los exámenes estatales. Posteriormente, trabajó como asesor de Pearson, la empresa que anteriormente tenía el contrato para proporcionar las pruebas estatales de la NJSLA.

Alrededor de 2016, dijo Hauger, el estado comenzó a implementar un sistema que utilizaba un calificador humano y uno automatizado para evaluar cada trabajo escrito por un estudiante.

Si se encontrara una gran discrepancia entre las dos puntuaciones, el ensayo sería leído por una segunda persona, dijo.

«Era una herramienta para la eficiencia, pero en aquel entonces el ser humano siempre estaba involucrado en todo el proceso», afirmó Hauger.

La puntuación de IA ahora es más sofisticada, dijo.

«La tecnología ha mejorado. Por lo tanto, ahora no es un avance tan grande como la gente podría pensar», señaló Hauger.

Durante el mandato del gobernador Phil Murphy, el departamento comenzó a depender más de la calificación automatizada y a dejar de lado la evaluación de cada texto tanto por una máquina como por un humano, dijo.

Señalar problemas

La puntuación de IA ha sido controvertida en otros estados.

En Massachusetts, los errores de calificación de IA fueron responsables de 1,400 puntuaciones incorrectas en el Massachusetts Comprehensive Assessment System (Sistema de Evaluación Integral de Massachusetts, conocido como MCAS, por sus siglas en inglés) el año pasado.

En Texas, varios distritos cuestionaron si la calificación de IA era justa en sus pruebas estatales en los últimos años.

El Distrito Escolar Independiente de Dallas ha cuestionado miles de puntajes de ensayos generados por IA en las pruebas estandarizadas STAAR de todo el estado de Texas durante los últimos dos años.

Cambium y Pearson, las empresas involucradas en las pruebas de Nueva Jersey, contribuyeron al sistema de pruebas estandarizadas de Texas.

En 2024, el distrito escolar de Dallas solicitó al estado que volviera a calificar 4,600 pruebas y las enviara al estado para que fueran calificadas nuevamente por humanos.

Alrededor del 44% de las pruebas recalificadas dieron puntajes más altos después de que un humano las leyera, dijo Jacob Cortez, superintendente adjunto de Dallas a cargo de evaluación y puntuación.

El distrito también envió miles de pruebas calificadas por IA para volver a calificar el año pasado y casi el 40% regresó con puntajes más altos obtenidos por humanos, dijo el distrito.

La tasa de precisión de las pruebas de tercer grado calificadas por IA fue la más preocupante: el 85% de las devueltas mostraron una puntuación mejorada cuando los humanos leyeron el trabajo de los estudiantes.

«Eso no está bien», afirmó Cortez.

El distrito escolar de Dallas, que atiende a unos 139,000 estudiantes, limitó el número de pruebas que devolvía para volver a calificar porque tenía que pagar $50 por cada prueba que no recibía una puntuación mejorada, dijeron funcionarios locales.

Los funcionarios de Cambium no respondieron a las solicitudes de comentarios sobre los problemas de precisión de Dallas o las prácticas de puntuación de inteligencia artificial de la empresa.

Los funcionarios de Nueva Jersey se negaron a hacer comentarios sobre preguntas sobre la precisión de la puntuación de IA en otros estados.

«Nueva Jersey no puede comentar sobre el proceso de evaluación y puntuación de otro estado», dijo Yaple.

Lily Laux, la nueva comisionada de educación de Nueva Jersey, tampoco respondió a una solicitud de comentarios. En su anterior puesto como comisionada adjunta de programas escolares de Texas, ayudó a diseñar el sistema de exámenes estandarizados del estado, según su perfil de LinkedIn.

Los problemas con la puntuación de IA en Dallas plantean interrogantes sobre el sistema, dijo Scott Marion, asociado principal de aprendizaje en el Centro de Evaluación, una empresa de consultoría no partidista y sin fines de lucro.

«¿No se está entrenando bien? ¿No se está entrenando con una población lo suficientemente diversa?», preguntó Marion.

La puntuación con IA tiene sentido desde el punto de vista financiero, pero los estados también deben tener cuidado de no depender demasiado de ella, afirmó. Se siente cómodo con que alrededor del 80% de la redacción esté basada en IA, ya que los sistemas aún requieren respaldo humano.

Nominaciones abiertas · USA Top Latinos
Formulario oficial de registro
Complete el formulario para nominarse o nominar a un líder destacado y formar parte de USA Top Latinos, una iniciativa que reconoce la excelencia, el liderazgo y el impacto de la comunidad latina en Estados Unidos.
Nominación →

«Hemos estado haciendo esto durante mucho tiempo», dijo, refiriéndose al uso de IA para calificar los escritos de los estudiantes.

Muchos estudiantes, maestros y padres podrían sorprenderse al saber cuánto de lo escrito en la escuela ya está calificado por IA, dijeron los defensores de la educación.

Muchos «padres no tienen idea de que esto existe», señaló Julie Borst, directora ejecutiva de organización comunitaria de Save Our Schools New Jersey, un grupo de defensa estatal.

A Borst le preocupa que los estudiantes con estilos de escritura únicos puedan terminar con puntajes más bajos en las pruebas porque la IA busca palabras y frases específicas o una cantidad estándar de oraciones para obtener los puntajes más altos.

Borst, cuya organización se ha opuesto durante mucho tiempo a las pruebas estandarizadas de alto riesgo, dijo que, al final, seguirá siendo responsabilidad de los docentes saber dónde los estudiantes se desempeñan bien y dónde tienen dificultades.

«El maestro sabrá dónde están esas debilidades. Sabrá dónde están esas fortalezas», dijo. «Eso no se puede saber, a nivel de estudiante, con una prueba estandarizada».

Esta traducción fue proporcionada por The Latino Spirit, en asociación con el Centro de Medios Cooperativos de la Universidad Estatal de Montclair, y cuenta con el apoyo financiero del Consorcio de Información Cívica de NJ. La historia fue escrita originalmente en inglés por NJ.com y se vuelve a publicar en virtud de un acuerdo especial para compartir contenido a través del Servicio de noticias de traducción al español de NJ News Commons.

This translation was provided by The Latino Spirit, in association with the Center for Cooperative Media at Montclair State University and is financially supported by the NJ Civic Information Consortium. The story was originally written in English by NJ.com and is republished under a special content sharing agreement through the NJ News Commons’ Spanish Translation News Service.