Hacía ya un tiempo que no me tocaba llevar a cabo el rol de revisora de artículos. A principios del mes recibí la invitación a revisar uno y acepté.
La revisión de un artículo es una actividad de gran responsabilidad: tienes en tus manos la versión de un trabajo que ha requerido mucho tiempo y esfuerzo. Los autores envían su trabajo con ilusión y esperan el feedback y la evaluación de personas desconocidas que, aunque debidamente acreditadas, siguen siendo solo revisores sin rostro.
Lo menos que puedes hacer es tener un profundo respeto por lo que tienes en tus manos, identificar fortalezas, debilidades y contribuir con recomendaciones para que ese escrito que pasa por ti pueda mejorar, para que su siguiente versión sea mucho mejor que la actual. Si lo haces bien, puedes ser un eslabón en la construcción de un mejor cuerpo de conocimiento sobre el tópico en cuestión.
Una de las partes que siempre me produce ansiedad es la revisión del estado del arte. Siento que habrá alguna referencia vital, necesaria para el artículo, de la cual desconozco su existencia. Como cuando sales de tu casa y sientes que dejaste algo encendido o que olvidaste algo. Es irracional, pero no lo puedo evitar.
El experimento: ¿Puede un asistente de GenAI revisar como yo?
Así, con todo y mi inseguridad en el aspecto de revisión de literatura, terminé la revisión. Ya tenía una visión clara de cómo dar un feedback útil y relevante a los autores; también tenía lista la evaluación. Con eso resuelto, decidí ver qué resultados obtendría si el asistente de GenAI hacía esta tarea y contrastar la versión humana que ya tenía con la revisión del asistente. La curiosidad de ver su revisión era grande, enorme.
Eliminé información sensible, le di guías de evaluación y también guías personales para hacer la revisión. Le indiqué, además, que fuera exigente. Usé el modelo de ChatGPT con Deep Research; hizo algunas preguntas y empezó con su trabajo.
Y de pronto, mientras esperaba, sentí que estaba compitiendo. ¿Era posible que una tarea que exige experiencia, criterio e intuición pudiera resolverse por completo con un modelo de lenguaje?
El veredicto: humano vs. asistente
Leí su revisión, sus sugerencias y su evaluación. Solo coincidimos en un 10%. Técnicamente, realizó una revisión que cumplía con las guías: era correcta, detectó problemas de inconsistencia en la redacción que yo no vi, y algunos detalles dentro del universo del artículo y del estado del arte. También sugirió algunas referencias asociadas que podían ser útiles.
Pero nada más. Nada que retara el trabajo, que les diera a los autores otra perspectiva, otra visión basada en la propia experiencia. Y ahí es donde está la clave: la propia experiencia. Eso que no está en documentos, sino en vivencias, en la vida misma.
Eso sí, algo hizo mejor: la revisión de artículos del estado del arte. Justo lo que necesitaba .
