Dos estudios recientes revelan fallas graves en las respuestas de herramientas como Grok, ChatGPT y Copilot cuando se les pide confirmar información.
El uso de inteligencia artificial para verificar datos es cada vez más común. Muchos usuarios acuden a chatbots como ChatGPT, Grok o Meta AI para corroborar lo que ven en redes sociales. Sin embargo, investigaciones recientes ponen en duda su fiabilidad.
En uno de los casos más comentados, Grok —el asistente creado por xAI, la empresa de Elon Musk— fue acusado de promover teorías conspirativas racistas sin que se lo consultara directamente sobre esos temas. La empresa alegó que el problema se debió a una «modificación no autorizada».
MIRÁ TAMBIÉN | Creían que era una copia y resultó ser un original de la Magna Carta
Un estudio de la BBC, realizado en febrero de 2025, evaluó las respuestas de ChatGPT, Gemini, Copilot y Perplexity usando artículos propios como referencia. Detectaron errores importantes en más de la mitad de los casos, incluyendo citas modificadas y datos falsos.
Por su parte, el Tow Center for Digital Journalism encontró que los chatbots fallaron al identificar correctamente el origen de artículos en el 60 por ciento de las consultas. Grok fue el que tuvo peor desempeño, con un 94 por ciento de respuestas equivocadas.
LEE TAMBIÉN | Tras 37 años: recuperaron el busto robado de Jim Morrison
Además, estas herramientas suelen responder con gran seguridad, incluso cuando están equivocadas. Según el estudio, ChatGPT erró en 134 ocasiones, pero solo mostró dudas en quince respuestas y nunca evitó contestar.
Otra limitación grave aparece con el análisis de imágenes. En una prueba de Deutsche Welle, Grok fue incapaz de identificar que una foto viral era generada por IA. La atribuyó a distintos incendios reales en ciudades de todo el mundo, ignorando señales claras de que era falsa.
Expertos como Felix Simon, del Oxford Internet Institute, advierten que estas herramientas no deberían considerarse métodos confiables para verificar hechos. Recomiendan siempre contrastar las respuestas con otras fuentes confiables.
Con información de DW.