Un informe reveló que los resúmenes automáticos fallan en uno de cada diez casos y reabrieron el debate sobre su confiabilidad.
Las respuestas generadas por inteligencia artificial en el buscador de Google volvieron al centro de la discusión tras un informe que puso en duda su nivel de precisión. Según el análisis, los llamados «AI Overviews» aciertan en la mayoría de los casos, pero mantienen un margen de error significativo.
El estudio, difundido por The New York Times, determinó que estas respuestas automáticas tienen una precisión cercana al 90%. Sin embargo, eso implica que una de cada diez respuestas puede ser incorrecta, lo que se traduce en una enorme cantidad de información errónea circulando diariamente.
Para realizar la evaluación se utilizó la prueba SimpleQA, desarrollada por OpenAI, junto con el apoyo de la startup Oumi. Esta metodología incluye miles de preguntas con respuestas verificables, lo que permite medir la capacidad real de los modelos de inteligencia artificial para brindar información precisa.
MIRÁ TAMBIÉN | TikTok invertirá 1.000 millones de euros en un nuevo centro de datos en Finlandia
Los resultados también reflejaron mejoras en el sistema. Mientras versiones anteriores del modelo Gemini alcanzaban un 85% de precisión, las actualizaciones más recientes lograron superar el 90%. Aun así, los errores persisten y generan preocupación, especialmente cuando las respuestas son presentadas como definitivas.
Entre los fallos detectados se incluyen citas incorrectas y conclusiones erróneas a partir de fuentes válidas. En algunos casos, la IA selecciona datos equivocados aun cuando dispone de información correcta, lo que evidencia limitaciones en el procesamiento y validación de contenidos.
LEE TAMBIÉN | Guillermo Francella será distinguido con el Premio Platino de Honor 2026
Especialistas advierten que parte del problema radica en el funcionamiento de estos sistemas, que no siempre responden de manera consistente. Incluso ante la misma pregunta pueden ofrecer respuestas distintas, lo que dificulta su verificación y uso como fuente confiable.
Desde la empresa explicaron que el sistema no utiliza un único modelo, sino que adapta la tecnología según el tipo de consulta. Esto permite mayor rapidez, pero puede afectar la calidad de las respuestas, ya que no siempre se emplean los modelos más avanzados por cuestiones de costo y velocidad.
En este contexto, el debate sobre la confiabilidad de la inteligencia artificial aplicada a la búsqueda de información sigue abierto. Aunque la tecnología avanza, los propios desarrolladores reconocen que los sistemas aún pueden equivocarse y recomiendan a los usuarios verificar los datos antes de darlos por válidos.


