Un estudio internacional detectó errores frecuentes en chatbots y plantea riesgos si se usan sin supervisión profesional
Un reciente estudio científico encendió las alarmas sobre el uso de chatbots de inteligencia artificial en temas de salud. Investigadores detectaron que una proporción significativa de las respuestas brindadas por estos sistemas presenta errores o información incompleta, lo que podría derivar en decisiones equivocadas por parte de los usuarios.
El análisis, publicado en la revista BMJ Open, evaluó el desempeño de cinco plataformas de IA ampliamente utilizadas: ChatGPT, Gemini, Meta AI, DeepSeek y Grok. Los resultados mostraron que el 50% de las respuestas fueron consideradas problemáticas, ya sea por falta de precisión o por contener afirmaciones potencialmente riesgosas.
LEE TAMBIÉN | Confirman al elenco de nueva película de El Señor de los Anillos
En detalle, el informe indica que el 30% de las respuestas fueron catalogadas como “algo problemáticas”, mientras que el 20% resultaron “muy problemáticas”. En particular, Grok presentó la mayor cantidad de errores graves, con un desempeño significativamente inferior al esperado en comparación con los otros sistemas evaluados.
Los especialistas también observaron que el tipo de consulta influye directamente en la calidad de las respuestas. Las preguntas abiertas generaron más fallos, especialmente en temas complejos como diagnósticos o tratamientos, mientras que las preguntas cerradas, con opciones más delimitadas, ofrecieron resultados más precisos y alineados con el consenso científico.
LEE TAMBIÉN | Vivir conectados: el fenómeno de quienes pasan casi todo el día frente a pantallas
Otro punto crítico fue la calidad de las fuentes utilizadas. El estudio reveló que las referencias aportadas por los chatbots resultaron insuficientes, con un nivel de exhaustividad promedio del 40%. Además, el lenguaje empleado en las respuestas fue calificado como difícil de comprender para el público general, lo que limita su utilidad práctica.
En paralelo, una investigación publicada en JAMA Network Open concluyó que estos sistemas aún no están preparados para tomar decisiones médicas de manera autónoma. Los modelos fallan en etapas clave del razonamiento clínico, como la elaboración de diagnósticos diferenciales, donde registraron errores en más del 80% de los casos analizados.
Ante este panorama, los expertos fueron contundentes: la inteligencia artificial puede ser una herramienta útil como apoyo informativo, pero no debe reemplazar el criterio profesional. Advirtieron que su uso sin supervisión podría amplificar la desinformación y generar riesgos para la salud pública.
Con información de DW.


