La discusión sobre qué tan “inteligentes” son realmente los sistemas de inteligencia artificial volvió a ganar protagonismo tras un estudio realizado por investigadores de España e Italia. El equipo analizó cómo distintos modelos de IA generativa interpretaban algo tan cotidiano como un reloj analógico, y los resultados fueron mucho más alarmantes que anecdóticos.
Los especialistas desarrollaron un conjunto de más de 40 mil imágenes sintéticas de relojes mostrando horarios variados y pidieron a los modelos —entre ellos GPT-4o, Gemma3 y LLaMa— que indicaran la hora correcta. Todos fallaron de manera consistente, confundiendo las manecillas y sus posiciones, incluso en imágenes simples. Lo más preocupante es que, tras un ajuste fino con miles de ejemplos adicionales, los errores persistieron cuando se utilizaron nuevas imágenes no vistas durante el entrenamiento.
MIRÁ TAMBIÉN | Qué es la depresión post show y por qué aparece después de un recital
El estudio expone un problema central: la incapacidad de estas tecnologías para generalizar, es decir, aplicar lo aprendido a situaciones nuevas. Si bien los humanos podemos interpretar un reloj distorsionado o con detalles atípicos, las IAs se desorientaron por completo ante variaciones mínimas, demostrando que su aparente precisión depende de la familiaridad con los datos y no de una comprensión real.
La investigación también incluyó pruebas más creativas, como relojes inspirados en Salvador Dalí o ilustraciones con flechas exageradas en las manecillas. En todos los casos, los modelos volvieron a fallar. Para los expertos, estos resultados encienden una alarma: si la IA tropieza con una tarea básica, sus limitaciones podrían convertirse en un riesgo cuando se aplican a entornos críticos como análisis médicos o sistemas de conducción autónoma.
MIRÁ TAMBIÉN | Revelan que Meta ganó miles de millones con avisos engañosos
Aunque la IA generativa continúa siendo una herramienta útil para programación, creatividad o síntesis de información, los investigadores sostienen que su funcionamiento sigue siendo más estadístico que inteligente. A medida que crece su adopción a nivel global, también crece la exigencia por modelos capaces de pensar más allá de sus datos de entrenamiento, algo que —por ahora— parece lejos de resolverse.
Fuente: Xakata.


