domingo 28 junio 2026

Una nueva métrica evalúa la capacidad de la IA en tareas humanas

Dólar Oficial
$1.495,00
=
Dólar Tarjeta
$1.943,50
=
Dólar Informal
$1.515,00
-0,98%
Dólar MEP
$1.517,44
1,10%
Prom. Tasa P.F.
19,58%
1,03%
UVA
2.012,67
=
Riesgo País
437
=
Actualizado: 06:50 28/06 | downtack.com

Investigadores de METR propusieron una métrica innovadora para medir el desempeño de modelos de IA en comparación con el tiempo de trabajo humano.

MIRÁ TAMBIÉN | Redescubren una obra de las mayores artistas del Renacimiento italiano

Un equipo de la organización METR, con sede en California, presentó una novedosa métrica denominada horizonte temporal de finalización de tareas (TCTH), que evalúa la eficiencia de los modelos de inteligencia artificial (IA) en relación con el tiempo que una persona capacitada tarda en completar tareas complejas. El estudio, publicado en el repositorio arXiv, analizó el desempeño de modelos como GPT-4 y Claude 3.7 Sonnet en 170 tareas de programación, ciberseguridad y aprendizaje automático.

El TCTH se basa en el tiempo promedio que un humano requiere para completar una tarea que un modelo puede resolver con un 50% de éxito. La investigación mostró que los modelos de IA enfrentan dificultades en tareas extensas: mientras GPT-2 no resolvió tareas de más de un minuto, Claude 3.7 Sonnet logró completar con éxito la mitad de las tareas que tomaban 59 minutos a un humano.

Los investigadores hallaron que la capacidad de las IA ha crecido exponencialmente, duplicándose cada siete meses desde 2019 y acelerándose a una duplicación cada tres meses en 2024. Si esta tendencia continúa, las IA podrían alcanzar un TCTH de un mes de trabajo humano (167 horas) entre 2028 y 2031.

MIRÁ TAMBIÉN | Estudio revela que la IA tiene dificultades para leer la hora

A pesar del avance, el estudio reconoce limitaciones: las tareas evaluadas eran más estructuradas que las del mundo real, y los modelos aún tienen dificultades para manejar información implícita o escenarios sin retroalimentación clara. Además, se observó que la brecha entre su rendimiento al 50% y al 80% sigue siendo significativa, lo que impacta su confiabilidad en tareas prolongadas.

El TCTH surge como una métrica prometedora para entender la evolución de la IA y su impacto en el trabajo humano, proporcionando un enfoque más representativo que los benchmarks tradicionales.

Fuente: Infobae 

Foto: Archivo

Croacia venció a Ghana y también avanzó en el Mundial

Ahora, tanto los Vatreni como las Estrellas Negras aguardarán la confirmación de sus respectivos rivales para la primera ronda de eliminación directa, donde buscarán continuar su camino hacia el título mundial.

Inglaterra venció a Panamá y avanzó a los 16avos del Mundial

El conjunto canalero quedó eliminado de la Copa del Mundo, mientras que Inglaterra ratificó su candidatura con un rendimiento sólido que le permitió avanzar como líder de su zona.

Robaron en dos chacras del Valle: se llevaron caballos, herramientas y electrodomésticos

En ese contexto, cobra fuerza una de las hipótesis que manejan investigadores y vecinos: que los delincuentes realizarían tareas de vigilancia previa mediante el uso de drones para identificar los movimientos de los propietarios y elegir el momento oportuno para concretar los robos.

Bullrich destacó la “confianza” y la “ética” tras la renuncia de Adorni

Bullrich afirmó que la situación representaba "más que un error" y la calificó como "una omisión ética", al tiempo que sostuvo que "nuestro gobierno tiene la moral como política de Estado".

Compartir

spot_img

Popular