AI Dynamics

Global AI News Aggregator

Claude Sonnet achieves 77.2% on SWE-bench Verified

En capacidades agénticas, que es donde estos modelos tienen un mayor impacto cuando se orquestan con el uso de herramientas o integrándose en Claude Code, Sonnet logra ahora un nuevo record em SWE-bench Verified, con un 77,2% Parece poco, pero estas pequeñas ganancias importan!

→ View original post on X — @dotcsv,

Commentaires

Leave a Reply

Your email address will not be published. Required fields are marked *