En capacidades agénticas, que es donde estos modelos tienen un mayor impacto cuando se orquestan con el uso de herramientas o integrándose en Claude Code, Sonnet logra ahora un nuevo record em SWE-bench Verified, con un 77,2% Parece poco, pero estas pequeñas ganancias importan!
Claude Sonnet achieves 77.2% on SWE-bench Verified
By
–
Leave a Reply