Google sort Gemini 3.0, 24h après Elon Musk ! Les benchmarks de Gemini 3 Deep Think sont absolument fous. – HLE (raisonnement & connaissances, sans outils) : 41 %
– GPQA Diamond (connaissances scientifiques, sans outils) : 93,8 %
– ARC-AGI-2 (puzzles de raisonnement visuel,
Google Gemini 3.0 Benchmarks Rival Top AI Models
By
–
