OpenAI O3 et O4-mini explosent les scores dans le Humanity's Last Exam. Pour ceux qui ne connaissent pas : le HLE, c’est un benchmark de 3 000 questions couvrant les mathématiques, les sciences humaines et les sciences naturelles. Honnêtement, c’est la première vraie différence
OpenAI O3 and O4-mini Achieve Top Scores on Humanity’s Last Exam
By
–
