Benchmarks d'IA
Base de données de résultats de benchmarks présentant les performances des principaux modèles d'IA sur des tâches exigeantes. Comprend des résultats de benchmarks évalués par Epoch AI ainsi que des données collectées auprès de sources externes. Explorez les tendances au fil du temps, par benchmark ou par modèle.
Chargement des données...
Benchmarking updates
APRIL 12, 2026
Mise à jour massive des données Epoch AI
ECI étendu à 1 471 modèles, 9 nouveaux benchmarks ajoutés dont ARC-AGI 2, HLE (Humanity's Last Exam), Video-MME, et Apex Agents.
Learn moreSEPTEMBER 29, 2025
Claude Sonnet 4.5 établit un nouveau SOTA
Claude Sonnet 4.5 établit une nouvelle performance état de l'art sur SWE-Bench Verified.
Learn moreJULY 11, 2025
Introduction de FrontierMath Tier 4
Un benchmark de problèmes mathématiques de niveau recherche, conçu pour tester les limites du raisonnement IA.
Learn more