OkurAI

Benchmarks d'IA

Base de données de résultats de benchmarks présentant les performances des principaux modèles d'IA sur des tâches exigeantes. Comprend des résultats de benchmarks évalués par Epoch AI ainsi que des données collectées auprès de sources externes. Explorez les tendances au fil du temps, par benchmark ou par modèle.

Chargement des données...

Benchmarking updates

APRIL 12, 2026

Mise à jour massive des données Epoch AI

ECI étendu à 1 471 modèles, 9 nouveaux benchmarks ajoutés dont ARC-AGI 2, HLE (Humanity's Last Exam), Video-MME, et Apex Agents.

Learn more
SEPTEMBER 29, 2025

Claude Sonnet 4.5 établit un nouveau SOTA

Claude Sonnet 4.5 établit une nouvelle performance état de l'art sur SWE-Bench Verified.

Learn more
JULY 11, 2025

Introduction de FrontierMath Tier 4

Un benchmark de problèmes mathématiques de niveau recherche, conçu pour tester les limites du raisonnement IA.

Learn more