Compréhension du langage
MMLU (Massive Multitask Language Understanding)
Test de compréhension du langage sur 57 tâches différentes couvrant les mathématiques, l'histoire, le droit, etc.
Créé: 07/09/2020
Mis à jour: 15/01/2024
Métriques
- Précision
- Performance par domaine
Statistiques
Modèles évalués
3
Score moyen
86.4%
Meilleur résultat
Modèle
Claude 3 Opus
Score
86.8%
Classement des modèles
Résultats triés par performance
| Rang | Modèle | Score | Date |
|---|---|---|---|
| 1 | Claude 3 Opus | 86.8% | 04/03/2024 |
| 2 | GPT-4 | 86.4% | 14/03/2023 |
| 3 | Gemini 1.5 Pro | 85.9% | 15/02/2024 |