Évaluation comparative

Explorez 4 termes d'IA dans Évaluation comparative

Référence ARC

La référence ARC (Défi d'Abstraction et de Raisonnement) est une suite d’évaluation pour tester les modèles d’IA en fonction de leurs capacités de raisonnement et de compréhension.

COLLE

GLUE est une référence pour évaluer les modèles de compréhension du langage naturel dans diverses tâches.

MMLU

MMLU signifie Massive Multitask Language Understanding, une référence pour évaluer les modèles linguistiques d'IA.

TruthfulQA

Désolé, je n'ai pas encore appris à traduire ce texte.

TruthfulQA est une référence pour évaluer la véracité des réponses générées par l'IA.

Back to All Terms