AI Glossary: Métriques D'évaluation De L'IA Terms & Definitions

Erreur absolue

AE

L'erreur absolue mesure la différence entre une valeur prédite et la valeur réelle, indiquant la précision d'un modèle.

Critère d'information d'Akaike

IA

Le critère d'information d'Akaike (AIC) aide à évaluer la qualité des modèles statistiques.

Perte asymétrique

La perte asymétrique désigne une fonction de perte qui pénalise différemment les erreurs en fonction de leur type ou gravité dans les modèles prédictifs.

Score de précision moyenne

Score AP

Average Precision Score measures the accuracy of a model's predictions in classification tasks, balancing precision and recall.

Précision de référence

La précision de référence est la précision minimale qu'un modèle doit atteindre pour être considéré comme efficace.

Critère d'information bayésien

BIC

Le critère d'information bayésien (BIC) est un outil statistique utilisé pour la sélection de modèles.

BERTScore

BERTScore est une métrique d’évaluation pour le traitement du langage naturel qui utilise les embeddings BERT pour évaluer la similarité entre textes.

Métrique du Score Bleu

BLEU

La métrique du Score Bleu évalue la qualité du texte généré par machine par rapport à des textes de référence.

Score de Brier

Le score de Brier mesure la précision des prédictions probabilistes, en quantifiant la moyenne des différences quadratiques entre les résultats prévus et réels.

Score CIDEr

CIDEr

Le score CIDEr est une métrique d’évaluation des modèles de légendes d’images basée sur le consensus avec des légendes générées par des humains.

Évaluation comparative

L’évaluation comparative évalue la performance des systèmes d’IA en les comparant entre eux selon des métriques définies.

Bornes de Confiance

Les bornes de confiance sont des limites statistiques qui quantifient l'incertitude dans les prédictions ou estimations.

Score de Confiance

CS

A Confidence Score quantifies the certainty of an AI model's predictions.

Métriques de la Matrice de Confusion

Les métriques de la matrice de confusion évaluent la performance d'un modèle de classification en utilisant des indicateurs clés comme la précision, le rappel, et le score F1.

Métrique de divergence

Une métrique de divergence quantifie la différence entre deux distributions de probabilité en apprentissage automatique.

Earth Mover’s Distance

EMD

Earth Mover's Distance (EMD) quantifies the difference between two probability distributions over a region.

Score d’humilité épistémique

EHS

The Epistemic Humility Score measures an AI's ability to recognize and express uncertainty in its knowledge.

Taux d'erreur égal

Le taux d'erreur égal (EER) est une métrique utilisée pour évaluer la performance des systèmes biométriques.

F-Mesure

F1

La mesure F est une métrique utilisée pour évaluer la performance des modèles de classification, en équilibrant précision et rappel.

Score F

F1

Le score F est une mesure statistique utilisée pour évaluer la précision des modèles de classification binaire.

Taux de fausse acceptation

TDR

Le taux d'acceptation erronée mesure la probabilité qu'un système identifie à tort un utilisateur non autorisé comme étant autorisé.

Taux de Découverte Faux

FDR

Le taux de fausses découvertes (FDR) est la proportion de faux positifs parmi tous les résultats positifs dans un test d'hypothèse statistique.

Faux Négatif

Un faux négatif se produit lorsqu'un test indique incorrectement l'absence d'une condition qui est en réalité présente.

Taux de faux positifs

FPR

The False Positive Rate measures the proportion of incorrect positive predictions in a model's output.

Taux de Rejet Faux

TDR

Le taux de rejet erroné (FRR) mesure le pourcentage d'utilisateurs non autorisés acceptés à tort par un système.

Erreur de prévision

L'erreur de prévision fait référence à la différence entre les valeurs prédites et réelles dans les modèles prédictifs.

Distance Fréchet Inception

FID

La Distance d'Inception de Fréchet (FID) mesure la qualité des images générées en comparant leur distribution à celle des images réelles.

Perte de Hamming

La perte de Hamming mesure la fraction de mauvaises étiquettes dans les tâches de classification multi-étiquettes.

Métriques d'évaluation de l'IA