Explorez 90 termes liés à l'IA dans les Métriques d'Évaluation de l'IA
L'erreur absolue mesure la différence entre une valeur prédite et la valeur réelle, indiquant la précision d'un modèle.
Le critère d'information d'Akaike (AIC) aide à évaluer la qualité des modèles statistiques.
La perte asymétrique désigne une fonction de perte qui pénalise différemment les erreurs en fonction de leur type ou gravité dans les modèles prédictifs.
Average Precision Score measures the accuracy of a model's predictions in classification tasks, balancing precision and recall.
La précision de référence est la précision minimale qu'un modèle doit atteindre pour être considéré comme efficace.
Le critère d'information bayésien (BIC) est un outil statistique utilisé pour la sélection de modèles.
BERTScore est une métrique d’évaluation pour le traitement du langage naturel qui utilise les embeddings BERT pour évaluer la similarité entre textes.
La métrique du Score Bleu évalue la qualité du texte généré par machine par rapport à des textes de référence.
Le score de Brier mesure la précision des prédictions probabilistes, en quantifiant la moyenne des différences quadratiques entre les résultats prévus et réels.
Le score CIDEr est une métrique d’évaluation des modèles de légendes d’images basée sur le consensus avec des légendes générées par des humains.
L’évaluation comparative évalue la performance des systèmes d’IA en les comparant entre eux selon des métriques définies.
Les bornes de confiance sont des limites statistiques qui quantifient l'incertitude dans les prédictions ou estimations.
A Confidence Score quantifies the certainty of an AI model's predictions.
Les métriques de la matrice de confusion évaluent la performance d'un modèle de classification en utilisant des indicateurs clés comme la précision, le rappel, et le score F1.
Une métrique de divergence quantifie la différence entre deux distributions de probabilité en apprentissage automatique.
Earth Mover's Distance (EMD) quantifies the difference between two probability distributions over a region.
The Epistemic Humility Score measures an AI's ability to recognize and express uncertainty in its knowledge.
Le taux d'erreur égal (EER) est une métrique utilisée pour évaluer la performance des systèmes biométriques.
La mesure F est une métrique utilisée pour évaluer la performance des modèles de classification, en équilibrant précision et rappel.
Le score F est une mesure statistique utilisée pour évaluer la précision des modèles de classification binaire.
Le taux d'acceptation erronée mesure la probabilité qu'un système identifie à tort un utilisateur non autorisé comme étant autorisé.
Le taux de fausses découvertes (FDR) est la proportion de faux positifs parmi tous les résultats positifs dans un test d'hypothèse statistique.
Un faux négatif se produit lorsqu'un test indique incorrectement l'absence d'une condition qui est en réalité présente.
The False Positive Rate measures the proportion of incorrect positive predictions in a model's output.
Le taux de rejet erroné (FRR) mesure le pourcentage d'utilisateurs non autorisés acceptés à tort par un système.
L'erreur de prévision fait référence à la différence entre les valeurs prédites et réelles dans les modèles prédictifs.
La Distance d'Inception de Fréchet (FID) mesure la qualité des images générées en comparant leur distribution à celle des images réelles.
La perte de Hamming mesure la fraction de mauvaises étiquettes dans les tâches de classification multi-étiquettes.