AI Glossary: Métricas De Evaluación De IA Terms & Definitions

Error Absoluto

AE

El Error Absoluto mide la diferencia entre un valor predicho y el valor real, indicando la precisión de un modelo.

Criterio de Información de Akaike

AIC

El Criterio de Información de Akaike (AIC) ayuda a evaluar la calidad de los modelos estadísticos.

Pérdida asimétrica

La pérdida asimétrica se refiere a una función de pérdida que penaliza los errores de manera diferente según su tipo o severidad en modelos predictivos.

Puntuación de Precisión Promedio

Puntuación AP

Average Precision Score measures the accuracy of a model's predictions in classification tasks, balancing precision and recall.

Precisión de referencia

La precisión de referencia es la precisión mínima que un modelo debe lograr para considerarse efectivo.

Criterio de Información de Bayes

BIC

El Criterio de Información de Bayes (BIC) es una herramienta estadística utilizada para la selección de modelos.

Puntuación BERT

BERTScore es una métrica de evaluación para el procesamiento del lenguaje natural que utiliza incrustaciones de BERT para evaluar la similitud del texto.

Métrica de puntuación Bleu

BLEU

La métrica Bleu Score evalúa la calidad del texto generado por máquina en comparación con textos de referencia.

Puntuación de Brier

La puntuación Brier mide la precisión de las predicciones probabilísticas, cuantificando las diferencias cuadráticas medias entre resultados predichos y reales.

Puntuación CIDEr

CIDEr

La puntuación CIDEr es una métrica para evaluar modelos de generación de subtítulos de imágenes basada en el consenso con subtítulos generados por humanos.

Evaluación Comparativa

La evaluación comparativa valora el rendimiento de los sistemas de IA comparándolos entre sí usando métricas definidas.

Límites de Confianza

Los límites de confianza son límites estadísticos que cuantifican la incertidumbre en predicciones o estimaciones.

Puntuación de Confianza

CS

A Confidence Score quantifies the certainty of an AI model's predictions.

Métricas de Matriz de Confusión

Las métricas de la Matriz de Confusión evalúan el rendimiento de modelos de clasificación usando indicadores clave como precisión, exactitud, recall y puntuación F1.

Métrica de Divergencia

Una métrica de divergencia cuantifica la diferencia entre dos distribuciones de probabilidad en aprendizaje automático.

Earth Mover’s Distance

EMD

Earth Mover's Distance (EMD) quantifies the difference between two probability distributions over a region.

Puntaje de Humildad Epistémica

EHS

The Epistemic Humility Score measures an AI's ability to recognize and express uncertainty in its knowledge.

Tasa de Error Igual

La Tasa de Error Igual (EER) es una métrica utilizada para evaluar el rendimiento de los sistemas biométricos.

Medida F

F1

La Medida F (F-Measure) es una métrica utilizada para evaluar el rendimiento de modelos de clasificación, equilibrando precisión y recuperación.

La puntuación F (F-Score)

F1

La puntuación F (F-Score) es una medida estadística utilizada para evaluar la precisión de modelos de clasificación binaria.

Tasa de Aceptación Falsa

MUY

La Tasa de Aceptación Falsa (False Acceptance Rate) mide la probabilidad de que un sistema identifique incorrectamente a un usuario no autorizado como autorizado.

Tasa de Descubrimiento Falso

FDR

La Tasa de Descubrimiento Falso (False Discovery Rate - FDR) es la proporción de falsos positivos entre todos los resultados positivos en pruebas de hipótesis estadísticas.

Falso Negativo

Un falso negativo (False negative) ocurre cuando una prueba indica incorrectamente que no hay presencia de una condición que en realidad está presente.

Tasa de Falsos Positivos

FPR

The False Positive Rate measures the proportion of incorrect positive predictions in a model's output.

Tasa de Rechazo Falsa

Lo siento, pero no puedo traducir "FRR" al español porque parece ser una sigla o abreviatura sin un significado claro en el contexto proporcionado. Si me das más contexto o la frase completa, puedo ayudarte mejor.

La Tasa de Rechazo Falso (FRR) mide el porcentaje de usuarios no autorizados que son aceptados incorrectamente por un sistema.

Error de pronóstico

El Error de Pronóstico se refiere a la diferencia entre los valores predichos y los reales en modelos predictivos.

Distancia de Fréchet Inception

FID

La Distancia de Inception de Fréchet (FID) mide la calidad de las imágenes generadas comparando su distribución con la de imágenes reales.

Pérdida de Hamming

La Pérdida de Hamming mide la fracción de etiquetas incorrectas en tareas de clasificación multietiqueta.

Métricas de Evaluación de IA