AI Glossary: Métricas De Avaliação De IA Terms & Definitions

Erro Absoluto

AE

Erro Absoluto mede a diferença entre um valor previsto e o valor real, indicando a precisão de um modelo.

Critério de Informação de Akaike

AIC

O Critério de Informação de Akaike (AIC) ajuda a avaliar a qualidade dos modelos estatísticos.

Perda Assimétrica

Perda assimétrica refere-se a uma função de perda que penaliza erros de forma diferente com base em seu tipo ou gravidade em modelos preditivos.

Pontuação de Precisão Média

Pontuação AP

Average Precision Score measures the accuracy of a model's predictions in classification tasks, balancing precision and recall.

Precisão de Linha de Base

A precisão de linha de base é a precisão mínima que um modelo deve alcançar para ser considerado eficaz.

Critério de Informação de Bayes

BIC

O Critério de Informação de Bayes (BIC) é uma ferramenta estatística usada para seleção de modelos.

BERTScore

BERTScore é uma métrica de avaliação para processamento de linguagem natural que utiliza embeddings do BERT para avaliar a similaridade de textos.

Métrica de Pontuação Bleu

BLEU

A Métrica de Pontuação Bleu avalia a qualidade do texto gerado por máquina em comparação com textos de referência.

Pontuação de Brier

A Pontuação de Brier mede a precisão das previsões probabilísticas, quantificando as diferenças quadráticas médias entre os resultados previstos e os reais.

Pontuação CIDEr

CIDEr

A pontuação CIDEr é uma métrica para avaliar modelos de legendas de imagens com base no consenso com legendas geradas por humanos.

Avaliação Comparativa

A Avaliação Comparativa avalia o desempenho de sistemas de IA comparando-os entre si usando métricas definidas.

Limites de Confiança

Os limites de confiança são limites estatísticos que quantificam a incerteza em previsões ou estimativas.

Pontuação de Confiança

CS

A Confidence Score quantifies the certainty of an AI model's predictions.

Métricas de Matriz de Confusão

Métricas de Matriz de Confusão avaliam o desempenho de modelos de classificação usando indicadores-chave como acurácia, precisão, recall e pontuação F1.

Métrica de Divergência

Uma métrica de divergência quantifica a diferença entre duas distribuições de probabilidade em aprendizado de máquina.

Earth Mover’s Distance

EMD

Earth Mover's Distance (EMD) quantifies the difference between two probability distributions over a region.

Pontuação de Humildade Epistêmica

EHS

The Epistemic Humility Score measures an AI's ability to recognize and express uncertainty in its knowledge.

Taxa de Erro Equivalente

EER

A Taxa de Erro Igual (EER) é uma métrica usada para avaliar o desempenho de sistemas biométricos.

Medida F

F1

Medida-F é uma métrica usada para avaliar o desempenho de modelos de classificação, equilibrando precisão e recall.

F-Medida

F1

F-Medida é uma medida estatística usada para avaliar a precisão de modelos de classificação binária.

Taxa de Aceitação Falsa

MUITO

A Taxa de Aceitação Falsa mede a probabilidade de um sistema identificar incorretamente um usuário não autorizado como autorizado.

Taxa de Descoberta Falsa

FDR

A Taxa de Descoberta Falsa (FDR) é a proporção de falsos positivos entre todos os resultados positivos em testes de hipóteses estatísticas.

Falso Negativo

Um falso negativo ocorre quando um teste indica incorretamente a ausência de uma condição que está presente.

Taxa de Positivos Falsos

FPR

The False Positive Rate measures the proportion of incorrect positive predictions in a model's output.

Taxa de Rejeição Falsa

FRR

A Taxa de Rejeição Falsa (FRR) mede a porcentagem de usuários não autorizados incorretamente aceitos por um sistema.

Erro de Previsão

Erro de Previsão refere-se à diferença entre valores previstos e reais em modelos preditivos.

Distância de Fréchet Inception

FID

A Distância de Fréchet Inception (FID) mede a qualidade das imagens geradas comparando sua distribuição com imagens reais.

Perda de Hamming

Hamming Loss mede a fração de rótulos incorretos em tarefas de classificação multi-rótulo.

Métricas de Avaliação de IA