Explore 90 termos de IA em Métricas de Avaliação de IA
Erro Absoluto mede a diferença entre um valor previsto e o valor real, indicando a precisão de um modelo.
O Critério de Informação de Akaike (AIC) ajuda a avaliar a qualidade dos modelos estatísticos.
Perda assimétrica refere-se a uma função de perda que penaliza erros de forma diferente com base em seu tipo ou gravidade em modelos preditivos.
Average Precision Score measures the accuracy of a model's predictions in classification tasks, balancing precision and recall.
A precisão de linha de base é a precisão mínima que um modelo deve alcançar para ser considerado eficaz.
O Critério de Informação de Bayes (BIC) é uma ferramenta estatística usada para seleção de modelos.
BERTScore é uma métrica de avaliação para processamento de linguagem natural que utiliza embeddings do BERT para avaliar a similaridade de textos.
A Métrica de Pontuação Bleu avalia a qualidade do texto gerado por máquina em comparação com textos de referência.
A Pontuação de Brier mede a precisão das previsões probabilísticas, quantificando as diferenças quadráticas médias entre os resultados previstos e os reais.
A pontuação CIDEr é uma métrica para avaliar modelos de legendas de imagens com base no consenso com legendas geradas por humanos.
A Avaliação Comparativa avalia o desempenho de sistemas de IA comparando-os entre si usando métricas definidas.
Os limites de confiança são limites estatísticos que quantificam a incerteza em previsões ou estimativas.
A Confidence Score quantifies the certainty of an AI model's predictions.
Métricas de Matriz de Confusão avaliam o desempenho de modelos de classificação usando indicadores-chave como acurácia, precisão, recall e pontuação F1.
Uma métrica de divergência quantifica a diferença entre duas distribuições de probabilidade em aprendizado de máquina.
Earth Mover's Distance (EMD) quantifies the difference between two probability distributions over a region.
The Epistemic Humility Score measures an AI's ability to recognize and express uncertainty in its knowledge.
A Taxa de Erro Igual (EER) é uma métrica usada para avaliar o desempenho de sistemas biométricos.
Medida-F é uma métrica usada para avaliar o desempenho de modelos de classificação, equilibrando precisão e recall.
F-Medida é uma medida estatística usada para avaliar a precisão de modelos de classificação binária.
A Taxa de Aceitação Falsa mede a probabilidade de um sistema identificar incorretamente um usuário não autorizado como autorizado.
A Taxa de Descoberta Falsa (FDR) é a proporção de falsos positivos entre todos os resultados positivos em testes de hipóteses estatísticas.
Um falso negativo ocorre quando um teste indica incorretamente a ausência de uma condição que está presente.
The False Positive Rate measures the proportion of incorrect positive predictions in a model's output.
A Taxa de Rejeição Falsa (FRR) mede a porcentagem de usuários não autorizados incorretamente aceitos por um sistema.
Erro de Previsão refere-se à diferença entre valores previstos e reais em modelos preditivos.
A Distância de Fréchet Inception (FID) mede a qualidade das imagens geradas comparando sua distribuição com imagens reais.
Hamming Loss mede a fração de rótulos incorretos em tarefas de classificação multi-rótulo.