Entdecken Sie 90 KI-Begriffe in KI-Bewertungsmetriken
Der Absolute Fehler misst die Differenz zwischen einem vorhergesagten Wert und dem tatsächlichen Wert und zeigt die Genauigkeit eines Modells an.
Das Akaike-Informationskriterium (AIC) hilft bei der Bewertung der Qualität statistischer Modelle.
Asymmetrischer Verlust bezieht sich auf eine Verlustfunktion, die Fehler je nach Art oder Schwere unterschiedlich bestraft in Vorhersagemodellen.
Average Precision Score measures the accuracy of a model's predictions in classification tasks, balancing precision and recall.
Die Grundlinien-Genauigkeit ist die minimale Genauigkeit, die ein Modell erreichen muss, um als effektiv zu gelten.
Das Bayesian Information Criterion (BIC) ist ein statistisches Werkzeug zur Modellwahl.
BERTScore ist eine Bewertungsmetrik für die Verarbeitung natürlicher Sprache, die BERT-Embeddings verwendet, um die Textähnlichkeit zu beurteilen.
Die Bleu-Score-Metrik bewertet die Qualität maschinell erzeugter Texte im Vergleich zu Referenztexten.
Der Brier-Score misst die Genauigkeit probabilistischer Vorhersagen und quantifiziert die mittleren quadrierten Differenzen zwischen vorhergesagten und tatsächlichen Ergebnissen.
Der CIDEr-Score ist eine Metrik zur Bewertung von Bildbeschriftungsmodellen, basierend auf dem Konsens mit von Menschen erstellten Beschriftungen.
Vergleichende Bewertung beurteilt die Leistung von KI-Systemen, indem sie diese anhand definierter Metriken miteinander vergleicht.
Konfidenzintervalle sind statistische Grenzen, die Unsicherheit bei Vorhersagen oder Schätzungen quantifizieren.
A Confidence Score quantifies the certainty of an AI model's predictions.
Konfusionsmatrix-Metriken bewerten die Leistung eines Klassifikationsmodells anhand wichtiger Indikatoren wie Genauigkeit, Präzision, Recall und F1-Score.
Eine Divergenzmetrik quantifiziert den Unterschied zwischen zwei Wahrscheinlichkeitsverteilungen im maschinellen Lernen.
Earth Mover's Distance (EMD) quantifies the difference between two probability distributions over a region.
The Epistemic Humility Score measures an AI's ability to recognize and express uncertainty in its knowledge.
Die Equal Error Rate (EER) ist eine Metrik zur Bewertung der Leistung biometrischer Systeme.
F-Messung ist eine Metrik zur Bewertung der Leistung von Klassifikationsmodellen, die Präzision und Rückruf ausbalanciert.
F-Wert ist ein statistisches Maß, das verwendet wird, um die Genauigkeit von binären Klassifikationsmodellen zu bewerten.
Die Rate falscher Akzeptanz misst die Wahrscheinlichkeit, dass ein System einen unbefugten Benutzer fälschlicherweise als autorisiert erkennt.
Die False-Discovery-Rate (FDR) ist der Anteil der falschen Positivbefunde unter allen positiven Ergebnissen bei statistischen Hypothesentests.
Ein falsch negatives Ergebnis liegt vor, wenn ein Test fälschlicherweise keine Anwesenheit einer tatsächlich vorhandenen Bedingung anzeigt.
The False Positive Rate measures the proportion of incorrect positive predictions in a model's output.
Die Rate falscher Ablehnungen (FRR) misst den Prozentsatz der unbefugten Benutzer, die vom System fälschlicherweise akzeptiert werden.
Prognosefehler bezeichnet die Differenz zwischen vorhergesagten und tatsächlichen Werten in prädiktiven Modellen.
Fréchet Inception Distance (FID) misst die Qualität generierter Bilder, indem er deren Verteilung mit echten Bildern vergleicht.
Hamming Loss misst die Fraktion der falschen Labels bei Multi-Label-Klassifikationsaufgaben.