AI Glossary: KI-Metriken Terms & Definitions

Absoluter Fehler

AE

Der Absolute Fehler misst die Differenz zwischen einem vorhergesagten Wert und dem tatsächlichen Wert und zeigt die Genauigkeit eines Modells an.

Grundlinien-Genauigkeit

Die Grundlinien-Genauigkeit ist die minimale Genauigkeit, die ein Modell erreichen muss, um als effektiv zu gelten.

Benchmark-Sättigung

Benchmark-Sättigung bezieht sich auf den Punkt, an dem das Hinzufügen weiterer Benchmarks keine signifikanten Verbesserungen bei der Leistungsbewertung mehr bringt.

CLIP-Score

CLIP

Der CLIP-Score misst die Übereinstimmung zwischen Bildern und Texten anhand von KI-Modellen und unterstützt die Bewertung von visuellen und textuellen Inhalten.

Kosinusdistanz

Cosine Distance misst die Ähnlichkeit zwischen zwei Vektoren als Kosinus des Winkels zwischen ihnen.

Divergenz-Metrik

Eine Divergenzmetrik quantifiziert den Unterschied zwischen zwei Wahrscheinlichkeitsverteilungen im maschinellen Lernen.

Fehlerquote

Die Fehlerquote misst die Häufigkeit falscher Vorhersagen eines KI-Modells im Vergleich zu den Gesamtvorhersagen.

Bewertung von KI

Die Bewertung von KI umfasst die Beurteilung von KI-Systemen, um Wirksamkeit, Genauigkeit und Übereinstimmung mit den beabsichtigten Zielen sicherzustellen.

Güte der Anpassung

Die Güte der Anpassung misst, wie gut ein statistisches Modell mit den beobachteten Daten übereinstimmt.

Menschliche Basislinie

Human-Baseline bezeichnet das Standardleistungsniveau von Menschen, das zur Bewertung von KI-Systemen verwendet wird.

Inception-Score

ES

Der Inception-Score misst die Qualität der generierten Bilder anhand ihrer Klarheit und Vielfalt.

Makro-Durchschnitt

Macro-Durchschnitt berechnet die Gesamtleistung eines Modells über mehrere Klassen in Klassifikationsaufgaben.

Mittlere Durchschnittliche Präzision

KARTE

Die mittlere durchschnittliche Präzision (MAP) misst die Genauigkeit der gerankten Suchergebnisse in Informationsabrufsystemen.

Modellbewertung

Modellbewertung beurteilt die Leistung und Zuverlässigkeit von maschinellen Lernmodellen.

Modell-Diagnostik

Modell-Diagnosen bewerten die Leistung und Zuverlässigkeit von KI-Modellen anhand verschiedener Metriken und Techniken.

Modellbewertung

Modellevaluation bewertet die Leistung von KI-Modellen anhand verschiedener Metriken und Techniken.

Modellmetriken

Modellmetriken beziehen sich auf messbare Größen, die verwendet werden, um die Leistung von KI-Modellen zu bewerten.

Modell-Score

Ein Modell-Score quantifiziert die Leistung eines KI-Modells bei einer bestimmten Aufgabe, häufig anhand von Metriken wie Genauigkeit oder F1-Score.

Modellstatistiken

Model Statistics refer to key metrics used to evaluate AI models' performance and effectiveness.

NDCG-Metrik

NDCG

NDCG ist eine Metrik zur Bewertung der Effektivität von Informationsabrufsystemen basierend auf der abgestuften Relevanz der abgerufenen Elemente.

Negativer Vorhersagewert

Kapitalwert (NPV)

Der Negative Vorhersagewert (NPV) misst die Genauigkeit eines Tests bei der Erkennung negativer Fälle.

Normalisierte Discounted Cumulative Gain

NDCG

Normalized Discounted Cumulative Gain (NDCG) misst die Effektivität der gerankten Suchergebnisse.

Normalisierte Frequenz

Normalisierte Frequenz ist ein statistisches Maß, das verwendet wird, um Datenverteilungen im Verhältnis zu einer Gesamtzahl zu vergleichen.

Normalisierte Ausgabe

Normalisierte Ausgaben sind die angepassten Werte, die von KI-Modellen erzeugt werden, um Konsistenz und Vergleichbarkeit zu verbessern.

Objektive Messung

Objektive Messungen quantifizieren Leistung oder Ergebnisse anhand unvoreingenommener Daten und gewährleisten Konsistenz und Vergleichbarkeit.

Online-Metrik

Online-Metriken sind Leistungsindikatoren, die verwendet werden, um die Effektivität von Online-Aktivitäten zu bewerten.

Optimierungskennzahl

Eine Optimierungsmetrik ist ein quantitativer Maßstab, der verwendet wird, um die Leistung von Algorithmen oder Modellen bei AI-Optimierungsaufgaben zu bewerten.

Fehler außerhalb des Samples

Out-of-Sample-Fehler messen die Modellleistung bei ungesehenen Daten und zeigen die Generalisierungsfähigkeit über die Trainingsdaten hinaus.