AI Glossary: What Is K-L Divergence (KLD)? Definition & Meaning

K-L Divergenz, or Kullback-Leibler-Divergenz, is a statistical method used to measure the difference between two Wahrscheinlichkeitsverteilungen. Specifically, it quantifies how much one probability distribution diverges from a second, expected probability distribution. In practical terms, K-L Divergence is used in various fields such as maschinellem Lernen, Informationstheorie, and statistics.

Die K-L Divergenz zwischen zwei Wahrscheinlichkeitsverteilungen P und Q wird mathematisch definiert als:

D_KL(P || Q) = Σ P(x) log(P(x) / Q(x))

Hier repräsentiert P die wahre Wahrscheinlichkeitsverteilung der Daten, während Q die approximative Verteilung ist, mit der wir vergleichen. Die Summe (Σ) wird über alle möglichen Ergebnisse x durchgeführt. Wenn P und Q stetige Verteilungen sind, wird die Summe durch ein Integral ersetzt.

Einige wichtige Punkte zur K-L Divergenz:

Die K-L Divergenz ist immer nicht-negativ, das heißt D_KL(P || Q) ≥ 0. Ein Wert von zero zeigt an, dass die beiden Verteilungen identisch sind.
Sie ist nicht symmetrisch: D_KL(P || Q) ≠ D_KL(Q || P). This means that the order of distributions matters when calculating the divergence.
K-L Divergence is particularly useful in applications such as model selection, anomaly detection, and der Verarbeitung natürlicher Sprache.

In summary, K-L Divergence serves as a powerful tool for understanding how different distributions relate to one another, making it wesentlich für Datenanalyse und Modellbewertung.