Erkunde 1 KI-Begriff in Bewertungstechniken
Die Off-Policy-Bewertung (OPE) bewertet die Leistung einer Richtlinie anhand von Daten, die aus einer anderen Richtlinie stammen.