Erkunde 1 KI-Begriff im Multi-Armed Bandit
Ein lineares Bandit ist eine Art von Verstärkungslernproblem, bei dem Aktionen Belohnungen basierend auf einer linearen Beziehung zu Merkmalen liefern.