Explora 1 término de IA en Multi-Armed Bandit
Un banda lineal es un tipo de problema de aprendizaje por refuerzo donde las acciones generan recompensas basadas en una relación lineal con las características.