Explore 1 termos de IA em Multi-Armed Bandit
Um bandido linear é um tipo de problema de aprendizado por reforço onde as ações geram recompensas com base em uma relação linear com as características.