Explorando o total potencial de um agente com Reinforcement Learning
Abstract
Aprendizado por Reforço, ou Reinforcement Learning (RL) é um conjunto de algoritmos e técnicas que consistem em um agente aprender a realizar determinada tarefa por meio de recompensas atribuídas à suas ações. Em nosso estudo, determinamos um benchmark onde essas diversas técnicas podem ser comparadas. Então, dentre as etapas que consistem em uma solução de RL, decidimos estudar o impacto do Tratamento das Observações no treinamento desses algoritmos. Reinforcement Learning (RL) is a field of study where an agent learns to accomplish goals by receiving rewards to their actions. In our study, we determine a new benchmark where these many techniques can be compared. Then, among the several steps that consist into a RL solution, we decided to study the impact of Observation Treatment on the training of such algorithms.


