FGV Digital Repository
    • português (Brasil)
    • English
    • español
      Visit:
    • FGV Digital Library
    • FGV Scientific Journals
  • English 
    • português (Brasil)
    • English
    • español
  • Login
View Item 
  •   DSpace Home
  • FGV EMAp - Escola de Matemática Aplicada
  • FGV EMAp - Trabalhos de Conclusão de Curso
  • View Item
  •   DSpace Home
  • FGV EMAp - Escola de Matemática Aplicada
  • FGV EMAp - Trabalhos de Conclusão de Curso
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Browse

All of DSpaceFGV Communities & CollectionsAuthorsAdvisorSubjectTitlesBy Issue DateKeywordsThis CollectionAuthorsAdvisorSubjectTitlesBy Issue DateKeywords

My Account

LoginRegister

Statistics

View Usage Statistics

Explorando o total potencial de um agente com Reinforcement Learning

Thumbnail
View/Open
Trabalho de conclusão de curso - Lucas de Brito dos Reis (2.503Mb)
Date
2019-11
Author
Reis, Lucas de Brito dos
Advisor
Souza, Renato Rocha
Metadata
Show full item record
Abstract
Aprendizado por Reforço, ou Reinforcement Learning (RL) é um conjunto de algoritmos e técnicas que consistem em um agente aprender a realizar determinada tarefa por meio de recompensas atribuídas à suas ações. Em nosso estudo, determinamos um benchmark onde essas diversas técnicas podem ser comparadas. Então, dentre as etapas que consistem em uma solução de RL, decidimos estudar o impacto do Tratamento das Observações no treinamento desses algoritmos.
 
Reinforcement Learning (RL) is a field of study where an agent learns to accomplish goals by receiving rewards to their actions. In our study, we determine a new benchmark where these many techniques can be compared. Then, among the several steps that consist into a RL solution, we decided to study the impact of Observation Treatment on the training of such algorithms.
 
URI
https://hdl.handle.net/10438/29350
Collections
  • FGV EMAp - Trabalhos de Conclusão de Curso [45]
Knowledge Areas
Matemática
Subject
Aprendizado por esforço
Keyword
Agente
Potencial
Reinforcement Learning
Algoritmos

DSpace software copyright © 2002-2016  DuraSpace
Contact Us | Send Feedback
Theme by 
@mire NV
 

 


DSpace software copyright © 2002-2016  DuraSpace
Contact Us | Send Feedback
Theme by 
@mire NV
 

 

Import Metadata