FGV Repositório Digital
    • português (Brasil)
    • English
    • español
      Acesse:
    • FGV Biblioteca Digital
    • FGV Periódicos científicos e revistas
  • português (Brasil) 
    • português (Brasil)
    • English
    • español
  • Entrar
Ver item 
  •   Página inicial
  • FGV EMAp - Escola de Matemática Aplicada
  • FGV EMAp - Trabalhos de Conclusão de Curso
  • Ver item
  •   Página inicial
  • FGV EMAp - Escola de Matemática Aplicada
  • FGV EMAp - Trabalhos de Conclusão de Curso
  • Ver item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Navegar

Todo o repositórioComunidades FGVAutorOrientadorAssuntoTítuloDataPalavra-chaveEsta coleçãoAutorOrientadorAssuntoTítuloDataPalavra-chave

Minha conta

EntrarCadastro

Estatísticas

Ver as estatísticas de uso

Desenvolvimento de estratégias e fenômenos em dinâmicas de jogos de múltiplos agentes

Thumbnail
Visualizar/Abrir
Trabalho de conclusão de curso - Giovanni Almeida Argento de Amorim (8.721Mb)
Data
2020-11
Autor
Amorim, Giovanni Almeida Argento de
Orientador
Coelho, Flávio Codeço
Metadados
Mostrar registro completo
Resumo
Recent developments in Reinforcement Learning (RL) methods are focused on models that can learn good policies in non stationary environments, such as multi-agent games, where agents must learn how to react to changes in other agent’s strategies or in the environment. Some development has been made by studying not only how one agent can develop it’s policy, but how a population of agents can evolve from initial distributions to stable states of strategies. Evolutionary Game Theory (EGT) is the theoretical framework that applies mathematical and economical knowledge from game theory and biological evolution inspiration to study how individuals from a population dynamically interact in an environment. In this paper, we first introduce EGT concepts and show how they can be applied to understanding a population’s learning dynamics in the context of RL. Then we link those concepts with learning algorithms and study how one can infer the behaviour of those methods from links with evolutionary dynamics. Finally, we study and evaluate a recently proposed algorithm derived from policy gradient model and EGT dynamics and discuss next steps.
URI
https://hdl.handle.net/10438/30458
Coleções
  • FGV EMAp - Trabalhos de Conclusão de Curso [45]
Áreas do conhecimento
Matemática
Assunto
Teoria dos jogos
Jogos estratégicos (Matemática)
Palavra-chave
Evolutionary game theory
Reinforcement learning
Multi agent
Learning dynamics
Replicator dynamics
Neural replicator dynamics

DSpace software copyright © 2002-2016  DuraSpace
Entre em contato | Deixe sua opinião
Theme by 
@mire NV
 

 


DSpace software copyright © 2002-2016  DuraSpace
Entre em contato | Deixe sua opinião
Theme by 
@mire NV
 

 

Importar metadado