Uma extensão do Framework de Almgren-Chriss para execução ótima de transações usando aprendizado de máquina
Abstract
Este trabalho busca explorar o uso do aprendizado por reforço como uma forma de melhorar uma solução analítica para o problema de liquidação ótima. Dado um determinado volume de liquidação a ser executado com um horizonte de tempo fixo e períodos de transação discretos, o objetivo será adaptar uma trajetória de liquidação gerada através de um modelo analítico de forma a torná-la dinâmica em relação a condições mais favoráveis/desfavoráveis à execução que não são levadas em conta pelo modelo base, reduzindo assim o custo operacional de transação. Replicando Hendricks e Wilcox (2014), o modelo base a ser utilizado será um modelo de Almgren-Chriss com impactos de preço lineares, um modelo já comumente utilizado para a otimização de execução em transações de mercado. Um agente é treinado para modificar a trajetória de execução gerada pelo modelo analítico, incorporando informações relativas ao volume disponível e aos spreads do mercado no momento da execução. O modelo é aplicado para ações transacionadas na B3, sendo capaz de uma redução de até 6,5% no déficit de implementação médio, comparado com o modelo base. The present dissertation is focused on exploring the use of reinforcement learning as a candidate technique for enhancing an analitic solution for the optimal liquidation problem. Given a volume to trade and a fixed time horizon with discrete trading intervals, the aim is to adapt a given trading trajectory generated by the analytic solution, such as to make it dynamic with respect to favourable/unfavourable trading conditions that are not taken into account by the base model. This is a replication of Hendricks e Wilcox (2014) and, as per the original work, uses the Almgren-Chriss model with linear price impact, which is a popularly used model for market applications, as the base model. An agent is then trained to modify the trading trajectory generated by the base model, incorporating volume and spread conditions. The model is then tested for Brazilian equities, and is able to reduce average implementation shortfall by up to 6.5%.


