Comparing machine learning algorithm performance for automated trading based on fundamentals
Abstract
Aplicações recentes de machine learning em finanças têm destacado a capacidade dessas técnicas em prever retornos de ativos. Neste artigo, comparamos diferentes metodologias de machine learning na previsão de retornos de ações durante vários períodos de um mês, com base em fundamentos e dados de preço. Para isso, os modelos ajustados são aplicados em uma estratégia de negociação simulada (“backtest”). Resultados preliminares sugerem que algoritmos não lineares como Random Forests, Extreme Gradient Boosting e Support Vector Machine podem ser superiores a algoritmos lineares como Regressão Linear e Lasso ao prever retornos de ações. Contudo, para o conjunto de fatores estudado neste artigo e para os ativos analisados, estes algoritmos não apresentam performance superior a uma estratégia de buy-and-hold para a maior parte dos ativos. Recent applications of machine learning in finance have highlighted the capacity of these techniques to predict asset returns. In this article, we compare different machine learning methodologies in forecasting stock returns over several one-month periods, based on fundamentals and price data. For this purpose, the fitted models are applied in a simulated trading strategy (“backtest”). Preliminary results suggest that nonlinear algorithms such as Random Forests, Extreme Gradient Boosting and Support Vector Machine may be superior to linear algorithms such as Linear Regression and Lasso in predicting stock returns. However, for the set of factors studied in this article and for the assets analyzed, these algorithms do not perform better than a buy-and-hold strategy for most assets.