Evaluating Google Trends data to the task of predicting stock returns
Resumo
The problem of predicting financial assets returns is one of the main problems of the empirical finance literature. In particular one of it’s main challenges is to evaluate the usefulness of the so called alternative data to this task. One of the most common alternative datasets is Google Trends data which have gained popularity in recent years. In this work we want to evaluate the usefulness of this data to the task of predicting U.S. stock indices returns. To achieve this goal we break up the problem in two steps: first we employ feature selection methods, and second we employ forecasting models. We use 15 feature selection methods and 10 forecasting models to achieve this goal. In contrast to what the literature have found, we do not found evidence that the Google Trends data contributes to predict the returns of the stock indices in question. The conclusions seems to be robust across feature selection methods, forecasting models, accuracy and risk and return metrics. A previsão dos retornos de ativos financeiros é um dos principais problemas da literatura de finanças empíricas. Em particular, um dos desafios atuais da literatura é avaliar a utilidade dos chamados dados alternativos para esta tarefa. Um dos dados mais comuns caracterizados como tal são os dados do Google Trends, e este tem alcançado popularidade elevada na literatura. Neste trabalho pretendemos avaliar a utilidade dos dados do Google Trends para a tarefa de previsão de índices de ações americanos. Para atingir este objetivo, separaremos o problema de previsão em duas etapas: primeiro a etapa de seleção de covariaveis, e segundo a etapa de previsão. Utilizamos 15 métodos de seleção de features e 10 métodos de previsão. Ao contrário do que a literatura anterior relatou, nós não encontramos evidencia de que os dados do Google Trends contribui para prever os retornos dos índices de ações estudados. As conclusões parecem ser consistentes entre modelos de seleção de covariaveis, modelos de previsão, e em relação a medidas de acurácia e de risco e retorno.


