Economic news as data: what's between the lines?
Abstract
Agentes econômicos necessitam de informação sobre diferentes aspectos da economia para tomarem decisões de modo apropriado. Entretanto, medidas importantes para acessar o estado atual da economia não se encontram disponíveis instantaneamente. O objetivo do presente trabalho é aplicar a metodologia proposta por Bybee et al. (2020) para estimar uma estrutura de tópicos para as notícias econômicas brasileiras. Adicionalmente, medimos a atenção dedicada a cada tópico ao longo do tempo. Com isso, estudamos se as séries de atenção podem ser utilizadas como proxies em tempo real para diferentes indicadores econômicos brasileiros. A base de dados textual abrange o período de Maio de 2000 até Julho de 2020. Os resultados mostram que as séries de tempo extraídas dos artigos econômicos fornecem informações úteis para reconstruir e gerar conhecimento para as séries macroeconômicas no contexto brasileiro ao final do seu período de referência. Economics agents need information about different aspects of the economy to properly make their decisions. However, important measures to access the economic state are not instantly available. The purpose of this work is to apply the methodology proposed by Bybee et al. (2020) to estimate a topic structure for the Brazilian economic news. Also, we measure the attention dedicated to each topic overtime. With that, we study whether the attention time series can be used as a real-time proxy for several Brazilian economic indicators. The textual dataset sample period goes from May 2000 to July 2020. The results show that the time series extract from the texts of the economic articles provides useful information to reconstruct Brazilian macroeconomic variables and generate instantaneous knowledge at the end of the reference period for some of them.