FGV Digital Repository
    • português (Brasil)
    • English
    • español
      Visit:
    • FGV Digital Library
    • FGV Scientific Journals
  • English 
    • português (Brasil)
    • English
    • español
  • Login
View Item 
  •   DSpace Home
  • FGV EESP - Escola de Economia de São Paulo
  • FGV EESP - MPFE: Dissertações, Mestrado Profissional em Finanças e Economia
  • View Item
  •   DSpace Home
  • FGV EESP - Escola de Economia de São Paulo
  • FGV EESP - MPFE: Dissertações, Mestrado Profissional em Finanças e Economia
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Browse

All of DSpaceFGV Communities & CollectionsAuthorsAdvisorControlled vocabularyTitlesBy Issue DateKeywordsThis CollectionAuthorsAdvisorControlled vocabularyTitlesBy Issue DateKeywords

My Account

LoginRegister

Statistics

View Usage Statistics

Predição de default de empresas: técnicas de machine learning em dados desbalanceados

Thumbnail
View/Open
Dissertação (1.293Mb)
Date
2020-11-11
Author
Cordeiro, Tiago Vilas Boas
Advisor
Chela, João Luiz
Metadata
Show full item record
Abstract
Given the importance of credit risk management for the banking sector, probability of default models have become fundamental. In this context, with the advances in the volume of information from customers and the computational capacity, several techniques have been studied and applied. In this study, we used two traditional linear techniques, the Linear Discriminant Analysis and Logistic Regression, and four non-linear ensemble techniques, Bagging, Random Forest, Adaboost and Stacking, applied to a problem of probability of default on brazilian companies, using information from their financial statements. The results indicate that the transformations in the data and treatment of class imbalanced have a strong impact on the predictive power of Logistic Regression. Yet, Random Forest was the technique with the best performance regardless of the scenario and the metric used.
 
Dada a importância do gerenciamento do risco de crédito para o setor bancário, modelos de probabilidade de default tornaram-se fundamentais. Neste contexto, com o avanço do volume de informações dos clientes e a capacidade computacional, diversas técnicas têm sido estudadas e aplicadas. Neste estudo, utilizamos duas técnicas lineares tradicionais, a Análise Discriminante Linear e a Regressão Logística, e quatro técnicas não-lineares ensembles, Bagging, Random Forest, Adaboost e Stacking, aplicadas em um problema de predição de default de empresas brasileiras utilizando informações de seus demonstrativos financeiros. Os resultados indicam que as transformações nos dados e tratamento de desbalanceamento de classes tem forte impacto no poder preditivo da Regressão Logística. Ainda, o Random Forest foi a técnica com melhor desempenho, independente do cenário e da métrica utilizada.
 
URI
https://hdl.handle.net/10438/29873
Collections
  • FGV EESP - MPFE: Dissertações, Mestrado Profissional em Finanças e Economia
Knowledge Areas
Economia
Subject
Machine Learning
Logistic Regression
Random Forest
Probability of default
Risk rating models
Regressão Logística
Probabilidade de default
Modelos de rating
Economia
Aprendizado do computador
Análise de Regressão Logística
Avaliação de risco

DSpace software copyright © 2002-2016  DuraSpace
Contact Us | Send Feedback
Theme by 
@mire NV
 

 


DSpace software copyright © 2002-2016  DuraSpace
Contact Us | Send Feedback
Theme by 
@mire NV
 

 

Import Metadata