Show simple item record

dc.contributor.advisorChela, João Luiz
dc.contributor.authorCordeiro, Tiago Vilas Boas
dc.date.accessioned2020-12-01T13:25:25Z
dc.date.available2020-12-01T13:25:25Z
dc.date.issued2020-11-11
dc.identifier.urihttps://hdl.handle.net/10438/29873
dc.description.abstractGiven the importance of credit risk management for the banking sector, probability of default models have become fundamental. In this context, with the advances in the volume of information from customers and the computational capacity, several techniques have been studied and applied. In this study, we used two traditional linear techniques, the Linear Discriminant Analysis and Logistic Regression, and four non-linear ensemble techniques, Bagging, Random Forest, Adaboost and Stacking, applied to a problem of probability of default on brazilian companies, using information from their financial statements. The results indicate that the transformations in the data and treatment of class imbalanced have a strong impact on the predictive power of Logistic Regression. Yet, Random Forest was the technique with the best performance regardless of the scenario and the metric used.eng
dc.description.abstractDada a importância do gerenciamento do risco de crédito para o setor bancário, modelos de probabilidade de default tornaram-se fundamentais. Neste contexto, com o avanço do volume de informações dos clientes e a capacidade computacional, diversas técnicas têm sido estudadas e aplicadas. Neste estudo, utilizamos duas técnicas lineares tradicionais, a Análise Discriminante Linear e a Regressão Logística, e quatro técnicas não-lineares ensembles, Bagging, Random Forest, Adaboost e Stacking, aplicadas em um problema de predição de default de empresas brasileiras utilizando informações de seus demonstrativos financeiros. Os resultados indicam que as transformações nos dados e tratamento de desbalanceamento de classes tem forte impacto no poder preditivo da Regressão Logística. Ainda, o Random Forest foi a técnica com melhor desempenho, independente do cenário e da métrica utilizada.por
dc.language.isopor
dc.subjectMachine Learningeng
dc.subjectLogistic Regressioneng
dc.subjectRandom Foresteng
dc.subjectProbability of defaulteng
dc.subjectRisk rating modelseng
dc.subjectRegressão Logísticapor
dc.subjectProbabilidade de defaultpor
dc.subjectModelos de ratingpor
dc.titlePredição de default de empresas: técnicas de machine learning em dados desbalanceadospor
dc.typeDissertationeng
dc.subject.areaEconomiapor
dc.contributor.unidadefgvEscolas::EESPpor
dc.subject.bibliodataAprendizado do computadorpor
dc.subject.bibliodataAnálise de Regressão Logísticapor
dc.subject.bibliodataAvaliação de riscopor
dc.rights.accessRightsopenAccesseng
dc.contributor.memberCosta, Oswaldo Luiz do Valle
dc.contributor.memberMatsumoto, Élia Yathie


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record