Redes bayesianas aplicadas à modelagem de fraudes em cartão de crédito
Abstract
Modelos para detecção de fraude são utilizados para identificar se uma transação é legítima ou fraudulenta com base em informações cadastrais e transacionais. A técnica proposta no estudo apresentado, nesta dissertação, consiste na de Redes Bayesianas (RB); seus resultados foram comparados à técnica de Regressão Logística (RL), amplamente utilizada pelo mercado. As Redes Bayesianas avaliadas foram os classificadores bayesianos, com a estrutura Naive Bayes. As estruturas das redes bayesianas foram obtidas a partir de dados reais, fornecidos por uma instituição financeira. A base de dados foi separada em amostras de desenvolvimento e validação por cross validation com dez partições. Naive Bayes foram os classificadores escolhidos devido à simplicidade e a sua eficiência. O desempenho do modelo foi avaliado levando-se em conta a matriz de confusão e a área abaixo da curva ROC. As análises dos modelos revelaram desempenho, levemente, superior da regressão logística quando comparado aos classificadores bayesianos. A regressão logística foi escolhida como modelo mais adequado por ter apresentado melhor desempenho na previsão das operações fraudulentas, em relação à matriz de confusão. Baseada na área abaixo da curva ROC, a regressão logística demonstrou maior habilidade em discriminar as operações que estão sendo classificadas corretamente, daquelas que não estão. For fraud detection models are used to identify whether a transaction is legitimate or fraudulent based on registration and transactional information. The proposal on technical study presented in this thesis consists in the Bayesian Networks (BN); their results were compared to logistic regression technique (RL), widely used by the market. Bayesian classifiers were evaluated, with the Naive Bayes structure. The structures of Bayesian networks were obtained from actual data, provided by a financial institution. The database was divided into samples development and validation by cross validation ten partitions. Naive Bayes classifiers were chosen due to the simplicity and efficiency. The model performance was evaluated taking into account the confusion matrix and the area under the ROC curve. The analyzes of performance models revealed slightly higher than the logistic regression compared to bayesian classifiers. Logistic regression was chosen as the most appropriate model for performed better in predicting fraudulent operations, compared to the confusion matrix. Based on area under the ROC curve, logistic regression demonstrated greater ability to discriminate the operations being classified correctly, those that are not.
Knowledge Areas
Related items
Showing items related by title, author, creator and subject.
-
Ações substantivas e simbólicas na criação e condução de uma fraude corporativa: o caso Boi Gordo
Wood Junior, Thomaz; Costa, Ana Paula Paulino da
2012-12-01In this paper, the results of an inductive interpretive study of a notorious corporate fraud case, which occurred in Brazil from the 1980s to the 2000s, are reported. Through the content analysis and discourse analysis ... -
The digital ecosystem in the 2020 municipal elections in Brazil: the buzz of distrust in the electoral system on Facebook, YouTube and Twitter
Ruediger, Marco Aurélio; Grassi, Amaro
2020This research analyzes the flux of content and narrative axis that support the lack of trust on the Brazilian electoral system. The study is based on a corpus of 1,426,687 posts published on Facebook, YouTube, and Twitter ... -
Viagem ao centro da denúncia: explorando as 'camadas' que influenciam as denúncias de fraudes nas organizações
Fajardo, Bernardo de Abreu Guelber
2012-03-13The accounting frauds represent a great loss for the global economy in both the public and private sectors, thus highlighting the social damage caused by them. In this regard, several studies have shown that the act of ...





