Nonparametric extreme value mixture models: applications to insurance losses
Abstract
Modelling insurance losses is a challenging topic to actuaries and practitioners in the insurance industry. Commonly used loss models based on standard parametric density functions (Lognormal, Gamma, Weibull, Burr Type XII, Inverse Gaussian and Inverse Gamma) are often able to fit the bulk of the claim size distributions well but they fail to describe the behaviour of the most extremal observations. A popular approach used to overcome this limitation is to isolate the extreme data points and model them separately using Extreme Value Theory and the Generalized Pareto Distribution, an approach known as Peaks-Over-Threshold (POT) method. However, in most empirical applications, actuaries are interested in obtain a single model that provides a suitable global fit over the whole range of the distribution. In this thesis, we consider a nonparametric extreme value mixture model that is able to fit both small and large claims simultaneously. The model is extremely flexible due to its nonparametric component, avoiding the need to impose a functional form to the bulk of the loss distribution, as in most of the previous mixture approaches proposed in the actuarial literature. Further, the kernel density estimator has just a single extra parameter to be estimated, overcoming the problem of high computational burden related to other similar models. To illustrate the applicability and effectiveness of our model in the context of property and casualty losses, we consider three real data sets widely accessible and well-studied in the actuarial literature. The results suggest that the model provides a superior fit when compared with other existing alternatives. A modelagem da severidade de sinistros é um tópico desafiador para atuários e profissionais que atuam no mercado segurador. Modelos paramétricos comumente utilizados para aproximar as distribuições de severidade (Lognormal, Gama, Weibull, Burr Tipo XII, Gaussiana Inversa e Gamma Inversa) são capazes de fornecer um bom ajuste para os dados localizados no corpo das distribuições, mas falham ao descrever o comportamento das observações mais extremas. Uma abordagem popular empregada para superar essa limitação consiste em isolar a porção extrema das caudas e modelá-las separadamente utilizando a célebre Teoria de Valores Extremos e a Distribuição Generalizada de Pareto, um método conhecido como Peaks-Over-Threshold (POT). Entretanto, na maioria das aplicações práticas, atuários estão interessados em obter um único modelo que proporcione um ajuste satisfatório em todo o suporte da distribuição. Nesta dissertação, consideramos uma mistura não-paramétrica de valores extremos capaz de modelar conjuntamente pequenas e grandes perdas. O modelo possui a vantagem de ser extremamente flexível devido ao seu componente não-paramétrico, evitando-se que seja necessário impor uma forma funcional para o corpo da distribuição, como na maioria dos modelos de mistura propostos na literatura atuarial. Adicionalmente, o estimador de densidade kernel tem apenas um único parâmetro adicional a ser estimado, superando o problema da complexidade computacional relacionado a modelos similares. Para demonstrar a aplicabilidade e efetividade do modelo proposto no contexto da modelagem da severidade de sinistros, utilizamos três conjuntos de dados reais amplamente acessíveis e bastante explorados na literatura atuarial. Os resultados sugerem que o modelo analisado proporciona um ajuste superior quando comparado às outras alternativas existentes.


