Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/29402

TítuloModelos para dados de contagem com excesso de zeros
Autor(es)Santos, Jorge Helder Pereira dos
Orientador(es)Faria, Susana
Palavras-chaveModelo de regressão de Poisson
Modelo de regressão binomial negativa
Modelo de regressão de zeros inflacionados
Poisson regression
Negative binomial regression
Zero inflated model
Data2013
Resumo(s)Os modelos de regressão para dados de contagem são muito utilizados nas mais variadas áreas de estudo para a modelação de fenómenos. Estes modelos integram um quadro especial de metodologias devido ao facto de a variável resposta tomar apenas valores inteiros não negativos. A distribuição de Poisson é a mais conhecida, e a mais utilizada para modelar dados de contagem, no entanto sempre que existe sobredispersão, torna-se necessário recorrer a outras distribuições, nomeadamente à distribuição Binomial Negativa. Outro problema comum nos dados de contagem é o excesso de zeros na variável resposta. Os modelos de regressão de zeros inflacionados são amplamente usados para modelar esse tipo de dados. Estes modelos modelam as contagens como uma mistura de duas distribuições com dois processos subjacentes, um que trata do excesso de zeros modelado por uma massa pontual, e um outro que trata das contagens sendo modelado por uma distribuição de Poisson ou Binomial Negativa. Neste trabalho pretendeu-se estudar os modelos de regressão para dados de contagem e a sua aplicação a dados bancários relativos a clientes a quem foi garantido crédito de consumo por um banco. Tem como principal objetivo estudar a relação do número de não pagamento da prestação do empréstimo de um cliente em função das caracteristicas do cliente e do contrato. Em particular, foram ajustados os modelos de regressão de Poisson, modelos de regressão Binomial Negativa, modelos de regressão de Poisson de zeros inflacionados e modelos de regressão binomial negativa de zeros inflacionados utilizando o algoritmo EM para obter as estimativas de máxima verosimilhança dos parâmetros. Os resultados obtidos mostraram que os modelos de regressão de zeros inflacionados apresentam um melhor ajustamento, quando comparados com os modelos que não têm em consideração o excesso de zeros. Mostraram ainda que os modelos baseados na distribuição Binomial Negativa, são os mais adequados para modelar estes dados, em vez dos modelos baseados na distribuição de Poisson.
Regression models for count data are highly used in several areas of study for modelation of phenomena. These models feature a special methodological board that comes from the fact that the response variable just takes non-negative integer values. The Poisson distribution is the most recognized and most widely used to model count data, however when there is overdispersion, it becomes necessary the use other distributions, as so, including negative binomial distribution. Another common problem in count data, is the excess of zeros in the response variable. Zero inflated regression models are widely used to model this type of data. These models model the counts as a mixture of two distributions with two underlying processes, one that deals with excess of zeros modeled by a pontual mass, and another one that handles the counts by being modelated by a Poisson or Negative Binomial distributions. In this work we intended to study regression models for count data and its application on bank data clients to whom it was granted consumption credit by a bank. Its main objective is to study the relationship of the number of non payment of the installment of a client depending on the characteristics of client and the contract. In particular, we fit the Poisson regression models, negative binomial regression models, zero inflated Poisson regression models and negative binomial regression models for zero inflated using the EM algorithm to obtain maximum likelihood estimates of the parameters. The results showed that zero inflated regression models have a better fit compared with models that do not take into account the extra zeros. Also showed that models based on the negative binomial distribution, are more suitable for modeling this data instead of models based on Poisson distribution.
TipoDissertação de mestrado
DescriçãoDissertação de mestrado em Estatística
URIhttps://hdl.handle.net/1822/29402
AcessoAcesso aberto
Aparece nas coleções:BUM - Dissertações de Mestrado
DMA - Dissertações de mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Tese_Jorge Helder Pereira dos Santos_2013.pdf3,75 MBAdobe PDFVer/Abrir

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID