Please use this identifier to cite or link to this item: http://hdl.handle.net/1822/28552

TitleUm modelo para previsão de churn na área do retalho
Author(s)Veloso, Fernando Jorge Machado
Advisor(s)Belo, Orlando
KeywordsData mining
Árvores de decisão
Regressão logística
Redes neuronais
Random forests
Support vector machines
Previsão de churn
Sistemas de retalho
Decision trees
Logistic regression
Neural networks
Churn prediction
Retail systems
Issue date20-Mar-2013
Abstract(s)O ambiente de grande competitividade característico do sector do retalho e crescente dificuldade na captação de novos clientes leva as empresas a apostar na implementação de estratégias adequadas para promover a satisfação dos clientes adquiridos para motivar a sua lealdade. É neste contexto que se começa a reconhecer a importância de combater o fenómeno de churn, ou seja, a perda de clientes. É necessário identificar os clientes que estão em risco de churn e, para isso, é necessário criar um método que o permita fazer com antecedência para que possam recair sobre eles as campanhas de retenção proactivas. Quanto mais eficaz for o método a identificar os clientes em riscos, maior será o retorno da aplicação da campanha. Muitos trabalhos têm sido desenvolvidos na área de previsão de churn nos mais diversos sectores. Contudo, na área do retalho a pesquisa têm sido muito limitada. Assim, com este trabalho de dissertação pretendeu-se estudar o fenómeno da perda de clientes com o objectivo de definir e implementar um modelo de churning para o sector do retalho recorrendo a técnicas de mineração de dados. Pretendeu-se fazer um levantamento das principais questões envolvidas na previsão de churn no retalho, na construção do conjunto de dados (assinaturas dos clientes) e na aplicação de técnicas de mineração de dados no processo de previsão. Nesse sentido, foram construídos alguns modelos para fazer a previsão de casos de churn baseados em cinco das técnicas de classificação mais utilizadas em trabalhos de previsão de churn: Árvores de Decisão, Regressão Logística, Redes Neuronais, Random Forests e SVM. A avaliação e comparação da performance dos modelos elaborados foi feita de acordo com várias medidas como accuracy, precision, sensitivity, specificity, f-measure e AUC e, para além disso, foi testado o impacto, na precisão do modelo, da alteração da densidade de eventos de churn no conjunto de treino.
The great competitive environment characteristic of the retail sector and increasing difficulty in attracting new customers leads firms to invest in the implementation of appropriate strategies to promote customer satisfaction to motivate their loyalty. It is in this context that we begin to recognize the importance of combating the phenomenon of churn, i.e., the loss of clients. It is necessary to identify customers who are at risk of churn and, therefore, it is necessary to create a method that allows to do it in advance so that they can be covered by the proactive retention campaigns. The more effective the method to identify customers at risk, the higher the return of applying the campaign. Many studies have been developed in the area of churn prediction in various sectors. However, in the area of retail the research has been very limited. So with this dissertation work was intended to study the phenomenon of loss of customers to define and implement a model of churning to the retail sector using data mining techniques. The intention was to make a survey of the main issues involved in the prediction of churn in retail, construction of the dataset (customer signatures) and applying data mining techniques in the forecasting process. Accordingly, some models were constructed to forecast cases of churn based on five of the most commonly used classification techniques in churn prediction: Decision Trees, Logistic Regression, Neural Networks, Random Forests and SVM. The evaluation and comparison of the performance of models developed has been made according to several measures as accuracy, precision, sensitivity, specificity, f-measure and AUC and, furthermore, has been tested the impact of the change in the density of churn events in the training set.
TypeMaster thesis
DescriptionDissertação de mestrado em Engenharia de Informática
URIhttp://hdl.handle.net/1822/28552
AccessOpen access
Appears in Collections:DI - Dissertações de Mestrado
BUM - Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
eeum_di_dissertacao_pg15446.pdf2,47 MBAdobe PDFView/Open

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID