Please use this identifier to cite or link to this item:
https://hdl.handle.net/1822/28552
Title: | Um modelo para previsão de churn na área do retalho |
Author(s): | Veloso, Fernando Jorge Machado |
Advisor(s): | Belo, Orlando |
Keywords: | Data mining Árvores de decisão Regressão logística Redes neuronais Random forests Support vector machines Previsão de churn Sistemas de retalho Decision trees Logistic regression Neural networks Churn prediction Retail systems |
Issue date: | 20-Mar-2013 |
Abstract(s): | O ambiente de grande competitividade característico do sector do retalho e crescente dificuldade na captação de novos clientes leva as empresas a apostar na implementação de estratégias adequadas para promover a satisfação dos clientes adquiridos para motivar a sua lealdade. É neste contexto que se começa a reconhecer a importância de combater o fenómeno de churn, ou seja, a perda de clientes. É necessário identificar os clientes que estão em risco de churn e, para isso, é necessário criar um método que o permita fazer com antecedência para que possam recair sobre eles as campanhas de retenção proactivas. Quanto mais eficaz for o método a identificar os clientes em riscos, maior será o retorno da aplicação da campanha. Muitos trabalhos têm sido desenvolvidos na área de previsão de churn nos mais diversos sectores. Contudo, na área do retalho a pesquisa têm sido muito limitada. Assim, com este trabalho de dissertação pretendeu-se estudar o fenómeno da perda de clientes com o objectivo de definir e implementar um modelo de churning para o sector do retalho recorrendo a técnicas de mineração de dados. Pretendeu-se fazer um levantamento das principais questões envolvidas na previsão de churn no retalho, na construção do conjunto de dados (assinaturas dos clientes) e na aplicação de técnicas de mineração de dados no processo de previsão. Nesse sentido, foram construídos alguns modelos para fazer a previsão de casos de churn baseados em cinco das técnicas de classificação mais utilizadas em trabalhos de previsão de churn: Árvores de Decisão, Regressão Logística, Redes Neuronais, Random Forests e SVM. A avaliação e comparação da performance dos modelos elaborados foi feita de acordo com várias medidas como accuracy, precision, sensitivity, specificity, f-measure e AUC e, para além disso, foi testado o impacto, na precisão do modelo, da alteração da
densidade de eventos de churn no conjunto de treino. The great competitive environment characteristic of the retail sector and increasing difficulty in attracting new customers leads firms to invest in the implementation of appropriate strategies to promote customer satisfaction to motivate their loyalty. It is in this context that we begin to recognize the importance of combating the phenomenon of churn, i.e., the loss of clients. It is necessary to identify customers who are at risk of churn and, therefore, it is necessary to create a method that allows to do it in advance so that they can be covered by the proactive retention campaigns. The more effective the method to identify customers at risk, the higher the return of applying the campaign. Many studies have been developed in the area of churn prediction in various sectors. However, in the area of retail the research has been very limited. So with this dissertation work was intended to study the phenomenon of loss of customers to define and implement a model of churning to the retail sector using data mining techniques. The intention was to make a survey of the main issues involved in the prediction of churn in retail, construction of the dataset (customer signatures) and applying data mining techniques in the forecasting process. Accordingly, some models were constructed to forecast cases of churn based on five of the most commonly used classification techniques in churn prediction: Decision Trees, Logistic Regression, Neural Networks, Random Forests and SVM. The evaluation and comparison of the performance of models developed has been made according to several measures as accuracy, precision, sensitivity, specificity, f-measure and AUC and, furthermore, has been tested the impact of the change in the density of churn events in the training set. |
Type: | Master thesis |
Description: | Dissertação de mestrado em Engenharia de Informática |
URI: | https://hdl.handle.net/1822/28552 |
Access: | Open access |
Appears in Collections: | BUM - Dissertações de Mestrado DI - Dissertações de Mestrado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
eeum_di_dissertacao_pg15446.pdf | 2,47 MB | Adobe PDF | View/Open |