Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/84928
Título: | Análise multivariada de dados sobre tipologia de produtos numa empresa |
Outro(s) título(s): | Multivariate analysis of data on typology of products in a company |
Autor(es): | Costa, Nelson Filipe Sá |
Orientador(es): | Sousa, Inês Rodrigues, Luís |
Palavras-chave: | Machine learning PCA k-Means Clustering hierárquico Vendas Hierarchical clustering Sales |
Data: | 11-Jan-2023 |
Resumo(s): | As pequenas, médias e grandes empresas recolhem os seus dados esperando que estes de alguma
forma gerem valor comercial. O machine learning tem a capacidade de fornecer informação valiosa a
partir dos dados, servindo de principal estratégia de vendas para que a empresa consiga alcançar maior
lucro.
O objetivo desta dissertação é analisar dados de vendas da empresa Litel, Lda, procurando extrair
padrões de vendas relativos a produtos (caixas e sacos) que compartilham similaridades entre si. Para
alcançar este objetivo são apresentadas metodologias de aprendizagem não supervisionada que permitem
traçar uma segmentação de grupos, nomeadamente Análise de Componentes Principais (PCA), algoritmos
de k-Means e clustering hierárquico.
O PCA foi usado para identificar variáveis correlacionadas e identificar padrões ocultos nos dados,
nomeadamente famílias de produtos com similaridades nas vendas. Foram aplicados os métodos do
cotovelo, da silhueta e dos 30 índices para escolha do melhor número de clusters, de modo a identifi car o número ótimo de clusters. Foram ainda aplicados métodos de validação, de modo a identificar o
algoritmo de clustering com melhor desempenho. Através das medidas de estabilidade foi avaliada a
consistência dos clusters, e através do coeficiente cofenético foi determinada a combinação de métodos
que refletiu num melhor agrupamento de dados. Após realizar as validações anteriores foram implemen tados os respetivos algoritmos de clustering. De um modo geral, todos os algoritmos de clustering
segmentaram os dados de uma forma bastante satisfatória podendo destacar a ótima performance do
algoritmo clustering hierárquico método ”average”. Small, medium and large companies collect their data hoping that it will somehow generate commer cial value. Machine learning has the ability to provide valuable information from data, serving as the main sales strategy for the company to achieve greater profit. The objective of this dissertation is to analyze sales data from the company Litel, Lda, seeking to extract sales patterns related to products (boxes and bags) that share similarities with each other. In order to achieve this objective, unsupervised learning methodologies are presented, which allow for a segmentation of groups, namely Principal Component Analysis (PCA), k-Means algorithms and hierarchical clustering. The PCA was used to identify correlated variables and identify hidden patterns in the data, namely product families with similar sales. The elbow, silhouette and 30 indices methods were applied to choose the best number of clusters, in order to identify the optimal number of clusters. Validation methods were also applied in order to identify the clustering algorithm with the best performance. Through the stability measures, the consistency of the clusters was evaluated, and through the cophenetic coefficient, the combination of methods that reflected a better data grouping was determined. After carrying out the previous validations, the respective clustering algorithms were implemented. In general, all clustering algorithms segmented the data in a very satisfactory way, highlighting the excellent performance of the hierarchical clustering algorithm ”average”method. |
Tipo: | Dissertação de mestrado |
Descrição: | Dissertação de mestrado em Matemática e Computação |
URI: | https://hdl.handle.net/1822/84928 |
Acesso: | Acesso aberto |
Aparece nas coleções: | BUM - Dissertações de Mestrado DMAT - Dissertações de Mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Nelson Filipe Sa Costa.pdf | 3,41 MB | Adobe PDF | Ver/Abrir |
Este trabalho está licenciado sob uma Licença Creative Commons