Utilize este identificador para referenciar este registo: https://hdl.handle.net/1822/84928

TítuloAnálise multivariada de dados sobre tipologia de produtos numa empresa
Outro(s) título(s)Multivariate analysis of data on typology of products in a company
Autor(es)Costa, Nelson Filipe Sá
Orientador(es)Sousa, Inês
Rodrigues, Luís
Palavras-chaveMachine learning
PCA
k-Means
Clustering hierárquico
Vendas
Hierarchical clustering
Sales
Data11-Jan-2023
Resumo(s)As pequenas, médias e grandes empresas recolhem os seus dados esperando que estes de alguma forma gerem valor comercial. O machine learning tem a capacidade de fornecer informação valiosa a partir dos dados, servindo de principal estratégia de vendas para que a empresa consiga alcançar maior lucro. O objetivo desta dissertação é analisar dados de vendas da empresa Litel, Lda, procurando extrair padrões de vendas relativos a produtos (caixas e sacos) que compartilham similaridades entre si. Para alcançar este objetivo são apresentadas metodologias de aprendizagem não supervisionada que permitem traçar uma segmentação de grupos, nomeadamente Análise de Componentes Principais (PCA), algoritmos de k-Means e clustering hierárquico. O PCA foi usado para identificar variáveis correlacionadas e identificar padrões ocultos nos dados, nomeadamente famílias de produtos com similaridades nas vendas. Foram aplicados os métodos do cotovelo, da silhueta e dos 30 índices para escolha do melhor número de clusters, de modo a identifi car o número ótimo de clusters. Foram ainda aplicados métodos de validação, de modo a identificar o algoritmo de clustering com melhor desempenho. Através das medidas de estabilidade foi avaliada a consistência dos clusters, e através do coeficiente cofenético foi determinada a combinação de métodos que refletiu num melhor agrupamento de dados. Após realizar as validações anteriores foram implemen tados os respetivos algoritmos de clustering. De um modo geral, todos os algoritmos de clustering segmentaram os dados de uma forma bastante satisfatória podendo destacar a ótima performance do algoritmo clustering hierárquico método ”average”.
Small, medium and large companies collect their data hoping that it will somehow generate commer cial value. Machine learning has the ability to provide valuable information from data, serving as the main sales strategy for the company to achieve greater profit. The objective of this dissertation is to analyze sales data from the company Litel, Lda, seeking to extract sales patterns related to products (boxes and bags) that share similarities with each other. In order to achieve this objective, unsupervised learning methodologies are presented, which allow for a segmentation of groups, namely Principal Component Analysis (PCA), k-Means algorithms and hierarchical clustering. The PCA was used to identify correlated variables and identify hidden patterns in the data, namely product families with similar sales. The elbow, silhouette and 30 indices methods were applied to choose the best number of clusters, in order to identify the optimal number of clusters. Validation methods were also applied in order to identify the clustering algorithm with the best performance. Through the stability measures, the consistency of the clusters was evaluated, and through the cophenetic coefficient, the combination of methods that reflected a better data grouping was determined. After carrying out the previous validations, the respective clustering algorithms were implemented. In general, all clustering algorithms segmented the data in a very satisfactory way, highlighting the excellent performance of the hierarchical clustering algorithm ”average”method.
TipoDissertação de mestrado
DescriçãoDissertação de mestrado em Matemática e Computação
URIhttps://hdl.handle.net/1822/84928
AcessoAcesso aberto
Aparece nas coleções:BUM - Dissertações de Mestrado
DMAT - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Nelson Filipe Sa Costa.pdf3,41 MBAdobe PDFVer/Abrir

Este trabalho está licenciado sob uma Licença Creative Commons Creative Commons

Partilhe no FacebookPartilhe no TwitterPartilhe no DeliciousPartilhe no LinkedInPartilhe no DiggAdicionar ao Google BookmarksPartilhe no MySpacePartilhe no Orkut
Exporte no formato BibTex mendeley Exporte no formato Endnote Adicione ao seu ORCID