Publicação

Análise multivariada de dados sobre tipologia de produtos numa empresa

Detalhes bibliográficos
Resumo:	As pequenas, médias e grandes empresas recolhem os seus dados esperando que estes de alguma forma gerem valor comercial. O machine learning tem a capacidade de fornecer informação valiosa a partir dos dados, servindo de principal estratégia de vendas para que a empresa consiga alcançar maior lucro. O objetivo desta dissertação é analisar dados de vendas da empresa Litel, Lda, procurando extrair padrões de vendas relativos a produtos (caixas e sacos) que compartilham similaridades entre si. Para alcançar este objetivo são apresentadas metodologias de aprendizagem não supervisionada que permitem traçar uma segmentação de grupos, nomeadamente Análise de Componentes Principais (PCA), algoritmos de k-Means e clustering hierárquico. O PCA foi usado para identificar variáveis correlacionadas e identificar padrões ocultos nos dados, nomeadamente famílias de produtos com similaridades nas vendas. Foram aplicados os métodos do cotovelo, da silhueta e dos 30 índices para escolha do melhor número de clusters, de modo a identifi car o número ótimo de clusters. Foram ainda aplicados métodos de validação, de modo a identificar o algoritmo de clustering com melhor desempenho. Através das medidas de estabilidade foi avaliada a consistência dos clusters, e através do coeficiente cofenético foi determinada a combinação de métodos que refletiu num melhor agrupamento de dados. Após realizar as validações anteriores foram implemen tados os respetivos algoritmos de clustering. De um modo geral, todos os algoritmos de clustering segmentaram os dados de uma forma bastante satisfatória podendo destacar a ótima performance do algoritmo clustering hierárquico método ”average”.
Autores principais:	Costa, Nelson Filipe Sá
Assunto:	Machine learning PCA k-Means Clustering hierárquico Vendas Hierarchical clustering Sales
Ano:	2023
País:	Portugal
Tipo de documento:	dissertação de mestrado
Tipo de acesso:	acesso aberto
Instituição associada:	Universidade do Minho
Idioma:	português
Origem:	RepositóriUM - Universidade do Minho

Descrição
Resumo:	As pequenas, médias e grandes empresas recolhem os seus dados esperando que estes de alguma forma gerem valor comercial. O machine learning tem a capacidade de fornecer informação valiosa a partir dos dados, servindo de principal estratégia de vendas para que a empresa consiga alcançar maior lucro. O objetivo desta dissertação é analisar dados de vendas da empresa Litel, Lda, procurando extrair padrões de vendas relativos a produtos (caixas e sacos) que compartilham similaridades entre si. Para alcançar este objetivo são apresentadas metodologias de aprendizagem não supervisionada que permitem traçar uma segmentação de grupos, nomeadamente Análise de Componentes Principais (PCA), algoritmos de k-Means e clustering hierárquico. O PCA foi usado para identificar variáveis correlacionadas e identificar padrões ocultos nos dados, nomeadamente famílias de produtos com similaridades nas vendas. Foram aplicados os métodos do cotovelo, da silhueta e dos 30 índices para escolha do melhor número de clusters, de modo a identifi car o número ótimo de clusters. Foram ainda aplicados métodos de validação, de modo a identificar o algoritmo de clustering com melhor desempenho. Através das medidas de estabilidade foi avaliada a consistência dos clusters, e através do coeficiente cofenético foi determinada a combinação de métodos que refletiu num melhor agrupamento de dados. Após realizar as validações anteriores foram implemen tados os respetivos algoritmos de clustering. De um modo geral, todos os algoritmos de clustering segmentaram os dados de uma forma bastante satisfatória podendo destacar a ótima performance do algoritmo clustering hierárquico método ”average”.