Publicação

Data mining via redes neuronais artificiais e máquinas de vectores de suporte

Ver documento

Detalhes bibliográficos
Resumo:O interesse nas áreas da Descoberta de Conhecimento em Bases de Dados e Data Mining emergiu devido ao rápido desenvolvimento das Tecnologias de Informação e Comunicação, levando a que, hoje em dia, grandes quantidades de dados estejam armazenados em computadores. Os peritos humanos são limitados, podendo falhar na identificação de detalhes importantes. Em alternativa, podem utilizar-se ferramentas de descoberta automática com vista à extracção de conhecimento de alto nível a partir de dados em bruto. Dada esta necessidade, foram propostas diversas técnicas de Data Mining. Nesta dissertação, pretende-se esclarecer quais as vantagens e capacidades de dois modelos de Data Mining com capacidade de aprendizagem não linear: as Redes Neuronais Artificiais (RNAs) e as Máquinas de Vectores de Suporte (MVSs). Em particular, pretende-se saber qual o desempenho destas técnicas quando aplicadas a tarefas de classificação e regressão, comparando-as com outras técnicas, i.e. Árvores de Decisão/Regressão. Assim, fez-se uma análise de ferramentas de software que implementam os modelos referidos, tendo-se escolhido duas aplicações de utilização livre (i.e. o ambiente de programação R e o Weka) para conduzir as experiências efectuadas. Como casos de estudo, foram utilizados diversos problemas do mundo real, retirados do repositório público UCI. Os resultados obtidos revelam que as MVSs obtêm em geral um melhor desempenho em previsão, sendo seguidas pelas RNAs. No entanto, tal melhoria é conseguida à custa de um maior esforço computacional.
Autores principais:Cruz, Armando Jorge Ribeiro da
Ano:2008
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Universidade do Minho
Idioma:português
Origem:RepositóriUM - Universidade do Minho
Descrição
Resumo:O interesse nas áreas da Descoberta de Conhecimento em Bases de Dados e Data Mining emergiu devido ao rápido desenvolvimento das Tecnologias de Informação e Comunicação, levando a que, hoje em dia, grandes quantidades de dados estejam armazenados em computadores. Os peritos humanos são limitados, podendo falhar na identificação de detalhes importantes. Em alternativa, podem utilizar-se ferramentas de descoberta automática com vista à extracção de conhecimento de alto nível a partir de dados em bruto. Dada esta necessidade, foram propostas diversas técnicas de Data Mining. Nesta dissertação, pretende-se esclarecer quais as vantagens e capacidades de dois modelos de Data Mining com capacidade de aprendizagem não linear: as Redes Neuronais Artificiais (RNAs) e as Máquinas de Vectores de Suporte (MVSs). Em particular, pretende-se saber qual o desempenho destas técnicas quando aplicadas a tarefas de classificação e regressão, comparando-as com outras técnicas, i.e. Árvores de Decisão/Regressão. Assim, fez-se uma análise de ferramentas de software que implementam os modelos referidos, tendo-se escolhido duas aplicações de utilização livre (i.e. o ambiente de programação R e o Weka) para conduzir as experiências efectuadas. Como casos de estudo, foram utilizados diversos problemas do mundo real, retirados do repositório público UCI. Os resultados obtidos revelam que as MVSs obtêm em geral um melhor desempenho em previsão, sendo seguidas pelas RNAs. No entanto, tal melhoria é conseguida à custa de um maior esforço computacional.