Publicação
Data mining via redes neuronais artificiais e máquinas de vectores de suporte
| Resumo: | O interesse nas áreas da Descoberta de Conhecimento em Bases de Dados e Data Mining emergiu devido ao rápido desenvolvimento das Tecnologias de Informação e Comunicação, levando a que, hoje em dia, grandes quantidades de dados estejam armazenados em computadores. Os peritos humanos são limitados, podendo falhar na identificação de detalhes importantes. Em alternativa, podem utilizar-se ferramentas de descoberta automática com vista à extracção de conhecimento de alto nível a partir de dados em bruto. Dada esta necessidade, foram propostas diversas técnicas de Data Mining. Nesta dissertação, pretende-se esclarecer quais as vantagens e capacidades de dois modelos de Data Mining com capacidade de aprendizagem não linear: as Redes Neuronais Artificiais (RNAs) e as Máquinas de Vectores de Suporte (MVSs). Em particular, pretende-se saber qual o desempenho destas técnicas quando aplicadas a tarefas de classificação e regressão, comparando-as com outras técnicas, i.e. Árvores de Decisão/Regressão. Assim, fez-se uma análise de ferramentas de software que implementam os modelos referidos, tendo-se escolhido duas aplicações de utilização livre (i.e. o ambiente de programação R e o Weka) para conduzir as experiências efectuadas. Como casos de estudo, foram utilizados diversos problemas do mundo real, retirados do repositório público UCI. Os resultados obtidos revelam que as MVSs obtêm em geral um melhor desempenho em previsão, sendo seguidas pelas RNAs. No entanto, tal melhoria é conseguida à custa de um maior esforço computacional. |
|---|---|
| Autores principais: | Cruz, Armando Jorge Ribeiro da |
| Ano: | 2008 |
| País: | Portugal |
| Tipo de documento: | dissertação de mestrado |
| Tipo de acesso: | acesso aberto |
| Instituição associada: | Universidade do Minho |
| Idioma: | português |
| Origem: | RepositóriUM - Universidade do Minho |
| Resumo: | O interesse nas áreas da Descoberta de Conhecimento em Bases de Dados e Data Mining emergiu devido ao rápido desenvolvimento das Tecnologias de Informação e Comunicação, levando a que, hoje em dia, grandes quantidades de dados estejam armazenados em computadores. Os peritos humanos são limitados, podendo falhar na identificação de detalhes importantes. Em alternativa, podem utilizar-se ferramentas de descoberta automática com vista à extracção de conhecimento de alto nível a partir de dados em bruto. Dada esta necessidade, foram propostas diversas técnicas de Data Mining. Nesta dissertação, pretende-se esclarecer quais as vantagens e capacidades de dois modelos de Data Mining com capacidade de aprendizagem não linear: as Redes Neuronais Artificiais (RNAs) e as Máquinas de Vectores de Suporte (MVSs). Em particular, pretende-se saber qual o desempenho destas técnicas quando aplicadas a tarefas de classificação e regressão, comparando-as com outras técnicas, i.e. Árvores de Decisão/Regressão. Assim, fez-se uma análise de ferramentas de software que implementam os modelos referidos, tendo-se escolhido duas aplicações de utilização livre (i.e. o ambiente de programação R e o Weka) para conduzir as experiências efectuadas. Como casos de estudo, foram utilizados diversos problemas do mundo real, retirados do repositório público UCI. Os resultados obtidos revelam que as MVSs obtêm em geral um melhor desempenho em previsão, sendo seguidas pelas RNAs. No entanto, tal melhoria é conseguida à custa de um maior esforço computacional. |
|---|