Detalhes do Documento

Classificação de dados biológicos : características e classificadores

Autor(es): Correia, Daniel João Bastos

Data: 2012

Identificador Persistente: http://hdl.handle.net/10400.26/17234

Origem: Instituto Politécnico de Coimbra

Projeto/bolsa: info:eu-repo/grantAgreement/FCT/5876-PPCDTI/71770/PT ;

Assunto(s): Proteínas; Deteção de Peptidases; Text mining; Support Vector Machines; One-Class; LASVM; Web Platform


Descrição

Reconhecendo a importância que o estudo das proteínas desempenha para a compreensão de inúmeros sistemas biológicos, este trabalho tem por objetivo analisar e explorar a efetividade da utilização de técnicas de data mining para classificação de proteínas, aplicadas ao caso de estudo da deteção de peptidases. A metodologia apresentada e avaliada é baseada em técnicas de text mining aplicadas à estrutura primária das proteínas, conjugadas com algoritmos de classificação supervisionada. São apresentados resultados para os algoritmos baseados em máquinas de vetor de suporte, nomeadamente C-SVC, One-Class e LASVM (incremental). Para o caso de estudo da deteção de peptidases, o algoritmo que apresentou melhores resultados foi o C-SVC. A utilização do algoritmo One-Class apresentou uma diminuição da capacidade de deteção de peptidases relativamente ao C-SVC. Apesar disso, o algoritmo One-Class pode ser uma solução de compromisso quando só são conhecidos exemplos positivos. Através da utilização do algoritmo incremental LASVM, conseguiram-se resultados muito próximos do C-SVC. Contudo, não foi possível superá-los, mas os resultados obtidos apresentam ganhos significativos ao nível do tempo de treino e da complexidade dos modelos gerados, tornando-se um algoritmo bastante válido para aplicar a problemas que disponham de uma grande quantidade de exemplos de treino. Além da análise e avaliação dos algoritmos, foi também elaborada uma plataforma web, “Bioink Search”, que permite aplicar as metodologias descritas para a deteção de peptidases.

Tipo de Documento Dissertação de mestrado
Idioma Português
Orientador(es) Pereira, Carlos Manuel Jorge da Silva
Contribuidor(es) Repositório Comum
facebook logo  linkedin logo  twitter logo 
mendeley logo

Documentos Relacionados

Não existem documentos relacionados.