Publicação

Combining metric and vector space data mining methods for screening CFTR rescuers in cystic fibrosis

Ver documento

Detalhes bibliográficos
Resumo:O objetivo principal desta dissertação é desenvolver modelos para propor moléculas de interesse que podem se tornar em princípios ativos no tratamento da fibrose quística. Neste projeto apresenta-se uma abordagem in silico para a seleção de moléculas que possivelmente têm capacidades terapêuticas em relação à fibrose quística. Este processo é efetuado computacionalmente com a utilização de ferramentas de prospeção de dados e os objetivos primordiais deste processo são a identificação e seleção de moléculas que podem ajudar no combate à doença para posterior teste em laboratório. Para este efeito foram desenvolvidos previsões para a capacidade terapêutica das moléculas em dois espaços: i) espaço vetorial; ii) espaço métrico. No espaço vetorial as previsões foram realizadas tendo em conta os descritores moleculares das moléculas, com recurso ao método estatístico e computacional random forest. As moléculas foram também representadas num espaço métrico construído com a dissemelhança molecular entre as mesmas, onde ocorreu uma redução de dimensões tornando possível a representação das instâncias num plano bidimensional – este espaço métrico foi subsequentemente analisado por uma ferramenta estatística denominada kriging. Para comprovar os métodos escolhidos, usaram-se dois conjuntos de dados; potenciadores e ativadores de anoctaminas (moléculas de possível interesse para o tratamento da fibrose quística) e corretores da proteína causadora da fibrose quística (CFTR - Cystic fibrosis transmembrane conductance regulator ). No âmbito desta dissertação, foram identificadas 10 moléculas provenientes do estudo com potenciadores de anoctaminas e 18 moléculas provenientes do estudo com corretores da CFTR, para serem testadas em laboratório. Adicionalmente, foram recolhidos dados de repositórios de informação biológica para validar os métodos utilizados. Este passo adicional permite concluir que algumas das moléculas escolhidas têm ligações diretas e indiretas à fibrose quística, dando credibilidade ao método desenvolvido. É importante referir que a forma como este projeto foi desenvolvido permite a utilização de diferentes conjuntos de dados de ligandos para proteínas alvo, o que torna este método flexível e adaptável à doença que seja objeto de estudo.
Autores principais:Coelho, Inês Cristina Ferreira
Assunto:Chemoinformatics Aprendizagem automática Fibrose Quística Design de medicamentos In silico Teses de mestrado - 2017
Ano:2017
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Universidade de Lisboa
Idioma:inglês
Origem:Repositório da Universidade de Lisboa
Descrição
Resumo:O objetivo principal desta dissertação é desenvolver modelos para propor moléculas de interesse que podem se tornar em princípios ativos no tratamento da fibrose quística. Neste projeto apresenta-se uma abordagem in silico para a seleção de moléculas que possivelmente têm capacidades terapêuticas em relação à fibrose quística. Este processo é efetuado computacionalmente com a utilização de ferramentas de prospeção de dados e os objetivos primordiais deste processo são a identificação e seleção de moléculas que podem ajudar no combate à doença para posterior teste em laboratório. Para este efeito foram desenvolvidos previsões para a capacidade terapêutica das moléculas em dois espaços: i) espaço vetorial; ii) espaço métrico. No espaço vetorial as previsões foram realizadas tendo em conta os descritores moleculares das moléculas, com recurso ao método estatístico e computacional random forest. As moléculas foram também representadas num espaço métrico construído com a dissemelhança molecular entre as mesmas, onde ocorreu uma redução de dimensões tornando possível a representação das instâncias num plano bidimensional – este espaço métrico foi subsequentemente analisado por uma ferramenta estatística denominada kriging. Para comprovar os métodos escolhidos, usaram-se dois conjuntos de dados; potenciadores e ativadores de anoctaminas (moléculas de possível interesse para o tratamento da fibrose quística) e corretores da proteína causadora da fibrose quística (CFTR - Cystic fibrosis transmembrane conductance regulator ). No âmbito desta dissertação, foram identificadas 10 moléculas provenientes do estudo com potenciadores de anoctaminas e 18 moléculas provenientes do estudo com corretores da CFTR, para serem testadas em laboratório. Adicionalmente, foram recolhidos dados de repositórios de informação biológica para validar os métodos utilizados. Este passo adicional permite concluir que algumas das moléculas escolhidas têm ligações diretas e indiretas à fibrose quística, dando credibilidade ao método desenvolvido. É importante referir que a forma como este projeto foi desenvolvido permite a utilização de diferentes conjuntos de dados de ligandos para proteínas alvo, o que torna este método flexível e adaptável à doença que seja objeto de estudo.