Publicação
Extraction of phylogenomic information for the development of new approaches for geotraceability
| Resumo: | Atualmente os consumidores têm ganho uma maior sensibilização face à autenticidade e origem dos produtos alimentares, apesar de a preocupação com a segurança alimentar também aumentar. A aplicação de novas metodologias como a implementação de sistemas de rastreabilidade, são o caminho a seguir para assegurar a autenticidade dos produtos alimentares. Os sistemas de rastreabilidade têm como objetivo proporcionar a capacidade de rastrear um produto desde a sua origem até às mãos do consumidor. Estes sistemas podem ser melhorados, integrando dados convencionais de rastreabilidade com outros domínios de dados, por exemplo, com dados geográficos ou topográficos. Portanto, a integração de dados convencionais de rastreabilidade com dados geográficos é referida como georrastreabilidade. Ao longo dos anos, várias ferramentas têm sido desenvolvidas para alcançar a integração dos domínios de dados referidos anteriormente, usando informações geradas por métodos microbiológicos convencionais e também pelas tecnologias de sequenciação de alto débito (vulgarmente referenciadas como Next Generation Sequencing ou NGS). Desde o seu desenvolvimento, as NGS têm gerado grandes volumes de dados, que se encontram disponíveis em repositórios públicos, permitindo aos utilizadores acederem e obterem dados genómicos curados necessários para o desenvolvimento de novas metodologias. Sendo assim, o objetivo principal do presente projeto trata-se do desenvolvimento de uma pipeline capaz de produzir informação filogenómica de microorganismos, a partir de dados obtidos por NGS, de modo a permitir a sua integração com dados geográficos. Esta integração permite gerar novos conhecimentos geofilogenómicos, permitindo novas abordagens para assegurar a rastreabilidade e a autenticidade. A pipeline desenvolvida obtém domínios de dados genómicos, geográficos e temporais, interrogando as bases de dados do National Center for Biotechnology (NCBI). Os dados genómicos são anotados e utilizados para efetuar a identificação do core genome e, em seguida, é efetuado core genome multi-locus sequence typing (cgMLST) para cada isolado. Após cgMLST, uma matriz de distâncias é gerada, seguida do cálculo da minimum spanning tree para a reconstrução das relações filogenómicas entre os isolados. A pipeline foi testada com 2 datasets distintos, contendo diferentes escalas geográficas e espécies de microorganismos. Os resultados sugerem que o método utilizado para a identificação de rotas de transmissão epidemiológicas putativas tem capacidade para discriminar casos epidemiologicamente relacionados, com diferentes escalas geográficas e espécies de microorganismos. |
|---|---|
| Autores principais: | Cerqueira, Pedro Rafael Vila |
| Assunto: | Georrastreabilidade Sequenciação de Alto Débito Transmissão Epidemiológica Segurança alimentar Teses de mestrado - 2018 |
| Ano: | 2018 |
| País: | Portugal |
| Tipo de documento: | dissertação de mestrado |
| Tipo de acesso: | acesso aberto |
| Instituição associada: | Universidade de Lisboa |
| Idioma: | inglês |
| Origem: | Repositório da Universidade de Lisboa |
| Resumo: | Atualmente os consumidores têm ganho uma maior sensibilização face à autenticidade e origem dos produtos alimentares, apesar de a preocupação com a segurança alimentar também aumentar. A aplicação de novas metodologias como a implementação de sistemas de rastreabilidade, são o caminho a seguir para assegurar a autenticidade dos produtos alimentares. Os sistemas de rastreabilidade têm como objetivo proporcionar a capacidade de rastrear um produto desde a sua origem até às mãos do consumidor. Estes sistemas podem ser melhorados, integrando dados convencionais de rastreabilidade com outros domínios de dados, por exemplo, com dados geográficos ou topográficos. Portanto, a integração de dados convencionais de rastreabilidade com dados geográficos é referida como georrastreabilidade. Ao longo dos anos, várias ferramentas têm sido desenvolvidas para alcançar a integração dos domínios de dados referidos anteriormente, usando informações geradas por métodos microbiológicos convencionais e também pelas tecnologias de sequenciação de alto débito (vulgarmente referenciadas como Next Generation Sequencing ou NGS). Desde o seu desenvolvimento, as NGS têm gerado grandes volumes de dados, que se encontram disponíveis em repositórios públicos, permitindo aos utilizadores acederem e obterem dados genómicos curados necessários para o desenvolvimento de novas metodologias. Sendo assim, o objetivo principal do presente projeto trata-se do desenvolvimento de uma pipeline capaz de produzir informação filogenómica de microorganismos, a partir de dados obtidos por NGS, de modo a permitir a sua integração com dados geográficos. Esta integração permite gerar novos conhecimentos geofilogenómicos, permitindo novas abordagens para assegurar a rastreabilidade e a autenticidade. A pipeline desenvolvida obtém domínios de dados genómicos, geográficos e temporais, interrogando as bases de dados do National Center for Biotechnology (NCBI). Os dados genómicos são anotados e utilizados para efetuar a identificação do core genome e, em seguida, é efetuado core genome multi-locus sequence typing (cgMLST) para cada isolado. Após cgMLST, uma matriz de distâncias é gerada, seguida do cálculo da minimum spanning tree para a reconstrução das relações filogenómicas entre os isolados. A pipeline foi testada com 2 datasets distintos, contendo diferentes escalas geográficas e espécies de microorganismos. Os resultados sugerem que o método utilizado para a identificação de rotas de transmissão epidemiológicas putativas tem capacidade para discriminar casos epidemiologicamente relacionados, com diferentes escalas geográficas e espécies de microorganismos. |
|---|