Publicação

Metagenomic mining of pathogenicity and antibiotic resistance traits across human populations worlwide

Ver documento

Detalhes bibliográficos
Resumo:O microbiota humano (a soma de todos os microrganismos que colonizam o corpo humano) ´e composto aproximadamente por 1e+14 células bacterianas, que abrangem vários taxa, e colonizam principalmente a pele, mucosas, tecido conjuntivo, e o tracto gastrointestinal, nomeadamente o cólon. O somatório de todos os genomas microbianos que lhe dizem respeito é frequentemente denominado microbioma. O conjunto de genes que codificam virulência (eventualmente conferindo patogenicidade à bactéria) são frequentemente codificados em elementos genéticos móveis. Deste modo, muitos factores de virulência (VF) bacteriana conseguem ser facilmente disseminados em populações bacterianas por transferência horizontal de genes (movimento de material genético entre células), convertendo batérias mutualistas ou comensais em potenciais patogenes. Analogamente, a coleção de genes cujos determinantes (produtos génicos) conferem resistência a antibióticos (AR), existentes tanto em bactérias patogénicas como não-patogénicas, também se apresenta repetidamente codificada em elementos genéticos móveis, os quais sob pressão selectiva, se conseguem disseminar por entre comunidades bacterianas através do processo de transferência horizontal de genes, atravessando por vezes as barreiras taxonómicas de espécie e género. Esta característica permite que a comunidade sobreviva, e persista como um todo, comportando-se como um reservatório de genes conferentes de resistência. Microbiomas ambientais, como os que se encontram presentes no solo, são descritos como reservatórios abundantes de genes de resistência a antibióticos. Estes codificam para determinantes de resistência a todas as classes de antibióticos descritas até hoje. Apesar da antibioticoterapia ser direcionada a bactérias patogénicas, esta também afeta muitas espécies bacterianas não-patogénicas que fazem parte do microbiota dos indivíduos sujeitos a este tipo de terapia medicamentosa. Efeito que também se verifica em bactérias ambientais que se encontrem expostas a este tipo de pressão selectiva consequente de más práticas agrárias e da pecuária, ou simplesmente poluição antropológica. Por conseguinte, o microbioma humano detém genes de resistência passiveis de transmissão a estirpes patogénicas, tornando-o num repertório de determinantes de resistência a antibióticos altamente diversificado. O estilo de vida virulento, característico de bactérias patogénicas, tem sido consecutivamente associado a fenótipos de resistência a antibióticos. No entanto, esta associação nem sempre tem sido direta e previsível. Por um lado, o crescente uso de antibióticos tem vindo a seleccionar bactérias detentoras de fenótipos resistentes, sejam elas patogénicas ou não, criando reservatórios genéticos de resistência em diversos microbiomas. Porventura não é claro se a diversidade de genes conferentes de virulência se correlaciona com a diversidade dos que conferem resistência a antibióticos. Em contrapartida, existem inúmeros relatos bibliográficos de estirpes altamente virulentas e multi-resistentes (resistentes a mais do que uma classe de antibiótico) que têm vindo a disseminar-se por todo o globo. Tendo em conta que atualmente existe uma grande disponibilidade de antibióticos, e em alguns casos, administração não supervisionada, podemos concluir que os microbiotas humanos, bem como os seus respectivos microbiomas, estão sujeitos a diferentes graus de pressões seletivas impostas pelos referidos compostos. Neste contexto, podemos inferir que para alguns patogenes, em ordem a sobreviver e colonizar o hospedeiro, codificar apenas para virulência pode não ser suficiente, se se encontrarem na presença de antibióticos. Por outras palavras, sob o efeito de pressões seletivas impostas pela administração de antibióticos, a seleção de elementos genéticos móveis que codifiquem para resistência aos referidos compostos juntamente com características genotípicas que confiram virulência irá ocorrer, tendo como consequência a sua disseminação dentro de comunidades bacterianas pertencentes ao microbiota humano. Tanto quanto sabemos, não existem registos bibliográficos sobre a dinâmica evolutiva que dita a epidemiologia de genes conferentes de resistência a antibióticos, e os que conferem virulência, colectivamente. Assim sendo, a presente dissertação pergunta se sob o efeito de pressões selectivas exercidas por antibióticos, os determinantes de resistência e de virulˆencia se encontram co-representados tanto em diversos microbiomas ambientais, como em microbiomas provenientes do trato gastrointestinal humano. Deste modo, foram escolhidos metagenomas a fim de abordar esta temática por várias razões. A mais preeminente prende-se com o facto das bactérias serem organismos sociais, vivendo em comunidades. Um metagenoma corresponde à panóplia de material genético isolado de uma comunidade, e posteriormente sequenciado, pelo que caracteriza o repertório completo de genes envolvidos em processos metabólicos, fisiológicos e ecológicos, como por exemplo, na adaptação ao ambiente pelas comunidades microbianas presentes na respectiva amostra sequenciada. Subsequentemente, a prospeção de genes em metagenomas surge como uma metodologia fidedigna no que toca ao estudo das pressões seletivas a que uma dada população bacteriana foi sujeita, assim como ao estudo da co-seleção de características genéticas do microbiota amostrado como um todo. No presente trabalho utilizamos 64 metagenomas ambientais, referentes a 12 biomas diversos, bem como 110 metagenomas do trato gastrointestinal humano, originários de indivíduos pertencentes a várias comunidades dos Estados Unidos da América, Venezuela, e Malawi, caracterizando várias faixas etárias, diferentes culturas, hábitos alimentares, bem como diferentes graus de acesso a saneamento básico, a cuidados médicos e antibióticos. Todos os metagenomas encontram-se publicamente disponíveis para download no servidor MG-RAST, tendo sido descarregados em ficheiros individuais em formato FASTA, nos dias 3 de Abril de 2015 (metagenomas do trato gastrointestinal humano) e 17 de Novembro de 2015 (metagenomas ambientais). Cada ficheiro compreende sequências proteicas previamente agrupadas a 90% de homologia pela pipeline de formatação de ficheiros do servidor MG-RAST, contendo assim sequências traduzidas não redundantes, e representando deste modo a diversidade proteica de cada metagenoma. O programa BLASTP foi utilizado a fim de inferir homologia de sequências proteicas envolvidas no fenómeno de resistência a antibióticos, bem como de virulência, de entre os metagenomas escolhidos, fazendo uso de duas bases-de-dados públicas: Resfams AR Proteins database (base-de-dados de proteínas bacterianas conferentes de resistência a antibióticos), e VFDB (base-de-dados de proteínas bacterianas envolvidas em virulência). Este programa permite inferir homologia entre sequências comparadas por via de um algoritmo de alinhamento de sequências derivado do algoritmo original de Smith-Waterman. De entre os vários critérios de seriação aplicáveis foi escolhido um limiar de E-value = 1e-15, com um filtro posterior que apenas considera o melhor alinhamento para cada sequência proteica, e que satisfaça os requisitos mínimos de 60% de homologia sob 75% de alinhamento entre sequências comparadas. Ulteriormente ainda se removeram os alinhamentos resultantes de sequências proteicas que tanto eram homologas de determinantes de resistência a antibióticos como de factores de virulência, de modo a eliminar um viés na análise estatística consecutivamente implementada. Seguidamente, de modo a aferir o tipo de relação entre os caracteres genéticos em causa, as contagens das diferentes sequências proteicas homologas de determinantes de resistência a antibióticos (ARd) foram correlacionadas numa primeira fase com o número de sequências proteicas presentes em cada metagenoma, previamente agrupadas a 90% (tamanho do metagenoma), procedendo de igual forma para as contagens de diversidade de sequências proteicas homologas de factores de virulência (VFd), para ambos os grupos de metagenomas considerados. Posteriormente as contagens ARd e VFd foram correlacionadas entre si, após a estandardização das mesmas. Em ordem a medir o grau de associação entre as correlações previamente descritas recorreu-se a medidas estatísticas como o coeficiente de correlação e o rho de Spearman, bem como o seu P-value. Foram também geradas todas as possíveis associações entre as contagens de ARd e VFd para subfamílias proteicas funcionais caracterizadas nas bases-de-dados mencionadas, efetuando uma correção aos P-values resultantes do rho de Spearman pelo procedimento de Benjamini-Hochberg. Em ordem a testar a dissemelhança entre médias provenientes dos rácios estandardizados de ARd/VFd em função da idade dos indivíduos pertencentes ao grupo de metagenomas do trato gastrointestinal humano, foram aplicados Welch Two Sample t-tests por pares, de acordo com os respectivos países de origem. Os nossos resultados mostram que os determinantes de resistência a antibióticos, bem como os factores de virulência, se encontram amplamente disseminados tanto em microbiomas ambientais, como em microbiomas do trato gastrointestinal humano pertencentes aos 110 indivíduos saudáveis originários de países diferentes. Em segundo lugar, também sugerem que, apesar das comunidades bacterianas ambientais possuírem maior variação de ARd e VFd tendo em conta o tamanho dos metagenomas, as comunidades que habitam o trato gastrointestinal humano detêm uma dependência linear muito forte no que toca à distribuição de ARd de acordo com o tamanho dos metagenomas, e uma relação linear forte entre VFd e o tamanho dos mesmos. Adicionalmente constatamos que as contagens estandardizadas de ARd e VFd apresentam uma correlação muito forte entre si nos metagenomas de origem ambiental, sendo que estas contagens também se mostraram fortemente correlacionadas no grupo de metagenomas provenientes do trato gastrointestinal humano. Entre os metagenomas do grupo anterior, os referentes aos indivíduos originários dos Estados Unidos da América, apresentam uma ampla diversidade de associações, ao passo que as amostras provenientes de indivíduos Venezuelanos não possuem uma associação estatisticamente relevante. No entanto, os metagenomas pertencentes a indivíduos Malauianos retratam a correlação e associação linear mais forte de entre os três países amostrados, possuindo também duas vezes mais contagens de ARd por VFd que os outros dois países. Referindo-nos ainda ao mesmo conjunto de metagenomas, conseguimos verificar que as contagens estandardizadas de ARd e VFd aparentam decrescer com o aumento da idade dos indivíduos, enquanto que os rácios ARd/VFd afiguram-se relativamente estáveis, evidenciando um incremento comum durante o primeiro ano de vida. Relativamente a todas as associações geradas entre subfamílias de proteínas que codificam para AR e as que codificam VFs, aquelas que se relacionam com o envelope celular bacteriano apresentaram as melhores correlações e estatísticas correspondentes. É de salientar que os resultados descritos neste trabalho apenas fornecem evidência para a co-representação de determinantes de AR e VF entre os metagenomas ambientais e do trato gastrointestinal humano que foram amostrados. Visto que a inclusão ou proximidade de determinantes AR e VF nos mesmos elementos genéticos m´oveis não se prende com os objectivos da presente dissertação, os nossos resultados não podem confirmar que a mobilização dos demais determinantes esteja a ocorrer conjuntamente. De qualquer modo, a natureza co-representativa dos nossos resultados reforça a noção, bem como a hipótese de co-seleção dos referidos determinantes.
Autores principais:Escudeiro, Pedro Miguel Agostinho
Assunto:Resistência a antibióticos Virulência Microbiomas humanos Microbiomas ambientais Metagenómica Teses de mestrado - 2016
Ano:2016
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Universidade de Lisboa
Idioma:inglês
Origem:Repositório da Universidade de Lisboa
Descrição
Resumo:O microbiota humano (a soma de todos os microrganismos que colonizam o corpo humano) ´e composto aproximadamente por 1e+14 células bacterianas, que abrangem vários taxa, e colonizam principalmente a pele, mucosas, tecido conjuntivo, e o tracto gastrointestinal, nomeadamente o cólon. O somatório de todos os genomas microbianos que lhe dizem respeito é frequentemente denominado microbioma. O conjunto de genes que codificam virulência (eventualmente conferindo patogenicidade à bactéria) são frequentemente codificados em elementos genéticos móveis. Deste modo, muitos factores de virulência (VF) bacteriana conseguem ser facilmente disseminados em populações bacterianas por transferência horizontal de genes (movimento de material genético entre células), convertendo batérias mutualistas ou comensais em potenciais patogenes. Analogamente, a coleção de genes cujos determinantes (produtos génicos) conferem resistência a antibióticos (AR), existentes tanto em bactérias patogénicas como não-patogénicas, também se apresenta repetidamente codificada em elementos genéticos móveis, os quais sob pressão selectiva, se conseguem disseminar por entre comunidades bacterianas através do processo de transferência horizontal de genes, atravessando por vezes as barreiras taxonómicas de espécie e género. Esta característica permite que a comunidade sobreviva, e persista como um todo, comportando-se como um reservatório de genes conferentes de resistência. Microbiomas ambientais, como os que se encontram presentes no solo, são descritos como reservatórios abundantes de genes de resistência a antibióticos. Estes codificam para determinantes de resistência a todas as classes de antibióticos descritas até hoje. Apesar da antibioticoterapia ser direcionada a bactérias patogénicas, esta também afeta muitas espécies bacterianas não-patogénicas que fazem parte do microbiota dos indivíduos sujeitos a este tipo de terapia medicamentosa. Efeito que também se verifica em bactérias ambientais que se encontrem expostas a este tipo de pressão selectiva consequente de más práticas agrárias e da pecuária, ou simplesmente poluição antropológica. Por conseguinte, o microbioma humano detém genes de resistência passiveis de transmissão a estirpes patogénicas, tornando-o num repertório de determinantes de resistência a antibióticos altamente diversificado. O estilo de vida virulento, característico de bactérias patogénicas, tem sido consecutivamente associado a fenótipos de resistência a antibióticos. No entanto, esta associação nem sempre tem sido direta e previsível. Por um lado, o crescente uso de antibióticos tem vindo a seleccionar bactérias detentoras de fenótipos resistentes, sejam elas patogénicas ou não, criando reservatórios genéticos de resistência em diversos microbiomas. Porventura não é claro se a diversidade de genes conferentes de virulência se correlaciona com a diversidade dos que conferem resistência a antibióticos. Em contrapartida, existem inúmeros relatos bibliográficos de estirpes altamente virulentas e multi-resistentes (resistentes a mais do que uma classe de antibiótico) que têm vindo a disseminar-se por todo o globo. Tendo em conta que atualmente existe uma grande disponibilidade de antibióticos, e em alguns casos, administração não supervisionada, podemos concluir que os microbiotas humanos, bem como os seus respectivos microbiomas, estão sujeitos a diferentes graus de pressões seletivas impostas pelos referidos compostos. Neste contexto, podemos inferir que para alguns patogenes, em ordem a sobreviver e colonizar o hospedeiro, codificar apenas para virulência pode não ser suficiente, se se encontrarem na presença de antibióticos. Por outras palavras, sob o efeito de pressões seletivas impostas pela administração de antibióticos, a seleção de elementos genéticos móveis que codifiquem para resistência aos referidos compostos juntamente com características genotípicas que confiram virulência irá ocorrer, tendo como consequência a sua disseminação dentro de comunidades bacterianas pertencentes ao microbiota humano. Tanto quanto sabemos, não existem registos bibliográficos sobre a dinâmica evolutiva que dita a epidemiologia de genes conferentes de resistência a antibióticos, e os que conferem virulência, colectivamente. Assim sendo, a presente dissertação pergunta se sob o efeito de pressões selectivas exercidas por antibióticos, os determinantes de resistência e de virulˆencia se encontram co-representados tanto em diversos microbiomas ambientais, como em microbiomas provenientes do trato gastrointestinal humano. Deste modo, foram escolhidos metagenomas a fim de abordar esta temática por várias razões. A mais preeminente prende-se com o facto das bactérias serem organismos sociais, vivendo em comunidades. Um metagenoma corresponde à panóplia de material genético isolado de uma comunidade, e posteriormente sequenciado, pelo que caracteriza o repertório completo de genes envolvidos em processos metabólicos, fisiológicos e ecológicos, como por exemplo, na adaptação ao ambiente pelas comunidades microbianas presentes na respectiva amostra sequenciada. Subsequentemente, a prospeção de genes em metagenomas surge como uma metodologia fidedigna no que toca ao estudo das pressões seletivas a que uma dada população bacteriana foi sujeita, assim como ao estudo da co-seleção de características genéticas do microbiota amostrado como um todo. No presente trabalho utilizamos 64 metagenomas ambientais, referentes a 12 biomas diversos, bem como 110 metagenomas do trato gastrointestinal humano, originários de indivíduos pertencentes a várias comunidades dos Estados Unidos da América, Venezuela, e Malawi, caracterizando várias faixas etárias, diferentes culturas, hábitos alimentares, bem como diferentes graus de acesso a saneamento básico, a cuidados médicos e antibióticos. Todos os metagenomas encontram-se publicamente disponíveis para download no servidor MG-RAST, tendo sido descarregados em ficheiros individuais em formato FASTA, nos dias 3 de Abril de 2015 (metagenomas do trato gastrointestinal humano) e 17 de Novembro de 2015 (metagenomas ambientais). Cada ficheiro compreende sequências proteicas previamente agrupadas a 90% de homologia pela pipeline de formatação de ficheiros do servidor MG-RAST, contendo assim sequências traduzidas não redundantes, e representando deste modo a diversidade proteica de cada metagenoma. O programa BLASTP foi utilizado a fim de inferir homologia de sequências proteicas envolvidas no fenómeno de resistência a antibióticos, bem como de virulência, de entre os metagenomas escolhidos, fazendo uso de duas bases-de-dados públicas: Resfams AR Proteins database (base-de-dados de proteínas bacterianas conferentes de resistência a antibióticos), e VFDB (base-de-dados de proteínas bacterianas envolvidas em virulência). Este programa permite inferir homologia entre sequências comparadas por via de um algoritmo de alinhamento de sequências derivado do algoritmo original de Smith-Waterman. De entre os vários critérios de seriação aplicáveis foi escolhido um limiar de E-value = 1e-15, com um filtro posterior que apenas considera o melhor alinhamento para cada sequência proteica, e que satisfaça os requisitos mínimos de 60% de homologia sob 75% de alinhamento entre sequências comparadas. Ulteriormente ainda se removeram os alinhamentos resultantes de sequências proteicas que tanto eram homologas de determinantes de resistência a antibióticos como de factores de virulência, de modo a eliminar um viés na análise estatística consecutivamente implementada. Seguidamente, de modo a aferir o tipo de relação entre os caracteres genéticos em causa, as contagens das diferentes sequências proteicas homologas de determinantes de resistência a antibióticos (ARd) foram correlacionadas numa primeira fase com o número de sequências proteicas presentes em cada metagenoma, previamente agrupadas a 90% (tamanho do metagenoma), procedendo de igual forma para as contagens de diversidade de sequências proteicas homologas de factores de virulência (VFd), para ambos os grupos de metagenomas considerados. Posteriormente as contagens ARd e VFd foram correlacionadas entre si, após a estandardização das mesmas. Em ordem a medir o grau de associação entre as correlações previamente descritas recorreu-se a medidas estatísticas como o coeficiente de correlação e o rho de Spearman, bem como o seu P-value. Foram também geradas todas as possíveis associações entre as contagens de ARd e VFd para subfamílias proteicas funcionais caracterizadas nas bases-de-dados mencionadas, efetuando uma correção aos P-values resultantes do rho de Spearman pelo procedimento de Benjamini-Hochberg. Em ordem a testar a dissemelhança entre médias provenientes dos rácios estandardizados de ARd/VFd em função da idade dos indivíduos pertencentes ao grupo de metagenomas do trato gastrointestinal humano, foram aplicados Welch Two Sample t-tests por pares, de acordo com os respectivos países de origem. Os nossos resultados mostram que os determinantes de resistência a antibióticos, bem como os factores de virulência, se encontram amplamente disseminados tanto em microbiomas ambientais, como em microbiomas do trato gastrointestinal humano pertencentes aos 110 indivíduos saudáveis originários de países diferentes. Em segundo lugar, também sugerem que, apesar das comunidades bacterianas ambientais possuírem maior variação de ARd e VFd tendo em conta o tamanho dos metagenomas, as comunidades que habitam o trato gastrointestinal humano detêm uma dependência linear muito forte no que toca à distribuição de ARd de acordo com o tamanho dos metagenomas, e uma relação linear forte entre VFd e o tamanho dos mesmos. Adicionalmente constatamos que as contagens estandardizadas de ARd e VFd apresentam uma correlação muito forte entre si nos metagenomas de origem ambiental, sendo que estas contagens também se mostraram fortemente correlacionadas no grupo de metagenomas provenientes do trato gastrointestinal humano. Entre os metagenomas do grupo anterior, os referentes aos indivíduos originários dos Estados Unidos da América, apresentam uma ampla diversidade de associações, ao passo que as amostras provenientes de indivíduos Venezuelanos não possuem uma associação estatisticamente relevante. No entanto, os metagenomas pertencentes a indivíduos Malauianos retratam a correlação e associação linear mais forte de entre os três países amostrados, possuindo também duas vezes mais contagens de ARd por VFd que os outros dois países. Referindo-nos ainda ao mesmo conjunto de metagenomas, conseguimos verificar que as contagens estandardizadas de ARd e VFd aparentam decrescer com o aumento da idade dos indivíduos, enquanto que os rácios ARd/VFd afiguram-se relativamente estáveis, evidenciando um incremento comum durante o primeiro ano de vida. Relativamente a todas as associações geradas entre subfamílias de proteínas que codificam para AR e as que codificam VFs, aquelas que se relacionam com o envelope celular bacteriano apresentaram as melhores correlações e estatísticas correspondentes. É de salientar que os resultados descritos neste trabalho apenas fornecem evidência para a co-representação de determinantes de AR e VF entre os metagenomas ambientais e do trato gastrointestinal humano que foram amostrados. Visto que a inclusão ou proximidade de determinantes AR e VF nos mesmos elementos genéticos m´oveis não se prende com os objectivos da presente dissertação, os nossos resultados não podem confirmar que a mobilização dos demais determinantes esteja a ocorrer conjuntamente. De qualquer modo, a natureza co-representativa dos nossos resultados reforça a noção, bem como a hipótese de co-seleção dos referidos determinantes.