Publicação

Análise do pangenoma de streptococcus pneumoniae e comporação de genomas dos serótipos 1 e 3

Ver documento

Detalhes bibliográficos
Resumo:Streptococcus pneumoniae é uma espécie bacteriana que coloniza a nasofaringe humana, sendo a principal causa de diversas doenças, como infeção respiratória aguda e otite média. Várias estirpes desta espécie apresentam uma cápsula polissacarídica, apresentando diversas variantes composicionais que correspondem a diferentes serótipos, os quais apresentam diferente potencial patogénico. Neste estudo pretende-se analisar o pangenoma { o reportório total de genes de uma espécie microbiana, que poderá ser significativamente maior que o número de genes encontrados em cada uma das estirpes individualmente { de S. pneumoniae, que compreende o genoma core { conjunto de genes presentes em todas as estirpes { e o genoma acessório { conjunto de genes presentes em duas ou mais estirpes e genes únicos. Com o desenvolvimento das tecnologias de sequenciação tornou-se fundamental o desenvolvimento de novas ferramentas bioinformáticas para lidar com as grandes quantidades de informação geradas, surgindo a necessidade de efetuar estudos genómicos comparativos a larga escala para tentar extrair informação útil desses dados. Assim, desenvolveu-se neste estudo uma ferramenta bioinformática, denominada SCRAG (Strict CoRe and Accessory Genome) que permite a comparação de vários genomas em simultâneo, obtendo o genoma core e acessório. Esta ferramenta foi então utilizada para a analise do genoma de S. pneumoniae. O SCRAG tem por base do processo de comparação de sequencias o algoritmo BLAST, cujos resultados são depois filtrados por vários parâmetros, dos quais o utilizador pode definir a percentagem de identidade e a percentagem de diferença de tamanho máxima permitida entre sequências de um conjunto de alelos que codificam para um mesmo locus. Os resultados obtidos com esta ferramenta são conservadores pois removem possíveis genes parálogos presentes nos genomas e os parâmetros de identidade e diferença de tamanho são determinados de modo a obter elevada confiança nos resultados obtidos. Utilizaram-se 27 genomas de vários serótipos completamente sequenciados e anotados disponíveis no GenBank e 49 genomas sequenciados pela Unidade de Microbiologia Molecular e Infeção. Estes 49 genomas continham 24 estirpes do serótipo 1 e 25 estirpes do serótipo 3. A escolha da análise destes serótipos prende-se com o facto de serem causadores de doença invasiva em diferentes grupos etários e a sua caracterização genómica ser muito diferente. Obtiveram-se os resultados para um conjunto de 25 dos 27 genomas disponíveis no GenBank, para os quais estavam disponíveis os ficheiros contendo as regiões codificantes. Obtiveram-se também os resultados para o total dos 76 genomas de S. pneumoniae. Foram utilizados diferentes parâmetros de percentagem de identidade e de diferença de tamanho, sendo que para 80% de identidade e 20% de diferença de tamanho se obtém 619 genes core e 873 genes acessórios para o conjunto de 25 genomas e 226 genes core e 977 genes acessórios, para o conjunto de 76 genomas. No entanto, o número total de genes descobertos não aumenta com o número de genomas analisados, o que será devido ao método utilizado, que se revela bastante estrito na filtragem dos resultados do BLAST. Para a comparação dos serótipos 1 e 3 utilizou-se também o SCRAG, tendo-se posteriormente comparado os conjuntos de resultados obtidos. Utilizando genes core, verificou-se que existem mais genes partilhados entre o serótipo 3 e o grupo de outros serótipos, ao passo que o serótipo 1 parece divergir bastante dos restantes, sendo também o que apresenta menos genes no total, o que era expectável uma vez que apresenta limitada diversidade genética. Já considerando genes acessórios, o maior número de genes partilhado ocorre entre os serótipos 1 e 3, continuando o serótipo 1 a divergir bastante do grupo \outros serótipos". Futuramente, será importante analisar os dados obtidos com o SCRAG em termos funcionais, para melhor compreender a espécie bacteriana estudada.
Autores principais:Policarpo, Adriana Domingos
Assunto:Streptococcus pneumoniae Pangenoma Serótipos Genoma core Genoma acessório BLAST Teses de mestrado - 2015
Ano:2015
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Universidade de Lisboa
Idioma:português
Origem:Repositório da Universidade de Lisboa
Descrição
Resumo:Streptococcus pneumoniae é uma espécie bacteriana que coloniza a nasofaringe humana, sendo a principal causa de diversas doenças, como infeção respiratória aguda e otite média. Várias estirpes desta espécie apresentam uma cápsula polissacarídica, apresentando diversas variantes composicionais que correspondem a diferentes serótipos, os quais apresentam diferente potencial patogénico. Neste estudo pretende-se analisar o pangenoma { o reportório total de genes de uma espécie microbiana, que poderá ser significativamente maior que o número de genes encontrados em cada uma das estirpes individualmente { de S. pneumoniae, que compreende o genoma core { conjunto de genes presentes em todas as estirpes { e o genoma acessório { conjunto de genes presentes em duas ou mais estirpes e genes únicos. Com o desenvolvimento das tecnologias de sequenciação tornou-se fundamental o desenvolvimento de novas ferramentas bioinformáticas para lidar com as grandes quantidades de informação geradas, surgindo a necessidade de efetuar estudos genómicos comparativos a larga escala para tentar extrair informação útil desses dados. Assim, desenvolveu-se neste estudo uma ferramenta bioinformática, denominada SCRAG (Strict CoRe and Accessory Genome) que permite a comparação de vários genomas em simultâneo, obtendo o genoma core e acessório. Esta ferramenta foi então utilizada para a analise do genoma de S. pneumoniae. O SCRAG tem por base do processo de comparação de sequencias o algoritmo BLAST, cujos resultados são depois filtrados por vários parâmetros, dos quais o utilizador pode definir a percentagem de identidade e a percentagem de diferença de tamanho máxima permitida entre sequências de um conjunto de alelos que codificam para um mesmo locus. Os resultados obtidos com esta ferramenta são conservadores pois removem possíveis genes parálogos presentes nos genomas e os parâmetros de identidade e diferença de tamanho são determinados de modo a obter elevada confiança nos resultados obtidos. Utilizaram-se 27 genomas de vários serótipos completamente sequenciados e anotados disponíveis no GenBank e 49 genomas sequenciados pela Unidade de Microbiologia Molecular e Infeção. Estes 49 genomas continham 24 estirpes do serótipo 1 e 25 estirpes do serótipo 3. A escolha da análise destes serótipos prende-se com o facto de serem causadores de doença invasiva em diferentes grupos etários e a sua caracterização genómica ser muito diferente. Obtiveram-se os resultados para um conjunto de 25 dos 27 genomas disponíveis no GenBank, para os quais estavam disponíveis os ficheiros contendo as regiões codificantes. Obtiveram-se também os resultados para o total dos 76 genomas de S. pneumoniae. Foram utilizados diferentes parâmetros de percentagem de identidade e de diferença de tamanho, sendo que para 80% de identidade e 20% de diferença de tamanho se obtém 619 genes core e 873 genes acessórios para o conjunto de 25 genomas e 226 genes core e 977 genes acessórios, para o conjunto de 76 genomas. No entanto, o número total de genes descobertos não aumenta com o número de genomas analisados, o que será devido ao método utilizado, que se revela bastante estrito na filtragem dos resultados do BLAST. Para a comparação dos serótipos 1 e 3 utilizou-se também o SCRAG, tendo-se posteriormente comparado os conjuntos de resultados obtidos. Utilizando genes core, verificou-se que existem mais genes partilhados entre o serótipo 3 e o grupo de outros serótipos, ao passo que o serótipo 1 parece divergir bastante dos restantes, sendo também o que apresenta menos genes no total, o que era expectável uma vez que apresenta limitada diversidade genética. Já considerando genes acessórios, o maior número de genes partilhado ocorre entre os serótipos 1 e 3, continuando o serótipo 1 a divergir bastante do grupo \outros serótipos". Futuramente, será importante analisar os dados obtidos com o SCRAG em termos funcionais, para melhor compreender a espécie bacteriana estudada.