Publicação

Análise das variações genéticas: caraterização do contexto em que ocorrem as variações de nucleótido único

Ver documento

Detalhes bibliográficos
Resumo:A identificação e caracterização das variações genéticas podem ajudar os médicos no diagnóstico e prevenção de doenças com origem genética. Com a sequenciação completa do genoma de referência foi possível, posteriormente, encontrar um grande número de variações genéticas entre a população, das quais as mais comuns são a variação de um único nucle ótido (SNV). No entanto, para ser possível capturar a diversidade humana, tornase necessário sequenciar o genoma de muitas pessoas. O projeto 1000 Genomas surge com objetivo de caracterizar a variação genética humana e construir o maior catálogo público de dados sobre variações, com especial foco nas variações raras. Neste trabalho, pretende-se caracterizar os diferentes tipos de SNVs, recorrendo aos dados disponibilizados na primeira fase do projeto do 1000 Genomas. Esses dados contêm 38 milhões de SNVs identificadas no genoma de 1092 indivíduos, provenientes de 14 populações. Tem-se como objetivo, avaliar a forma como ocorrem os diferentes tipos de SNVs ao longo do genoma, fazendo uma análise por cromossoma ou de acordo com a prevalência, assim como, verificar se os genótipos associados a cada SNV satisfazem o equilíbrio de Hardy-Weinberg (HWE). Para além disso, acreditando que as variações genéticas não ocorrem por acaso e que numa vizinhança da posição onde ocorre a SNV existir a informação que seja indicadora do fenómeno, um dos objetivos principais deste trabalho e caracterizar o contexto na vizinhança de cada SNV, através da contagem de palavras de diferentes tamanhos. Observou-se que os diferentes tipos de SNVs ocorrem de forma homogénea ao longo do genoma, mas que as frequências de palavras na vizinhança do local de ocorrência da SNV, estão associadas a cada tipo de variação, principalmente nas posições imediatamente adjacentes a esse local. Verificou-se ainda que para a maioria das SNVs, os respetivos genótipos estão de acordo com o HWE.
Autores principais:Enes, Vera Alexandra do Amparo R.
Assunto:Estatística Variação genética - Métodos estatísticos Genomas - Métodos estatísticos
Ano:2016
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Universidade de Aveiro
Idioma:português
Origem:RIA - Repositório Institucional da Universidade de Aveiro
Descrição
Resumo:A identificação e caracterização das variações genéticas podem ajudar os médicos no diagnóstico e prevenção de doenças com origem genética. Com a sequenciação completa do genoma de referência foi possível, posteriormente, encontrar um grande número de variações genéticas entre a população, das quais as mais comuns são a variação de um único nucle ótido (SNV). No entanto, para ser possível capturar a diversidade humana, tornase necessário sequenciar o genoma de muitas pessoas. O projeto 1000 Genomas surge com objetivo de caracterizar a variação genética humana e construir o maior catálogo público de dados sobre variações, com especial foco nas variações raras. Neste trabalho, pretende-se caracterizar os diferentes tipos de SNVs, recorrendo aos dados disponibilizados na primeira fase do projeto do 1000 Genomas. Esses dados contêm 38 milhões de SNVs identificadas no genoma de 1092 indivíduos, provenientes de 14 populações. Tem-se como objetivo, avaliar a forma como ocorrem os diferentes tipos de SNVs ao longo do genoma, fazendo uma análise por cromossoma ou de acordo com a prevalência, assim como, verificar se os genótipos associados a cada SNV satisfazem o equilíbrio de Hardy-Weinberg (HWE). Para além disso, acreditando que as variações genéticas não ocorrem por acaso e que numa vizinhança da posição onde ocorre a SNV existir a informação que seja indicadora do fenómeno, um dos objetivos principais deste trabalho e caracterizar o contexto na vizinhança de cada SNV, através da contagem de palavras de diferentes tamanhos. Observou-se que os diferentes tipos de SNVs ocorrem de forma homogénea ao longo do genoma, mas que as frequências de palavras na vizinhança do local de ocorrência da SNV, estão associadas a cada tipo de variação, principalmente nas posições imediatamente adjacentes a esse local. Verificou-se ainda que para a maioria das SNVs, os respetivos genótipos estão de acordo com o HWE.