Publicação

Lost pigs: searching for the origins of Angola indigenous pigs

Ver documento

Detalhes bibliográficos
Resumo:O javali (Sus scrofa) selvagem teve a sua origem no Sudoeste asiático, tendo conseguido a colonização de vários territórios asiáticos com características ambientais distintas. Após a sua introdução em território europeu, mudanças climáticas levaram ao seu isolamento, o que conduziu à formação de dois grandes pools genéticos na Europa e na Asia. Há cerca de 10,000 anos surgiram centros de domesticação no extremo oriente e, posteriormente, um centro de domesticação ocorreu na Anatólia dando origem aos primeiros porcos domésticos. A subsequente introdução destes porcos até ao norte europeu e o seu cruzamento com javalis selvagens, prática frequente na época, levou à sua domesticação na Europa. Este complexo processo de domesticação levou à formação de dois grandes centros de criação (Europa e Asia), responsáveis pela formação de várias populações altamente adaptadas a diferentes condições ambientais. Durante séculos, estas populações foram alvo de seleção artificial, levando à formação das raças cosmopolitas atuais. A domesticação suína foi também de elevada importância no norte de África, até à sua erradicação durante a difusão da cultura islâmica. Ainda assim, centros de criação antigos em território subsariano persistiram na Africa Centro-Ocidental, sendo estes responsáveis pela criação das populações de porcos indígenas africanos que permanecem até hoje pouco exploradas. Durante a diáspora portuguesa no século XV, foram estabelecidas rotas comerciais ao longo da costa oeste africana, possivelmente permitindo o abandono de porcos durante as expedições. Não é do nosso conhecimento que existissem criações de porcos em território angolano na altura da chegada dos portugueses, mas registos antigos descrevem a produção de uma nova raça (Ganda) a partir de cruzamentos entre porcos locais e raças europeias no séc. XX. Atualmente, a maior parte destes suínos desapareceu devido a desastres sociais e ambientais que decorreram no país. Ainda assim, algumas populações dispersas com um reduzido número de indivíduos persistiram atualmente em algumas regiões remotas de Angola. Alguns estudos sugerem que estes porcos apresentam um conteúdo genético altamente diversificado, moldado por condições ambientais adversas e epidemias, sendo o estudo destes recursos genéticos crucial para a preservação destas populações. Atualmente, tecnologias de sequenciação de elevado rendimento podem ser usadas no contexto da genética populacional para gerar milhões de leituras a partir do genoma inteiro de múltiplos indivíduos. As bibliotecas geradas são posteriormente utilizadas para a genotipagem de milhões de loci de uma forma eficiente permitindo estudar a variação nucleotídica inerente a eventos de seleção e adaptação local. Vários métodos foram desenvolvidos para utilizar a informação de milhões de SNPs para o estudo da estrutura e seleção de uma população. O estudo da estrutura genética de uma população é extremamente complexo e até ao momento, nenhum método desenvolvido é capaz de abordar a questão de uma forma completa. Até recentemente, o Índice de Diferenciação (FST) introduzido em 1943 e sujeito a múltiplas adaptações até ao seu estabelecimento em 1984, era amplamente utilizado. Recentemente tem sido substituído por ferramentas capazes de representar indivíduos com modelos de Admixture ou de redução de dimensões. O método de Admixture permite estimar a proporção de genótipos que pertence a uma determinada população ancestral. No que diz respeito à análise em componentes principais, esta permite a representação de indivíduos num espaço com um certo número de componentes. Uma grande vantagem da PCA sobre os modelos de Admixture é a representação mais flexível e continua dos indivíduos, em oposição a representação discreta das análises de Admixture. No entanto, a PCA apresenta algumas limitações, como a necessidade de remover regiões onde existe desequilíbrio de ligação (LD). Além destas análises, a análise filogenética permite estimar as relações históricas entre espécies e populações de uma forma bidimensional. Esta análise pode usar métodos baseados em distância ou baseados em caracteres para descrever a relação entre indivíduos. Para esta análise, vários softwares foram desenvolvidos para usar o método de Neighbor-Joining devido a sua eficiência ao lidar com um grande número de sequências e fazer uso de métricas de bootstrap para aumentar a precisão das topologias. No que diz respeito ao fitness de uma população, a procura por assinaturas de seleção, frequentemente o produto de seleção positiva, ao longo do genoma é usada para identificar características importantes. Vários métodos foram desenvolvidos para identificar estas assinaturas e para o propósito deste trabalho, o método de Diversidade e Diferenciação Genética Populacional, bem como métodos com base em haplótipos são considerados. A comparação da diversidade genética e diferenciação entre duas populações (xpFST/θπ), com o propósito de procurar regiões que possuem elevada diferenciação genética (FST) e baixa diversidade genética (θπ) pode ser usada para pesquisar regiões de seleção positiva entre populações. Com os métodos de haplótipos, em regiões sob seleção positiva, haplótipos que contem os alelos benéficos tendem a ser mais longos do que os restantes. Com base nesta evidência, o método integrated haplotype scores (iHS) é usado para a procura de regiões sob seleção na população, sendo útil na identificação de alelos que ainda não atingiram a fixação. O método cross-population extended haplotype homozygosity (xpEHH) é usado para a procura de regiões sob seleção positiva entre populações, sendo útil na identificação de alelos fixados ou quase fixados. No contexto desta dissertação, foi feito um estudo compreensivo do conteúdo genético de um conjunto de porcos selvagens Angolanos (ANG) para investigar a relação genética entre estes porcos e as principais raças domésticas e populações de javali selvagem europeias e asiáticas através da obtenção e uso de dados de resequenciação. Além da caracterização desta população, esta dissertação tem como objetivo estudar o fitness destes porcos, contribuindo para um primeiro estudo das assinaturas de seleção derivadas da adaptação destes porcos sujeitos a condições adversas e epidemias. A identificação de 44 SNPs no genoma mitocondrial dos porcos ANG foi semelhante a valores obtidos para outros porcos europeus como os porcos ibéricos, Landrace e Pietrain. Cerca de oito milhões de SNPs foram identificados nos autossomas, sendo a sua maioria localizados em regiões intergénicas. A análise filogenética com base em DNA mitocondrial sugere uma linhagem materna de origem ibérica. A análise filogenética efetuada com SNPs localizados nos autossomas mostra também uma menor distância genética entre os porcos ANG e os ibéricos. No entanto, valores mais baixos de diferenciação genética foram obtidos entre ANG e populações comerciais europeias, e a análise de componentes principais sugere também uma maior proximidade com raças comerciais, provavelmente devido a iniciativas de cruzamento de porcos locais com populações europeias "exóticas", como Landrace ou Large White, uma prática que foi introduzida em Angola para aumentar a produtividade nas populações locais, ou devido aos cruzamentos efetuadas no sec. XX. Para a caracterização do fitness dos porcos de ANG, a análise iHS permitiu identificar um total de 25 regiões as quais sobrepõe um total de 15 genes. Uma análise de rede de interação génica permitiu a identificação de um enriquecimento significativo de 234 processos biológicos relacionados com processos metabólicos, comportamento e adaptabilidade. Entre os genes identificados localizados em regiões candidatas com sinais fortes de seleção positiva estão os genes CDKAL1 e SLC2A9 para os quais encontramos um elevado número de SNPs candidatos. Com o método xpFST/θπ e com o método de xpEHH usados para detetar regiões sob pressão seletiva entre ANG e outras populações domésticas, cerca de metade das regiões observadas encontram-se em regiões intergénicas o que sugere um papel importante de variantes não codificantes em mecanismos regulatórios. Na comparação entre ANG e IBN, vários genes foram identificados em regiões de QTLs e relacionados com eficiência alimentar, metabolismo lipídico, forma corporal e defesa imunológica com o método xpFST/θπ e genes com QTLs sobrepostos relacionados com eficiência alimentar, área muscular do lombo, idade na puberdade e nível de androstenona foram identificados com o método xpEHH. Após cruzar os resultados de ambas as análises, identificámos um total de oito genes que são comuns às comparações entre ANG e as raças de Pietrain. Duroc e Large White nos quais se inclui o gene CDKAL1. Os genes DLGAP2 e DOCK5 foram identificados para a comparação ANG vs LR com QTLs sobrepostos relacionados com consumo de ração por alimentação e gordura no dorso entre a 3ª e a 4ª costela, respetivamente. A caracterização destes suínos de Angola indica que estes porcos são o produto de uma quimera de populações europeias e indígenas geradas por eventos antigos e recentes de introgressão. A presença de uma relação materna clara com as populações ibéricas e a baixa diferenciação genética observada entre as raças ANG e cosmopolitas europeias constituem a primeira avaliação desta população, representando um marco para a sua conservação. A caracterização do fitness destes porcos feita neste trabalho sugere que as condições ambientais adversas levaram a uma seleção positiva intensa associada a características de elevado valor econômico e agrícola, refletindo um perfil único de adaptação.
Autores principais:Sá, Pedro Manuel da Costa
Assunto:Sus scrofa População Nativa de Angola (ANG) Whole-genome Resequencing SNPs Adaptação local Teses de mestrado - 2021
Ano:2021
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Universidade de Lisboa
Idioma:inglês
Origem:Repositório da Universidade de Lisboa
Descrição
Resumo:O javali (Sus scrofa) selvagem teve a sua origem no Sudoeste asiático, tendo conseguido a colonização de vários territórios asiáticos com características ambientais distintas. Após a sua introdução em território europeu, mudanças climáticas levaram ao seu isolamento, o que conduziu à formação de dois grandes pools genéticos na Europa e na Asia. Há cerca de 10,000 anos surgiram centros de domesticação no extremo oriente e, posteriormente, um centro de domesticação ocorreu na Anatólia dando origem aos primeiros porcos domésticos. A subsequente introdução destes porcos até ao norte europeu e o seu cruzamento com javalis selvagens, prática frequente na época, levou à sua domesticação na Europa. Este complexo processo de domesticação levou à formação de dois grandes centros de criação (Europa e Asia), responsáveis pela formação de várias populações altamente adaptadas a diferentes condições ambientais. Durante séculos, estas populações foram alvo de seleção artificial, levando à formação das raças cosmopolitas atuais. A domesticação suína foi também de elevada importância no norte de África, até à sua erradicação durante a difusão da cultura islâmica. Ainda assim, centros de criação antigos em território subsariano persistiram na Africa Centro-Ocidental, sendo estes responsáveis pela criação das populações de porcos indígenas africanos que permanecem até hoje pouco exploradas. Durante a diáspora portuguesa no século XV, foram estabelecidas rotas comerciais ao longo da costa oeste africana, possivelmente permitindo o abandono de porcos durante as expedições. Não é do nosso conhecimento que existissem criações de porcos em território angolano na altura da chegada dos portugueses, mas registos antigos descrevem a produção de uma nova raça (Ganda) a partir de cruzamentos entre porcos locais e raças europeias no séc. XX. Atualmente, a maior parte destes suínos desapareceu devido a desastres sociais e ambientais que decorreram no país. Ainda assim, algumas populações dispersas com um reduzido número de indivíduos persistiram atualmente em algumas regiões remotas de Angola. Alguns estudos sugerem que estes porcos apresentam um conteúdo genético altamente diversificado, moldado por condições ambientais adversas e epidemias, sendo o estudo destes recursos genéticos crucial para a preservação destas populações. Atualmente, tecnologias de sequenciação de elevado rendimento podem ser usadas no contexto da genética populacional para gerar milhões de leituras a partir do genoma inteiro de múltiplos indivíduos. As bibliotecas geradas são posteriormente utilizadas para a genotipagem de milhões de loci de uma forma eficiente permitindo estudar a variação nucleotídica inerente a eventos de seleção e adaptação local. Vários métodos foram desenvolvidos para utilizar a informação de milhões de SNPs para o estudo da estrutura e seleção de uma população. O estudo da estrutura genética de uma população é extremamente complexo e até ao momento, nenhum método desenvolvido é capaz de abordar a questão de uma forma completa. Até recentemente, o Índice de Diferenciação (FST) introduzido em 1943 e sujeito a múltiplas adaptações até ao seu estabelecimento em 1984, era amplamente utilizado. Recentemente tem sido substituído por ferramentas capazes de representar indivíduos com modelos de Admixture ou de redução de dimensões. O método de Admixture permite estimar a proporção de genótipos que pertence a uma determinada população ancestral. No que diz respeito à análise em componentes principais, esta permite a representação de indivíduos num espaço com um certo número de componentes. Uma grande vantagem da PCA sobre os modelos de Admixture é a representação mais flexível e continua dos indivíduos, em oposição a representação discreta das análises de Admixture. No entanto, a PCA apresenta algumas limitações, como a necessidade de remover regiões onde existe desequilíbrio de ligação (LD). Além destas análises, a análise filogenética permite estimar as relações históricas entre espécies e populações de uma forma bidimensional. Esta análise pode usar métodos baseados em distância ou baseados em caracteres para descrever a relação entre indivíduos. Para esta análise, vários softwares foram desenvolvidos para usar o método de Neighbor-Joining devido a sua eficiência ao lidar com um grande número de sequências e fazer uso de métricas de bootstrap para aumentar a precisão das topologias. No que diz respeito ao fitness de uma população, a procura por assinaturas de seleção, frequentemente o produto de seleção positiva, ao longo do genoma é usada para identificar características importantes. Vários métodos foram desenvolvidos para identificar estas assinaturas e para o propósito deste trabalho, o método de Diversidade e Diferenciação Genética Populacional, bem como métodos com base em haplótipos são considerados. A comparação da diversidade genética e diferenciação entre duas populações (xpFST/θπ), com o propósito de procurar regiões que possuem elevada diferenciação genética (FST) e baixa diversidade genética (θπ) pode ser usada para pesquisar regiões de seleção positiva entre populações. Com os métodos de haplótipos, em regiões sob seleção positiva, haplótipos que contem os alelos benéficos tendem a ser mais longos do que os restantes. Com base nesta evidência, o método integrated haplotype scores (iHS) é usado para a procura de regiões sob seleção na população, sendo útil na identificação de alelos que ainda não atingiram a fixação. O método cross-population extended haplotype homozygosity (xpEHH) é usado para a procura de regiões sob seleção positiva entre populações, sendo útil na identificação de alelos fixados ou quase fixados. No contexto desta dissertação, foi feito um estudo compreensivo do conteúdo genético de um conjunto de porcos selvagens Angolanos (ANG) para investigar a relação genética entre estes porcos e as principais raças domésticas e populações de javali selvagem europeias e asiáticas através da obtenção e uso de dados de resequenciação. Além da caracterização desta população, esta dissertação tem como objetivo estudar o fitness destes porcos, contribuindo para um primeiro estudo das assinaturas de seleção derivadas da adaptação destes porcos sujeitos a condições adversas e epidemias. A identificação de 44 SNPs no genoma mitocondrial dos porcos ANG foi semelhante a valores obtidos para outros porcos europeus como os porcos ibéricos, Landrace e Pietrain. Cerca de oito milhões de SNPs foram identificados nos autossomas, sendo a sua maioria localizados em regiões intergénicas. A análise filogenética com base em DNA mitocondrial sugere uma linhagem materna de origem ibérica. A análise filogenética efetuada com SNPs localizados nos autossomas mostra também uma menor distância genética entre os porcos ANG e os ibéricos. No entanto, valores mais baixos de diferenciação genética foram obtidos entre ANG e populações comerciais europeias, e a análise de componentes principais sugere também uma maior proximidade com raças comerciais, provavelmente devido a iniciativas de cruzamento de porcos locais com populações europeias "exóticas", como Landrace ou Large White, uma prática que foi introduzida em Angola para aumentar a produtividade nas populações locais, ou devido aos cruzamentos efetuadas no sec. XX. Para a caracterização do fitness dos porcos de ANG, a análise iHS permitiu identificar um total de 25 regiões as quais sobrepõe um total de 15 genes. Uma análise de rede de interação génica permitiu a identificação de um enriquecimento significativo de 234 processos biológicos relacionados com processos metabólicos, comportamento e adaptabilidade. Entre os genes identificados localizados em regiões candidatas com sinais fortes de seleção positiva estão os genes CDKAL1 e SLC2A9 para os quais encontramos um elevado número de SNPs candidatos. Com o método xpFST/θπ e com o método de xpEHH usados para detetar regiões sob pressão seletiva entre ANG e outras populações domésticas, cerca de metade das regiões observadas encontram-se em regiões intergénicas o que sugere um papel importante de variantes não codificantes em mecanismos regulatórios. Na comparação entre ANG e IBN, vários genes foram identificados em regiões de QTLs e relacionados com eficiência alimentar, metabolismo lipídico, forma corporal e defesa imunológica com o método xpFST/θπ e genes com QTLs sobrepostos relacionados com eficiência alimentar, área muscular do lombo, idade na puberdade e nível de androstenona foram identificados com o método xpEHH. Após cruzar os resultados de ambas as análises, identificámos um total de oito genes que são comuns às comparações entre ANG e as raças de Pietrain. Duroc e Large White nos quais se inclui o gene CDKAL1. Os genes DLGAP2 e DOCK5 foram identificados para a comparação ANG vs LR com QTLs sobrepostos relacionados com consumo de ração por alimentação e gordura no dorso entre a 3ª e a 4ª costela, respetivamente. A caracterização destes suínos de Angola indica que estes porcos são o produto de uma quimera de populações europeias e indígenas geradas por eventos antigos e recentes de introgressão. A presença de uma relação materna clara com as populações ibéricas e a baixa diferenciação genética observada entre as raças ANG e cosmopolitas europeias constituem a primeira avaliação desta população, representando um marco para a sua conservação. A caracterização do fitness destes porcos feita neste trabalho sugere que as condições ambientais adversas levaram a uma seleção positiva intensa associada a características de elevado valor econômico e agrícola, refletindo um perfil único de adaptação.