Publicação

Depicting epigenetic mechanisms involved in the regulation of pseudogene expression

Ver documento

Detalhes bibliográficos
Resumo:A epigenética dedica-se ao estudo de modificações que ocorrem, principalmente, sobre a dupla cadeia de DNA, sem que exista a edição da sequência nela contida (Waddington 1942b, 1942a). Graças às descobertas feitas nesta área nos últimos anos, existem vários tipos de modificações epigenéticas já descritas, entre as quais se destaca as modificações de histonas e a metilação do DNA (Li et al. 2007). Assim, avaliando a presença ou ausência destas modificações, poderemos inferir relativamente à activação ou silenciamento de uma determinada região do genoma. Vários estudos têm sido realizados para caracterizar a forma como estas modificações afectam a transcrição de genes codificadores de proteína (Kouzarides 2007), no entanto, pouco se sabe como estas modificações podem condicionar outras classes de genes, nomeadamente, os pseudogenes. Neste sentido, o objectivo deste trabalho consiste na determinação de modificações epigenéticas que possam estar envolvidas na expressão dos pseudogenes, potencialmente exercendo um papel crucial na sua regulação. Os pseudogenes são cópias ancestrais de sequências codificantes que, possivelmente devido à perda de pressão selectiva, degeneraram em novas unidades genéticas (Jacq et al. 1977). Actualmente, os pseudogenes são classificados em três grandes grupos que são definidos com base no seu processo de formação: processados, a classe de pseudogenes mais representada e cuja formação envolve um processo de transcrição reversa e integração de um RNA mensageiro novamente no DNA, num processo conhecido por retrotransposição; não processados, no caso do processo de formação do pseudogene acontecer através da duplicação de um gene completo; e unitários, quando a própria estrutura física do gene sofre modificações que levam à perda da capacidade de codificar uma proteína (Pink et al. 2011). O processo de formação dos pseudogenes que resulta na incapacidade do novo pseudogene codificar uma proteína denomina-se “pseudogenização” (Gregório 2016). Graças ao recente desenvolvimento de plataformas de sequenciação em larga escala, revelou-se que os pseudogenes são transcritos e que a sua transcrição pode estar envolvida na condução de importantes processos celulares nos quais os pseudogenes podem desempenhar funções celulares específicas. Presentemente, sabe-se que os pseudogenes conseguem também actuar através de diferentes mecanismos para modular a regulação dos seus genes parentais, nomeadamente através da competição para esponjas de microRNAs (Thomson and Dinger 2016), transcritos antisense ou lncRNAs com a capacidade de conduzir complexos proteicos remodeladores de cromatina (Groen et al. 2014). Para além desta actuação mediada por RNA através dos potenciais transcritos dos pseudogenes, pensa-se também que os pseudogenes podem ter mecanismos de acção ao nível do DNA que podem condicionar a actividade do gene parental, por exemplo através de um evento de recombinação homóloga entre o pseudogene e o gene parental que pode resultar na deleção do gene parental (Poliseno 2012). Dada esta possível contribuição em vários processos celulares, os pseudogenes definem um novo paradigma de como o genoma não codificante pode ter importantes contribuições em diversas funções biológicas, nomeadamente no desenvolvimento e no cancro. Um exemplo destas contribuições é o pseudogene Oct4p4, que tem a capacidade de regular a transcrição do seu gene parental, o regulador de pluripotência Oct4. Quando expresso, este pseudogene conduz a célula a iniciar o processo de diferenciação neural, através da imposição da modificação repressiva da histona H3 (H3K9me3) na região promotora do gene Oct4 (Liedtke et al. 2007). Um outro exemplo de um pseudogene com uma função importante, neste caso em cancro, é o PTENP1, um pseudogene do gene supressor tumoral PTEN. O PTENP1 é o exemplo de um pseudogene com diversificados mecanismos de acção através de um único pseudogene conseguindo actuar como uma esponja de microRNAs, um catalisador do recrutamento de remodeladores da cromatina para o promotor do gene PTEN e um transcrito antisense que consegue regular a estabilidade e a função de esponja de microRNAs do próprio transcrito sense do PTENP1 (Johnsson et al. 2013). Contudo, os mecanismos pelos quais a expressão dos pseudogenes é regulada e qual o seu papel biológico estão ainda por explorar. Grande porção dos pseudogenes não aparentam ter sequências regulatórias a montante do corpo do pseudogene, o que pode sugerir que outros mecanismos poderão estar envolvidos neste processo, em resultado da observação de modificações nas histonas de pseudogenes que são transcritos e que não são características nos seus genes parentais ou nos restantes genes codificadores de proteínas (Pei et al. 2012). Um destes exemplos é a presença de H3K9me3 na região do promotor de pseudogenes expressos (Guo et al. 2014). Tendo em consideração estas observações, propomos a hipótese que os pseudogenes possuem mecanismos epigenéticos próprios a regular a sua transcrição. Para testar esta hipótese, estudámos o transcriptoma e epigenoma dos pseudogenes durante a diferenciação neural de células estaminais embrionárias, através da combinação de análises de dados em larga de escala do transcriptoma (RNAseq e GRO-seq), metilação de DNA (BS-seq), regiões de cromatina aberta (hipersensibilidade à DNase) e modificações de histona (ChIP-seq). Os dados usados foram obtidos através da plataforma NIH Roadmap Epigenomics Consortium (Bernstein et al. 2010), consistindo em 72 amostras e um total de 194 replicados. Devido à elevada expressão de pseudogenes no cérebro (Pei et al. 2012), este projecto incidiu essencialmente na diferenciação neural, durante a qual células estaminais embrionárias (H1) foram diferenciadas in vitro em células progenitoras neuronais (H1N). As nossas análises referentes ao transcriptoma revelaram um número mais elevado de pseudogenes a serem expressos durante a diferenciação neural quando comparado com a diferenciação mesenquimal. No entanto, observámos que a detecção da transcrição dos pseudogenes pode ser incorrectamente determinada usando dados de RNA-seq, pois os perfis obtidos por esta tecnologia são influenciados pela estabilidade dos transcritos. Em concordância, os resultados obtidos usando dados de GRO-seq suportam esta hipótese, dado que permitem identificar um maior número de pseudogenes a serem transcritos. Após a identificação dos pseudogenes transcritos e silenciados, analisámos o seu enriquecimento em modificações de histonas. De todas as alterações observadas, destacamos três importantes observações associadas com a transcrição de pseudogenes, nomeadamente a presença de: H3K36me3 no corpo do pseudogenes transcritos, associada a episódios de continuação da transcrição do gene na região a montante (“read-through”); H3K9me3, uma marca epigenética usualmente associada a regiões não transcritas; e, por fim, domínios bivalentes (H3K4me3 e H3K27me3) na região promotora de alguns pseudogenes. Estas observações parecem sustentar a hipótese que sugere que a transcrição dos pseudogenes é regulada. Estudos mais profundos são necessários para perceber a extensão destas modificações na expressão dos pseudogenes, apesar da presença de H3K36me3 e H3K9me3 terem sido já observadas previamente em pseudogenes transcritos (Pei et al. 2012; Guo et al. 2014). No entanto, são ainda muitas as limitações associadas ao estudo dos pseudogenes e que precisam de um melhoramento no futuro. Primeiramente, a semelhança existente entre pseudogenes e os genes parentais dificulta o mapeamento destas regiões usando dados de sequenciação de transcriptoma. Adicionalmente, a expressão de pseudogenes por “read-through” do gene a montante pode sugerir a existência de erros na anotação de bases de dados e pressiona para a crescente necessidade de melhoramento na caracterização de genomas. Concluindo, os resultados aqui observados e discutidos confirmam que os pseudogenes são transcritos e que a sua transcrição parece ser regulada, sugerindo que o seu papel não será assim tão “pseudo” como previamente se pensava. Contudo, mais esforços são necessários para caracterizar a extensão destas alterações, bem como para aferir a contribuição da metilação do DNA na regulação da expressão dos pseudogenes.
Autores principais:Ferreira, Ana Margarida Esteves
Assunto:Pseudogenes Transcrição Epigenética Biologia computacional Teses de mestrado - 2017
Ano:2017
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Universidade de Lisboa
Idioma:inglês
Origem:Repositório da Universidade de Lisboa
Descrição
Resumo:A epigenética dedica-se ao estudo de modificações que ocorrem, principalmente, sobre a dupla cadeia de DNA, sem que exista a edição da sequência nela contida (Waddington 1942b, 1942a). Graças às descobertas feitas nesta área nos últimos anos, existem vários tipos de modificações epigenéticas já descritas, entre as quais se destaca as modificações de histonas e a metilação do DNA (Li et al. 2007). Assim, avaliando a presença ou ausência destas modificações, poderemos inferir relativamente à activação ou silenciamento de uma determinada região do genoma. Vários estudos têm sido realizados para caracterizar a forma como estas modificações afectam a transcrição de genes codificadores de proteína (Kouzarides 2007), no entanto, pouco se sabe como estas modificações podem condicionar outras classes de genes, nomeadamente, os pseudogenes. Neste sentido, o objectivo deste trabalho consiste na determinação de modificações epigenéticas que possam estar envolvidas na expressão dos pseudogenes, potencialmente exercendo um papel crucial na sua regulação. Os pseudogenes são cópias ancestrais de sequências codificantes que, possivelmente devido à perda de pressão selectiva, degeneraram em novas unidades genéticas (Jacq et al. 1977). Actualmente, os pseudogenes são classificados em três grandes grupos que são definidos com base no seu processo de formação: processados, a classe de pseudogenes mais representada e cuja formação envolve um processo de transcrição reversa e integração de um RNA mensageiro novamente no DNA, num processo conhecido por retrotransposição; não processados, no caso do processo de formação do pseudogene acontecer através da duplicação de um gene completo; e unitários, quando a própria estrutura física do gene sofre modificações que levam à perda da capacidade de codificar uma proteína (Pink et al. 2011). O processo de formação dos pseudogenes que resulta na incapacidade do novo pseudogene codificar uma proteína denomina-se “pseudogenização” (Gregório 2016). Graças ao recente desenvolvimento de plataformas de sequenciação em larga escala, revelou-se que os pseudogenes são transcritos e que a sua transcrição pode estar envolvida na condução de importantes processos celulares nos quais os pseudogenes podem desempenhar funções celulares específicas. Presentemente, sabe-se que os pseudogenes conseguem também actuar através de diferentes mecanismos para modular a regulação dos seus genes parentais, nomeadamente através da competição para esponjas de microRNAs (Thomson and Dinger 2016), transcritos antisense ou lncRNAs com a capacidade de conduzir complexos proteicos remodeladores de cromatina (Groen et al. 2014). Para além desta actuação mediada por RNA através dos potenciais transcritos dos pseudogenes, pensa-se também que os pseudogenes podem ter mecanismos de acção ao nível do DNA que podem condicionar a actividade do gene parental, por exemplo através de um evento de recombinação homóloga entre o pseudogene e o gene parental que pode resultar na deleção do gene parental (Poliseno 2012). Dada esta possível contribuição em vários processos celulares, os pseudogenes definem um novo paradigma de como o genoma não codificante pode ter importantes contribuições em diversas funções biológicas, nomeadamente no desenvolvimento e no cancro. Um exemplo destas contribuições é o pseudogene Oct4p4, que tem a capacidade de regular a transcrição do seu gene parental, o regulador de pluripotência Oct4. Quando expresso, este pseudogene conduz a célula a iniciar o processo de diferenciação neural, através da imposição da modificação repressiva da histona H3 (H3K9me3) na região promotora do gene Oct4 (Liedtke et al. 2007). Um outro exemplo de um pseudogene com uma função importante, neste caso em cancro, é o PTENP1, um pseudogene do gene supressor tumoral PTEN. O PTENP1 é o exemplo de um pseudogene com diversificados mecanismos de acção através de um único pseudogene conseguindo actuar como uma esponja de microRNAs, um catalisador do recrutamento de remodeladores da cromatina para o promotor do gene PTEN e um transcrito antisense que consegue regular a estabilidade e a função de esponja de microRNAs do próprio transcrito sense do PTENP1 (Johnsson et al. 2013). Contudo, os mecanismos pelos quais a expressão dos pseudogenes é regulada e qual o seu papel biológico estão ainda por explorar. Grande porção dos pseudogenes não aparentam ter sequências regulatórias a montante do corpo do pseudogene, o que pode sugerir que outros mecanismos poderão estar envolvidos neste processo, em resultado da observação de modificações nas histonas de pseudogenes que são transcritos e que não são características nos seus genes parentais ou nos restantes genes codificadores de proteínas (Pei et al. 2012). Um destes exemplos é a presença de H3K9me3 na região do promotor de pseudogenes expressos (Guo et al. 2014). Tendo em consideração estas observações, propomos a hipótese que os pseudogenes possuem mecanismos epigenéticos próprios a regular a sua transcrição. Para testar esta hipótese, estudámos o transcriptoma e epigenoma dos pseudogenes durante a diferenciação neural de células estaminais embrionárias, através da combinação de análises de dados em larga de escala do transcriptoma (RNAseq e GRO-seq), metilação de DNA (BS-seq), regiões de cromatina aberta (hipersensibilidade à DNase) e modificações de histona (ChIP-seq). Os dados usados foram obtidos através da plataforma NIH Roadmap Epigenomics Consortium (Bernstein et al. 2010), consistindo em 72 amostras e um total de 194 replicados. Devido à elevada expressão de pseudogenes no cérebro (Pei et al. 2012), este projecto incidiu essencialmente na diferenciação neural, durante a qual células estaminais embrionárias (H1) foram diferenciadas in vitro em células progenitoras neuronais (H1N). As nossas análises referentes ao transcriptoma revelaram um número mais elevado de pseudogenes a serem expressos durante a diferenciação neural quando comparado com a diferenciação mesenquimal. No entanto, observámos que a detecção da transcrição dos pseudogenes pode ser incorrectamente determinada usando dados de RNA-seq, pois os perfis obtidos por esta tecnologia são influenciados pela estabilidade dos transcritos. Em concordância, os resultados obtidos usando dados de GRO-seq suportam esta hipótese, dado que permitem identificar um maior número de pseudogenes a serem transcritos. Após a identificação dos pseudogenes transcritos e silenciados, analisámos o seu enriquecimento em modificações de histonas. De todas as alterações observadas, destacamos três importantes observações associadas com a transcrição de pseudogenes, nomeadamente a presença de: H3K36me3 no corpo do pseudogenes transcritos, associada a episódios de continuação da transcrição do gene na região a montante (“read-through”); H3K9me3, uma marca epigenética usualmente associada a regiões não transcritas; e, por fim, domínios bivalentes (H3K4me3 e H3K27me3) na região promotora de alguns pseudogenes. Estas observações parecem sustentar a hipótese que sugere que a transcrição dos pseudogenes é regulada. Estudos mais profundos são necessários para perceber a extensão destas modificações na expressão dos pseudogenes, apesar da presença de H3K36me3 e H3K9me3 terem sido já observadas previamente em pseudogenes transcritos (Pei et al. 2012; Guo et al. 2014). No entanto, são ainda muitas as limitações associadas ao estudo dos pseudogenes e que precisam de um melhoramento no futuro. Primeiramente, a semelhança existente entre pseudogenes e os genes parentais dificulta o mapeamento destas regiões usando dados de sequenciação de transcriptoma. Adicionalmente, a expressão de pseudogenes por “read-through” do gene a montante pode sugerir a existência de erros na anotação de bases de dados e pressiona para a crescente necessidade de melhoramento na caracterização de genomas. Concluindo, os resultados aqui observados e discutidos confirmam que os pseudogenes são transcritos e que a sua transcrição parece ser regulada, sugerindo que o seu papel não será assim tão “pseudo” como previamente se pensava. Contudo, mais esforços são necessários para caracterizar a extensão destas alterações, bem como para aferir a contribuição da metilação do DNA na regulação da expressão dos pseudogenes.