Publicação
Splicing kinetics revealed by nascent transcript sequencing
| Resumo: | A transcrição é o primeiro passo da expressão génica, no qual um segmento particular de informação presente no DNA é copiado para RNA mensageiro (mRNA), que por sua vez irá ser traduzido tendo como resultado final o conjunto de proteínas que suportam a vida. A biogénese do RNA mensageiro (mRNA) é um processo constituído por múltiplas etapas. Imediatamente a seguir à transcrição o RNA é modificado na extremidade 5' pela adição de uma 7-methylguanosina. Segue-se o splicing, que resulta na remoção dos intrões. Finalmente o RNA é clivado na extremidade 3' e modificado pela adição de uma cauda poli(A). Uma vez que a maior parte destes processos ocorre enquanto a molécula de RNA nascente ainda está acoplada à RNA polimerase II (Pol II), considera-se que a biogénese do mRNA é maioritariamente um processo co-transcricional. A associação entre Pol II e processamento de moléculas precursoras de mRNA (pré-mRNAs) é mediada pela maior subunidade da Pol II que se caracteriza por possuir, nos organismos eucariotas, um domínio carboxilo terminal (CTD) altamente longo e flexível. Este serve como plataforma para ancoragem de várias proteínas que regulam a transcrição e o processamento do pré-mRNA. O CTD da Pol II nas células humanas inclui 52 repetições da sequência proteica consenso YSPTSPS que é conservada entre leveduras e mamíferos. Para além de 21 repetições com a sequência consenso, as células humanas apresentam ainda 31 repetições de sequências mais degeneradas maioritariamente na última metade (desde a repetição 26 até à 52). Durante o ciclo da transcrição, composto por iniciação, elongação e terminação, o CTD é reversivelmente modificado por várias reações químicas, nomeadamente por fosforilações. Consoante o tipo de modificação, o CTD manifesta afinidade para diferentes proteínas. Assim, consoante a fase da transcrição, o CTD recruta proteínas responsáveis por etapas específicas do processamento do pré-mRNA. Antes da Pol II iniciar a transcrição o CTD encontra-se sobretudo desfosforilado. Durante a fase de iniciação da transcrição o CTD está maioritariamente fosforilado na serina 5 (S5P), enquanto que na fase de elongação o CTD vai gradualmente ficando mais fosforilado na serina 2 (S2P) perdendo ao mesmo ritmo o nível de fosforilação em S5P até à fase de terminação onde o CTD estará maioritariamente fosforilado na S2P. A transcrição termina quando a Pol II se dissocia da cadeia de DNA, ficando o CTD desfosforilado e pronto para começar um novo ciclo. O splicing de pré-mRNAs consiste num processo químico constituído por duas fases em que é primeiro gerado um grupo hidroxilo 3' livre (3'-OH) no exão a montante e se cria uma ligação fosfodiéster 2'-5' na adenosina no ponto de ramificação ("branch point") responsável pela estrutura característica em forma de laço adotada pelo intrão. Na segunda fase, o grupo 3'-OH do exão a montante realiza um ataque nucleofílico no local de splicing (SS) a 3' de forma a ligar os exões e excisar a estrutura de laço formada pelo intrão. Estas reações ocorrem dentro do spliceossoma cataliticamente ativo, mas antes de chegar a este ponto é necessário que o SS a 3' esteja exposto, isto é, deixe de estar protegido pela estrutura da Pol II. De facto, as sequências de nucleótidos presentes nos locais local de splicing a 5' e a 3' precisam de estar acessíveis para serem reconhecidas por componentes do spliceossoma. A maior parte do splicing ocorre co-transcricionalmente, isto é, enquanto a molécula de pré-mRNA ainda está acoplada à Pol II durante a transcrição da cadeia de DNA. Ao longo dos últimos anos foram realizados inúmeros estudos que revelam uma íntima relação entre o splicing e da transcrição, com importantes repercussões funcionais. Por exemplo, já foi descrito que a velocidade de elongação da Pol II influencia a capacidade de reconhecimento de locais de splicing, pelo que a existência de pausas da Pol II determina a escolha de padrões distintos de splicing alternativo. Esta associação entre a transcrição e a biogénese do mRNA é determinante para a regulação da expressão génica. No entanto, sabe-se pouco sobre os mecanismos que ligam as duas maquinarias moleculares. O objetivo deste trabalho foi realizar um estudo à escala genómica do acoplamento entre a transcrição e o splicing utilizando uma estratégia de sequenciação de nova geração denominada "Native Elongation Transcript sequencing in mammalian cells" (mNET-seq). Esta foi a abordagem escolhida porque era aquela que nos permite estudar perfis de transcrição nascente com resolução de nucleótido a nucleótido ao nível de todo o genoma, onde podemos então procurar padrões específicos de pausa da Pol II. O meu trabalho conducente a esta dissertação de mestrado consistiu na análise bioinformática de dados gerados, através da plataforma Illumina Hiseq 2500, no laboratório do Professor Proudfoot na Universidade de Oxford, Reino Unido, tendo sido o planeamento experimental conduzido em colaboração com a Professora Carmo-Fonseca no Instituto de Medicina Molecular da Faculdade de Medicina da Universidade de Lisboa. Os resultados obtidos revelaram a presença de componentes do spliceossoma, nomeadamente os pequenos RNAs nucleares (snRNA) U1, U2, U4 e U5, num complexo associado especificamente à Pol II com o seu domínio carboxilo terminal contendo resíduos de serina 5 fosforilados (S5P Pol II). Encontramos também a nível global produtos intermediários da reação de splicing em associação com S5P Pol II. A capacidade da técnica de mNET-seq de mapear intermediários de splicing permitiu-nos uma análise global do splicing co-transcricional in vivo. O cálculo da percentagem de índice de splicing (PSI) mostrou que praticamente todos os exões que apresentam um intermediário de splicing associado a Pol II estão completamente incluídos no mRNA. Observamos níveis mais elevados de densidade da Pol II nos exões com splicing co-transcricional, em particular para o conjunto de dados de S5P CTD. Ademais identificamos moléculas de RNA já desprovidas de intrões associadas preferencialmente a S5P Pol II. Nestes casos observamos uma acumulação de transcritos já processados sugestivos de pausas da Pol II relacionadas com o processo de splicing. A nossa análise permitiu-nos ainda identificar a posição da Pol II no momento em que ocorreu splicing. Os resultados mostram uma tendência para o splicing ocorrer quando a Pol II transcreveu apenas cerca de 20 nucleótidos após o local de splicing a 3'. No entanto, ainda que raramente, foram detetados eventos de splicing a ocorrer quando a Pol II já se encontrava a transcrever o intrão a jusante. Em resumo, os resultados obtidos revelam que as reações de splicing podem ocorrer imediatamente após a transcrição pela Pol II e sugerem que o splicing impõe uma travagem à velocidade da Pol II. Os resultados deste trabalho permitiram ainda identificar algumas limitações impostas pela técnica de mNET-seq, pelo que será necessário desenvolver aperfeiçoamentos e/ou técnicas adicionais para uma melhor caracterização global dos mecanismos de splicing co-transcricional no futuro. A principal limitação relaciona-se com o reduzido tamanho dos fragmentos de RNA que resistem à digestão pela Micrococcal nuclease (Mnase). Neste trabalho analisamos fragmentos de RNA com um tamanho entre 60 a 160 nucleótidos, o que não nos permite localizar a posição da Pol II no momento em que o splicing lento acontece nas células humanas. É previsível que o contínuo desenvolvimento de novas plataformas de sequenciação em larga escala vão também permitir uma análise mais precisa dos eventos de processamento do RNA que decorrem durante a transcrição. Desenvolvimentos futuros que permitam aumentar os níveis de resolução e sensibilidade das análises são absolutamente essenciais para uma correta interpretação da biologia subjacente. A par do desenvolvimento tecnológico, importa também investigar se as observações aqui reportadas em células humanas (células HeLa) são conservadas do ponto de vista evolutivo, nomeadamente noutros mamíferos e em organismos menos complexos. Em particular, seria importante determinar em que estadio ao longo da evolução ocorreu a separação entre splicing rápido e lento, e qual das duas formas (rápida e lenta) terá surgido primeiro. |
|---|---|
| Autores principais: | Rebelo, Kenny Patrick Figueira |
| Assunto: | mNET-seq Transcrição Splicing Spliceossoma CTD Teses de mestrado - 2017 |
| Ano: | 2017 |
| País: | Portugal |
| Tipo de documento: | dissertação de mestrado |
| Tipo de acesso: | acesso aberto |
| Instituição associada: | Universidade de Lisboa |
| Idioma: | inglês |
| Origem: | Repositório da Universidade de Lisboa |
| Resumo: | A transcrição é o primeiro passo da expressão génica, no qual um segmento particular de informação presente no DNA é copiado para RNA mensageiro (mRNA), que por sua vez irá ser traduzido tendo como resultado final o conjunto de proteínas que suportam a vida. A biogénese do RNA mensageiro (mRNA) é um processo constituído por múltiplas etapas. Imediatamente a seguir à transcrição o RNA é modificado na extremidade 5' pela adição de uma 7-methylguanosina. Segue-se o splicing, que resulta na remoção dos intrões. Finalmente o RNA é clivado na extremidade 3' e modificado pela adição de uma cauda poli(A). Uma vez que a maior parte destes processos ocorre enquanto a molécula de RNA nascente ainda está acoplada à RNA polimerase II (Pol II), considera-se que a biogénese do mRNA é maioritariamente um processo co-transcricional. A associação entre Pol II e processamento de moléculas precursoras de mRNA (pré-mRNAs) é mediada pela maior subunidade da Pol II que se caracteriza por possuir, nos organismos eucariotas, um domínio carboxilo terminal (CTD) altamente longo e flexível. Este serve como plataforma para ancoragem de várias proteínas que regulam a transcrição e o processamento do pré-mRNA. O CTD da Pol II nas células humanas inclui 52 repetições da sequência proteica consenso YSPTSPS que é conservada entre leveduras e mamíferos. Para além de 21 repetições com a sequência consenso, as células humanas apresentam ainda 31 repetições de sequências mais degeneradas maioritariamente na última metade (desde a repetição 26 até à 52). Durante o ciclo da transcrição, composto por iniciação, elongação e terminação, o CTD é reversivelmente modificado por várias reações químicas, nomeadamente por fosforilações. Consoante o tipo de modificação, o CTD manifesta afinidade para diferentes proteínas. Assim, consoante a fase da transcrição, o CTD recruta proteínas responsáveis por etapas específicas do processamento do pré-mRNA. Antes da Pol II iniciar a transcrição o CTD encontra-se sobretudo desfosforilado. Durante a fase de iniciação da transcrição o CTD está maioritariamente fosforilado na serina 5 (S5P), enquanto que na fase de elongação o CTD vai gradualmente ficando mais fosforilado na serina 2 (S2P) perdendo ao mesmo ritmo o nível de fosforilação em S5P até à fase de terminação onde o CTD estará maioritariamente fosforilado na S2P. A transcrição termina quando a Pol II se dissocia da cadeia de DNA, ficando o CTD desfosforilado e pronto para começar um novo ciclo. O splicing de pré-mRNAs consiste num processo químico constituído por duas fases em que é primeiro gerado um grupo hidroxilo 3' livre (3'-OH) no exão a montante e se cria uma ligação fosfodiéster 2'-5' na adenosina no ponto de ramificação ("branch point") responsável pela estrutura característica em forma de laço adotada pelo intrão. Na segunda fase, o grupo 3'-OH do exão a montante realiza um ataque nucleofílico no local de splicing (SS) a 3' de forma a ligar os exões e excisar a estrutura de laço formada pelo intrão. Estas reações ocorrem dentro do spliceossoma cataliticamente ativo, mas antes de chegar a este ponto é necessário que o SS a 3' esteja exposto, isto é, deixe de estar protegido pela estrutura da Pol II. De facto, as sequências de nucleótidos presentes nos locais local de splicing a 5' e a 3' precisam de estar acessíveis para serem reconhecidas por componentes do spliceossoma. A maior parte do splicing ocorre co-transcricionalmente, isto é, enquanto a molécula de pré-mRNA ainda está acoplada à Pol II durante a transcrição da cadeia de DNA. Ao longo dos últimos anos foram realizados inúmeros estudos que revelam uma íntima relação entre o splicing e da transcrição, com importantes repercussões funcionais. Por exemplo, já foi descrito que a velocidade de elongação da Pol II influencia a capacidade de reconhecimento de locais de splicing, pelo que a existência de pausas da Pol II determina a escolha de padrões distintos de splicing alternativo. Esta associação entre a transcrição e a biogénese do mRNA é determinante para a regulação da expressão génica. No entanto, sabe-se pouco sobre os mecanismos que ligam as duas maquinarias moleculares. O objetivo deste trabalho foi realizar um estudo à escala genómica do acoplamento entre a transcrição e o splicing utilizando uma estratégia de sequenciação de nova geração denominada "Native Elongation Transcript sequencing in mammalian cells" (mNET-seq). Esta foi a abordagem escolhida porque era aquela que nos permite estudar perfis de transcrição nascente com resolução de nucleótido a nucleótido ao nível de todo o genoma, onde podemos então procurar padrões específicos de pausa da Pol II. O meu trabalho conducente a esta dissertação de mestrado consistiu na análise bioinformática de dados gerados, através da plataforma Illumina Hiseq 2500, no laboratório do Professor Proudfoot na Universidade de Oxford, Reino Unido, tendo sido o planeamento experimental conduzido em colaboração com a Professora Carmo-Fonseca no Instituto de Medicina Molecular da Faculdade de Medicina da Universidade de Lisboa. Os resultados obtidos revelaram a presença de componentes do spliceossoma, nomeadamente os pequenos RNAs nucleares (snRNA) U1, U2, U4 e U5, num complexo associado especificamente à Pol II com o seu domínio carboxilo terminal contendo resíduos de serina 5 fosforilados (S5P Pol II). Encontramos também a nível global produtos intermediários da reação de splicing em associação com S5P Pol II. A capacidade da técnica de mNET-seq de mapear intermediários de splicing permitiu-nos uma análise global do splicing co-transcricional in vivo. O cálculo da percentagem de índice de splicing (PSI) mostrou que praticamente todos os exões que apresentam um intermediário de splicing associado a Pol II estão completamente incluídos no mRNA. Observamos níveis mais elevados de densidade da Pol II nos exões com splicing co-transcricional, em particular para o conjunto de dados de S5P CTD. Ademais identificamos moléculas de RNA já desprovidas de intrões associadas preferencialmente a S5P Pol II. Nestes casos observamos uma acumulação de transcritos já processados sugestivos de pausas da Pol II relacionadas com o processo de splicing. A nossa análise permitiu-nos ainda identificar a posição da Pol II no momento em que ocorreu splicing. Os resultados mostram uma tendência para o splicing ocorrer quando a Pol II transcreveu apenas cerca de 20 nucleótidos após o local de splicing a 3'. No entanto, ainda que raramente, foram detetados eventos de splicing a ocorrer quando a Pol II já se encontrava a transcrever o intrão a jusante. Em resumo, os resultados obtidos revelam que as reações de splicing podem ocorrer imediatamente após a transcrição pela Pol II e sugerem que o splicing impõe uma travagem à velocidade da Pol II. Os resultados deste trabalho permitiram ainda identificar algumas limitações impostas pela técnica de mNET-seq, pelo que será necessário desenvolver aperfeiçoamentos e/ou técnicas adicionais para uma melhor caracterização global dos mecanismos de splicing co-transcricional no futuro. A principal limitação relaciona-se com o reduzido tamanho dos fragmentos de RNA que resistem à digestão pela Micrococcal nuclease (Mnase). Neste trabalho analisamos fragmentos de RNA com um tamanho entre 60 a 160 nucleótidos, o que não nos permite localizar a posição da Pol II no momento em que o splicing lento acontece nas células humanas. É previsível que o contínuo desenvolvimento de novas plataformas de sequenciação em larga escala vão também permitir uma análise mais precisa dos eventos de processamento do RNA que decorrem durante a transcrição. Desenvolvimentos futuros que permitam aumentar os níveis de resolução e sensibilidade das análises são absolutamente essenciais para uma correta interpretação da biologia subjacente. A par do desenvolvimento tecnológico, importa também investigar se as observações aqui reportadas em células humanas (células HeLa) são conservadas do ponto de vista evolutivo, nomeadamente noutros mamíferos e em organismos menos complexos. Em particular, seria importante determinar em que estadio ao longo da evolução ocorreu a separação entre splicing rápido e lento, e qual das duas formas (rápida e lenta) terá surgido primeiro. |
|---|