| Resumo: | O núcleo das células eucariotas é um organelo muito dinâmico onde decorre um grande elevado número de reações químicas por segundo das mais diversas naturezas. Este dinamismo e variedade de processos só é possível devido à sua organização tridimensional. No núcleo, os genes codificantes de proteínas são transcritos pela ARN Polimerase II (ARN Pol II). Os recém-sintetizados ARN mensageiros imaturos (pré-mARN) necessitam de ser processado para se tornarem funcionais (mARN). O processamento acontece maioritariamente durante a transcrição, sendo por isso designado por processamento co-transcricional. Um destes processos co-transcricionais é a remoção de regiões não codificantes (intrões) da molécula de pré-mARN que passa apenas a conter regiões codificantes (exões). Este processo é designado de splicing, e embora nas últimas décadas, muito tem sido desvendado à cerca dos componentes e dos mecanismos de ação, sabe-se muito pouco sobre os mecanismos de regulação. No núcleo, o ser humano tem 2 metros de ADN genómico que estão compactados em apenas 10 μm. Esta compactação é o resultado da associação do material genético a proteínas nucleares que permite com que este seja compactado em cromatina. A topologia da cromatina cria vizinhanças funcionais que desempenham um papel central na regulação da transcrição. De forma semelhante, estudos de microscopia eletrónica realizados nos anos 80 revelaram que pré-mARNs recém-sintetizados (mARN nascentes) associam-se a proteínas e formam grânulos de ARN. No entanto, a organização destes grânulos e o seu impacto funcional na regulação do splicing nunca foram investigados. Com as recentes observações de que o splicing de intrões longos pode ser imediato, o que quebrou o dogma de que intrões longos são processados através de mecanismos de reconhecimento dos exões, nós levantamos a hipótese de que esta elevada eficiência do splicing está dependente da estrutura da molécula de ARN nascente. Aqui, nós apresentamos uma nova abordagem para mapear a organização espacial do mARN nascente – APEX2-POINT-seq. Nós combinámos a abordagem de marcação de proximidade - APEX2 - com a tecnologia de captura de transcritos nascentes intactos associados à polimerase (POINT-seq). Por um lado, a tecnologia APEX2 permite realizar o mapeamento de várias biomoléculas na proximidade da proteína à qual está ligada. Este mapeamento consiste na biotinilação destas biomoléculas pela oxidação de substratos permeáveis de biotina em moléculas altamente reativas que são capazes de marcar num raio de ~ 25 nm. Por outro lado, a metodologia POINT permite isolar ARN nascente intacto, que corresponde a apenas 0.5 % do ARN total das células. De forma a testar a hipótese de que o ARN nascente tem uma estrutura sistemática, nós inserimos o gene apex2 no locus de 3 subunidades diferentes da ARN Pol II para mapear as regiões de ARN nascentes próximas da ARN Pol II em células de Drosophila. Essas subunidades foram selecionadas com base em sua exclusividade para ARN Pol II, proximidade para com a saída de ARN do local de síntese, dados de no cryo-EM de última geração e evidências de clonagem anteriores. A extremidade N do gene Polr2A e a extremidade C do gene Polr2C já tinham sido previamente usadas em edições genómicas e por este motivo foram selecionadas. Em contraste, por não haver evidências em relação ao gene Polr2J, decidimos inserir o Apex2 em ambas as extremidades. De forma a realizar estas inserções, usamos um protocolo otimizado para edição de genes em células de Drosophila S2 através do método, CRISPR/Cas9. CRISPR/cas9 é uma poderosa ferramenta de edição genómica, que utiliza uma molécula de ARN como guia, a fim de levar consigo uma proteína capaz de causar um dano no DNA. Este dano permite com que os mecanismos de reparação celulares sejam capazes de repara este dano, mas usando como molde uma sequência nova, fornecida aquando da transfeção, que neste caso conterá o gene Apex2. Após a confirmação da inserção do gene Apex2 no genoma de 25 clones, procedemos a um teste que visava aferir a atividade de marcação de proximidade da proteína APEX2. A análise de imunofluorescência confirmou a biotinilação nuclear de 8 das 25 linhas celulares corretamente editadas. No entanto, é necessária uma avaliação mais aprofundada da integração destas subunidades recombinantes nos complexos transcricionais ativos. Isto poderá ser realizado por co-imunoprecipitação da proteína recombinante na sua forma nativa utilizando um anticorpo anti-APEX2, com posterior marcação para componentes conhecidos nestes complexos. Após a validação funcional, queremos capturar e sequenciar os fragmentos de RNA nascente proximal do RNA Pol II. Mapear as regiões que estão sob- e sub-representadas na fração de ARNs nascente biotiniladas permitirá mapear a organização espacial do ARN nascente. Durante este processo de inserção e validação das linhas em células S2, implementámos o APEX2-POINT-seq usando uma linha celular que expressa o fator de splicing, SRSF1, fundido ao APEX2 – SRSF1-APEX2. Os nossos resultados preliminares indicam que o APEX2-SRSF1 marca sequências predominantemente exónicas, já que o SRSF1 se liga predominantemente aos exões. Além disso, detetamos também sequências intrónicas biotiniladas. Assumindo que um nucleótido mede 0,3 nm, um intrão com mil nucleótidos deveria ter os locais de splicing separados por aproximadamente 300 nm. A biotinilação intrónica pode sugerir que, através do dobramento da molécula de ARN nascente, os intrões ficam a uma distância de aproximadamente 25 nm dos exões. Além disso, também exploramos a presença de ARN Pol II nas regiões de vizinhanças de splicing com a, onde quisemos entender como variam as formas de fosforilação da ARN Pol II após inibir o processo de transcrição e o processo de splicing. Também analisamos estas regiões através da combinação da técnica de APEX2 e o uso de metodologias de sequenciação de ARN e de identificação de proteínas. Estes resultados mostraram que isoformas ativas da ARN Pol II estão presentes nas vizinhanças do SRSF1 e que após a inibição de ambos os processos existe uma redução da quantidade de isoformas ativas ARN Pol II nas células, o que é refletido na fração que está na proximidade do SRSF1. Através do método de identificação de proteínas, conseguimos detetar um enriquecimento em proteínas do complexo das junções de exões, já descrito previamente. A falta de cobertura na sequenciação de ARN na vizinhança do SRSF1 limitou a análise deste grupo de moléculas. Embora não tenhamos conseguido observar um enriquecimento em regiões intrónicas quando capturamos ARN na proximidade do SRSF1, ao analisar a subpopulação de ARN não codificantes, foi possível observar um enriquecimento em ARN não codificantes que têm um papel ativo no processo de splicing. Apesar dos desafios na exploração das vizinhanças de splicing, os resultados permitiram aferir a alta-resolução da técnica APEX2. Em suma, APEX2-POINT-seq é um passo promissor para a compreensão da dinâmica e da complexidade da regulação do splicing co-transcricional. A otimização da técnica poderá melhorar a resolução e a precisão dos mapas da conformação do RNA nascente. Além disso, a ligação do APEX2 à mesma proteína em diferentes organismos permitirá avaliar uma possível organização espacial conservada em eucariotas. Da mesma forma, marcar diferentes proteínas com APEX2, com posterior integração dos mapas de mapeamento, aumentaria a precisão. No futuro, esta abordagem poderá ser usada para investigar o impacto de várias proteínas de ligação ao RNA e fatores de splicing na conformação do RNA nascente. Podemos também avaliar a conformação do ARN nascente a diferentes temperaturas, já que a temperatura afeta a cinética dos processos celulares, ou após a inibição do splicing para avaliar o impacto que tem na conformação do ARN nascente. No geral, o APEX2-POINT-seq tem o potencial de avançar significativamente a nossa compreensão dos mecanismos subjacentes à expressão e regulação dos genes. |