Publicação
LINCRNAS' profile in setd2 downregulated cells
| Resumo: | O carcinoma de células renais (CCR) é o tipo de cancro renal mais prevalente na população adulta e representa 2-3% dos casos de cancro em todo o mundo. O CCR inclui quatro subtipos histologicamente distintos, sendo o mais comum o de células claras, assim designado devido ao baixo teor lipídico presente no citoplasma das suas células. Este subtipo é geneticamente caracterizado pela recorrente perda do braço pequeno do cromossoma 3 (3p) e consequentemente, pela inativação dos genes supressores de tumores que estão localizados nesta região do genoma. Mutações no gene supressor de tumor Von Hippel-Lindau (VHL) eram comummente observadas na grande maioria dos casos e, por isso, pensou-se que estas mutações estariam na base genética do desenvolvimento de CCR. Contudo, estudos mais aprofundados mostraram que a inativação do gene VHL é necessária mas insuficiente para despoletar a doença, desta forma surgiu a hipótese de existir a intervenção de um outro gene supressor de tumores que também estivesse localizado nas proximidades da região. Esta hipótese foi suportada por estudos posteriores que identificaram o gene SETD2 como um possível novo gene supressor de tumor do CCR de células claras. O gene SETD2 codifica uma metiltransferase que atua especificamente na lisina-36 da histona H3 (H3K36). A trimetilação desta histona (H3K36me3) está associada ao estado ativo da cromatina e desempenha um importante papel durante a fase de elongação no processo de transcrição génica. Foi também demonstrado que os níveis de modificação da H3K36me3, e consequentemente os níveis de expressão do gene SETD2, são mais elevados em genes que são constituídos por vários exões, o que sugere que o SETD2 tem um papel preponderante na prevenção da iniciação intragénica (evitando assim a produção de transcritos incorretos). Uma vez que todas estas funções são importantes para que haja uma boa regulação génica, é possível prever que a alteração dos níveis de expressão do SETD2 poderá comprometer importantes processos celulares, levando em última instância ao desenvolvimento de cancros. De facto, em células de pacientes com cancro da mama, foram observados baixos níveis de expressão deste gene e em estudos independentes, foi também constatado que o SETD2 regula a transcrição da proteína p53, descrita atualmente como a proteína mais comummente alterada em tumores humanos. Apesar das últimas décadas de investigação científica se terem gravitado em torno das proteínas e das suas funções, o desenvolvimento de tecnologias de sequenciação de nova geração (NGS) têm levado ao reconhecimento de que, na verdade, apenas uma pequena parte do genoma está efetivamente associado à produção de proteínas. Surpreendentemente, observou-se também que a grande maioria do genoma (apesar de não estar associada à codificação de proteínas) continua a ser transcrito de forma frequente e generalizada, tornando-se evidente que as regiões não-codificantes do genoma (assim designadas por não codificarem proteínas) estão longe de estarem desprovidas de qualquer tipo de função. Na realidade, sabe-se agora, que a grande maioria delas produz moléculas que estão associadas a mecanismos de regulação génica e que orquestram tudo o que é produzido dentro das células. Dentro do conjunto de genes não-codificantes encontram-se os genes que produzem lincRNAs (long intergenic noncoding RNAs), que são longos transcritos de RNA funcionais que se encontram localizados entre genes que codificam proteínas. Uma vez que os lincRNAs desempenham importantes funções de regulação celular têm sido, ultimamente, alvo de vários estudos que têm demonstrado que em diversas doenças, como alguns tipos de cancro, existem profundas alterações na produção destes transcritos. Uma vez que o CCR de células claras é conhecido por ser particularmente resistente à radioterapia ou à quimioterapia, a terapia génica direcionada apresenta-se como uma boa alternativa de tratamento para os seus doentes. No entanto, apesar da quantidade de estudos moleculares realizados em CCR de células claras ainda não é possível compreender totalmente este subtipo de carcinoma renal. É portanto necessária uma melhor caracterização molecular deste carcinoma, a fim de se poderem encontrar os genes-alvo na realização de uma terapia génica direcionada. Deste modo, com o intuito de explorar de que forma é que o perfil de expressão dos genes (tanto codificadores de proteínas, como lincRNAs) é influenciado pelo SETD2 em células com este subtipo de CCR, decidiu-se fazer uma análise de expressão diferencial, quantificando e comparando os níveis de expressão génica entre linhas celulares com o SETD2 expresso a níveis normais e linhas celulares com o SETD2 mutado. Para tal, e uma vez que se pretendia fazer uma análise integral do genoma, foi necessário obter um catálogo de anotação de lincRNAs humanos que fosse o mais completo possível. Como o importante papel de regulação desempenhado pelos lincRNAs por todo o genoma tem feito com que sejam associados ao desenvolvimento de certas doenças, e por isso, que estejam a ser alvo de intensos e meticulosos estudos, algumas das bases de dados começaram a catalogá-los o que levou a que, rapidamente emergissem inúmeras bases de dados publicamente acessíveis e exclusivamente dedicadas à anotação de genes não-codificantes. As bases de dados oferecem uma excelente ferramenta na investigação científica, contudo, como não são criadas com os mesmos propósitos nem têm a mesma anotação, também se podem tornar num grande obstáculo à obtenção de conhecimento. Assim, procurou-se as maiores e mais especializadas bases de dados de lincRNAs (Ensembl, Genivcode, Vega, Lncipedia, UCSC, Broad Institute, Noncode e dados publicados por Zhipeng e Adelson) e convergiram-se todas numa só, obtendo-se um total de 38 402 lincRNAs. De seguida, para que se pudesse descobrir novos lincRNAs e completar o catálogo obtido anteriormente, o transcriptoma de CCR de células claras foi reconstruído, tendo se descoberto 21 661 potenciais novos lincRNAs. Depois de adicionados ao catálogo de anotação anterior, obteve-se um número surpreendentemente elevado de lincRNAs que é concordante com o que tem sido descrito relativamente à porção do genoma que não codifica proteínas. A análise diferencial entre as amostras cujo SETD2 tem uma expressão normal versus as que têm uma mutação do SETD2 permitiu a identificação de 505 genes diferencialmente expressos, entre os quais 292 genes codificadores de proteínas e 213 lincRNAs. Durante esta análise, foi possível observar que a sub-expressão de lincRNAs nas linhas celulares com o SETD2 mutado foi incrivelmente elevada, quando comparada com a sub-expressão de genes codificadores de proteínas, sugerindo que a desregulação do SETD2 tem um maior impacto no perfil de expressão dos lincRNAs. Apesar de enumeras evidências sugerirem que a maioria dos lincRNAs são funcionais, a verdade é que apenas uma pequena quantidade tem atualmente a sua função anotada. Sabendo que alguns lincRNAs são co-expressos com os genes que codificam proteínas que estão localizados nas suas proximidades, pode-se inferir a função dos primeiros através da função dos últimos. No entanto, alguns lincRNAs podem também influenciar a expressão de genes codificadores de proteínas em regiões cromossómicas bastante distantes da sua própria localização. Assim, com a intenção de obter conjuntos de genes codificadores de proteínas e lincRNAs cujos níveis de expressão estivessem correlacionados entre si, e correlacionados com a expressão de SETD2, mas também com o objetivo de prever possíveis funções para alguns lincRNAs, procedeu-se à construção de uma rede de correlação génica. Esta análise permitiu distinguir três módulos de genes altamente correlacionados entre si, e entre os níveis de expressão do SETD2. De uma forma geral, constatou-se que as funções dos genes pertencentes a um mesmo módulo tendiam a ser bastante semelhantes, tendo-se desta forma feito uma previsão funcional para os lincRNAs que ainda não estão descritos ou caracterizados. No final, este trabalho permitiu dar os primeiros passos na compreensão do perfil de expressão dos lincRNAs no CCR de células claras, para que futuramente se possam encontrar os biomarcadores genéticos que indicam a suscetibilidade de certos indivíduos para desenvolverem este carcinoma, ou ainda para que se encontrem os genes-alvo numa possível terapia génica direcionada. |
|---|---|
| Autores principais: | Tavares, Joana Patrícia Moreira |
| Assunto: | lincRNA ccRCC RNA-seq Perfil de expressão génica Análise génica de expressão diferencial Rede de correlação génica Teses de mestrado - 2015 |
| Ano: | 2015 |
| País: | Portugal |
| Tipo de documento: | dissertação de mestrado |
| Tipo de acesso: | acesso aberto |
| Instituição associada: | Universidade de Lisboa |
| Idioma: | inglês |
| Origem: | Repositório da Universidade de Lisboa |
| Resumo: | O carcinoma de células renais (CCR) é o tipo de cancro renal mais prevalente na população adulta e representa 2-3% dos casos de cancro em todo o mundo. O CCR inclui quatro subtipos histologicamente distintos, sendo o mais comum o de células claras, assim designado devido ao baixo teor lipídico presente no citoplasma das suas células. Este subtipo é geneticamente caracterizado pela recorrente perda do braço pequeno do cromossoma 3 (3p) e consequentemente, pela inativação dos genes supressores de tumores que estão localizados nesta região do genoma. Mutações no gene supressor de tumor Von Hippel-Lindau (VHL) eram comummente observadas na grande maioria dos casos e, por isso, pensou-se que estas mutações estariam na base genética do desenvolvimento de CCR. Contudo, estudos mais aprofundados mostraram que a inativação do gene VHL é necessária mas insuficiente para despoletar a doença, desta forma surgiu a hipótese de existir a intervenção de um outro gene supressor de tumores que também estivesse localizado nas proximidades da região. Esta hipótese foi suportada por estudos posteriores que identificaram o gene SETD2 como um possível novo gene supressor de tumor do CCR de células claras. O gene SETD2 codifica uma metiltransferase que atua especificamente na lisina-36 da histona H3 (H3K36). A trimetilação desta histona (H3K36me3) está associada ao estado ativo da cromatina e desempenha um importante papel durante a fase de elongação no processo de transcrição génica. Foi também demonstrado que os níveis de modificação da H3K36me3, e consequentemente os níveis de expressão do gene SETD2, são mais elevados em genes que são constituídos por vários exões, o que sugere que o SETD2 tem um papel preponderante na prevenção da iniciação intragénica (evitando assim a produção de transcritos incorretos). Uma vez que todas estas funções são importantes para que haja uma boa regulação génica, é possível prever que a alteração dos níveis de expressão do SETD2 poderá comprometer importantes processos celulares, levando em última instância ao desenvolvimento de cancros. De facto, em células de pacientes com cancro da mama, foram observados baixos níveis de expressão deste gene e em estudos independentes, foi também constatado que o SETD2 regula a transcrição da proteína p53, descrita atualmente como a proteína mais comummente alterada em tumores humanos. Apesar das últimas décadas de investigação científica se terem gravitado em torno das proteínas e das suas funções, o desenvolvimento de tecnologias de sequenciação de nova geração (NGS) têm levado ao reconhecimento de que, na verdade, apenas uma pequena parte do genoma está efetivamente associado à produção de proteínas. Surpreendentemente, observou-se também que a grande maioria do genoma (apesar de não estar associada à codificação de proteínas) continua a ser transcrito de forma frequente e generalizada, tornando-se evidente que as regiões não-codificantes do genoma (assim designadas por não codificarem proteínas) estão longe de estarem desprovidas de qualquer tipo de função. Na realidade, sabe-se agora, que a grande maioria delas produz moléculas que estão associadas a mecanismos de regulação génica e que orquestram tudo o que é produzido dentro das células. Dentro do conjunto de genes não-codificantes encontram-se os genes que produzem lincRNAs (long intergenic noncoding RNAs), que são longos transcritos de RNA funcionais que se encontram localizados entre genes que codificam proteínas. Uma vez que os lincRNAs desempenham importantes funções de regulação celular têm sido, ultimamente, alvo de vários estudos que têm demonstrado que em diversas doenças, como alguns tipos de cancro, existem profundas alterações na produção destes transcritos. Uma vez que o CCR de células claras é conhecido por ser particularmente resistente à radioterapia ou à quimioterapia, a terapia génica direcionada apresenta-se como uma boa alternativa de tratamento para os seus doentes. No entanto, apesar da quantidade de estudos moleculares realizados em CCR de células claras ainda não é possível compreender totalmente este subtipo de carcinoma renal. É portanto necessária uma melhor caracterização molecular deste carcinoma, a fim de se poderem encontrar os genes-alvo na realização de uma terapia génica direcionada. Deste modo, com o intuito de explorar de que forma é que o perfil de expressão dos genes (tanto codificadores de proteínas, como lincRNAs) é influenciado pelo SETD2 em células com este subtipo de CCR, decidiu-se fazer uma análise de expressão diferencial, quantificando e comparando os níveis de expressão génica entre linhas celulares com o SETD2 expresso a níveis normais e linhas celulares com o SETD2 mutado. Para tal, e uma vez que se pretendia fazer uma análise integral do genoma, foi necessário obter um catálogo de anotação de lincRNAs humanos que fosse o mais completo possível. Como o importante papel de regulação desempenhado pelos lincRNAs por todo o genoma tem feito com que sejam associados ao desenvolvimento de certas doenças, e por isso, que estejam a ser alvo de intensos e meticulosos estudos, algumas das bases de dados começaram a catalogá-los o que levou a que, rapidamente emergissem inúmeras bases de dados publicamente acessíveis e exclusivamente dedicadas à anotação de genes não-codificantes. As bases de dados oferecem uma excelente ferramenta na investigação científica, contudo, como não são criadas com os mesmos propósitos nem têm a mesma anotação, também se podem tornar num grande obstáculo à obtenção de conhecimento. Assim, procurou-se as maiores e mais especializadas bases de dados de lincRNAs (Ensembl, Genivcode, Vega, Lncipedia, UCSC, Broad Institute, Noncode e dados publicados por Zhipeng e Adelson) e convergiram-se todas numa só, obtendo-se um total de 38 402 lincRNAs. De seguida, para que se pudesse descobrir novos lincRNAs e completar o catálogo obtido anteriormente, o transcriptoma de CCR de células claras foi reconstruído, tendo se descoberto 21 661 potenciais novos lincRNAs. Depois de adicionados ao catálogo de anotação anterior, obteve-se um número surpreendentemente elevado de lincRNAs que é concordante com o que tem sido descrito relativamente à porção do genoma que não codifica proteínas. A análise diferencial entre as amostras cujo SETD2 tem uma expressão normal versus as que têm uma mutação do SETD2 permitiu a identificação de 505 genes diferencialmente expressos, entre os quais 292 genes codificadores de proteínas e 213 lincRNAs. Durante esta análise, foi possível observar que a sub-expressão de lincRNAs nas linhas celulares com o SETD2 mutado foi incrivelmente elevada, quando comparada com a sub-expressão de genes codificadores de proteínas, sugerindo que a desregulação do SETD2 tem um maior impacto no perfil de expressão dos lincRNAs. Apesar de enumeras evidências sugerirem que a maioria dos lincRNAs são funcionais, a verdade é que apenas uma pequena quantidade tem atualmente a sua função anotada. Sabendo que alguns lincRNAs são co-expressos com os genes que codificam proteínas que estão localizados nas suas proximidades, pode-se inferir a função dos primeiros através da função dos últimos. No entanto, alguns lincRNAs podem também influenciar a expressão de genes codificadores de proteínas em regiões cromossómicas bastante distantes da sua própria localização. Assim, com a intenção de obter conjuntos de genes codificadores de proteínas e lincRNAs cujos níveis de expressão estivessem correlacionados entre si, e correlacionados com a expressão de SETD2, mas também com o objetivo de prever possíveis funções para alguns lincRNAs, procedeu-se à construção de uma rede de correlação génica. Esta análise permitiu distinguir três módulos de genes altamente correlacionados entre si, e entre os níveis de expressão do SETD2. De uma forma geral, constatou-se que as funções dos genes pertencentes a um mesmo módulo tendiam a ser bastante semelhantes, tendo-se desta forma feito uma previsão funcional para os lincRNAs que ainda não estão descritos ou caracterizados. No final, este trabalho permitiu dar os primeiros passos na compreensão do perfil de expressão dos lincRNAs no CCR de células claras, para que futuramente se possam encontrar os biomarcadores genéticos que indicam a suscetibilidade de certos indivíduos para desenvolverem este carcinoma, ou ainda para que se encontrem os genes-alvo numa possível terapia génica direcionada. |
|---|