Publicação

Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data

Ver documento

Detalhes bibliográficos
Resumo:A sequenciação de nova geração tornou-se, nos últimos anos, a tecnologia de eleição para o estudo do transcriptoma. Esta metodologia permite a sequenciação de pequenos RNAs não codificantes (small-RNA-seq) a serem expressos numa amostra, tendo contribuído para o aumento, a um ritmo nunca antes visto, da descrição de novos microRNAs (miRNAs) nos genomas de várias espécies. Principalmente, permite caracterizar a complexidade existente numa amostra de RNA, o que acabou por revelar a existência de pequenas variações no que toca ao comprimento e/ou à sequência de miRNAs quando comparados ao respectivo miRNA canónico. Os miRNAs que apresentam estas variações são denominados de isomiRs, sendo que as variações podem incluir a adição ou remoção de um ou mais nucleótidos nas extremidades da sequência ou podem resultar de eventos de editing no interior da sequência. Os miRNAs são conhecidos por actuarem como reguladores de expressão génica em várias espécies, sendo considerados essenciais para manter um bom funcionamento de inúmeras vias biológicas. No entanto, estudos recentes sugerem que as variações na sequência dos isomiRs têm como consequência uma alteração nos alvos destes (miRNAs), resultando em alterações ao nível da programação genética da célula. Apesar de vários estudos apontarem para este cenário, o impacto biológico dos isomiRs ainda não é extensivamente conhecido. Várias ferramentas têm sido desenvolvidas para a análise de dados de small-RNA-seq com o intuito de identificar isomiRs, no entanto, a maioria das ferramentas, não permite identificar todos os tipos possíveis de isomiRs. Adicionalmente, muitas das ferramentas disponibilizadas não realizam de um modo automatizado a inferência sobre o impacto da expressão destes isomiRs ao nível funcional, ou seja, estudar o impacto destas sequências ao nível dos pathways e de redes de regulação génica da célula. Por este motivo, o presente projecto teve como finalidade o desenvolvimento de um pipeline que integra a ferramenta IsomiR Window. A ferramenta em questão permite obter a anotação, quantificação e análise funcional de miRNAs/isomiRs provenientes de dados de small-RNA-seq. O pipeline desenvolvido tem a capacidade de receber múltiplos ficheiros de input para um total de duas condições experimentais, permitindo a identificação e quantificação dos diferentes tipos de pequenos RNAs não codificantes presentes em cada dataset. Posteriormente, é capaz de detectar e categorizar todos os tipos de isomiRs: modificações nas extremidades 3’ e 5’ relativamente ao miRNA canónico, eventos de editing internos, adição de tailings na extremidade 3’ relativamente ao miRNA canónico e possíveis combinações entre os diferentes tipos de isomiRs. Adicionalmente, o pipeline inclui uma etapa de análise de expressão diferencial e análise funcional, fornecendo informação relacionada com os targets de isomiRs específicos e com o seu impacto funcional em diversas vias biológicas. O pipeline integra ainda a funcionalidade de previsão de novos miRNAs. Finalmente, embora não de forma automatizada, é possível adicionar os novos miRNAs previstos à correspondente base de dados das espécies em estudo, permitindo, numa análise subsequente, a identificação de isomiRs derivados de potenciais novos pre-miRNAs. De modo a validar o pipeline desenvolvido, analisaram-se seis datasets que incluíram amostras de indivíduos saudáveis e amostras de indivíduos infectados com hepatite B. Esta análise incluiu a identificação, quantificação, análise de expressão diferencial e por fim, a previsão de alvos para os isomiRs de interesse. Como resultado, identificámos alterações significativas na expressão de alguns isomiRs que não tinham sido anteriormente reportados. Adicionalmente, a análise funcional permitiu identificar genes, que de acordo com a literatura, não têm sido associados a lesões no fígado.
Autores principais:Viegas, Inês Correia
Assunto:miRNA isomiR small-RNA-seq Bioinformática Pipeline Teses de mestrado - 2017
Ano:2017
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Universidade de Lisboa
Idioma:inglês
Origem:Repositório da Universidade de Lisboa

Registos relacionados