Publicação

Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data

Ver documento

Detalhes bibliográficos
Resumo:A sequenciação de nova geração tornou-se, nos últimos anos, a tecnologia de eleição para o estudo do transcriptoma. Esta metodologia permite a sequenciação de pequenos RNAs não codificantes (small-RNA-seq) a serem expressos numa amostra, tendo contribuído para o aumento, a um ritmo nunca antes visto, da descrição de novos microRNAs (miRNAs) nos genomas de várias espécies. Principalmente, permite caracterizar a complexidade existente numa amostra de RNA, o que acabou por revelar a existência de pequenas variações no que toca ao comprimento e/ou à sequência de miRNAs quando comparados ao respectivo miRNA canónico. Os miRNAs que apresentam estas variações são denominados de isomiRs, sendo que as variações podem incluir a adição ou remoção de um ou mais nucleótidos nas extremidades da sequência ou podem resultar de eventos de editing no interior da sequência. Os miRNAs são conhecidos por actuarem como reguladores de expressão génica em várias espécies, sendo considerados essenciais para manter um bom funcionamento de inúmeras vias biológicas. No entanto, estudos recentes sugerem que as variações na sequência dos isomiRs têm como consequência uma alteração nos alvos destes (miRNAs), resultando em alterações ao nível da programação genética da célula. Apesar de vários estudos apontarem para este cenário, o impacto biológico dos isomiRs ainda não é extensivamente conhecido. Várias ferramentas têm sido desenvolvidas para a análise de dados de small-RNA-seq com o intuito de identificar isomiRs, no entanto, a maioria das ferramentas, não permite identificar todos os tipos possíveis de isomiRs. Adicionalmente, muitas das ferramentas disponibilizadas não realizam de um modo automatizado a inferência sobre o impacto da expressão destes isomiRs ao nível funcional, ou seja, estudar o impacto destas sequências ao nível dos pathways e de redes de regulação génica da célula. Por este motivo, o presente projecto teve como finalidade o desenvolvimento de um pipeline que integra a ferramenta IsomiR Window. A ferramenta em questão permite obter a anotação, quantificação e análise funcional de miRNAs/isomiRs provenientes de dados de small-RNA-seq. O pipeline desenvolvido tem a capacidade de receber múltiplos ficheiros de input para um total de duas condições experimentais, permitindo a identificação e quantificação dos diferentes tipos de pequenos RNAs não codificantes presentes em cada dataset. Posteriormente, é capaz de detectar e categorizar todos os tipos de isomiRs: modificações nas extremidades 3’ e 5’ relativamente ao miRNA canónico, eventos de editing internos, adição de tailings na extremidade 3’ relativamente ao miRNA canónico e possíveis combinações entre os diferentes tipos de isomiRs. Adicionalmente, o pipeline inclui uma etapa de análise de expressão diferencial e análise funcional, fornecendo informação relacionada com os targets de isomiRs específicos e com o seu impacto funcional em diversas vias biológicas. O pipeline integra ainda a funcionalidade de previsão de novos miRNAs. Finalmente, embora não de forma automatizada, é possível adicionar os novos miRNAs previstos à correspondente base de dados das espécies em estudo, permitindo, numa análise subsequente, a identificação de isomiRs derivados de potenciais novos pre-miRNAs. De modo a validar o pipeline desenvolvido, analisaram-se seis datasets que incluíram amostras de indivíduos saudáveis e amostras de indivíduos infectados com hepatite B. Esta análise incluiu a identificação, quantificação, análise de expressão diferencial e por fim, a previsão de alvos para os isomiRs de interesse. Como resultado, identificámos alterações significativas na expressão de alguns isomiRs que não tinham sido anteriormente reportados. Adicionalmente, a análise funcional permitiu identificar genes, que de acordo com a literatura, não têm sido associados a lesões no fígado.
Autores principais:Viegas, Inês Correia
Assunto:miRNA isomiR small-RNA-seq Bioinformática Pipeline Teses de mestrado - 2017
Ano:2017
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Universidade de Lisboa
Idioma:inglês
Origem:Repositório da Universidade de Lisboa
_version_ 1865920771909484544
author Viegas, Inês Correia
author_facet Viegas, Inês Correia
Viegas, Inês Correia
author_role author
contributor_name_str_mv Fonseca, Andreia de Jesus Amaral Gomes Barbosa
Carmo, Maria Beatriz Duarte Pereira do,1960-
Repositório Científico de Acesso Aberto da ULisboa
country_str PT
creators_json_str [{\"Person.name\":\"Viegas, Inês Correia\"}]
datacite.contributors.contributor.contributorName.fl_str_mv Fonseca, Andreia de Jesus Amaral Gomes Barbosa
Carmo, Maria Beatriz Duarte Pereira do,1960-
Repositório Científico de Acesso Aberto da ULisboa
datacite.creators.creator.creatorName.fl_str_mv Viegas, Inês Correia
datacite.date.Accepted.fl_str_mv 2017-01-01T00:00:00Z
datacite.date.available.fl_str_mv 2018-04-05T14:48:36Z
datacite.date.embargoed.fl_str_mv 2018-04-05T14:48:36Z
datacite.rights.fl_str_mv http://purl.org/coar/access_right/c_abf2
datacite.subjects.subject.fl_str_mv miRNA
isomiR
small-RNA-seq
Bioinformática
Pipeline
Teses de mestrado - 2017
datacite.titles.title.fl_str_mv Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
dc.contributor.none.fl_str_mv Fonseca, Andreia de Jesus Amaral Gomes Barbosa
Carmo, Maria Beatriz Duarte Pereira do,1960-
Repositório Científico de Acesso Aberto da ULisboa
dc.creator.none.fl_str_mv Viegas, Inês Correia
dc.date.Accepted.fl_str_mv 2017-01-01T00:00:00Z
dc.date.available.fl_str_mv 2018-04-05T14:48:36Z
dc.date.embargoed.fl_str_mv 2018-04-05T14:48:36Z
dc.format.none.fl_str_mv application/pdf
dc.identifier.none.fl_str_mv http://hdl.handle.net/10451/32636
dc.language.none.fl_str_mv eng
dc.rights.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.subject.none.fl_str_mv miRNA
isomiR
small-RNA-seq
Bioinformática
Pipeline
Teses de mestrado - 2017
dc.title.fl_str_mv Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
dc.type.none.fl_str_mv http://purl.org/coar/resource_type/c_bdcc
description A sequenciação de nova geração tornou-se, nos últimos anos, a tecnologia de eleição para o estudo do transcriptoma. Esta metodologia permite a sequenciação de pequenos RNAs não codificantes (small-RNA-seq) a serem expressos numa amostra, tendo contribuído para o aumento, a um ritmo nunca antes visto, da descrição de novos microRNAs (miRNAs) nos genomas de várias espécies. Principalmente, permite caracterizar a complexidade existente numa amostra de RNA, o que acabou por revelar a existência de pequenas variações no que toca ao comprimento e/ou à sequência de miRNAs quando comparados ao respectivo miRNA canónico. Os miRNAs que apresentam estas variações são denominados de isomiRs, sendo que as variações podem incluir a adição ou remoção de um ou mais nucleótidos nas extremidades da sequência ou podem resultar de eventos de editing no interior da sequência. Os miRNAs são conhecidos por actuarem como reguladores de expressão génica em várias espécies, sendo considerados essenciais para manter um bom funcionamento de inúmeras vias biológicas. No entanto, estudos recentes sugerem que as variações na sequência dos isomiRs têm como consequência uma alteração nos alvos destes (miRNAs), resultando em alterações ao nível da programação genética da célula. Apesar de vários estudos apontarem para este cenário, o impacto biológico dos isomiRs ainda não é extensivamente conhecido. Várias ferramentas têm sido desenvolvidas para a análise de dados de small-RNA-seq com o intuito de identificar isomiRs, no entanto, a maioria das ferramentas, não permite identificar todos os tipos possíveis de isomiRs. Adicionalmente, muitas das ferramentas disponibilizadas não realizam de um modo automatizado a inferência sobre o impacto da expressão destes isomiRs ao nível funcional, ou seja, estudar o impacto destas sequências ao nível dos pathways e de redes de regulação génica da célula. Por este motivo, o presente projecto teve como finalidade o desenvolvimento de um pipeline que integra a ferramenta IsomiR Window. A ferramenta em questão permite obter a anotação, quantificação e análise funcional de miRNAs/isomiRs provenientes de dados de small-RNA-seq. O pipeline desenvolvido tem a capacidade de receber múltiplos ficheiros de input para um total de duas condições experimentais, permitindo a identificação e quantificação dos diferentes tipos de pequenos RNAs não codificantes presentes em cada dataset. Posteriormente, é capaz de detectar e categorizar todos os tipos de isomiRs: modificações nas extremidades 3’ e 5’ relativamente ao miRNA canónico, eventos de editing internos, adição de tailings na extremidade 3’ relativamente ao miRNA canónico e possíveis combinações entre os diferentes tipos de isomiRs. Adicionalmente, o pipeline inclui uma etapa de análise de expressão diferencial e análise funcional, fornecendo informação relacionada com os targets de isomiRs específicos e com o seu impacto funcional em diversas vias biológicas. O pipeline integra ainda a funcionalidade de previsão de novos miRNAs. Finalmente, embora não de forma automatizada, é possível adicionar os novos miRNAs previstos à correspondente base de dados das espécies em estudo, permitindo, numa análise subsequente, a identificação de isomiRs derivados de potenciais novos pre-miRNAs. De modo a validar o pipeline desenvolvido, analisaram-se seis datasets que incluíram amostras de indivíduos saudáveis e amostras de indivíduos infectados com hepatite B. Esta análise incluiu a identificação, quantificação, análise de expressão diferencial e por fim, a previsão de alvos para os isomiRs de interesse. Como resultado, identificámos alterações significativas na expressão de alguns isomiRs que não tinham sido anteriormente reportados. Adicionalmente, a análise funcional permitiu identificar genes, que de acordo com a literatura, não têm sido associados a lesões no fígado.
dirty 0
eu_rights_str_mv openAccess
format masterThesis
fulltext.url.fl_str_mv https://repositorio.ulisboa.pt/bitstreams/5d457626-701f-4953-9f41-428cc946d98f/download
id ul_1066ea0d68cd6cd4397c91a18c7af7f9
identifier.url.fl_str_mv http://hdl.handle.net/10451/32636
instacron_str ul
institution Universidade de Lisboa
instname_str Universidade de Lisboa
language eng
network_acronym_str ul
network_name_str Repositório da Universidade de Lisboa
oai_identifier_str oai:repositorio.ulisboa.pt:10451/32636
organization_str_mv urn:organizationAcronym:ul
person_str_mv Viegas, Inês Correia
publishDate 2017
reponame_str Repositório da Universidade de Lisboa
repository_id_str urn:repositoryAcronym:ul
service_str_mv urn:repositoryAcronym:ul
spelling engpt_PTA sequenciação de nova geração tornou-se, nos últimos anos, a tecnologia de eleição para o estudo do transcriptoma. Esta metodologia permite a sequenciação de pequenos RNAs não codificantes (small-RNA-seq) a serem expressos numa amostra, tendo contribuído para o aumento, a um ritmo nunca antes visto, da descrição de novos microRNAs (miRNAs) nos genomas de várias espécies. Principalmente, permite caracterizar a complexidade existente numa amostra de RNA, o que acabou por revelar a existência de pequenas variações no que toca ao comprimento e/ou à sequência de miRNAs quando comparados ao respectivo miRNA canónico. Os miRNAs que apresentam estas variações são denominados de isomiRs, sendo que as variações podem incluir a adição ou remoção de um ou mais nucleótidos nas extremidades da sequência ou podem resultar de eventos de editing no interior da sequência. Os miRNAs são conhecidos por actuarem como reguladores de expressão génica em várias espécies, sendo considerados essenciais para manter um bom funcionamento de inúmeras vias biológicas. No entanto, estudos recentes sugerem que as variações na sequência dos isomiRs têm como consequência uma alteração nos alvos destes (miRNAs), resultando em alterações ao nível da programação genética da célula. Apesar de vários estudos apontarem para este cenário, o impacto biológico dos isomiRs ainda não é extensivamente conhecido. Várias ferramentas têm sido desenvolvidas para a análise de dados de small-RNA-seq com o intuito de identificar isomiRs, no entanto, a maioria das ferramentas, não permite identificar todos os tipos possíveis de isomiRs. Adicionalmente, muitas das ferramentas disponibilizadas não realizam de um modo automatizado a inferência sobre o impacto da expressão destes isomiRs ao nível funcional, ou seja, estudar o impacto destas sequências ao nível dos pathways e de redes de regulação génica da célula. Por este motivo, o presente projecto teve como finalidade o desenvolvimento de um pipeline que integra a ferramenta IsomiR Window. A ferramenta em questão permite obter a anotação, quantificação e análise funcional de miRNAs/isomiRs provenientes de dados de small-RNA-seq. O pipeline desenvolvido tem a capacidade de receber múltiplos ficheiros de input para um total de duas condições experimentais, permitindo a identificação e quantificação dos diferentes tipos de pequenos RNAs não codificantes presentes em cada dataset. Posteriormente, é capaz de detectar e categorizar todos os tipos de isomiRs: modificações nas extremidades 3’ e 5’ relativamente ao miRNA canónico, eventos de editing internos, adição de tailings na extremidade 3’ relativamente ao miRNA canónico e possíveis combinações entre os diferentes tipos de isomiRs. Adicionalmente, o pipeline inclui uma etapa de análise de expressão diferencial e análise funcional, fornecendo informação relacionada com os targets de isomiRs específicos e com o seu impacto funcional em diversas vias biológicas. O pipeline integra ainda a funcionalidade de previsão de novos miRNAs. Finalmente, embora não de forma automatizada, é possível adicionar os novos miRNAs previstos à correspondente base de dados das espécies em estudo, permitindo, numa análise subsequente, a identificação de isomiRs derivados de potenciais novos pre-miRNAs. De modo a validar o pipeline desenvolvido, analisaram-se seis datasets que incluíram amostras de indivíduos saudáveis e amostras de indivíduos infectados com hepatite B. Esta análise incluiu a identificação, quantificação, análise de expressão diferencial e por fim, a previsão de alvos para os isomiRs de interesse. Como resultado, identificámos alterações significativas na expressão de alguns isomiRs que não tinham sido anteriormente reportados. Adicionalmente, a análise funcional permitiu identificar genes, que de acordo com a literatura, não têm sido associados a lesões no fígado.application/pdfpt_PTIdentifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq dataViegas, Inês CorreiaFonseca, Andreia de Jesus Amaral Gomes BarbosaCarmo, Maria Beatriz Duarte Pereira do,1960-HostingInstitutionOrganizationalRepositório Científico de Acesso Aberto da ULisboae-mailmailto:repositorio@reitoria.ulisboa.ptrepositorio@reitoria.ulisboa.ptURNurn:tid:2019109932018-04-05T14:48:36Z201720172017-01-01T00:00:00ZHandlehttp://hdl.handle.net/10451/32636http://purl.org/coar/access_right/c_abf2open accessmiRNAisomiRsmall-RNA-seqBioinformáticaPipelineTeses de mestrado - 20171876598 bytesliteraturehttp://purl.org/coar/resource_type/c_bdccmaster thesishttp://purl.org/coar/access_right/c_abf2application/pdffulltexthttps://repositorio.ulisboa.pt/bitstreams/5d457626-701f-4953-9f41-428cc946d98f/download
spellingShingle Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
Viegas, Inês Correia
miRNA
isomiR
small-RNA-seq
Bioinformática
Pipeline
Teses de mestrado - 2017
Viegas, Inês Correia
miRNA
isomiR
small-RNA-seq
Bioinformática
Pipeline
Teses de mestrado - 2017
status SINGLETON
subject.fl_str_mv miRNA
isomiR
small-RNA-seq
Bioinformática
Pipeline
Teses de mestrado - 2017
title Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
title_full Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
title_fullStr Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
title_full_unstemmed Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
title_short Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
title_sort Identifying the sequence complexity of miRNAs and their functional impact in small-RNA-seq data
topic miRNA
isomiR
small-RNA-seq
Bioinformática
Pipeline
Teses de mestrado - 2017
topic_facet miRNA
isomiR
small-RNA-seq
Bioinformática
Pipeline
Teses de mestrado - 2017
url http://hdl.handle.net/10451/32636
visible 1