Publicação

Sistema computacional para o estudo da estrutura primária e redesenho de genes

Ver documento

Detalhes bibliográficos
Resumo:Um dos maiores avanços científicos do século XX foi o desenvolvimento de tecnologia que permite a sequenciação de genomas em larga escala. Contudo, a informação produzida pela sequenciação não explica por si só a sua estrutura primária, evolução e seu funcionamento. Para esse fim novas áreas como a biologia molecular, a genética e a bioinformática são usadas para estudar as diversas propriedades e funcionamento dos genomas. Com este trabalho estamos particularmente interessados em perceber detalhadamente a descodificação do genoma efectuada no ribossoma e extrair as regras gerais através da análise da estrutura primária do genoma, nomeadamente o contexto de codões e a distribuição dos codões. Estas regras estão pouco estudadas e entendidas, não se sabendo se poderão ser obtidas através de estatística e ferramentas bioinfomáticas. Os métodos tradicionais para estudar a distribuição dos codões no genoma e seu contexto não providenciam as ferramentas necessárias para estudar estas propriedades à escala genómica. As tabelas de contagens com as distribuições de codões, assim como métricas absolutas, estão actualmente disponíveis em bases de dados. Diversas aplicações para caracterizar as sequências genéticas estão também disponíveis. No entanto, outros tipos de abordagens a nível estatístico e outros métodos de visualização de informação estavam claramente em falta. No presente trabalho foram desenvolvidos métodos matemáticos e computacionais para a análise do contexto de codões e também para identificar zonas onde as repetições de codões ocorrem. Novas formas de visualização de informação foram também desenvolvidas para permitir a interpretação da informação obtida. As ferramentas estatísticas inseridas no modelo, como o clustering, análise residual, índices de adaptação dos codões revelaram-se importantes para caracterizar as sequências codificantes de alguns genomas. O objectivo final é que a informação obtida permita identificar as regras gerais que governam o contexto de codões em qualquer genoma.
Autores principais:Pinheiro, Miguel Monsanto
Assunto:Informática Bioinformática Genomas
Ano:2010
País:Portugal
Tipo de documento:tese de doutoramento
Tipo de acesso:acesso aberto
Instituição associada:Universidade de Aveiro
Idioma:português
Origem:RIA - Repositório Institucional da Universidade de Aveiro
_version_ 1866172419218079744
author Pinheiro, Miguel Monsanto
author_facet Pinheiro, Miguel Monsanto
author_role author
country_str PT
creators_json_txt [{\"Person.name\":\"Pinheiro, Miguel Monsanto\"}]
datacite.creators.creator.creatorName.fl_str_mv Pinheiro, Miguel Monsanto
datacite.date.Accepted.fl_str_mv 2010-01-01T00:00:00Z
datacite.date.available.fl_str_mv 2011-04-19T13:54:51Z
datacite.date.embargoed.fl_str_mv 2011-04-19T13:54:51Z
datacite.rights.fl_str_mv http://purl.org/coar/access_right/c_abf2
datacite.subjects.subject.fl_str_mv Informática
Bioinformática
Genomas
datacite.titles.title.fl_str_mv Sistema computacional para o estudo da estrutura primária e redesenho de genes
dc.creator.none.fl_str_mv Pinheiro, Miguel Monsanto
dc.date.Accepted.fl_str_mv 2010-01-01T00:00:00Z
dc.date.available.fl_str_mv 2011-04-19T13:54:51Z
dc.date.embargoed.fl_str_mv 2011-04-19T13:54:51Z
dc.description.none.fl_str_mv Sequencing of several genomes. However, the raw data alone produced from these genome sequencing efforts does not explain its primary structure, its evolution or its functioning. In order to do this, molecular biology, genetics and bioinformatics approaches have to be used for genome analysis. We are particularly interested in understanding the general rules that govern accurate decoding by the ribosome and gene evolution through global analysis of genome primary structure features, such as codon context and usage. However, the general rules that govern codon usage and codon context remain largely elusive, raising the question: can those rules be unraveled using genomic scale approaches by combining bioinformatics, statistical and computer visualization tools? Traditional methods, used for codon usage and context analysis, do not provide the tools to carry out detailed gene primary structure analysis at a genomic scale. Codon usage tables, using absolute metric, are available in public databases for any sequenced gene or genome and free-ware software for multivariate analysis of codon and amino acid usage is also readily available, however sophisticated statistical and data visualization tools are clearly missing. We developed a model supported by mathematical and statistical tools for automated analysis of codon context and codon usage and also to find trinucleotide repeats within coding regions on a genomic scale. A sophisticated graphical application system has also been developed to help data visualization and interpretation. The statistical tools incorporated in the system for data clustering, residual analysis and codon adaptation index determination will allow the obtention of global views of the important sequence features. It is expected that the data obtained will allow the identification of general rules that govern codon context and codon usage in any genome.
dc.format.none.fl_str_mv application/pdf
dc.identifier.none.fl_str_mv http://hdl.handle.net/10773/2238
dc.language.none.fl_str_mv por
dc.publisher.none.fl_str_mv Universidade de Aveiro
dc.rights.none.fl_str_mv http://purl.org/coar/access_right/c_abf2
dc.subject.none.fl_str_mv Informática
Bioinformática
Genomas
dc.title.fl_str_mv Sistema computacional para o estudo da estrutura primária e redesenho de genes
dc.type.none.fl_str_mv http://purl.org/coar/resource_type/c_db06
description Um dos maiores avanços científicos do século XX foi o desenvolvimento de tecnologia que permite a sequenciação de genomas em larga escala. Contudo, a informação produzida pela sequenciação não explica por si só a sua estrutura primária, evolução e seu funcionamento. Para esse fim novas áreas como a biologia molecular, a genética e a bioinformática são usadas para estudar as diversas propriedades e funcionamento dos genomas. Com este trabalho estamos particularmente interessados em perceber detalhadamente a descodificação do genoma efectuada no ribossoma e extrair as regras gerais através da análise da estrutura primária do genoma, nomeadamente o contexto de codões e a distribuição dos codões. Estas regras estão pouco estudadas e entendidas, não se sabendo se poderão ser obtidas através de estatística e ferramentas bioinfomáticas. Os métodos tradicionais para estudar a distribuição dos codões no genoma e seu contexto não providenciam as ferramentas necessárias para estudar estas propriedades à escala genómica. As tabelas de contagens com as distribuições de codões, assim como métricas absolutas, estão actualmente disponíveis em bases de dados. Diversas aplicações para caracterizar as sequências genéticas estão também disponíveis. No entanto, outros tipos de abordagens a nível estatístico e outros métodos de visualização de informação estavam claramente em falta. No presente trabalho foram desenvolvidos métodos matemáticos e computacionais para a análise do contexto de codões e também para identificar zonas onde as repetições de codões ocorrem. Novas formas de visualização de informação foram também desenvolvidas para permitir a interpretação da informação obtida. As ferramentas estatísticas inseridas no modelo, como o clustering, análise residual, índices de adaptação dos codões revelaram-se importantes para caracterizar as sequências codificantes de alguns genomas. O objectivo final é que a informação obtida permita identificar as regras gerais que governam o contexto de codões em qualquer genoma.
dirty 0
eu_rights_str_mv openAccess
format doctoralThesis
id ria_ef3908b2359ceccf8d4cbb161ae4e6e1
identifier.url.fl_str_mv http://hdl.handle.net/10773/2238
instacron_str ua
institution Universidade de Aveiro
instname_str Universidade de Aveiro
language por
network_acronym_str ria
network_name_str RIA - Repositório Institucional da Universidade de Aveiro
oai_identifier_str oai:ria.ua.pt:10773/2238
organization_str_mv urn:organizationAcronym:ua
person_str_mv Pinheiro, Miguel Monsanto
publishDate 2010
publisher.none.fl_str_mv Universidade de Aveiro
reponame_str RIA - Repositório Institucional da Universidade de Aveiro
repository_id_str urn:repositoryAcronym:ria
service_str_mv urn:repositoryAcronym:ria
spelling porUm dos maiores avanços científicos do século XX foi o desenvolvimento de tecnologia que permite a sequenciação de genomas em larga escala. Contudo, a informação produzida pela sequenciação não explica por si só a sua estrutura primária, evolução e seu funcionamento. Para esse fim novas áreas como a biologia molecular, a genética e a bioinformática são usadas para estudar as diversas propriedades e funcionamento dos genomas. Com este trabalho estamos particularmente interessados em perceber detalhadamente a descodificação do genoma efectuada no ribossoma e extrair as regras gerais através da análise da estrutura primária do genoma, nomeadamente o contexto de codões e a distribuição dos codões. Estas regras estão pouco estudadas e entendidas, não se sabendo se poderão ser obtidas através de estatística e ferramentas bioinfomáticas. Os métodos tradicionais para estudar a distribuição dos codões no genoma e seu contexto não providenciam as ferramentas necessárias para estudar estas propriedades à escala genómica. As tabelas de contagens com as distribuições de codões, assim como métricas absolutas, estão actualmente disponíveis em bases de dados. Diversas aplicações para caracterizar as sequências genéticas estão também disponíveis. No entanto, outros tipos de abordagens a nível estatístico e outros métodos de visualização de informação estavam claramente em falta. No presente trabalho foram desenvolvidos métodos matemáticos e computacionais para a análise do contexto de codões e também para identificar zonas onde as repetições de codões ocorrem. Novas formas de visualização de informação foram também desenvolvidas para permitir a interpretação da informação obtida. As ferramentas estatísticas inseridas no modelo, como o clustering, análise residual, índices de adaptação dos codões revelaram-se importantes para caracterizar as sequências codificantes de alguns genomas. O objectivo final é que a informação obtida permita identificar as regras gerais que governam o contexto de codões em qualquer genoma.porSequencing of several genomes. However, the raw data alone produced from these genome sequencing efforts does not explain its primary structure, its evolution or its functioning. In order to do this, molecular biology, genetics and bioinformatics approaches have to be used for genome analysis. We are particularly interested in understanding the general rules that govern accurate decoding by the ribosome and gene evolution through global analysis of genome primary structure features, such as codon context and usage. However, the general rules that govern codon usage and codon context remain largely elusive, raising the question: can those rules be unraveled using genomic scale approaches by combining bioinformatics, statistical and computer visualization tools? Traditional methods, used for codon usage and context analysis, do not provide the tools to carry out detailed gene primary structure analysis at a genomic scale. Codon usage tables, using absolute metric, are available in public databases for any sequenced gene or genome and free-ware software for multivariate analysis of codon and amino acid usage is also readily available, however sophisticated statistical and data visualization tools are clearly missing. We developed a model supported by mathematical and statistical tools for automated analysis of codon context and codon usage and also to find trinucleotide repeats within coding regions on a genomic scale. A sophisticated graphical application system has also been developed to help data visualization and interpretation. The statistical tools incorporated in the system for data clustering, residual analysis and codon adaptation index determination will allow the obtention of global views of the important sequence features. It is expected that the data obtained will allow the identification of general rules that govern codon context and codon usage in any genome.application/pdfporUniversidade de AveiroporSistema computacional para o estudo da estrutura primária e redesenho de genesPinheiro, Miguel MonsantoHandlehttp://hdl.handle.net/10773/2238URNTID:1012001452011-04-19T13:54:51Z2010-01-01T00:00:00Z2010http://purl.org/coar/access_right/c_abf2open accessporInformáticaporBioinformáticaporGenomas20746563 byteshttp://purl.org/coar/access_right/c_abf2application/pdffulltexthttps://ria.ua.pt/bitstream/10773/2238/1/2010000716.pdfother research producthttp://purl.org/coar/resource_type/c_db06doctoral thesis
spellingShingle Sistema computacional para o estudo da estrutura primária e redesenho de genes
Pinheiro, Miguel Monsanto
Informática
Bioinformática
Genomas
status SINGLETON
subject.fl_str_mv Informática
Bioinformática
Genomas
title Sistema computacional para o estudo da estrutura primária e redesenho de genes
title_full Sistema computacional para o estudo da estrutura primária e redesenho de genes
title_fullStr Sistema computacional para o estudo da estrutura primária e redesenho de genes
title_full_unstemmed Sistema computacional para o estudo da estrutura primária e redesenho de genes
title_short Sistema computacional para o estudo da estrutura primária e redesenho de genes
title_sort Sistema computacional para o estudo da estrutura primária e redesenho de genes
topic Informática
Bioinformática
Genomas
topic_facet Informática
Bioinformática
Genomas
url http://hdl.handle.net/10773/2238
visible 1