Publicação

Sistema computacional para o estudo da estrutura primária e redesenho de genes

Detalhes bibliográficos
Resumo:	Um dos maiores avanços científicos do século XX foi o desenvolvimento de tecnologia que permite a sequenciação de genomas em larga escala. Contudo, a informação produzida pela sequenciação não explica por si só a sua estrutura primária, evolução e seu funcionamento. Para esse fim novas áreas como a biologia molecular, a genética e a bioinformática são usadas para estudar as diversas propriedades e funcionamento dos genomas. Com este trabalho estamos particularmente interessados em perceber detalhadamente a descodificação do genoma efectuada no ribossoma e extrair as regras gerais através da análise da estrutura primária do genoma, nomeadamente o contexto de codões e a distribuição dos codões. Estas regras estão pouco estudadas e entendidas, não se sabendo se poderão ser obtidas através de estatística e ferramentas bioinfomáticas. Os métodos tradicionais para estudar a distribuição dos codões no genoma e seu contexto não providenciam as ferramentas necessárias para estudar estas propriedades à escala genómica. As tabelas de contagens com as distribuições de codões, assim como métricas absolutas, estão actualmente disponíveis em bases de dados. Diversas aplicações para caracterizar as sequências genéticas estão também disponíveis. No entanto, outros tipos de abordagens a nível estatístico e outros métodos de visualização de informação estavam claramente em falta. No presente trabalho foram desenvolvidos métodos matemáticos e computacionais para a análise do contexto de codões e também para identificar zonas onde as repetições de codões ocorrem. Novas formas de visualização de informação foram também desenvolvidas para permitir a interpretação da informação obtida. As ferramentas estatísticas inseridas no modelo, como o clustering, análise residual, índices de adaptação dos codões revelaram-se importantes para caracterizar as sequências codificantes de alguns genomas. O objectivo final é que a informação obtida permita identificar as regras gerais que governam o contexto de codões em qualquer genoma.
Autores principais:	Pinheiro, Miguel Monsanto
Assunto:	Informática Bioinformática Genomas
Ano:	2010
País:	Portugal
Tipo de documento:	tese de doutoramento
Tipo de acesso:	acesso aberto
Instituição associada:	Universidade de Aveiro
Idioma:	português
Origem:	RIA - Repositório Institucional da Universidade de Aveiro

_version_	1866172419218079744
author	Pinheiro, Miguel Monsanto
author_facet	Pinheiro, Miguel Monsanto
author_role	author
country_str	PT
creators_json_txt	[{\"Person.name\":\"Pinheiro, Miguel Monsanto\"}]
datacite.creators.creator.creatorName.fl_str_mv	Pinheiro, Miguel Monsanto
datacite.date.Accepted.fl_str_mv	2010-01-01T00:00:00Z
datacite.date.available.fl_str_mv	2011-04-19T13:54:51Z
datacite.date.embargoed.fl_str_mv	2011-04-19T13:54:51Z
datacite.rights.fl_str_mv	http://purl.org/coar/access_right/c_abf2
datacite.subjects.subject.fl_str_mv	Informática Bioinformática Genomas
datacite.titles.title.fl_str_mv	Sistema computacional para o estudo da estrutura primária e redesenho de genes
dc.creator.none.fl_str_mv	Pinheiro, Miguel Monsanto
dc.date.Accepted.fl_str_mv	2010-01-01T00:00:00Z
dc.date.available.fl_str_mv	2011-04-19T13:54:51Z
dc.date.embargoed.fl_str_mv	2011-04-19T13:54:51Z
dc.description.none.fl_str_mv	Sequencing of several genomes. However, the raw data alone produced from these genome sequencing efforts does not explain its primary structure, its evolution or its functioning. In order to do this, molecular biology, genetics and bioinformatics approaches have to be used for genome analysis. We are particularly interested in understanding the general rules that govern accurate decoding by the ribosome and gene evolution through global analysis of genome primary structure features, such as codon context and usage. However, the general rules that govern codon usage and codon context remain largely elusive, raising the question: can those rules be unraveled using genomic scale approaches by combining bioinformatics, statistical and computer visualization tools? Traditional methods, used for codon usage and context analysis, do not provide the tools to carry out detailed gene primary structure analysis at a genomic scale. Codon usage tables, using absolute metric, are available in public databases for any sequenced gene or genome and free-ware software for multivariate analysis of codon and amino acid usage is also readily available, however sophisticated statistical and data visualization tools are clearly missing. We developed a model supported by mathematical and statistical tools for automated analysis of codon context and codon usage and also to find trinucleotide repeats within coding regions on a genomic scale. A sophisticated graphical application system has also been developed to help data visualization and interpretation. The statistical tools incorporated in the system for data clustering, residual analysis and codon adaptation index determination will allow the obtention of global views of the important sequence features. It is expected that the data obtained will allow the identification of general rules that govern codon context and codon usage in any genome.
dc.format.none.fl_str_mv	application/pdf
dc.identifier.none.fl_str_mv	http://hdl.handle.net/10773/2238
dc.language.none.fl_str_mv	por
dc.publisher.none.fl_str_mv	Universidade de Aveiro
dc.rights.none.fl_str_mv	http://purl.org/coar/access_right/c_abf2
dc.subject.none.fl_str_mv	Informática Bioinformática Genomas
dc.title.fl_str_mv	Sistema computacional para o estudo da estrutura primária e redesenho de genes
dc.type.none.fl_str_mv	http://purl.org/coar/resource_type/c_db06
description	Um dos maiores avanços científicos do século XX foi o desenvolvimento de tecnologia que permite a sequenciação de genomas em larga escala. Contudo, a informação produzida pela sequenciação não explica por si só a sua estrutura primária, evolução e seu funcionamento. Para esse fim novas áreas como a biologia molecular, a genética e a bioinformática são usadas para estudar as diversas propriedades e funcionamento dos genomas. Com este trabalho estamos particularmente interessados em perceber detalhadamente a descodificação do genoma efectuada no ribossoma e extrair as regras gerais através da análise da estrutura primária do genoma, nomeadamente o contexto de codões e a distribuição dos codões. Estas regras estão pouco estudadas e entendidas, não se sabendo se poderão ser obtidas através de estatística e ferramentas bioinfomáticas. Os métodos tradicionais para estudar a distribuição dos codões no genoma e seu contexto não providenciam as ferramentas necessárias para estudar estas propriedades à escala genómica. As tabelas de contagens com as distribuições de codões, assim como métricas absolutas, estão actualmente disponíveis em bases de dados. Diversas aplicações para caracterizar as sequências genéticas estão também disponíveis. No entanto, outros tipos de abordagens a nível estatístico e outros métodos de visualização de informação estavam claramente em falta. No presente trabalho foram desenvolvidos métodos matemáticos e computacionais para a análise do contexto de codões e também para identificar zonas onde as repetições de codões ocorrem. Novas formas de visualização de informação foram também desenvolvidas para permitir a interpretação da informação obtida. As ferramentas estatísticas inseridas no modelo, como o clustering, análise residual, índices de adaptação dos codões revelaram-se importantes para caracterizar as sequências codificantes de alguns genomas. O objectivo final é que a informação obtida permita identificar as regras gerais que governam o contexto de codões em qualquer genoma.
dirty	0
eu_rights_str_mv	openAccess
format	doctoralThesis
id	ria_ef3908b2359ceccf8d4cbb161ae4e6e1
identifier.url.fl_str_mv	http://hdl.handle.net/10773/2238
instacron_str	ua
institution	Universidade de Aveiro
instname_str	Universidade de Aveiro
language	por
network_acronym_str	ria
network_name_str	RIA - Repositório Institucional da Universidade de Aveiro
oai_identifier_str	oai:ria.ua.pt:10773/2238
organization_str_mv	urn:organizationAcronym:ua
person_str_mv	Pinheiro, Miguel Monsanto
publishDate	2010
publisher.none.fl_str_mv	Universidade de Aveiro
reponame_str	RIA - Repositório Institucional da Universidade de Aveiro
repository_id_str	urn:repositoryAcronym:ria
service_str_mv	urn:repositoryAcronym:ria
spelling	porUm dos maiores avanços científicos do século XX foi o desenvolvimento de tecnologia que permite a sequenciação de genomas em larga escala. Contudo, a informação produzida pela sequenciação não explica por si só a sua estrutura primária, evolução e seu funcionamento. Para esse fim novas áreas como a biologia molecular, a genética e a bioinformática são usadas para estudar as diversas propriedades e funcionamento dos genomas. Com este trabalho estamos particularmente interessados em perceber detalhadamente a descodificação do genoma efectuada no ribossoma e extrair as regras gerais através da análise da estrutura primária do genoma, nomeadamente o contexto de codões e a distribuição dos codões. Estas regras estão pouco estudadas e entendidas, não se sabendo se poderão ser obtidas através de estatística e ferramentas bioinfomáticas. Os métodos tradicionais para estudar a distribuição dos codões no genoma e seu contexto não providenciam as ferramentas necessárias para estudar estas propriedades à escala genómica. As tabelas de contagens com as distribuições de codões, assim como métricas absolutas, estão actualmente disponíveis em bases de dados. Diversas aplicações para caracterizar as sequências genéticas estão também disponíveis. No entanto, outros tipos de abordagens a nível estatístico e outros métodos de visualização de informação estavam claramente em falta. No presente trabalho foram desenvolvidos métodos matemáticos e computacionais para a análise do contexto de codões e também para identificar zonas onde as repetições de codões ocorrem. Novas formas de visualização de informação foram também desenvolvidas para permitir a interpretação da informação obtida. As ferramentas estatísticas inseridas no modelo, como o clustering, análise residual, índices de adaptação dos codões revelaram-se importantes para caracterizar as sequências codificantes de alguns genomas. O objectivo final é que a informação obtida permita identificar as regras gerais que governam o contexto de codões em qualquer genoma.porSequencing of several genomes. However, the raw data alone produced from these genome sequencing efforts does not explain its primary structure, its evolution or its functioning. In order to do this, molecular biology, genetics and bioinformatics approaches have to be used for genome analysis. We are particularly interested in understanding the general rules that govern accurate decoding by the ribosome and gene evolution through global analysis of genome primary structure features, such as codon context and usage. However, the general rules that govern codon usage and codon context remain largely elusive, raising the question: can those rules be unraveled using genomic scale approaches by combining bioinformatics, statistical and computer visualization tools? Traditional methods, used for codon usage and context analysis, do not provide the tools to carry out detailed gene primary structure analysis at a genomic scale. Codon usage tables, using absolute metric, are available in public databases for any sequenced gene or genome and free-ware software for multivariate analysis of codon and amino acid usage is also readily available, however sophisticated statistical and data visualization tools are clearly missing. We developed a model supported by mathematical and statistical tools for automated analysis of codon context and codon usage and also to find trinucleotide repeats within coding regions on a genomic scale. A sophisticated graphical application system has also been developed to help data visualization and interpretation. The statistical tools incorporated in the system for data clustering, residual analysis and codon adaptation index determination will allow the obtention of global views of the important sequence features. It is expected that the data obtained will allow the identification of general rules that govern codon context and codon usage in any genome.application/pdfporUniversidade de AveiroporSistema computacional para o estudo da estrutura primária e redesenho de genesPinheiro, Miguel MonsantoHandlehttp://hdl.handle.net/10773/2238URNTID:1012001452011-04-19T13:54:51Z2010-01-01T00:00:00Z2010http://purl.org/coar/access_right/c_abf2open accessporInformáticaporBioinformáticaporGenomas20746563 byteshttp://purl.org/coar/access_right/c_abf2application/pdffulltexthttps://ria.ua.pt/bitstream/10773/2238/1/2010000716.pdfother research producthttp://purl.org/coar/resource_type/c_db06doctoral thesis
spellingShingle	Sistema computacional para o estudo da estrutura primária e redesenho de genes Pinheiro, Miguel Monsanto Informática Bioinformática Genomas
status	SINGLETON
subject.fl_str_mv	Informática Bioinformática Genomas
title	Sistema computacional para o estudo da estrutura primária e redesenho de genes
title_full	Sistema computacional para o estudo da estrutura primária e redesenho de genes
title_fullStr	Sistema computacional para o estudo da estrutura primária e redesenho de genes
title_full_unstemmed	Sistema computacional para o estudo da estrutura primária e redesenho de genes
title_short	Sistema computacional para o estudo da estrutura primária e redesenho de genes
title_sort	Sistema computacional para o estudo da estrutura primária e redesenho de genes
topic	Informática Bioinformática Genomas
topic_facet	Informática Bioinformática Genomas
url	http://hdl.handle.net/10773/2238
visible	1

Publicação

Sistema computacional para o estudo da estrutura primária e redesenho de genes

Registos relacionados