Publicação
Sistema computacional para o estudo da estrutura primária e redesenho de genes
| Resumo: | Um dos maiores avanços científicos do século XX foi o desenvolvimento de tecnologia que permite a sequenciação de genomas em larga escala. Contudo, a informação produzida pela sequenciação não explica por si só a sua estrutura primária, evolução e seu funcionamento. Para esse fim novas áreas como a biologia molecular, a genética e a bioinformática são usadas para estudar as diversas propriedades e funcionamento dos genomas. Com este trabalho estamos particularmente interessados em perceber detalhadamente a descodificação do genoma efectuada no ribossoma e extrair as regras gerais através da análise da estrutura primária do genoma, nomeadamente o contexto de codões e a distribuição dos codões. Estas regras estão pouco estudadas e entendidas, não se sabendo se poderão ser obtidas através de estatística e ferramentas bioinfomáticas. Os métodos tradicionais para estudar a distribuição dos codões no genoma e seu contexto não providenciam as ferramentas necessárias para estudar estas propriedades à escala genómica. As tabelas de contagens com as distribuições de codões, assim como métricas absolutas, estão actualmente disponíveis em bases de dados. Diversas aplicações para caracterizar as sequências genéticas estão também disponíveis. No entanto, outros tipos de abordagens a nível estatístico e outros métodos de visualização de informação estavam claramente em falta. No presente trabalho foram desenvolvidos métodos matemáticos e computacionais para a análise do contexto de codões e também para identificar zonas onde as repetições de codões ocorrem. Novas formas de visualização de informação foram também desenvolvidas para permitir a interpretação da informação obtida. As ferramentas estatísticas inseridas no modelo, como o clustering, análise residual, índices de adaptação dos codões revelaram-se importantes para caracterizar as sequências codificantes de alguns genomas. O objectivo final é que a informação obtida permita identificar as regras gerais que governam o contexto de codões em qualquer genoma. |
|---|---|
| Autores principais: | Pinheiro, Miguel Monsanto |
| Assunto: | Informática Bioinformática Genomas |
| Ano: | 2010 |
| País: | Portugal |
| Tipo de documento: | tese de doutoramento |
| Tipo de acesso: | acesso aberto |
| Instituição associada: | Universidade de Aveiro |
| Idioma: | português |
| Origem: | RIA - Repositório Institucional da Universidade de Aveiro |
| _version_ | 1866172419218079744 |
|---|---|
| author | Pinheiro, Miguel Monsanto |
| author_facet | Pinheiro, Miguel Monsanto |
| author_role | author |
| country_str | PT |
| creators_json_txt | [{\"Person.name\":\"Pinheiro, Miguel Monsanto\"}] |
| datacite.creators.creator.creatorName.fl_str_mv | Pinheiro, Miguel Monsanto |
| datacite.date.Accepted.fl_str_mv | 2010-01-01T00:00:00Z |
| datacite.date.available.fl_str_mv | 2011-04-19T13:54:51Z |
| datacite.date.embargoed.fl_str_mv | 2011-04-19T13:54:51Z |
| datacite.rights.fl_str_mv | http://purl.org/coar/access_right/c_abf2 |
| datacite.subjects.subject.fl_str_mv | Informática Bioinformática Genomas |
| datacite.titles.title.fl_str_mv | Sistema computacional para o estudo da estrutura primária e redesenho de genes |
| dc.creator.none.fl_str_mv | Pinheiro, Miguel Monsanto |
| dc.date.Accepted.fl_str_mv | 2010-01-01T00:00:00Z |
| dc.date.available.fl_str_mv | 2011-04-19T13:54:51Z |
| dc.date.embargoed.fl_str_mv | 2011-04-19T13:54:51Z |
| dc.description.none.fl_str_mv | Sequencing of several genomes. However, the raw data alone produced from these genome sequencing efforts does not explain its primary structure, its evolution or its functioning. In order to do this, molecular biology, genetics and bioinformatics approaches have to be used for genome analysis. We are particularly interested in understanding the general rules that govern accurate decoding by the ribosome and gene evolution through global analysis of genome primary structure features, such as codon context and usage. However, the general rules that govern codon usage and codon context remain largely elusive, raising the question: can those rules be unraveled using genomic scale approaches by combining bioinformatics, statistical and computer visualization tools? Traditional methods, used for codon usage and context analysis, do not provide the tools to carry out detailed gene primary structure analysis at a genomic scale. Codon usage tables, using absolute metric, are available in public databases for any sequenced gene or genome and free-ware software for multivariate analysis of codon and amino acid usage is also readily available, however sophisticated statistical and data visualization tools are clearly missing. We developed a model supported by mathematical and statistical tools for automated analysis of codon context and codon usage and also to find trinucleotide repeats within coding regions on a genomic scale. A sophisticated graphical application system has also been developed to help data visualization and interpretation. The statistical tools incorporated in the system for data clustering, residual analysis and codon adaptation index determination will allow the obtention of global views of the important sequence features. It is expected that the data obtained will allow the identification of general rules that govern codon context and codon usage in any genome. |
| dc.format.none.fl_str_mv | application/pdf |
| dc.identifier.none.fl_str_mv | http://hdl.handle.net/10773/2238 |
| dc.language.none.fl_str_mv | por |
| dc.publisher.none.fl_str_mv | Universidade de Aveiro |
| dc.rights.none.fl_str_mv | http://purl.org/coar/access_right/c_abf2 |
| dc.subject.none.fl_str_mv | Informática Bioinformática Genomas |
| dc.title.fl_str_mv | Sistema computacional para o estudo da estrutura primária e redesenho de genes |
| dc.type.none.fl_str_mv | http://purl.org/coar/resource_type/c_db06 |
| description | Um dos maiores avanços científicos do século XX foi o desenvolvimento de tecnologia que permite a sequenciação de genomas em larga escala. Contudo, a informação produzida pela sequenciação não explica por si só a sua estrutura primária, evolução e seu funcionamento. Para esse fim novas áreas como a biologia molecular, a genética e a bioinformática são usadas para estudar as diversas propriedades e funcionamento dos genomas. Com este trabalho estamos particularmente interessados em perceber detalhadamente a descodificação do genoma efectuada no ribossoma e extrair as regras gerais através da análise da estrutura primária do genoma, nomeadamente o contexto de codões e a distribuição dos codões. Estas regras estão pouco estudadas e entendidas, não se sabendo se poderão ser obtidas através de estatística e ferramentas bioinfomáticas. Os métodos tradicionais para estudar a distribuição dos codões no genoma e seu contexto não providenciam as ferramentas necessárias para estudar estas propriedades à escala genómica. As tabelas de contagens com as distribuições de codões, assim como métricas absolutas, estão actualmente disponíveis em bases de dados. Diversas aplicações para caracterizar as sequências genéticas estão também disponíveis. No entanto, outros tipos de abordagens a nível estatístico e outros métodos de visualização de informação estavam claramente em falta. No presente trabalho foram desenvolvidos métodos matemáticos e computacionais para a análise do contexto de codões e também para identificar zonas onde as repetições de codões ocorrem. Novas formas de visualização de informação foram também desenvolvidas para permitir a interpretação da informação obtida. As ferramentas estatísticas inseridas no modelo, como o clustering, análise residual, índices de adaptação dos codões revelaram-se importantes para caracterizar as sequências codificantes de alguns genomas. O objectivo final é que a informação obtida permita identificar as regras gerais que governam o contexto de codões em qualquer genoma. |
| dirty | 0 |
| eu_rights_str_mv | openAccess |
| format | doctoralThesis |
| id | ria_ef3908b2359ceccf8d4cbb161ae4e6e1 |
| identifier.url.fl_str_mv | http://hdl.handle.net/10773/2238 |
| instacron_str | ua |
| institution | Universidade de Aveiro |
| instname_str | Universidade de Aveiro |
| language | por |
| network_acronym_str | ria |
| network_name_str | RIA - Repositório Institucional da Universidade de Aveiro |
| oai_identifier_str | oai:ria.ua.pt:10773/2238 |
| organization_str_mv | urn:organizationAcronym:ua |
| person_str_mv | Pinheiro, Miguel Monsanto |
| publishDate | 2010 |
| publisher.none.fl_str_mv | Universidade de Aveiro |
| reponame_str | RIA - Repositório Institucional da Universidade de Aveiro |
| repository_id_str | urn:repositoryAcronym:ria |
| service_str_mv | urn:repositoryAcronym:ria |
| spelling | porUm dos maiores avanços científicos do século XX foi o desenvolvimento de tecnologia que permite a sequenciação de genomas em larga escala. Contudo, a informação produzida pela sequenciação não explica por si só a sua estrutura primária, evolução e seu funcionamento. Para esse fim novas áreas como a biologia molecular, a genética e a bioinformática são usadas para estudar as diversas propriedades e funcionamento dos genomas. Com este trabalho estamos particularmente interessados em perceber detalhadamente a descodificação do genoma efectuada no ribossoma e extrair as regras gerais através da análise da estrutura primária do genoma, nomeadamente o contexto de codões e a distribuição dos codões. Estas regras estão pouco estudadas e entendidas, não se sabendo se poderão ser obtidas através de estatística e ferramentas bioinfomáticas. Os métodos tradicionais para estudar a distribuição dos codões no genoma e seu contexto não providenciam as ferramentas necessárias para estudar estas propriedades à escala genómica. As tabelas de contagens com as distribuições de codões, assim como métricas absolutas, estão actualmente disponíveis em bases de dados. Diversas aplicações para caracterizar as sequências genéticas estão também disponíveis. No entanto, outros tipos de abordagens a nível estatístico e outros métodos de visualização de informação estavam claramente em falta. No presente trabalho foram desenvolvidos métodos matemáticos e computacionais para a análise do contexto de codões e também para identificar zonas onde as repetições de codões ocorrem. Novas formas de visualização de informação foram também desenvolvidas para permitir a interpretação da informação obtida. As ferramentas estatísticas inseridas no modelo, como o clustering, análise residual, índices de adaptação dos codões revelaram-se importantes para caracterizar as sequências codificantes de alguns genomas. O objectivo final é que a informação obtida permita identificar as regras gerais que governam o contexto de codões em qualquer genoma.porSequencing of several genomes. However, the raw data alone produced from these genome sequencing efforts does not explain its primary structure, its evolution or its functioning. In order to do this, molecular biology, genetics and bioinformatics approaches have to be used for genome analysis. We are particularly interested in understanding the general rules that govern accurate decoding by the ribosome and gene evolution through global analysis of genome primary structure features, such as codon context and usage. However, the general rules that govern codon usage and codon context remain largely elusive, raising the question: can those rules be unraveled using genomic scale approaches by combining bioinformatics, statistical and computer visualization tools? Traditional methods, used for codon usage and context analysis, do not provide the tools to carry out detailed gene primary structure analysis at a genomic scale. Codon usage tables, using absolute metric, are available in public databases for any sequenced gene or genome and free-ware software for multivariate analysis of codon and amino acid usage is also readily available, however sophisticated statistical and data visualization tools are clearly missing. We developed a model supported by mathematical and statistical tools for automated analysis of codon context and codon usage and also to find trinucleotide repeats within coding regions on a genomic scale. A sophisticated graphical application system has also been developed to help data visualization and interpretation. The statistical tools incorporated in the system for data clustering, residual analysis and codon adaptation index determination will allow the obtention of global views of the important sequence features. It is expected that the data obtained will allow the identification of general rules that govern codon context and codon usage in any genome.application/pdfporUniversidade de AveiroporSistema computacional para o estudo da estrutura primária e redesenho de genesPinheiro, Miguel MonsantoHandlehttp://hdl.handle.net/10773/2238URNTID:1012001452011-04-19T13:54:51Z2010-01-01T00:00:00Z2010http://purl.org/coar/access_right/c_abf2open accessporInformáticaporBioinformáticaporGenomas20746563 byteshttp://purl.org/coar/access_right/c_abf2application/pdffulltexthttps://ria.ua.pt/bitstream/10773/2238/1/2010000716.pdfother research producthttp://purl.org/coar/resource_type/c_db06doctoral thesis |
| spellingShingle | Sistema computacional para o estudo da estrutura primária e redesenho de genes Pinheiro, Miguel Monsanto Informática Bioinformática Genomas |
| status | SINGLETON |
| subject.fl_str_mv | Informática Bioinformática Genomas |
| title | Sistema computacional para o estudo da estrutura primária e redesenho de genes |
| title_full | Sistema computacional para o estudo da estrutura primária e redesenho de genes |
| title_fullStr | Sistema computacional para o estudo da estrutura primária e redesenho de genes |
| title_full_unstemmed | Sistema computacional para o estudo da estrutura primária e redesenho de genes |
| title_short | Sistema computacional para o estudo da estrutura primária e redesenho de genes |
| title_sort | Sistema computacional para o estudo da estrutura primária e redesenho de genes |
| topic | Informática Bioinformática Genomas |
| topic_facet | Informática Bioinformática Genomas |
| url | http://hdl.handle.net/10773/2238 |
| visible | 1 |