Document details

Classificação de genes em hibridação genómica comparativa de estirpes de Streptococcus pneumoniae

Author(s): Cardoso, Liliana Sofia Mendonça

Date: 2009

Persistent ID: http://hdl.handle.net/10451/4128

Origin: Repositório da Universidade de Lisboa

Subject(s): Microarray; Hibridação genómica; Algoritmo EM; Classificador bayesiano; Streptococcus pneumoniae; Teses de mestrado - 2009


Description

O Streptococcus pneumoniae é uma espécie bacteriana responsável por várias infecções no Homem e possui no seu conteúdo genómico uma vasta diversidade. De entre as suas diversas linhagens genéticas é possível identificar aquelas que estão associadas a uma maior virulência através da presença ou ausência de genes específicos. A hibridação genómica comparativa em microarrays é uma tecnologia que examina a semelhança genómica entre organismos e permite a busca em larga escala de genes determinantes da virulência bacteriana. A comparação genómica entre estirpes de Streptococcus pneumoniae com genoma sequenciado (amostra de controlo) e estirpes com genoma ainda não sequenciado (amostra de teste) permite detectar os genes que são comuns às duas amostras (genes presentes na amostra de teste) e aqueles que são específicos à amostra de controlo (genes ausentes da amostra de teste). Nesta dissertação foram usados o algoritmo EM e o classificador bayesiano (ambos baseados em modelos de mistura) com o objectivo de se encontrar uma metodologia que, atrav´es desta comparação, permita classificar os genes em presentes ou ausentes na amostra de teste. Bons resultados foram alcançados com o uso do classificador bayesiano após pré-classificação obtida pelo algoritmo EM, usando como dados o rácio entre as intensidades da amostra de controlo e de teste, sem transformação logarítmica nem normalização. Corrigindo o rácio das intensidades de acordo com o número de estirpes de controlo identificado por cada spot, os resultados anteriores foram ainda melhorados.

Streptococcus pneumoniae is a bacterial microorganism accountable for many types of human infections with highly diverse genomic content. Among its several genetic lineages it is possible to identify a few which are associated with increased virulence due to the presence (or absence) of specific genes. Comparative genomic hybridization using microarrays is a technology used to examine genomic similarity among organisms and allows for a high throughput search for the genes responsible for bacterial virulence. Genomic comparison between sequenced strains (the reference sample) and unsequenced strains (the test sample) of Streptococcus pneumoniae allows the detection of genes which are common to both strains (genes that are present in the test sample) and genes which are specific to the reference sample (genes that are absent from the test sample). In this thesis we used the EM algorithm and a Bayesian classifier (both based on mixture models) with the purpose of finding an optimal strategy to classify genes as present (or absent) in the test sample. Good results were obtained with the Bayesian classifier (following a previous classification by the EM algorithm), using as data the ratio of reference strain intensities compared to test strain intensities without logarithmic transformation or normalization. By correcting the intensities ratio accordingly with the number of reference strains identified by each spot, we can improve the previous results.

Tese de mestrado, Bioestatística, Universidade de Lisboa, Faculdade de Ciências, 2009

Document Type Master thesis
Language Portuguese
Advisor(s) Antunes, Marília Cristina de Sousa, 1969-; Pinto, Francisco Rodrigues
Contributor(s) Cardoso, Liliana Sofia Mendonça
facebook logo  linkedin logo  twitter logo 
mendeley logo

Related documents

No related documents