Publicação

Compound matching of biomedical ontologies

Ver documento

Detalhes bibliográficos
Resumo:As ontologias biomédicas são particularmente bem sucedidas na uniformização do domínio das ciências da vida. Devido à sua recente expansão, a integração de todo o conhecimento que contêm tornou-se uma tarefa extenuante. Desta forma, foram desenvolvidos sistemas de alinhamento de ontologias para lidar com o problema, que alinham uma ontologia com outra e encontram classes que correspondem entre as duas. Contudo, novos desafios para estes sistemas estão a começar a aparecer, já que existem ontologias biomédicas que contêm relações complexas e os sistemas têm dificuldade em encontrá-las. Produzir alinhamentos compostos, ou seja, que alinham mais de duas ontologias simultaneamente, pode ser útil para o desenvolvimento de uma próxima geração de tecnologias semânticas. Desta forma, esta dissertação avança o campo de alinhamento de ontologias biomédicas com o desenvolvimento de novos algoritmos que produzem correspondências compostas entre três ontologias diferentes, uma fonte e dois alvos. O algoritmo é baseado em dois passos de comparação léxica. Num primeiro é feito o alinhamento parcial da ontologia fonte com um primeiro alvo, e no segundo apenas as palavras não mapeadas das classes fonte alinhadas são comparadas com as palavras das classes do segundo alvo. O alinhamento composto assim gerado é sujeito a um passo de seleção para encontrar a melhor correspondência possível para cada classe da fonte. Os alinhamentos resultantes foram avaliados contra seis alinhamentos de referência automaticamente inferidos a partir de definições lógicas de ontologias biomédicas da OBO Foundry, mas também foram manualmente verificados. Os resultados preliminares, usando a avaliação automática, apresentam f-measure baixa, com uma precisão mais alta, que flutua entre os 62.9 e os 11.7% e sensibilidade máxima de 60.7%. Contudo, a análise manual demonstra que, apesar do baixo desempenho contra as referências automáticas, o algoritmo estava a encontrar maioritariamente mapeamentos corretos, com uma pequena percentagem de mapeamentos incorretos. Assim, esta descoberta inspirou a investigação da possível aplicação do algoritmo na expansão e manutenção das definições lógicas. O algoritmo também foi bem sucedido no alinhamento de conjuntos ternários de ontologias do domínio das plantas.
Autores principais:Oliveira, Daniela Patrícia dos Santos
Assunto:Ontologias biomédicas Emparelhamento de ontologias Alinhamento de ontologias Alinhamento composto de ontologias Definições lógicas Teses de mestrado - 2015
Ano:2015
País:Portugal
Tipo de documento:dissertação de mestrado
Tipo de acesso:acesso aberto
Instituição associada:Universidade de Lisboa
Idioma:inglês
Origem:Repositório da Universidade de Lisboa
Descrição
Resumo:As ontologias biomédicas são particularmente bem sucedidas na uniformização do domínio das ciências da vida. Devido à sua recente expansão, a integração de todo o conhecimento que contêm tornou-se uma tarefa extenuante. Desta forma, foram desenvolvidos sistemas de alinhamento de ontologias para lidar com o problema, que alinham uma ontologia com outra e encontram classes que correspondem entre as duas. Contudo, novos desafios para estes sistemas estão a começar a aparecer, já que existem ontologias biomédicas que contêm relações complexas e os sistemas têm dificuldade em encontrá-las. Produzir alinhamentos compostos, ou seja, que alinham mais de duas ontologias simultaneamente, pode ser útil para o desenvolvimento de uma próxima geração de tecnologias semânticas. Desta forma, esta dissertação avança o campo de alinhamento de ontologias biomédicas com o desenvolvimento de novos algoritmos que produzem correspondências compostas entre três ontologias diferentes, uma fonte e dois alvos. O algoritmo é baseado em dois passos de comparação léxica. Num primeiro é feito o alinhamento parcial da ontologia fonte com um primeiro alvo, e no segundo apenas as palavras não mapeadas das classes fonte alinhadas são comparadas com as palavras das classes do segundo alvo. O alinhamento composto assim gerado é sujeito a um passo de seleção para encontrar a melhor correspondência possível para cada classe da fonte. Os alinhamentos resultantes foram avaliados contra seis alinhamentos de referência automaticamente inferidos a partir de definições lógicas de ontologias biomédicas da OBO Foundry, mas também foram manualmente verificados. Os resultados preliminares, usando a avaliação automática, apresentam f-measure baixa, com uma precisão mais alta, que flutua entre os 62.9 e os 11.7% e sensibilidade máxima de 60.7%. Contudo, a análise manual demonstra que, apesar do baixo desempenho contra as referências automáticas, o algoritmo estava a encontrar maioritariamente mapeamentos corretos, com uma pequena percentagem de mapeamentos incorretos. Assim, esta descoberta inspirou a investigação da possível aplicação do algoritmo na expansão e manutenção das definições lógicas. O algoritmo também foi bem sucedido no alinhamento de conjuntos ternários de ontologias do domínio das plantas.