Publicação

Dicionários dinâmicos multi-fonte

Ver documento

Detalhes bibliográficos
Resumo:O tema central desta dissertação é a especi cação de dicionários. Defende-se a aproximação de de nir consultas a Dicionário com base na activação de consultas a várias fontes (capazes de produzir informação diferente, mas com plementar, referente a um termo) e junção dos resultados delas provenientes. As fontes a colar têm por base ferramentas várias de processamento de linguagem natural (funções) e recursos de linguagem natural (constantes). Chamaremos fonte de informação a algo capaz de produzir informação as sociada a um termo. Uma fonte pode ser um simples recurso de processamento de linguagem natural ou envolver um conjunto de ferramentas e recursos. A especi cação formal das ferramentas é um procedimento de abstracção que, para além de permitir entender e discutir as ferramentas, cria uma plata forma comum a todas elas e portanto um domínio sintáctico-semântico onde possam cooperar. Além disso, a abstração facilita a comunicação e a cooperação. A especificação formal das ferramentas vai permitir descrever o seu funcionamento e encapsular detalhes menos relevantes. Permitirá também definir uma álgebra de ferramentas, recursos gerais, recursos locais, e um tipo de dados comum. Para se conseguir juntar as informações há necessidade de usar um tipo de dados comum e definir funções de conciliação que permitam harmonizar informações provenientes das várias fontes. A definição de funções estratégia capazes de descrever o modo como serão consultadas as diversas fontes de informação é também um elemento indispensável para que se possa escolher um compromisso aceitável de custo/qualidade, completude. Para descrição da interpelação às várias fontes de informação será utilizada a linguagem de especificação Camila. Para fazer a adaptação de formatos e encapsular detalhes sintácticos será utilizada linguagem de scripting Perl. Sempre que possível, tentou-se construir e disponibilizar recursos e ferramentas de processamento de linguagem natural de modo a ajudar a colmatar algumas necessidades gerais existentes.
Autores principais:Almeida, J. J.
Assunto:Dicionários PLN DSL Ontologias Bibliotecas digitais Dictionaries NLP Ontologies Digital libraries
Ano:2003
País:Portugal
Tipo de documento:tese de doutoramento
Tipo de acesso:acesso aberto
Instituição associada:Universidade do Minho
Idioma:português
Origem:RepositóriUM - Universidade do Minho
Descrição
Resumo:O tema central desta dissertação é a especi cação de dicionários. Defende-se a aproximação de de nir consultas a Dicionário com base na activação de consultas a várias fontes (capazes de produzir informação diferente, mas com plementar, referente a um termo) e junção dos resultados delas provenientes. As fontes a colar têm por base ferramentas várias de processamento de linguagem natural (funções) e recursos de linguagem natural (constantes). Chamaremos fonte de informação a algo capaz de produzir informação as sociada a um termo. Uma fonte pode ser um simples recurso de processamento de linguagem natural ou envolver um conjunto de ferramentas e recursos. A especi cação formal das ferramentas é um procedimento de abstracção que, para além de permitir entender e discutir as ferramentas, cria uma plata forma comum a todas elas e portanto um domínio sintáctico-semântico onde possam cooperar. Além disso, a abstração facilita a comunicação e a cooperação. A especificação formal das ferramentas vai permitir descrever o seu funcionamento e encapsular detalhes menos relevantes. Permitirá também definir uma álgebra de ferramentas, recursos gerais, recursos locais, e um tipo de dados comum. Para se conseguir juntar as informações há necessidade de usar um tipo de dados comum e definir funções de conciliação que permitam harmonizar informações provenientes das várias fontes. A definição de funções estratégia capazes de descrever o modo como serão consultadas as diversas fontes de informação é também um elemento indispensável para que se possa escolher um compromisso aceitável de custo/qualidade, completude. Para descrição da interpelação às várias fontes de informação será utilizada a linguagem de especificação Camila. Para fazer a adaptação de formatos e encapsular detalhes sintácticos será utilizada linguagem de scripting Perl. Sempre que possível, tentou-se construir e disponibilizar recursos e ferramentas de processamento de linguagem natural de modo a ajudar a colmatar algumas necessidades gerais existentes.