Publicação
Dicionários dinâmicos multi-fonte
| Resumo: | O tema central desta dissertação é a especi cação de dicionários. Defende-se a aproximação de de nir consultas a Dicionário com base na activação de consultas a várias fontes (capazes de produzir informação diferente, mas com plementar, referente a um termo) e junção dos resultados delas provenientes. As fontes a colar têm por base ferramentas várias de processamento de linguagem natural (funções) e recursos de linguagem natural (constantes). Chamaremos fonte de informação a algo capaz de produzir informação as sociada a um termo. Uma fonte pode ser um simples recurso de processamento de linguagem natural ou envolver um conjunto de ferramentas e recursos. A especi cação formal das ferramentas é um procedimento de abstracção que, para além de permitir entender e discutir as ferramentas, cria uma plata forma comum a todas elas e portanto um domínio sintáctico-semântico onde possam cooperar. Além disso, a abstração facilita a comunicação e a cooperação. A especificação formal das ferramentas vai permitir descrever o seu funcionamento e encapsular detalhes menos relevantes. Permitirá também definir uma álgebra de ferramentas, recursos gerais, recursos locais, e um tipo de dados comum. Para se conseguir juntar as informações há necessidade de usar um tipo de dados comum e definir funções de conciliação que permitam harmonizar informações provenientes das várias fontes. A definição de funções estratégia capazes de descrever o modo como serão consultadas as diversas fontes de informação é também um elemento indispensável para que se possa escolher um compromisso aceitável de custo/qualidade, completude. Para descrição da interpelação às várias fontes de informação será utilizada a linguagem de especificação Camila. Para fazer a adaptação de formatos e encapsular detalhes sintácticos será utilizada linguagem de scripting Perl. Sempre que possível, tentou-se construir e disponibilizar recursos e ferramentas de processamento de linguagem natural de modo a ajudar a colmatar algumas necessidades gerais existentes. |
|---|---|
| Autores principais: | Almeida, J. J. |
| Assunto: | Dicionários PLN DSL Ontologias Bibliotecas digitais Dictionaries NLP Ontologies Digital libraries |
| Ano: | 2003 |
| País: | Portugal |
| Tipo de documento: | tese de doutoramento |
| Tipo de acesso: | acesso aberto |
| Instituição associada: | Universidade do Minho |
| Idioma: | português |
| Origem: | RepositóriUM - Universidade do Minho |
| Resumo: | O tema central desta dissertação é a especi cação de dicionários. Defende-se a aproximação de de nir consultas a Dicionário com base na activação de consultas a várias fontes (capazes de produzir informação diferente, mas com plementar, referente a um termo) e junção dos resultados delas provenientes. As fontes a colar têm por base ferramentas várias de processamento de linguagem natural (funções) e recursos de linguagem natural (constantes). Chamaremos fonte de informação a algo capaz de produzir informação as sociada a um termo. Uma fonte pode ser um simples recurso de processamento de linguagem natural ou envolver um conjunto de ferramentas e recursos. A especi cação formal das ferramentas é um procedimento de abstracção que, para além de permitir entender e discutir as ferramentas, cria uma plata forma comum a todas elas e portanto um domínio sintáctico-semântico onde possam cooperar. Além disso, a abstração facilita a comunicação e a cooperação. A especificação formal das ferramentas vai permitir descrever o seu funcionamento e encapsular detalhes menos relevantes. Permitirá também definir uma álgebra de ferramentas, recursos gerais, recursos locais, e um tipo de dados comum. Para se conseguir juntar as informações há necessidade de usar um tipo de dados comum e definir funções de conciliação que permitam harmonizar informações provenientes das várias fontes. A definição de funções estratégia capazes de descrever o modo como serão consultadas as diversas fontes de informação é também um elemento indispensável para que se possa escolher um compromisso aceitável de custo/qualidade, completude. Para descrição da interpelação às várias fontes de informação será utilizada a linguagem de especificação Camila. Para fazer a adaptação de formatos e encapsular detalhes sintácticos será utilizada linguagem de scripting Perl. Sempre que possível, tentou-se construir e disponibilizar recursos e ferramentas de processamento de linguagem natural de modo a ajudar a colmatar algumas necessidades gerais existentes. |
|---|