Document details

Compansion system for a pictogram-based AAC application in Catalan

Author(s): Pahisa-Solé, Joan

Date: 2012

Persistent ID: http://hdl.handle.net/10400.1/4528

Origin: Sapientia - Universidade do Algarve

Subject(s): Comunicação; Linguagem computacional; Processamento da linguagem; Linguagem natural; Língua catalã


Description

Dissertação de mest., Processamento da Linguagem Natural e Tecnologia da Linguagem Humana, Faculdade de Ciências Humanas e Sociais, Univ. do Algarve, 2012

In this project we have built a compansion (compression-expansion) system that expands telegraphic language (utterances with only uninflected content words) into natural language sentences in Catalan, in the context of an Augmentative and Alternative Communication (AAC) software. The system has been designed to improve the communication of AAC users, who usually have severe speech or motor impairments and use pictogram-based communication methods in their daily life. However, it can also be seen as a potential tool to support Catalan literacy for these users and to help in the field of language rehabilitation. The compansion system has two main components: a syntactic-semantic dependency parser and a generator that constructs the final sentence. A simile of an input system has been built to allow the use of an existing AAC vocabulary (CACE). This vocabulary has been enriched by syntactic and semantic information in view of the parser and the generator. From the user’s input, the parser extracts sentence patterns, based on a constraint grammar and a controlled vocabulary, taking into account input words and their modifiers. It then assigns the remaining words to the structural slots of those patterns, which correspond to the semantic roles of the predicative elements and of other words’ complements. Then, the generator builds the natural language sentence, from the resulting parse tree, reordering and inflecting words and adding articles, prepositions and other necessary particles. The system has been evaluated and results are most promising: 98,7% of the sentences generated by the compansion system were considered correct by three independent annotators.

Este projecto consiste na construção de um sistema de compressão-expansão (em inglês: compansion) que expande frases em linguagem telegráfica, isto é, frases formadas apenas por palavras plenamente significativas e sem informação de flexão, em frases em língua natural (Catalão), no contexto de uma aplicação em Comunicação Suplementar e Alternativa (CSA). O sistema foi projectado para melhorar a comunicação dos utilizadores de CSA, que normalmente apresentam graves perturbações motoras ou de fala e que usam métodos comunicativos baseados em pictogramas para as suas actividades quotidianas. Contudo, o sistema pode igualmente ser considerado como uma potencial ferramenta para apoiar a literacia em Catalão destes utilizadores e para ajudar na reabilitação da linguagem. O sistema de compansion tem duas componentes principais: um analisador sintáctico-semântico (parser) e um gerador, que constrói a frase de saída. Um simile de sistema de input foi construído de forma a permitir a utilização de um vocabulário de CSA já existente (o CACE). Este vocabulário foi enriquecido com informação sintáctica e semântica para poder servir tanto ao módulo de análise como de geração. A partir do input, o parser extrai os padrões frásicos, baseados numa gramática e vocabulários controlados, e com base na informação associada às palavras e seus modificadores. Em seguida, atribui as palavras remanescentes às diversas posições estruturais desses padrões frásicos, que correspondem aos papeis semânticos associados aos diversos elementos predicativos e aos complementos de outras palavras. Em seguida, o sistema gera a frase de saída a partir da árvore de análise resultante, reordenando e flexionando as diversas palavras, acrescentando artigos, preposições e outros elementos necessários a uma expressão adequada em língua natural. O sistema foi avaliado e os resultados são muito promissores: 98,7% das frases geradas pelo sistema foram consideradas correctas por três anotadores independentes

Document Type Master thesis
Language English
Advisor(s) Baptista, Jorge; Blanco, Xavier
Contributor(s) Sapientia
facebook logo  linkedin logo  twitter logo 
mendeley logo

Related documents

No related documents