Document details

Comparison of AMR annotations across languages: problems and solutions

Author(s): Baptista, Jorge ; Reis, Sónia ; Santos, Pedro A. ; Dias, João

Date: 2024

Origin: Revista da Associação Portuguesa de Linguística

Subject(s): anotação semântica; representação abstrata de significado (AMR); representação lexicalizada de significado (LMR); processamento de linguagem natural; português europeu; semantic annotation; abstract meaning representation (AMR); lexicalized meaning representation (LMR); natural language processing; European Portuguese


Description

This study presents an adaptation of the Abstract Meaning Representation (AMR) framework for European Portuguese. This adaptation, referred to as Lexicalized Meaning Representation (LMR), was deemed necessary to address specific challenges posed by the grammar of the language, as well as various linguistic issues raised by the current version of AMR annotation guidelines. Some of these aspects stemmed from the use of a notation similar to AMR to represent real texts from the legal domain, enabling its use in natural language processing (NLP) applications. In this context, several aspects of AMR were significantly simplified, e.g., the representation of multi-word expressions, named entities, and temporal expressions; while others were reintroduced, with efforts made to maintain the representation scheme as compatible as possible with standard AMR notation.

Este estudo apresenta uma adaptação do esquema de Representação Abstrata de Significado (em inglês, Abstract Meaning Representation – AMR) para o português europeu. Esta adaptação, a que se chamou Representação Lexicalizada de Significado (Lexicalized Meaning Representation – LMR) foi considerada necessária para lidar com desafios específicos apresentados pela gramática da língua, mas também por várias questões linguísticas suscitadas pela versão atual das diretivas de anotação de AMR. Alguns destes aspetos foram uma consequência do uso de notação semelhante ao AMR para representar textos reais, do domínio jurídico, que permitisse o seu uso em aplicações de processamento de linguagem natural (PLN). Neste contexto, vários aspetos do AMR foram drasticamente simplificados, por exemplo, a representação de expressões multipalavra, entidades mencionadas e expressões temporais; enquanto outros foram introduzidos de novo, tendo sido feitos esforços para manter o esquema de representação o mais compatível possível com a notação em AMR padrão.

Document Type Journal article
Language Portuguese
facebook logo  linkedin logo  twitter logo 
mendeley logo

Related documents

No related documents