Document details

Análise e representação de construções adjectivais para processamento automático de texto : adjectivos intransitivos humanos

Author(s): Carvalho, Paula Cristina Quaresma da Fonseca, 1975-

Date: 2007

Persistent ID: http://hdl.handle.net/10451/3939

Origin: Repositório da Universidade de Lisboa

Subject(s): Língua portuguesa; Adjectivos; Grupo nominal; Sintaxe; Léxico-Gramática; Processamento da linguagem natural; Teses de doutoramento - 2008


Description

Tese de doutoramento em Linguística (Linguística Portuguesa), apresentada à Universidade de Lisboa através da Faculdade de Letras, 2008

Este estudo teve como objectivo determinar e formalizar as propriedades léxico-sintácticas dos adjectivos intransitivos, i.e., sem complementos, e que se constroem com sujeito humano, em português europeu contemporâneo. Uma das motivações subjacentes à escolha deste tema foi a aparente falta de economia descritiva resultante da dupla classificação de numerosas unidades lexicais como nomes e adjectivos. Efectivamente, muitos destes adjectivos têm sido classificados como nomes, por forma a dar conta dos casos em que aparecem em posições sintácticas tipicamente nominais. Esta ambiguidade encontra eco no fenómeno de criação lexical tradicionalmente designado como derivação imprópria (ou conversão). Nesta dissertação, defendemos que certos adjectivos humanos têm a propriedade de desempenhar superficialmente a função de núcleo de grupos nominais. Esta análise baseia-se na constatação de que, nessas construções sintácticas, os adjectivos exibem, geralmente, algumas propriedades que exibiriam se se encontrassem em contexto adnominal e de que é possível reconstituir o nome (humano) a que os mesmos se encontram associados. Entre as várias estruturas aqui analisadas, tratámos (i) as construções caracterizadoras indefinidas, em que o adjectivo aparece precedido de artigo indefinido; (ii) as construções cruzadas, em que o adjectivo ocupa a posição típica de núcleo de um grupo nominal; (iii) as orações exclamativas de insulto; e outras, cujas especificidades sintácticas, semânticas e discursivas procurámos igualmente clarificar. A investigação baseou-se na análise de 4.250 lemas adjectivais, que organizámos em diversas subclasses sintáctico-semânticas, de acordo com os princípios teórico-metodológicos do Léxico-Gramática, fundados na gramática transformacional de operadores harrissiana. As informações linguísticas foram formalizadas em matrizes léxico-sintácticas, o que permite, como ilustraremos, a sua utilização em diversas tarefas de processamento de linguagem natural (PLN), nomeadamente, na desambiguação e análise sintáctica automática de textos.

This dissertation focus on the analysis and formalization of the lexico-syntactic properties of intransitive adjectives in contemporary European Portuguese. These adjectives are characterized as occurring with a human subject and having no complements. One of the underlying motivations for choosing this subject is the apparent lack of descriptive economy resulting from the double classification of many lexical entries as both nouns and adjectives. A substantial number of these adjectives has been classified as nouns, as a way of considering the cases in which they appear in typical nominal syntactic positions. This ambiguity finds resonance in the lexical phenomenon traditionally known as improper derivation, or conversion. In this study, we argue that some human adjectives can superficially fill the syntactic slot of head of a noun phrase. This analysis is based on the fact that in those syntactic constructions, the adjectives generally maintain some of the properties that they would have if they were in an adnominal context, and that it is always possible to reconstruct the human noun to which the adjective is related. Among several constructions studied here, we focus on: (i) characterizing indefinite constructions, where the adjective appears after an indefinite article; (ii) cross-constructions, where the adjective fills the head of a noun phrase; (iii) exclamatives expressing insult; and others, whose syntactic-semantic and discursive details we also try to clarify. The research is based on the analysis of 4,250 adjectival lemmas, which are organized in several syntacticsemantic subclasses according to the Lexicon-Grammar theoretical and methodological principles, established in the Harrisian framework of transformational operator grammar. All linguistic information was formalized in lexicon-grammar matrices which, as we illustrate, can be explored in several NLP tasks, namely in disambiguation and automatic text analysis.

Document Type Doctoral thesis
Language English
Advisor(s) Ranchhod, Elisabete Marques, 1947-
Contributor(s) Repositório da Universidade de Lisboa
facebook logo  linkedin logo  twitter logo 
mendeley logo

Related documents

No related documents