Publicação

Linguística de Corpus e outros usos do corpus em Linguística

Ver documento

Detalhes bibliográficos
Resumo:Este capítulo discute a noção de corpus e as diferentes formas como é utilizado nos trabalhos em Linguística: quer, na abordagem da Linguística de Corpus e de perpetivas teóricas afins, como uma fonte de dados que fornece informações sobre fenómenos que poderiam não ser detetados com base apenas na intuição e cuja quantificação permite apontar padrões e tendências, quer como metodologia de trabalho utilizada em trabalhos que se situam em teorias linguísticas várias. Discutem-se algumas das etapas de compilação de corpora, os princípios de representatividade e equilíbrio, os problemas de direitos de autor envolvidos e algumas ferramentas de pesquisa. Apresentam-se, ainda, os diferentes tipos de corpora existentes para o português europeu (podendo alguns incluir outras variedades do português) e os níveis de anotação linguística desenvolvidos. Finalmente, são referidos alguns estudos em diferentes áreas da linguística que tiveram como base corpora compilados para o português.
Autores principais:Mendes, Amália
Assunto:Corpus Anotação linguística Pesquisa de informação Análise quantitativa e estatística Estudos baseados em corpora
Ano:2016
País:Portugal
Tipo de documento:artigo
Tipo de acesso:acesso aberto
Instituição associada:Universidade de Lisboa
Idioma:português
Origem:Repositório da Universidade de Lisboa
Descrição
Resumo:Este capítulo discute a noção de corpus e as diferentes formas como é utilizado nos trabalhos em Linguística: quer, na abordagem da Linguística de Corpus e de perpetivas teóricas afins, como uma fonte de dados que fornece informações sobre fenómenos que poderiam não ser detetados com base apenas na intuição e cuja quantificação permite apontar padrões e tendências, quer como metodologia de trabalho utilizada em trabalhos que se situam em teorias linguísticas várias. Discutem-se algumas das etapas de compilação de corpora, os princípios de representatividade e equilíbrio, os problemas de direitos de autor envolvidos e algumas ferramentas de pesquisa. Apresentam-se, ainda, os diferentes tipos de corpora existentes para o português europeu (podendo alguns incluir outras variedades do português) e os níveis de anotação linguística desenvolvidos. Finalmente, são referidos alguns estudos em diferentes áreas da linguística que tiveram como base corpora compilados para o português.