Publicação
Linguística de Corpus e outros usos do corpus em Linguística
| Resumo: | Este capítulo discute a noção de corpus e as diferentes formas como é utilizado nos trabalhos em Linguística: quer, na abordagem da Linguística de Corpus e de perpetivas teóricas afins, como uma fonte de dados que fornece informações sobre fenómenos que poderiam não ser detetados com base apenas na intuição e cuja quantificação permite apontar padrões e tendências, quer como metodologia de trabalho utilizada em trabalhos que se situam em teorias linguísticas várias. Discutem-se algumas das etapas de compilação de corpora, os princípios de representatividade e equilíbrio, os problemas de direitos de autor envolvidos e algumas ferramentas de pesquisa. Apresentam-se, ainda, os diferentes tipos de corpora existentes para o português europeu (podendo alguns incluir outras variedades do português) e os níveis de anotação linguística desenvolvidos. Finalmente, são referidos alguns estudos em diferentes áreas da linguística que tiveram como base corpora compilados para o português. |
|---|---|
| Autores principais: | Mendes, Amália |
| Assunto: | Corpus Anotação linguística Pesquisa de informação Análise quantitativa e estatística Estudos baseados em corpora |
| Ano: | 2016 |
| País: | Portugal |
| Tipo de documento: | artigo |
| Tipo de acesso: | acesso aberto |
| Instituição associada: | Universidade de Lisboa |
| Idioma: | português |
| Origem: | Repositório da Universidade de Lisboa |
| Resumo: | Este capítulo discute a noção de corpus e as diferentes formas como é utilizado nos trabalhos em Linguística: quer, na abordagem da Linguística de Corpus e de perpetivas teóricas afins, como uma fonte de dados que fornece informações sobre fenómenos que poderiam não ser detetados com base apenas na intuição e cuja quantificação permite apontar padrões e tendências, quer como metodologia de trabalho utilizada em trabalhos que se situam em teorias linguísticas várias. Discutem-se algumas das etapas de compilação de corpora, os princípios de representatividade e equilíbrio, os problemas de direitos de autor envolvidos e algumas ferramentas de pesquisa. Apresentam-se, ainda, os diferentes tipos de corpora existentes para o português europeu (podendo alguns incluir outras variedades do português) e os níveis de anotação linguística desenvolvidos. Finalmente, são referidos alguns estudos em diferentes áreas da linguística que tiveram como base corpora compilados para o português. |
|---|