Detalhes do Documento

Stance detection from text using semi-automatic corpus expansion

Autor(es): Farias Pena Pereira, Camila ; Paraboni, Ivandré

Data: 2024

Origem: Linguamática

Assunto(s): stance detection; corpus expansion; detecção de posicionamentos; expansão de córpus

Descrição

Computational stance detection---the task of determining, given an input text, the attitude (e.g., for or against) towards a particular target topic---usually makes use of annotated corpus as training data and, since possible topics are in principle unlimited, so is the need for new labelled datasets about every topic of interest. In order to overcome some of these challenges, the present work adapts to the stance prediction task an existing corpus expansion method that has been originally devised for sentiment analysis. The method is applied to a large (46K instances) Brazilian Portuguese corpus conveying stances towards six target topics of moral and/or political nature, achieving a substantial increase in the number of labelled instances. Results from both automatic and human evaluation suggest that adding semi-automatically labelled data to the corpus does not decrease accuracy, and that the majority of these labels are correct.

A detecção computacional de posicionamentos---a tarefa de determinar, a partir de um texto de entrada, a atitude ou posição (e.g., favorável ou contrária) em relação a um tópico-alvo específico---geralmente depende de córpus rotulados com informações de posicionamentos para cada tópico de interesse. Uma vez que esses tópicos são em princípio ilimitados, a necessidade de novos córpus rotulados também o é. Como forma de amenizar algumas dessas dificuldades, este trabalho adapta para a detecção de posicionamento um método de expansão de córpus originalmente desenvolvido para a tarefa análoga de análise de sentimento. O método é então aplicado a um grande (46 mil instâncias) córpus de posicionamentos cobrindo seis temas de interesse político e/ou moral em português brasileiro, obtendo um aumento substancial no número de instâncias. Resultados de avaliação automática e humana sugerem que a adição de instâncias rotuladas semiautomaticamente ao conjunto de dados original não prejudica a precisão da classificação, e que os rótulos gerados automaticamente estão, em sua maioria, corretos.

Tipo de Documento Artigo científico
Idioma Português

Documentos Relacionados

Não existem documentos relacionados.

Sobre o RCAAP Ajuda