Autor(es): Farias Pena Pereira, Camila ; Paraboni, Ivandré
Data: 2024
Origem: Linguamática
Assunto(s): stance detection; corpus expansion; detecção de posicionamentos; expansão de córpus
Autor(es): Farias Pena Pereira, Camila ; Paraboni, Ivandré
Data: 2024
Origem: Linguamática
Assunto(s): stance detection; corpus expansion; detecção de posicionamentos; expansão de córpus
Computational stance detection---the task of determining, given an input text, the attitude (e.g., for or against) towards a particular target topic---usually makes use of annotated corpus as training data and, since possible topics are in principle unlimited, so is the need for new labelled datasets about every topic of interest. In order to overcome some of these challenges, the present work adapts to the stance prediction task an existing corpus expansion method that has been originally devised for sentiment analysis. The method is applied to a large (46K instances) Brazilian Portuguese corpus conveying stances towards six target topics of moral and/or political nature, achieving a substantial increase in the number of labelled instances. Results from both automatic and human evaluation suggest that adding semi-automatically labelled data to the corpus does not decrease accuracy, and that the majority of these labels are correct.
A detecção computacional de posicionamentos---a tarefa de determinar, a partir de um texto de entrada, a atitude ou posição (e.g., favorável ou contrária) em relação a um tópico-alvo específico---geralmente depende de córpus rotulados com informações de posicionamentos para cada tópico de interesse. Uma vez que esses tópicos são em princípio ilimitados, a necessidade de novos córpus rotulados também o é. Como forma de amenizar algumas dessas dificuldades, este trabalho adapta para a detecção de posicionamento um método de expansão de córpus originalmente desenvolvido para a tarefa análoga de análise de sentimento. O método é então aplicado a um grande (46 mil instâncias) córpus de posicionamentos cobrindo seis temas de interesse político e/ou moral em português brasileiro, obtendo um aumento substancial no número de instâncias. Resultados de avaliação automática e humana sugerem que a adição de instâncias rotuladas semiautomaticamente ao conjunto de dados original não prejudica a precisão da classificação, e que os rótulos gerados automaticamente estão, em sua maioria, corretos.
A detecção computacional de posicionamentos---a tarefa de determinar, a partir de um texto de entrada, a atitude ou posição (e.g., favorável ou contrária) em relação a um tópico-alvo específico---geralmente depende de córpus rotulados com informações de posicionamentos para cada tópico de interesse. Uma vez que esses tópicos são em princípio ilimitados, a necessidade de novos córpus rotulados também o é. Como forma de amenizar algumas dessas dificuldades, este trabalho adapta para a detecção de posicionamento um método de expansão de córpus originalmente desenvolvido para a tarefa análoga de análise de sentimento. O método é então aplicado a um grande (46 mil instâncias) córpus de posicionamentos cobrindo seis temas de interesse político e/ou moral em português brasileiro, obtendo um aumento substancial no número de instâncias. Resultados de avaliação automática e humana sugerem que a adição de instâncias rotuladas semiautomaticamente ao conjunto de dados original não prejudica a precisão da classificação, e que os rótulos gerados automaticamente estão, em sua maioria, corretos.