Document details

Exploring Artificial Intelligence in Language Teaching: Automatic Creation and Classification of Narrative Corpora Based on Proverbs for Teaching PFL with Large Language Models

Author(s): Baptista, Jorge ; Reis, Sónia

Date: 2025

Origin: Revista da Associação Portuguesa de Linguística

Subject(s): geração automática de corpus de narrativas; Português como Língua Estrangeira (PLE); inteligência artificial (IA); modelos de linguagem de grande escala (Large Language Models); classificação automática de provérbios; automatic generation of narrative corpora; Portuguese as a Foreign Language (PFL); Artificial Intelligence (AI); Large Language Models (LLMs); Automatic classification of proverbs


Description

Artificial Intelligence (AI), particularly Large Language Models (LLMs), has been transforming language education. This study explores the application of LLMs in the teaching of Portuguese as a Foreign Language (PFL), focusing on the automatic creation, classification, and validation of a corpus of short narratives based on Portuguese proverbs. The objectives are: (i) to automatically generate short narratives based on proverbs, suitable for different proficiency levels as defined by the CEFR; (ii) to automatically classify the linguistic proficiency level of these narratives using traditional machine learning techniques and foundational models (LLMs), followed by validation by human evaluators; (iii) to assess the adequacy of the narratives in relation to the original proverbs, justifying their potential didactic use in the context of PFL teaching. The methodology involves generating narratives with LLMs, which are then validated using automatic tools and human experts, as well as analysing the correspondence between the proverb and the generated narrative with a view to pedagogical application.

A Inteligência Artificial (IA), em particular os Modelos de Linguagem de Grande Escala (LLMs), tem vindo a transformar o ensino de línguas. Este estudo explora a aplicação de LLMs no ensino de Português como Língua Estrangeira (PLE), centrando-se na criação, classificação e validação automática de um corpus de narrativas curtas baseadas em provérbios portugueses. Os objetivos centram-se em: (i) gerar automaticamente narrativas curtas baseadas em provérbios, adequadas a diferentes níveis de proficiência definidos pelo QECR; (ii) classificar automaticamente o nível de proficiência linguística dessas narrativas, utilizando técnicas de machine learning tradicionais e modelos fundacionais (LLMs), com posterior validação por avaliadores humanos; (iii) avaliar a adequação das narrativas aos provérbios originais, justificando o seu potencial uso didático no contexto do ensino de PLE. A metodologia envolve a geração de narrativas com LLMs, validadas por ferramentas automáticas e por especialistas humanos, bem como a análise da correspondência entre provérbio e narrativa gerada, tendo em vista a sua aplicação pedagógica.

Document Type Journal article
Language Portuguese
facebook logo  linkedin logo  twitter logo 
mendeley logo

Related documents