Este trabalho pretende descrever o processo de desenvolvimento de um referencial de complexidade textual inserida no âmbito do projeto iRead4Skills. O nosso objetivo é fazer uma descrição e análise dos traços linguísticos que conferem complexidade aos textos, em particular àqueles que se destinam a adultos de baixa literacia. Apesar da existência de orientações sobre a proficiência em leitura (QECR, PISA, etc.)...
This paper presents the iRead4Skills framework of textual complexity, a novel approach to text difficulty tailored to low-literacy adult native speakers. Recognizing the pivotal role of literacy in personal and professional development, this framework addresses the challenges of identifying and adapting texts for this demographic. Integrating lexical, syntactic, and cohesion features, the framework delineates t...
This paper presents the iRead4Skills benchmark of textual complexity, a novel approach to text complexity difficulty tailored to low-literacy adult native speakers. Despite the existence of various instruments and guidelines related to reading proficiency (CEFR, PISA, etc.), little attention is given to adult reading difficulties and how these manifest linguistically in texts. Recognizing the pivotal role of li...
Caderno de exercícios elaborado especialmente para o ensino da língua portuguesa através do uso do dicionário. Este material foi desenvolvido no âmbito da primeira edição da formação “Ensinar com o Dicionário”, realizada em 2024, fruto de uma colaboração entre o Instituto Internacional da Língua Portuguesa (IILP) e o Centro de Linguística da Universidade NOVA de Lisboa (CLUNL). Este caderno pretende ser uma fer...
This paper presents the Portuguese dataset of the iRead4Skills project (Dataset 1: corpora by complexity level for FR, PT, and SP – v.2.0), a representative sample of written European Portuguese for automatic complexity assessment that addresses a gap in existing resources for Portuguese. The corpus was created within the framework of the iRead4Skills project, which encompasses Portuguese, French, and Spanish. ...
Foreign language (FL) or second language (L2) corpora are sets of productions by non-native speakers, learners of a given language, which contemplate the errors and well-formed structures produced. These serve different research objectives, such as studies on language acquisition (LE and L2), phenomena of linguistic interference or analysis and diagnosis of LE/L2 proficiency levels. In the context of this resea...
O painel visa apresentar e debater perspetivas interdisciplinares entre a Ciência da Informação as Humanidades Digitais e as Ciências da Computação, bem como experiências de formação e investigação que se cruzam e enriquecem reciprocamente, explorando possíveis modelos de cooperação académica e discutindo a necessidade de criação de novos perfis profissionais para o setor de Informação e Documentação e o setor ...
The automatic diagnosis and analysis of the production of foreign language learners can contribute to overcome linguistic barriers that hinder the integration of migrant populations. The richness and complexity of the phenomena observed in this context and the multiplicity of objectives served by automatic analysis tools demonstrate the inevitability of manual annotation of data and the importance of producing ...