Document details

Basque time structures. Analysis and annotating experiment

Author(s): Altuna, Begoña ; Aranzabe, María Jesús ; Díaz de Ilarraza, Arantza

Date: 2014

Origin: Linguamática

Subject(s): Time information; time expressions; time function words; lexical triggers; Denbora-informazioa; denbora-adierazpenak; denborazko erlazio-hitzak; abiarazle lexikoak


Description

Time information extraction is very useful in natural language processing (NLP), as it can be used in text simplification, information extraction and machine translation systems. In this paper we present the first steps of making that information accessible for Basque language: on one hand, Basque structures that convey time have been analysed based on grammars and, on the other hand, first decisions on tagging those on real texts have been taken. Also, we give account of an annotating experiment we have carried out on a financial news corpus.

Denbora-informazioa erauztea oso erabilgarria da hizkuntzaren prozesamenduan (HP), besteak beste, testuen sinplifikazioan, informazio-erauzketako eta itzulpen automatikoko sistemetan balia baitaiteke. Lan honetan, euskaraz informazio hori baliagarri bihurtzeko egin diren lehen urratsak azaltzen dira: batetik, euskaraz denbora adierazteko erabiltzen diren egiturak zein eratakoak diren aztertu da gramatiketan oinarrituta, eta bestetik, egitura horiek testuetan etiketatzeko lehen erabakiak hartu dira. Halaber, ekonomiari buruzko corpus bat osatuta egin den etiketatze-lanaren esperimentua azaltzen da.

Denbora-informazioa erauztea oso erabilgarria da hizkuntzaren prozesamenduan (HP), besteak beste, testuen sinplifikazioan, informazio-erauzketako eta itzulpen automatikoko sistemetan balia baitaiteke. Lan honetan, euskaraz informazio hori baliagarri bihurtzeko egin diren lehen urratsak azaltzen dira: batetik, euskaraz denbora adierazteko erabiltzen diren egiturak zein eratakoak diren aztertu da gramatiketan oinarrituta, eta bestetik, egitura horiek testuetan etiketatzeko lehen erabakiak hartu dira. Halaber, ekonomiari buruzko corpus bat osatuta egin den etiketatze-lanaren esperimentua azaltzen da.

Document Type Journal article
Language Portuguese
facebook logo  linkedin logo  twitter logo 
mendeley logo

Related documents

No related documents