Vés al contingut

La traducció s'ha generat de manera automàtica (elia.eus)

Noticia Elhuyar

Unitat de Llengua i Tecnologia d'Elhuyar a Macedònia, en el workshop PARHIJO/ENEL

2016 | abril 11

Antton Gurrutxaga, membre de la Unitat de Llengua i Tecnologia d'Elhuyar, ha assistit a Macedònia els dies 5 i 6 d'abril a un workshop sobre unitats multi-paraula (PARHIJO/ENEL workshop on MWE e-lexicons). La representant del Grup Ixa de la UPV/EHU, Uxoa Iñurrieta, ha participat en el taller que ha unit dos projectes europeus:

- ENEL - European Network of e-lexicography (http://www.elexicography.eu/)

Antton Gurrutxaga, membre de la Unitat de Llengua i Tecnologia d'Elhuyar, ha assistit a Macedònia els dies 5 i 6 d'abril a un workshop sobre unitats multi-paraula (PARHIJO/ENEL workshop on MWE e-lexicons). La representant del Grup Ixa de la UPV/EHU, Uxoa Iñurrieta, ha participat en el taller que ha unit dos projectes europeus:

- ENEL - European Network of e-lexicography (http://www.elexicography.eu/)

- PARHIJO - Parsing and Multi-word Expressions (http://typo.uni-constanz.de/parhijo/)

El conjunt d'unitats multi-paraula és molt ampli, abastant unitats lingüístiques molt variades, com a locucions o expressions idiomàtiques (prendre el pèl, treure les faves de l'olla), collocaciones (cridar l'atenció, entaular amistat íntima), termes multi-paraules (vent solar, llibre electrònic, condició necessària, tren d'alta velocitat) i expressions (què veure, aprendre allò).

Aquest tipus d'unitats tenen gran importància en àmbits com l'ensenyament de la llengua i la traducció. De fet, no es poden crear mitjançant una combinació lliure de components, ni en la majoria dels casos traduir components. Per això, és necessari introduir-los en els diccionaris i integrar-los en les eines de processament automàtic del llenguatge.

L'objectiu del workshop ha estat fomentar l'intercanvi de coneixements i la col·laboració entre investigadors de la lexicografia i el processament de la llengua, i analitzar com satisfer i resoldre les necessitats i problemes de cada àrea a través dels recursos i eines de l'altre.

Elhuyar treballa en aquests dos camps: d'una banda, edita diccionaris i crea recursos lexicogràfics i terminològics; per un altre, des de 2002 treballa en la recerca en el processament de la llengua i ha desenvolupat eines per a l'extracció automàtica d'unitats multi-paraula de textos. Per exemple:

- El servei Itzulterm permet extreure les parelles de termes bilingües que s'han utilitzat en una col·lecció de textos bilingües, és a dir, en un corpus paral·lel.

- Mitjançant la tecnologia desenvolupada en el projecte Konastigarraga es poden obtenir combinacions típiques o significatives d'una paraula. Un cas d'aplicació és l'apartat Combinacions de paraules del portal de corpus Web d'Elhuyar. La informació més detallada d'aquest treball de recerca es troba en el següent article: Gurrutxaga, A., Alegria, I & Artola, X. (2016) "Caracterització automàtica de la idiomaticidad: combinacions nomeni+verb" en EKAIA - Revista científica i tecnològica de la Universitat del País Basc. 10 episodis de Tesis Basques. UPV/EHU.

 

 

Contacte

Irune Bengoetxea Lanberri
Komunikazio-arduraduna
943363040 (Ext. 301)