Pasar al contenido principal
Noticia Elhuyar

Unidad de Lengua y Tecnología de Elhuyar en Macedonia, en el workshop PARHIJO/ENeL

2016 | Abril 11

Antton Gurrutxaga, miembro de la Unidad de Lengua y Tecnología de Elhuyar, ha asistido en Macedonia los días 5 y 6 de abril a un workshop sobre unidades multi-palabra (PARHIJO/ENeL workshop on MWE e-lexicons). La representante del Grupo Ixa de la UPV/EHU, Uxoa Iñurrieta, ha participado en el taller que ha unido dos proyectos europeos:

- ENeL - European Network of e-lexicography (http://www.elexicography.eu/)

Antton Gurrutxaga, miembro de la Unidad de Lengua y Tecnología de Elhuyar, ha asistido en Macedonia los días 5 y 6 de abril a un workshop sobre unidades multi-palabra (PARHIJO/ENeL workshop on MWE e-lexicons). La representante del Grupo Ixa de la UPV/EHU, Uxoa Iñurrieta, ha participado en el taller que ha unido dos proyectos europeos:

- ENeL - European Network of e-lexicography (http://www.elexicography.eu/)

- PARHIJO - Parsing and Multi-word Expressions (http://typo.uni-constanz.de/parhijo/)

El conjunto de unidades multi-palabra es muy amplio, abarcando unidades lingüísticas muy variadas, como locuciones o expresiones idiomáticas (tomar el pelo, sacar las habas de la olla), collocaciones (llamar la atención, entablar amistad íntima), términos multi-palabras (viento solar, libro electrónico, condición necesaria, tren de alta velocidad) y expresiones (qué ver, aprender aquello).

Este tipo de unidades tienen gran importancia en ámbitos como la enseñanza de la lengua y la traducción. De hecho, no se pueden crear mediante una combinación libre de componentes, ni en la mayoría de los casos traducir componentes. Por ello, es necesario introducirlos en los diccionarios e integrarlos en las herramientas de procesamiento automático del lenguaje.

El objetivo del workshop ha sido fomentar el intercambio de conocimientos y la colaboración entre investigadores de la lexicografía y el procesamiento de la lengua, y analizar cómo satisfacer y resolver las necesidades y problemas de cada área a través de los recursos y herramientas del otro.

Elhuyar trabaja en estos dos campos: por un lado, edita diccionarios y crea recursos lexicográficos y terminológicos; por otro, desde 2002 trabaja en la investigación en el procesamiento de la lengua y ha desarrollado herramientas para la extracción automática de unidades multi-palabra de textos. Por ejemplo:

- El servicio Itzulterm permite extraer las parejas de términos bilingües que se han utilizado en una colección de textos bilingües, es decir, en un corpus paralelo.

- Mediante la tecnología desarrollada en el proyecto Konastigarraga se pueden obtener combinaciones típicas o significativas de una palabra. Un caso de aplicación es el apartado Combinaciones de palabras del portal de corpus Web de Elhuyar. La información más detallada de este trabajo de investigación se encuentra en el siguiente artículo: Gurrutxaga, A., Alegria, I & Artola, X. (2016) "Caracterización automática de la idiomaticidad: combinaciones nombre+verbo" en EKAIA - Revista científica y tecnológica de la Universidad del País Vasco. 10 episodios de Tesis Vascas. UPV/EHU.

 

 

Contacto

Irune Bengoetxea Lanberri
Responsable de comunicación
943363040 (Ext. 301)