Unidade de Lingua e Tecnoloxía de Elhuyar en Macedonia, no workshop PARHIJO/ENeL
Antton Gurrutxaga, membro da Unidade de Lingua e Tecnoloxía de Elhuyar, asistiu en Macedonia os días 5 e 6 de abril a un workshop sobre unidades multi-palabra (PARHIJO/ENeL workshop on MWE e-lexicons). A representante do Grupo Ixa da UPV/EHU, Uxoa Iñurrieta, participou no taller que uniu dous proxectos europeos:
- ENeL - European Network of e-lexicography (http://www.elexicography.eu/)
Antton Gurrutxaga, membro da Unidade de Lingua e Tecnoloxía de Elhuyar, asistiu en Macedonia os días 5 e 6 de abril a un workshop sobre unidades multi-palabra (PARHIJO/ENeL workshop on MWE e-lexicons). A representante do Grupo Ixa da UPV/EHU, Uxoa Iñurrieta, participou no taller que uniu dous proxectos europeos: - ENeL - European Network of e-lexicography (http://www.elexicography.eu/) - PARHIJO - Parsing and Multi-word Expressions (http://typo.uni-constanz.de/parhijo/) O conxunto de unidades multi-palabra é moi amplo, abarcando unidades lingüísticas moi variadas, como locuciones ou expresións idiomáticas (tomar o pelo, sacar as fabas da pota), collocaciones (chamar a atención, establecer amizade íntima), termos multi-palabras (vento solar, libro electrónico, condición necesaria, tren de alta velocidade) e expresións (que ver, aprender aquilo). Este tipo de unidades teñen gran importancia en ámbitos como o ensino da lingua e a tradución. De feito, non se poden crear mediante unha combinación libre de compoñentes, nin na maioría dos casos traducir compoñentes. Por iso, é necesario introducilos nos dicionarios e integralos nas ferramentas de procesamiento automático da linguaxe. O obxectivo do workshop foi fomentar o intercambio de coñecementos e a colaboración entre investigadores da lexicografía e o procesamiento da lingua, e analizar como satisfacer e resolver as necesidades e problemas de cada área a través dos recursos e ferramentas do outro. Elhuyar traballa nestes dous campos: por unha banda, edita dicionarios e crea recursos lexicográficos e terminolóxicos; por outro, desde 2002 traballa na investigación no procesamiento da lingua e desenvolveu ferramentas paira a extracción automática de unidades multi-palabra de textos. Por exemplo: - O servizo Itzulterm permite extraer as parellas de termos bilingües que se utilizaron nunha colección de textos bilingües, é dicir, nun corpus paralelo. - Mediante a tecnoloxía desenvolvida no proxecto Konastigarraga pódense obter combinacións típicas ou significativas dunha palabra. Un caso de aplicación é as apartado Combinacións de palabras do portal de corpus Web de Elhuyar. A información máis detallada deste traballo de investigación atópase no seguinte artigo: Gurrutxaga, A., Alegria, I & Artola, X. (2016) "Caracterización automática da idiomaticidad: combinacións nomee+verbo" en EKAIA - Revista científica e tecnolóxica da Universidade do País Vasco. 10 episodios de Teses Vascas. UPV/EHU. 
