Unité de Langue et Technologie d'Elhuyar en Macédoine, dans le workshop PARFILS/ENeL
Antton Gurrutxaga, membre de l'Unité de Langue et Technologie d'Elhuyar, a assisté en Macédoine les 5 et 6 avril à un workshop sur les unités multi-mots (PARFILS/ENeL workshop on MWE e-lexicons). La représentante du Groupe Ixa de l’UPV/EHU, Uxoa Iñurrieta, a participé à l’atelier qui a uni deux projets européens:
- ENeL - European Network of e-lexicography (http://www.elexicography.eu/)
Antton Gurrutxaga, membre de l'Unité de Langue et Technologie d'Elhuyar, a assisté en Macédoine les 5 et 6 avril à un workshop sur les unités multi-mots (PARFILS/ENeL workshop on MWE e-lexicons). La représentante du Groupe Ixa de l’UPV/EHU, Uxoa Iñurrieta, a participé à l’atelier qui a uni deux projets européens: - ENeL - European Network of e-lexicography (http://www.elexicography.eu/) - PARFILS - Parsing and Multi-word Expressions (http://typo.uni-constanz.de/parfils/) L'ensemble des unités multi-mots est très large, englobant des unités linguistiques très variées, telles que locutions ou expressions idiomatiques (prendre les cheveux, sortir les fèves de la casserole), collocations (attirer l'attention, nouer l'amitié intime), termes multi-mots (vent solaire, livre électronique, condition nécessaire, train à grande vitesse) et expressions (ce qu'il faut voir, apprendre cela). Ces unités ont une grande importance dans des domaines tels que l'enseignement de la langue et la traduction. En fait, ils ne peuvent pas être créés par une combinaison libre de composants, ni dans la plupart des cas traduire des composants. Par conséquent, il est nécessaire de les insérer dans les dictionnaires et de les intégrer dans les outils de traitement automatique du langage. L'objectif du workshop a été de favoriser l'échange de connaissances et la collaboration entre chercheurs de la lexicographie et le traitement de la langue, et d'analyser comment satisfaire et résoudre les besoins et les problèmes de chaque zone à travers les ressources et les outils de l'autre. Elhuyar travaille sur ces deux domaines: d'une part, il édite des dictionnaires et crée des ressources lexicographiques et terminologiques; d'autre part, depuis 2002 il travaille à la recherche dans le traitement de la langue et a développé des outils pour l'extraction automatique d'unités multi-mot de texte. Par exemple : - Le service Itzulterm permet d'extraire les couples de termes bilingues qui ont été utilisés dans une collection de textes bilingues, c'est-à-dire dans un corpus parallèle. - Grâce à la technologie développée dans le projet Konastigarraga, on peut obtenir des combinaisons typiques ou significatives d'un mot. Un cas d'application est la section Combinaisons de mots du portail de corpus Web d'Elhuyar. Les informations les plus détaillées sur ce travail de recherche se trouvent dans l'article suivant: Gurrutxaga, A., Alegria, I Artola, X. (2016) "Caractérisation automatique de l'idiomaticité: combinaisons nom+verbe" à EKAIA - Revue scientifique et technologique de l'Université du Pays Basque. 10 épisodes de Thèse Basque. UPV/EHU. 
