Elhuyarreko Hizkuntza eta Teknologia unitatea Mazedonian, PARSEME/ENeL workshopean
Elhuyarreko Hizkuntza eta Teknologia unitateko kide Antton Gurrutxaga Mazedonian izan da apirilaren 5ean eta 6an, hitz anitzeko unitateen inguruko workshop batean (PARSEME/ENeL workshop on MWE e-lexicons). EHUko Ixa Taldearen ordezkari Uxoa Iñurrietak ere hartu du parte Europako bi proiektu hauek batu dituen tailerrean:
- ENeL - European Network of e-lexicography (http://...
Elhuyarreko Hizkuntza eta Teknologia unitateko kide Antton Gurrutxaga Mazedonian izan da apirilaren 5ean eta 6an, hitz anitzeko unitateen inguruko workshop batean (PARSEME/ENeL workshop on MWE e-lexicons). EHUko Ixa Taldearen ordezkari Uxoa Iñurrietak ere hartu du parte Europako bi proiektu hauek batu dituen tailerrean:
- ENeL - European Network of e-lexicography (http://www.elexicography.eu/)
- PARSEME - Parsing and Multi-word Expressions (http://typo.uni-konstanz.de/parseme/)
Hitz anitzeko unitateen multzoa oso da zabala, eta era askotako hizkuntza-unitateak hartzen ditu bere barnean: besteak beste, lokuzioak edo esapide idiomatikoak (adarra jo, babak eltzetik atera), kolokazioak (atentzioa eman, adiskide min), hitz anitzeko terminoak (eguzki-haize, liburu elektroniko, beharrezko baldintza, abiadura handiko tren), eta esaerak (zer ikusi, hura ikasi).
Horrelako unitateek garrantzi handia dute hainbat arlotan, hala nola hizkuntzaren irakaskuntzan eta itzulpengintzan. Izan ere, ezin dira osagaiak modu librean konbinatuz sortu, ezta, gehienetan, osagaiz osagai itzuli ere. Horregatik, beharrezkoa da hiztegietan sartzea eta hizkuntza automatikoki prozesatzeko tresnetan integratzea.
Workshoparen helburua izan da lexikografiaren eta hizkuntzaren prozesamenduko ikertzaileen arteko jakintza-trukea eta lankidetza sustatzea, eta arlo bakoitzak dituen beharrak eta arazoak bestearen baliabide eta tresnen bidez nola ase eta konpon litezkeen aztertzea.
Elhuyarrek bi arlo horietan egiten du lan: batetik, hiztegiak argitaratzen ditu, eta baliabide lexikografikoak zein terminologiak sortzen; bestetik, hizkuntzaren prozesamenduaren arloko ikerketan dihardu 2002az geroztik, eta testuetatik hitz anitzeko unitateak automatikoki erauzteko tresnak garatu ditu. Esaterako:
- Itzulterm zerbitzuaren bidez, testu elebidunen bilduma batean (hau da, corpus paralelo batean) erabili diren termino-bikote elebidunak erauz ditzakegu.

- Konbitz proiektuan garatutako teknologiaren bidez, hitz baten konbinazio ohikoak edo esanguratsuak atera daitezke. Horren aplikazio-kasu bat da Elhuyarren Web-corpusen atariko Hitz-konbinazioak atala. Artikulu honetan dago ikerkuntza-lan horren informazio zehatzagoa: Gurrutxaga, A., Alegria, I & Artola, X. (2016) "Idiomatikotasunaren karakterizazio automatikoa: izena+aditza konbinazioak" in EKAIA - Euskal Herriko Unibertsitateko zientzi eta teknologi aldizkaria. Euskal Tesien 10 pasarte. EHU.
