Adimen artifiziala eta hizkuntza-teknologiak
Elhuyar | Zerbitzuak
Adimen artifizialaren arloko teknologia lankidetzan garatzen dute Elhuyarrek eta Orai adimen artifizialeko zentroak. Aliantza horrek aukera ematen digu puntako-puntako ikerketa-eremuak esploratzeko eta haiek zerbitzuetara ekartzeko.
Hona hemen Elhuyarrek garatu eta merkaturatzen dituen zerbitzuak eta produktuak:
Elia, Elhuyarren itzultzaile automatikoa
Urteak daramatza Elhuyarrek itzulpen automatikoko proiektuetan murgilduta. 2007an, esaterako, EHUko Ixa ikerketa-taldearekin batera, Matxin izeneko sistema sortzeko proiektuan parte hartu zuen; euskarazko itzulpen automatikoan mugarri izan zen proiektu hura. Matxin software librean oinarritutako itzulpen automatikoko sistema bat zen, eta gaztelaniatik euskarara itzultzen zuen. Ezaugarri horiek zituen lehen itzultzaile automatikoa izan zen.
Ikerketan aurrera egin ahala, beste teknika batzuk erabili dira itzultzaile automatikoak sortzeko, eta, gaur egun, adimen artifiziala eta sare neuronalak erabiltzen ditugu sistema horiek sortzeko. Itzultzaile automatikoko zerbitzu bat daukagu erabiltzaile eta bezeroen eskura: Elia. Elhuyarren itzultzaile automatikoa Elia, eta ezaugarri nagusi hauek ditu:
- 6 hizkuntza dakizki: euskara, gaztelania, frantsesa, ingelesa, katalana eta galegoa.
- Dokumentu osoak itzultzeko aukera eskaintzen du. Gainera, esaldiz esaldi moldatu daiteke sistemak proposatutako itzulpena.
- Doako aplikazioak eskaintzen ditu: ordenagailuko mahaigainerako eta mugikorretarako.
- Itzulpenak pertsonalizatzeko aukera: hiztegi pertsonalizatu bat gehitu diezaiokezu, hitz edo esaldi batzuk zuk nahi bezala itzul ditzan.
- Testu juridiko-administratiboetarako berariazko sistema bat dauka.
- Itzulpen gidatua eskaintzen du. Hala, proposatzen digun itzulpenaren gainean aldaketak egin daitezke sistemak lagunduta: hitz batean klik egin, eta handik aurrerako zatirako beste proposamen batzuk zerrendatzen dizkigu.
- Itzultzaile profesionalen tresnetan txertatzeko aukera: Wordfast, SDL Trados...
- Konfidentzialtasuna eta segurtasuna: erabiltzaileen datuak eta zerbitzua erabiliz bidalitako informazioa modu seguruan kudeatzen dira.
- REST API bidez, edozein aplikaziotan integra daiteke.
Informazio gehiago, elia.eus webgunean eta info@elia.eus helbidean.
Mugaz gaindiko kooperazioaren garapena eta hizkuntza-teknologien jakintzaren transferentzia (EFA 227/16/LINGUATEC)
|
Proiektuaren helburua da aragoieraren, euskararen eta okzitanieraren digitalizazio-maila hobetuko duten baliabide, tresna eta aplikazio linguistiko berritzaileak garatu, frogatu eta zabaltzea. Proiektu horrek aukera emango du hizkuntzen arteko lankidetza teknologikoa egiteko eta, haren bidez, hizkuntza-baliabide eta -tresna berriak garatzeko, bai eta hiru hizkuntza horien onlineko aplikazio berriak sortzeko eta azken erabiltzaileek edukiak hizkuntza anitzetan eskuragarri izateko ere.
|
Aditu, Elhuyarren hizketa-ezagutzailea
Ahotsaren errekonozimenduko teknologiarekin egindako ikerketen emaitza da Aditu. Bideo- eta audio-fitxategietako ahotsa testu bihurtu eta emaitza horrekin lan egiteko aukera eskaintzen duen plataforma da.
Bideo- eta audio-fitxategien transkribapen automatikoak egiten ditu euskaraz, gaztelaniaz eta ele bietan. Horrez gain, azpitituluak sortzeko aukera ere eskaintzen du. Tresna aparta da ikus-entzunezkoen irisgarritasuna bermatzeko.
Adituk aukera ematen du ikus-entzunezkoen transkribapen eta azpititulu automatikoak lortzeko minutu gutxitan; esaterako, sistema hau baliagarria da bilerak, udaletako osoko bilkurak edo dokumentalak azpititulatzeko.
Adituk eskaintzen dituen aukera nagusiak:
- Euskarazko eta gaztelaniazko jarduna duten ikus-entzunezko fitxategien transkribapen eta azpititulu automatikoak sortzen ditu.
- Azpitituluak eta transkribapenak zuzentzeko edizio-interfaze aurreratua eskaintzen du, erabiltzaileak moldaketak erraz egin ditzan.
- Azpitituluak eta transkribapenak automatikoki itzultzeko aukera eskaintzen du, Eliaren bidez.
- Azpitituluak eta transkribapenak formatu batean baino gehiagotan deskargatzeko aukera ematen du; gainera, azpitituluen kasuan, bideoan txertatuta ere deskargatu daitezke.
- Konfidentzialtasuna eta segurtasuna: erabiltzaileen datuak eta zerbitzua erabiliz bidalitako informazioa modu seguruan kudeatzen dira.
- REST API bidez, edozein aplikaziotan integra daiteke.
Informazio gehiago, aditu.eus webgunean edo aditu@elhuyar.eus helbidean.
Elhuyarren TTS neuronala
Elhuyarrek testua ahots bihurtzeko zenbait sistema eskaintzen ditu ttsneuronala.elhuyar.eus webgunean. Naturalak diruditen ahots sintetikoak dira, eta edozein testu irakurtzen dute. Momentu honetan euskarazko eta gaztelaniazko ahotsak eskaintzen ditu.
Elhuyarrek zenbait TTS ahots sortu ditu, eta erabiltzaileen eta bezeroen esku jarri. Alde batetik, identifikagarriak ez diren ahotsak sortu ditu, hots, entzutean pertsona zehatz batekin identifikatu ezin diren ahotsak. Beste alde batetik, pertsona zehatzen ahotsa imitatzeko sistemak ere sortu ditu; beraz, ahots pertsonalizatuak sortzeko aukera ere eskaintzen du.
TTS ahots pertsonalizatuak erabiltzen dira Elhuyarren beste zerbitzu hauetan: Elhuyar Hiztegia, Elhuyar Aldizkaria eta zientzia.eus webgunea.
Modu bat baino gehiago daude eskaintzen diren ahotsak erabiltzeko: barra irakurlearen bitartez, webguneko zerbitzuaren bitartez edo REST API bidezko integrazioaren bitartez.
Informazio gehiago, ttsneuronala.elhuyar.eus webgunean eta tts@elhuyar.eus helbidean
Soluzio adimendun gehiago
Adimen artifizialean eta hizkuntza-teknologietan, bestelako proiektuak ere garatzen ditugu; hala nola terminologiaren eta ezagutzaren erauzketa automatikoa, datu linguistikoen kudeaketa eta sorkuntza aurreratua, humanitate digitalei lotutako soluzioak eta hizkuntzaren kudeaketa adimendun eta aurreraturako zerbitzuak.
- Proiektu horietako bat LINGUATEC IA da, adimen artifizialaren bidez aragoiera, euskara, katalana eta okzitaniera digitalizatzen aurrera egiteko proiektua. Hizkuntza horietan hizkuntza-eredu sortzaile berriak aplikatzea du helburu proiektuak, zeina Elhuyarrek lideratzen baitu (Orai adimen artifizialeko zentroaren bidez) eta EGEFen finantzaketa jaso baitu (POCTEFA 2021-2027 programaren bitartez).
- 2022ko urrian hasi eta 2024ko maiatzera bitartean martxan egon den proiektua da Deep Learning-a, azpititulazio-sistema eta bikoizketa automatiko eleaniztuna garatzeko proiektua. Europar Batasuneko – NextGenerationEU funtsen bidez finantziatu da.
