Intelixencia artificial e tecnoloxías da lingua
Elhuyar | Zerbitzuak
Elhuyar e o centro de intelixencia artificial Orai traballan conxuntamente para desenvolver a tecnoloxía do ámbito da intelixencia artificial. Esta alianza permítenos explorar campos de investigación punteiros, para despois trasladar os resultados aos servizos.
Estes son os servizos e produtos desenvolvidos e comercializados por Elhuyar:
Elia, o tradutor automático de Elhuyar
Elhuyar conta cunha experiencia de moitos anos de traballo en proxectos de tradución automática. En 2007, por exemplo, participou xunto ao equipo de investigación Ixa da UPV/EHU no proxecto de creación do sistema denominado Matxin, un fito na tradución automática en eúscaro, que consistía nun sistema de tradución automática baseado en software libre que traducía do castelán ao eúscaro. Foi o primeiro tradutor automático desas características.
A medida que se avanzou na investigación, fóronse incorporando outras técnicas para a creación de tradutores automáticos, que na actualidade baséanse na intelixencia artificial e nas redes neuronais. Ofrecemos un servizo de tradución automática a disposición de usuarios e clientes: Elia. Elia, o tradutor automático de Elhuyar, conta coas seguintes características:
- Fala 6 idiomas: eúscaro, castelán, francés, inglés, catalán e galego.
- Permite traducir documentos completos. Ademais, permite modificar frase a frase a tradución proposta polo sistema.
- Ofrece aplicacións gratuítas tanto como para o escritorio do computador como para móbiles.
- Ofrece a posibilidade de personalizar as traducións: pódeselle engadir un dicionario personalizado para que traduza determinadas palabras ou frases conforme ás preferencias de cada usuario.
- Conta cun sistema específico para os textos xurídico-administrativos.
- Ofrece tradución guiada. Os usuarios poden así realizar cambios na tradución proposta polo sistema, coa axuda deste: pulsando sobre unha palabra, o sistema ofrecerá distintas posibilidades para o texto inmediatamente posterior a devandita palabra.
- Integración en ferramentas de tradutores profesionais: Wordfast, SDL Trados...
- Confidencialidade e seguridade: os datos dos usuarios e a información enviada a través do servizo xestiónanse de forma segura.
- Grazas ao seu REST API, pódese integrar en calquera aplicación.
Máis información en elia.eus e en info@elia.eus
Desenvolvemento da cooperación transfronteiriza e a transferencia de coñecemento en tecnoloxías da lingua (EFA 227/16/LINGUATEC)
|
O proxecto ten como obxectivo desenvolver, demostrar e difundir novos recursos, ferramentas e aplicacións lingüísticas innovadoras que melloren o nivel de dixitalización do aragonés, do eúscaro e do occitano. O Proxecto vai permitir a cooperación tecnolóxica entre linguas para desenvolver novos recursos e ferramentas lingüísticas, así como novas aplicacións on-line para facilitar o uso das tres linguas e o acceso multilingüe a contidos por parte dos usuarios finais. Financiamento:
|
Aditu, o reconocedor da fala de Elhuyar
Aditu é o resultado de investigacións realizadas con tecnoloxía de recoñecemento de voz. É unha plataforma que permite converter en texto a voz de ficheiros de vídeo e audio, para despois poder editar o resultado obtido.
Realiza transcricións automáticas de ficheiros de vídeo e audio en eúscaro e en castelán, así como de ficheiros bilingües. Permite así mesmo a creación de subtítulos automaticamente, polo que se trata dunha ferramenta ideal para garantir a accesibilidade nos produtos audiovisuais.
Aditu permite a transcrición e subtitulación automática de audiovisuais en poucos minutos, o que o converte nun sistema moi útil para a subtitulación de reunións, plenos municipais ou documentais.
Estas son as principais funcións que ofrece Aditu:
- Transcricións e subtítulos automáticos de ficheiros audiovisuais con intervencións en eúscaro e en castelán.
- Conta cunha interfaz de edición avanzada para a corrección de subtítulos e transcricións, que permite ao usuario realizar facilmente as adaptacións necesarias.
- Permite a tradución automática de subtítulos e transcricións a través do tradutor automático Elia.
- Permite a descarga de subtítulos e transcricións en diferentes formatos e, no caso dos subtítulos, tamén se pode descargar o vídeo cos subtítulos xa inseridos.
- Confidencialidade e seguridade: os datos dos usuarios e a información enviada a través do servizo xestiónanse de forma segura.
- Grazas ao seu REST API, pódese integrar en calquera aplicación.
Máis información no sitio web aditu.eus ou en aditu@elhuyar.eus
TTS neuronal de Elhuyar
Elhuyar ofrece varios sistemas de conversión de texto en voz na web ttsneuronala.elhuyar.eus. Trátase de voces sintéticas que soan naturais e son capaces de ler calquera texto. Actualmente, ofrece voces en eúscaro e en castelán.
En Elhuyar creamos varias voces TTS e puxémolas a disposición de usuarios e clientes. Por unha banda, xeramos voces que non son identificables, é dicir, voces que ao ser escoitadas non nos remiten a unha persoa concreta. Doutra banda, tamén creamos sistemas que imitan a voz de persoas concretas, polo que ofrecemos tamén a posibilidade de crear voces personalizadas.
Utilízanse voces personalizadas TTS nos seguintes servizos de Elhuyar: O dicionario Elhuyar, a revista Elhuyar e o sitio web zientzia.eus.
Existen varias formas de utilizar as voces dispoñibles: a través da barra lectora, do servizo da web ou integrándoas mediante a REST API.
Máis información na web ttsneuronala.elhuyar.eus e en tts@elhuyar.eus
Máis solucións intelixentes
Desenvolvemos tamén outros proxectos de intelixencia artificial e tecnoloxías da linguaxe, como a extracción automática de terminología e coñecemento, a xestión e creación avanzada de datos lingüísticos, solucións ligadas ás humanidades dixitais e servizos para a xestión intelixente e avanzada da linguaxe.
- Un deses proxectos é LINGUATEC IA, un proxecto para avanzar na dixitalización do aragonés, catalán, euskera e occitano, mediante a intelixencia artificial. Cofinanciado por FEDER a través do Programa POCTEFA 2021-2027 e liderado por Elhuyar (a través do seu centro de intelixencia artificial Orai), ten o obxectivo de aplicar novos modelos de linguaxe xenerativos nestas linguas.
- O proxecto Deep Learning para o desenvolvemento dun sistema de subtitulación e dobraxe automática multilingüe comezou en outubro de 2022 e terminou en maio de 2024. O proxecto foi financiado pola Unión Europea – NextGenerationEU.
