DABILENA, el portal de análisis del euskera utilizado en Internet
- La web que consulta textos reales como si fueran diccionarios
Elhuyar ha elaborado el portal de corpus Dabilena, disponible para todo el público en dabilena.elhuyar.eus. Este portal permite hacer búsquedas en gran parte de los textos escritos en euskera en los últimos años en Internet, es decir, búsquedas sobre el uso real del euskera.
El sitio web Dabilena cuenta con tres secciones principales: ‘Non erabili da?’(¿Dónde se ha utilizado?), ‘Nola itzuli da?’ (¿Cómo se ha traducido?) y ‘Zer hitzekin konbinatzen da?’ (¿Con qué palabras se combina?').
En el apartado ‘Non erabili da?’, podremos ver en qué web y en qué contexto ha aparecido la palabra que buscamos.

En el apartado ‘Nola itzuli da?’, se puede consultar el corpus bilingüe. De este modo, las búsquedas se pueden hacer tanto en euskera como en castellano y Dabilena nos mostrará ejemplos de ambos. En primer lugar, nos mostrará una relación de las traducciones de la palabra consultada y, debajo, los ejemplos de los dos idiomas en su contexto.

El apartado ‘Zer hitzekin konbinatzen da?’ sirve para consultar con qué palabras se utiliza una palabra determinada. Por ejemplo, podemos consultar con qué palabras se utiliza más el sustantivo aurrerapen.

También se pueden hacer búsquedas comparativas, es decir, comparar el uso de dos variantes en el portal Dabilena. Así podemos consultar, por ejemplo, cuál de estas dos palabras tiene más presencia en Internet: boluntario o bolondres.

No podemos dejar de mencionar otra herramienta muy útil que hemos incluido en el portal. El portal Dabilena permite, con su apartado ‘Corpus gehiago’, consultar simultáneamente varios corpus disponibles en Internet.

Dabilena es la herramienta perfecta para profesionales de la lengua como traductores, lingüistas o profesores de euskera, así como para aquellos que crean recursos lingüísticos y desarrollan tecnologías lingüísticas para dichos profesionales.
Corpus de texto
Este portal tiene como objetivo la recopilación automática de los textos necesarios para el análisis del euskera utilizado en Internet (corpus de web) y, una vez procesados con herramientas de tecnología lingüística, ponerlos a disposición de los usuarios para su consulta.
Los corpus de textos son, hoy en día, la herramienta indispensable para varios de los ámbitos y actividades relacionados con la lengua, como la lexicografía, la traducción, la enseñanza de idiomas, la lingüística y el desarrollo de tecnologías lingüísticas.
Han transcurrido nueve años desde que Elhuyar iniciara la de elaboración de corpus web en euskera y, desde entonces, no ha cejado en el desarrollo de tecnologías de recopilación y explotación de corpus. Además, Internet ha visto incrementado notablemente el volumen de textos en euskera, que son cada vez más diversos. De ahí que Dabilena haya incorporado corpus de mayor tamaño, nuevas funcionalidades y sistemas de consulta innovadores.
Colaboradores y patrocinadores
Para acabar, queremos hacer mención a los colaboradores que nos han acompañado en este proceso. Destacar, por un lado, la labor realizada por el Grupo IXA en el procesamiento del corpus y, por otro, los patrocinadores que han hecho posible este trabajo: Laboral Kutxa y la Diputación Foral de Gipuzkoa.