O eúscaro é a lingua con maior número de significados en Wiki
- É o sexto en número de liñas (lexemas)
- Segunda en número de formas de palabras
- É a lingua principal en canto ao número de significados
Grazas a a colaboración de Euskal Wikilarien Kultur Elkartea e Elhuyar, o eúscaro é o sexto idioma de entre todas as linguas presentes en Wiki, en número de liñas (lexemas), o segundo en número de formas verbais (tendo en conta todas as formas que da declinación de cada una delas), e é a lingua principal en canto ao número de significados, por diante do inglés, do castelán e do francés, entre outras.
Wliquidata é una gran base de datos editada en colaboración. Está xestionado pola Fundación Wikimedia, para que poida ser utilizado nos seus proxectos como alimentar a Wikipedia.
Desde a posta en marcha da Wlikata en 2012 fomos alimentando progresivamente. Entre outros, hai case dous anos incorporamos uns 6.500 conceptos do Dicionario Enciclopédico da Ciencia e a Tecnoloxía, así como vídeos de Teknopolis.
Nos últimos anos, Wliquidata empezou a gardar novos tipos de datos, en moitas linguas, nunha estrutura similar aos dicionarios. Toda esta información se garda dividida en tres grupos: palabras raíz (entradas de vocabulario ou lexemas), formas (formas que cada palabra pode adoptar en función do caso declinativo), significados ou definicións.

Grazas á colaboración entre a Asociación Cultural Wikilarien Kultur Elkartea e Elhuyar, engadíronse en Wlikita varias palabras ou lexemas (da categoría nomee) do Dicionario do Estudante de Elhuyar. En total engadíronse 10.000 lexemas, 65 formas de cada un (en todos os casos de declinación, singular, plural e indefinido) e as súas definicións.
Grazas a este traballo, agora é máis fácil identificar as palabras en eúscaro en textos de Wikipedia, por exemplo, e pronto será posible realizar novos desenvolvementos tecnolóxicos a partir destas bases de datos.
O código de programación desenvolvido polo equipo de I+D de Elhuyar paira este traballo está dispoñible en GitHub..

Máis información:
Galder Gonzalez Larrañaga @email
Klara Ceberio Berger @email