El basc és la llengua amb major nombre de significats en Wiki
- És el sisè en nombre de línies (lexemes)
- Segona en nombre de formes de paraules
- És la llengua principal quant al nombre de significats
Gràcies a la col·laboració d'Euskal Wikilarien Kultur Elkartea i Elhuyar, el basc és el sisè idioma d'entre totes les llengües presents en Wiki, en nombre de línies (lexemes), el segon en nombre de formes verbals (tenint en compte totes les formes que de la declinació de cadascuna d'elles), i és la llengua principal quant al nombre de significats, per davant del anglès, del castellà i del francès, entre altres.
Wliquidata és una gran base de dades editada en col·laboració. És gestionat per la Fundació Wikimedia, perquè pugui ser utilitzat en els seus projectes com alimentar a Wikipedia.
Des de la posada en marxa de la Wlikata en 2012 hem anat alimentant progressivament. Entre altres, fa gairebé dos anys incorporem uns 6.500 conceptes del Diccionari Enciclopèdic de la Ciència i la Tecnologia, així com vídeos de Teknopolis.
En els últims anys, Wliquidata ha començat a guardar nous tipus de dades, en moltes llengües, en una estructura similar als diccionaris. Tota aquesta informació es guarda dividida en tres grups: paraules arrel (entrades de vocabulari o lexemes), formes (formes que cada paraula pot adoptar en funció del cas declinativo), significats o definicions.

Gràcies a la col·laboració entre l'Associació Cultural Wikilarien Kultur Elkartea i Elhuyar, s'han afegit en Wlikita diverses paraules o lexemes (de la categoria nomeni) del Diccionari de l'Estudiant d'Elhuyar. En total s'han afegit 10.000 lexemes, 65 formes de cadascun (en tots els casos de declinació, singular, plural i indefinit) i les seves definicions.
Gràcies a aquest treball, ara és més fàcil identificar les paraules en basca en textos de Wikipedia, per exemple, i aviat serà possible realitzar nous desenvolupaments tecnològics a partir d'aquestes bases de dades.
El codi de programació desenvolupat per l'equip d'I+D d'Elhuyar per a aquest treball està disponible en GitHub.

Més informació:
Galder Gonzalez Larrañaga @email
Klara Ceberio Berger @email