Vés al contingut

La traducció s'ha generat de manera automàtica (elia.eus)

El euskera es la lengua con mayor número de significados en Wiki

El basc és la llengua amb major nombre de significats en Wiki

2019 | octubre 16
  • És el sisè en nombre de línies (lexemes)
  • Segona en nombre de formes de paraules
  • És la llengua principal quant al nombre de significats

Gràcies a la col·laboració d'Euskal Wikilarien Kultur Elkartea i Elhuyar, el basc és el sisè idioma d'entre totes les llengües presents en Wiki, en nombre de línies (lexemes), el segon en nombre de formes verbals (tenint en compte totes les formes que de la declinació de cadascuna d'elles), i és la llengua principal quant al nombre de significats, per davant del anglès, del castellà i del francès, entre altres.

Wliquidata és una gran base de dades editada en col·laboració. És gestionat per la Fundació Wikimedia, perquè pugui ser utilitzat en els seus projectes com alimentar a Wikipedia.

Des de la posada en marxa de la Wlikata en 2012 hem anat alimentant progressivament. Entre altres, fa gairebé dos anys incorporem uns 6.500 conceptes del Diccionari Enciclopèdic de la Ciència i la Tecnologia, així com vídeos de Teknopolis.

En els últims anys, Wliquidata ha començat a guardar nous tipus de dades, en moltes llengües, en una estructura similar als diccionaris. Tota aquesta informació es guarda dividida en tres grups: paraules arrel (entrades de vocabulari o lexemes), formes (formes que cada paraula pot adoptar en funció del cas declinativo), significats o definicions.

 

 

Gràcies a la col·laboració entre l'Associació Cultural Wikilarien Kultur Elkartea i Elhuyar, s'han afegit en Wlikita diverses paraules o lexemes (de la categoria nomeni) del Diccionari de l'Estudiant d'Elhuyar. En total s'han afegit 10.000 lexemes, 65 formes de cadascun (en tots els casos de declinació, singular, plural i indefinit) i les seves definicions.

Gràcies a aquest treball, ara és més fàcil identificar les paraules en basca en textos de Wikipedia, per exemple, i aviat serà possible realitzar nous desenvolupaments tecnològics a partir d'aquestes bases de dades.

El codi de programació desenvolupat per l'equip d'I+D d'Elhuyar per a aquest treball està disponible en GitHub.


Més informació:

Galder Gonzalez Larrañaga @email

Klara Ceberio Berger @email

Contacte

Irune Bengoetxea Lanberri
Komunikazio-arduraduna
943363040 (Ext. 301)