Aller au contenu principal

La traduction a été créée automatiquement (elia.eus)

El euskera es la lengua con mayor número de significados en Wiki

L'euskera est la langue avec le plus grand nombre de significations dans Wiki

2019 | octobre 16
  • C'est le sixième nombre de lignes (lexèmes)
  • Deuxième en nombre de formes de mots
  • C'est la langue principale quant au nombre de significations

Grâce à la collaboration d'Euskal Wikilarien Kultur Elkartea et Elhuyar, l'euskera est la sixième langue parmi toutes les langues présentes sur Wiki, en nombre de lignes (lexèmes), le second en nombre de formes verbales (en tenant compte de toutes les formes que de la déclinaison de chacune d'elles), et c'est la langue principale en ce qui concerne le nombre d'autres significations françaises.

Wliquidata est une grande base de données éditée en collaboration. Il est géré par la Wikimedia Foundation, afin qu'il puisse être utilisé dans ses projets comme nourrir Wikipedia.

Depuis la mise en service de la Wlikata en 2012, nous avons progressivement alimenté. Entre autres, il y a près de deux ans, nous avons incorporé environ 6500 concepts du Dictionnaire encyclopédique de la science et de la technologie, ainsi que des vidéos de Teknopolis.

Ces dernières années, Wliquidata a commencé à enregistrer de nouveaux types de données, dans de nombreuses langues, dans une structure similaire aux dictionnaires. Toutes ces informations sont divisées en trois groupes : mots racine (entrées de vocabulaire ou lexèmes), formes (formes que chaque mot peut adopter en fonction du cas déclinatif), significations ou définitions.

 

 

Grâce à la collaboration entre l'Association culturelle Wikilarien Kultur Elkartea et Elhuyar, plusieurs mots ou lexèmes (de la catégorie nom) du Dictionnaire de l'étudiant d'Elhuyar ont été ajoutés à Wlikita. Au total, 10.000 lexèmes ont été ajoutés, 65 formes de chacun (dans tous les cas de déclin, singulier, pluriel et indéfini) et leurs définitions.

Grâce à ce travail, il est maintenant plus facile d'identifier les mots en basque dans des textes de Wikipedia, par exemple, et bientôt il sera possible de réaliser de nouveaux développements technologiques à partir de ces bases de données.

Le code de programmation développé par l'équipe de R & D d'Elhuyar pour ce travail est disponible sur GitHub.


Plus d'informations:

Galder Gonzalez Larrañaga prentsa@wikimedia.eus

Klara Ceberio Berger k.ceberio@elhuyar.eus