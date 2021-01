Une collection unique d’archives sonores de langues rares ou en danger est aujourd’hui accessible à tous sur le site de la collection Pangloss. Plusieurs milliers de contes et récits se laissent entendre dans plus de 170 langues recueillies et documentées grâce au travail de linguistes passionnés.

Connaissez-vous l’oubykh, cette langue caucasienne que la poussée russe dans la région depuis la fin du XIXe siècle a lentement et sûrement conduit au déclin, puis à la disparition ? Avez-vous jamais entendu une chanson en na, un idiome sino-tibétain toujours parlé dans les montagnes du Sichuan, région de Chine située à l’est du Tibet où le mandarin s’impose peu à peu comme la langue unique ? Avec 170 autres, ces dialectes méconnus sont aujourd’hui à portée de toutes les oreilles grâce au site Pangloss, une collection unique d’archives sonores de langues rares ou en danger, que le patient travail de linguistes de terrain a permis de recueillir.

« Sur les 6 000 langues que l’on dénombre aujourd’hui dans le monde, plusieurs milliers sont insuffisamment ou pas du tout documentées, raconte Alexis Michaud, linguiste au Lacito (Langues et civilisation à tradition orale) , le laboratoire à l’origine de la collection Pangloss. Ce sont des langues sans écriture pour lesquelles il n’existe ni dictionnaire ni corpus grammatical. » Des linguistes et ethnologues passionnés tentent de combler ce manque, en enregistrant contes et récits de la tradition orale, afin de pouvoir les retranscrire phonétiquement et en percer tous les secrets. « Documenter une langue représente généralement le travail d’une vie pour un linguiste », témoigne le chercheur.

25 langues s’éteignent chaque année

Jusqu’à l’arrivée du numérique, le travail des scientifiques donnait lieu à la publication de grammaires et de dictionnaires et, plus ponctuellement, de livres de récits traduits à destination du grand public, tandis que les bobines finissaient leur vie sur des étagères ou se perdaient à tout jamais. La collection Pangloss démarrée il y a plus de vingt ans veut pallier ce manque, en numérisant ce trésor sonore et en l’ouvrant au plus grand nombre : les linguistes et chercheurs du monde entier auxquels le site bilingue français-anglais réserve un espace et des outils dédiés, mais aussi et c’est nouveau, les simples amateurs.

Il y a urgence, alors que la biodiversité linguistique connaît le même sort que les écosystèmes : on estime que 25 langues s’éteignent chaque année, et qu’au moins un tiers des langues parlées sur la planète pourrait avoir disparu d’ici à la fin du siècle. La faute à la globalisation, qui voit les langues des dominants prendre le dessus sur les langues locales – c’est le cas de l’espagnol en Amérique latine, du mandarin en Chine, du wolof au Sénégal, du vietnamien au Vietnam pourtant riche de dizaines de langues... Mais pas que : le changement climatique, en poussant des populations hors de leurs territoires, accentue encore le phénomène.

Conversation en langue ixcatèque du Mexique À propos Partager À propos Fermer Description: Conversation en langue ixcatèque. L’ixcatèque n’est parlé que dans le seul village de Santa María Ixcatlán (État d’Oaxaca), dans la zone montagneuse de la Mixteca Alta.

« Historiquement, les endroits où la diversité des langues est la plus grande sont des régions isolées, comme les régions montagneuses, par exemple, ou les régions de forêt dense comme l’Amazonie ou la Papouasie Nouvelle-Guinée – dans cette dernière, on dénombre plus de 800 langues différentes ! explique Alexis Michaud. Avec la hausse des températures, ces territoires menacent de devenir inhabitables – c’est déjà le cas de certaines régions himalayennes où la fonte des glaciers pousse les habitants à émigrer vers les plaines et les villes où elles perdent progressivement l’usage de leur langue maternelle. »

Une collection de 3 500 documents sonores et vidéos

Afin de sauvegarder cette richesse menacée, 3 500 documents sonores mais aussi vidéos enregistrés par plus de 50 linguistes sont déjà disponibles sur le site Pangloss, qui espère s’enrichir encore dans les mois et les années qui viennent. « Il faut que les chercheurs prennent l’habitude de mettre leurs archives sonores en ligne au fur et à mesure de leurs travaux, plutôt que d’attendre la fin de leur carrière pour s’y atteler, insiste le linguiste. Tant pis si toutes n’ont pas encore de transcription écrite. » Pour y remédier, Pangloss promet de mettre à disposition dans le courant de l’année 2021 un logiciel de traitement automatisé du langage qui devrait grandement leur faciliter la tâche. « Jusqu’ici, il fallait une centaine d’heures d’enregistrement au moins pour entraîner une intelligence artificielle à faire des transcriptions dans une nouvelle langue. Avec l’interface que nous préparons pour le site sur la base des derniers outils disponibles, une heure d’enregistrement suffira, c’est une vraie révolution », s’enthousiasme le chercheur.

Développé sur le principe de la science ouverte – les documents mis en ligne sont sous licence Creative Commons et tout le monde peut y piocher à sa guise –, Pangloss se veut aussi « prudemment collaboratif ». « Les documents ne seront pas modifiables directement, comme sur Wikipedia, mais nous accueillerons avec plaisir les suggestions et les propositions d’aide, d’où qu’elles viennent. Notamment pour la traduction des documents qui n’en disposent pas encore », indique Alexis Michaud. L’une des nombreuses pépites du site, un récit recueilli par le linguiste et académicien Georges Dumézil dans les années 1960 auprès du tout dernier locuteur oubykh (« La chair du poisson rend intelligent »), a pu être transcrit et traduit grâce au concours inattendu d’un étudiant... californien : celui-ci avait appris cette langue disparue en autodidacte grâce au dictionnaire et aux textes publiés par le même Dumézil. ♦

