CNRS Le journal
Publié sur CNRS Le journal (https://lejournal.cnrs.fr)

Accueil > Un laboratoire mobile pour les langues parlées de France

Un laboratoire mobile pour les langues parlées de France

Vous êtes ici
Accueil [1]
Sociétés [2]
sciences du langage [3]
-A [4] +A [4]
article

Un laboratoire mobile pour les langues parlées de France

16.05.2022, par
Martin Koppe [5]
Temps de lecture : 6 minutes
Écouter-Parler a ouvert ses portes les 19 et 20 mars 2022 pour l'inauguration de la Cité internationale de la langue française, à Villers-Cotterêts, dans l'Aisne.
DGLFLF
Des scientifiques sillonnent la France à bord d’un camion entièrement équipé pour enregistrer et restituer la richesse du langage parlé en France. Un étonnant projet à découvrir les 18 et 19 mai sur le Campus Condorcet, à Aubervilliers, lors de la nouvelle édition des Innovatives SHS, salon de la valorisation en sciences humaines et sociales organisé par le CNRS.

Si l’idée de partir documenter des langues évoque de grandes expéditions internationales, cette mission peut aussi s’effectuer en sillonnant les routes de France en camion. Le projet Écouter-Parler [6] se présente comme le laboratoire mobile des langues, avec à bord tout le matériel nécessaire. Il vise à constituer un corpus de la voix enregistrée afin de la décrire et de la modéliser, et ainsi assurer la conservation et la valorisation du langage du quotidien. Objectif : contribuer à créer la plus large base de données sur les langues parlées en France.

« Écouter-Parler est un dispositif atypique qui nous permet d’aller au contact des gens tout en restant reliés à nos plateformes technologiques », explique Olivier Baude, professeur de sciences du langage à l’université Paris-Nanterre, membre du laboratoire Modèles, dynamiques, corpus (MoDyCo) et responsable scientifique d’Écouter-Parler à la Délégation générale à langue française et aux langues de France (DGLFLF, ratachée au ministère de la Culture). L’ère du numérique a largement simplifié la collecte, le stockage, l’étude et la diffusion des documents sonores, offrant des outils dont les linguistes se saisissent peu à peu. Les données recueillies sont ainsi traitées pour en faciliter l’accès et la réutilisation selon les pratiques actuelles de la science ouverte. 

Explorer la diversité du langage

« La langue parlée existe sous de très nombreuses formes différentes, c’est ce qu’étudie la linguistique variationniste, poursuit Olivier Baude. La langue change en effet selon les lieux, et ce au-delà de la seule question de l’accent, avec des régionalismes ou des syntaxes particulières. Des variations apparaissent selon les époques et les groupes sociaux, mais aussi selon des contextes et les moyens de communication. » Ainsi, on ne parle pas de la même manière à un ami au téléphone que lorsque l’on est en face d’un recruteur.

Conférence par Ferdinand Brunot à la faculté de lettres de la Sorbonne (fin XIXe siècle).
CNRS Le Journal
Conférence par Ferdinand Brunot à la faculté de lettres de la Sorbonne (fin XIXe siècle).
Archives Charmet / Bridgeman Images
Archives Charmet / Bridgeman Images
Partager
Partager
[7] [8] [9]

L’idée d’explorer cette diversité du langage à l’échelle de la France remonte au début du XXe siècle, avec les travaux du linguiste Ferdinand Brunot (1860-1938). « Jusqu’alors, les chercheurs travaillaient uniquement sur des documents écrits, souvent très uniformes, précise Olivier Baude. Dans les archives de la parole, son grand projet démarré en 1911, Ferdinand Brunot a réalisé les tout premiers enregistrements dédiés à la linguistique, et permis de travailler sur les formes orales des langues avec, pour la première fois, la possibilité de réécouter ce qu’il avait entendu sur le terrain. »

Ferdinand Brunot a ainsi parcouru la France pour enregistrer langues, dialectes et patois, aussi bien auprès de personnalités que de gens ordinaires au lavoir ou au café. La Première Guerre mondiale a cependant mis fin à son projet. Ses enregistrements ont été transférés en 1938 à la phonothèque nationale de la BNF, tout juste créée par Jean Zay, alors ministre de l’Éducation nationale et futur fondateur du CNRS. Ils ont depuis été numérisés et sont librement accessibles sur Gallica [10]. Le CNRS s’est également doté de sa propre plateforme dédiée à l’archivage des documents sonores au début des années 2000 : CoCOon [11] (pour Collection de corpus oraux numérisés). Celle-ci est hébergée au sein de l’infrastructure de recherche Huma-Num qui permet la conservation, le traitement et l’accès aux données de la recherche en sciences humaines et sociales.

Réaliser un « portrait sonore » de la France

« Ferdinand Brunot, déjà, tenait à faire entendre aux gens leurs propres enregistrements, souligne Olivier Baude, alors que les rouleaux de cire étaient si fragiles qu’ils s’abîmaient au bout de seulement quatre ou cinq écoutes. Il voulait vraiment rendre aux personnes enregistrées l’accès à ce savoir. » Le camion d’Écouter-Parler partage cet esprit et combine à sa vocation scientifique une mission de médiation, en permettant de faire écouter les enregistrements et de naviguer, grâce à un écran tactile, au travers d’énormes ressources sur les langues parlées en France. L’artiste Guykayser [12] a même été associé à cette facette d’Écouter-Parler pour améliorer l’expérience pour le grand public.

De nombreux partenaires sont d’ailleurs impliqués dans cette aventure au contact des territoires et de la diversité linguistique française : le ministère de la Culture et sa DGLFLF, à l’initiative du projet et qui le porte avec le CNRS, la Maison européenne des sciences de l’homme et de la société (MESHS), MoDyCo et les partenaires du pacte linguistique de la Région Hauts-de-France [13].

L'aménagement intérieur du camion permet d'accueillir du public pour des activités de médiation scientifique.
CNRS Le Journal
L'aménagement intérieur du camion permet d'accueillir du public pour des activités de médiation scientifique.
DGLFLF
DGLFLF
Partager
Partager
[7] [14] [9]

« Ensemble, nous voulons dessiner un vaste portrait sonore de la France », s’enthousiasme Olivier Baude. Ce travail se manifeste d’abord par une phase de collecte grâce au matériel d’enregistrement installé dans le camion. La parole y est enregistrée sous forme d’interviews, mais aussi de discussions plus libres. Le camion suivra des « tournées » coordonnées par Thomas Chretien qui réalise une thèse sur les sciences participatives, en commençant par les Hauts-de-France pour étudier le picard, mais pourra également servir à des projets parallèles, par exemple liés à la mémoire d’un lieu ou d’un évènement précis.

Un intérêt pour la technologie

« En plus de la recherche et de la médiation, Écouter-Parler touche à de véritables enjeux technologiques, insiste Olivier Baude. Les assistants vocaux et les traducteurs automatiques se sont largement répandus, et nous voulons vérifier s’ils sont affectés par les accents ou les variations sociales du langage. » La collecte sert ainsi dans le cadre du projet Voice Lab [15], qui a récemment reçu une aide de 4,7 millions d’euros de la Banque publique d’investissements. Ce regroupement de start-up et de laboratoires de recherche, qui travaillent sur les technologies du langage, vise à constituer d’importantes ressources sur le français. « Sans cela, les Gafam continueraient d’avoir un quasi-monopole sur les grandes bases de données, indispensables à l’entraînement des intelligences artificielles », déplore Olivier Baude.

Pour l’instant, le camion circulera principalement en région Hauts-de-France et en métropole, mais l’équipe espère que le projet se déploiera également en outre-mer, puis hors du territoire national à la découverte de la francophonie. Considéré comme un prototype, il pourra également servir d’exemple pour d’autres laboratoires itinérants en linguistique et dans diverses disciplines. Son prochain arrêt sera à Aubervilliers, les 18 et 19 mai, afin de participer au salon Innovatives SHS 2022, organisé par le CNRS. ♦

Pour en savoir plus
Le site du salon Innovatives SHS [16], 18 et 19 mai 2022, Campus Condorcet, Aubervilliers
 

Voir aussi

Sociétés
Blog
28/05/2025
Protectionnisme et croissance, une question d’équilibre(s) [17]
Blog
25/05/2025
Nouvelles inscriptions au registre Mémoire du monde de l’UNESCO [18]
[19]
Article
19/05/2025
Énergies : le mythe de la transition [19]
[20]
Article
12/05/2025
Une nouvelle vitrine pour la sono mondiale [20]
Panier de battage de la soie, en Thaïlande © kavee29 / Shutterstock.com
[21]
Blog
30/05/2002
Tisser l’histoire méconnue des soies « sauvages » [21]
sciences du langage
© SIGN-HUB Consortium / Vincenza Iadevaia Gökgöz, Bogazici Univ., Istanbul – CC BY-NC-SA 4.0
[22]
Article
16/04/2025
Toute la richesse des langues des signes à portée de clic [22]
innovatives shs
[23]
Blog
15/05/2019
Un salon pour valoriser les recherches en SHS [23]
Image d'un klérotérion en pierre avec, en fond, les plans de la restitution archéologique
[24]
Vidéo
18/05/2017
La machine qui tirait au sort les citoyens d’Athènes [24]

Mots-clés

innovatives shs [25] Écouter-Parler [26] langues [27] camion [28] laboratoire mobile [29] documents sonores [30] linguistique variationniste [31] Ferdinand Brunot [32] CoCOon [33] Hauts-de-France [34] patois [35] bases de données [36]

Partager cet article

[37]
[38]
[7]
[9]

URL source:https://lejournal.cnrs.fr/articles/un-laboratoire-mobile-pour-les-langues-parlees-de-france

Liens
[1] https://lejournal.cnrs.fr/ [2] https://lejournal.cnrs.fr/societes [3] https://lejournal.cnrs.fr/sciences-du-langage [4] https://lejournal.cnrs.fr/javascript%3A%3B [5] https://lejournal.cnrs.fr/auteurs/martin-koppe [6] https://ecouter-parler.fr/ [7] https://twitter.com/intent/tweet?url=https%3A//lejournal.cnrs.fr/print/3106%2F&text=Un laboratoire mobile pour les langues parlées de France [8] http://www.facebook.com/sharer/sharer.php?s=100&p%5Burl%5D=https%3A//lejournal.cnrs.fr/print/3106&p%5Btitle%5D=Un%20laboratoire%20mobile%20pour%20les%20langues%20parl%C3%A9es%20de%20France&p%5Bimages%5D%5B0%5D=https%3A//lejournal.cnrs.fr/sites/default/files/styles/lightbox-hd/public/assets/images/bal_247767_72dpi.jpg%3Fitok%3DQu6OZP2u&p%5Bsummary%5D= [9] https://bsky.app/intent/compose?text=Un laboratoire mobile pour les langues parlées de France%0Ahttps%3A//lejournal.cnrs.fr/print/3106 [10] https://gallica.bnf.fr/html/und/enregistrements-sonores/archives-de-la-parole-ferdinand-brunot-1911-1914?mode=desktop [11] https://cocoon.huma-num.fr/exist/crdo/ [12] https://guykayser.autoportrait.com/ [13] https://www.culture.gouv.fr/Presse/Communiques-de-presse/Signature-du-pacte-linguistique-dans-les-Hauts-de-France-renforcement-de-la-cooperation-entre-l-Etat-et-les-collectivites-territoriales-pour-une [14] http://www.facebook.com/sharer/sharer.php?s=100&p%5Burl%5D=https%3A//lejournal.cnrs.fr/print/3106&p%5Btitle%5D=Un%20laboratoire%20mobile%20pour%20les%20langues%20parl%C3%A9es%20de%20France&p%5Bimages%5D%5B0%5D=https%3A//lejournal.cnrs.fr/sites/default/files/styles/lightbox-hd/public/assets/images/inauguration-demo_72dpi.jpg%3Fitok%3D6gh-DZgD&p%5Bsummary%5D= [15] http://www.levoicelab.org/ [16] https://www.inshs.cnrs.fr/fr/innovatives-shs-2022 [17] https://lejournal.cnrs.fr/nos-blogs/dialogues-economiques/protectionnisme-et-croissance-une-question-dequilibres [18] https://lejournal.cnrs.fr/nos-blogs/breves-mesopotamiennes/nouvelles-inscriptions-au-registre-memoire-du-monde-de-lunesco [19] https://lejournal.cnrs.fr/articles/energies-le-mythe-de-la-transition [20] https://lejournal.cnrs.fr/articles/une-nouvelle-vitrine-pour-la-sono-mondiale [21] https://lejournal.cnrs.fr/nos-blogs/focus-sciences/tisser-lhistoire-meconnue-des-soies-sauvages [22] https://lejournal.cnrs.fr/articles/toute-la-richesse-des-langues-des-signes-a-portee-de-clic [23] https://lejournal.cnrs.fr/nos-blogs/de-la-decouverte-a-linnovation/un-salon-pour-valoriser-les-recherches-en-shs [24] https://lejournal.cnrs.fr/videos/la-machine-qui-tirait-au-sort-les-citoyens-dathenes [25] https://lejournal.cnrs.fr/innovatives-shs [26] https://lejournal.cnrs.fr/ecouter-parler [27] https://lejournal.cnrs.fr/langues [28] https://lejournal.cnrs.fr/camion [29] https://lejournal.cnrs.fr/laboratoire-mobile [30] https://lejournal.cnrs.fr/documents-sonores [31] https://lejournal.cnrs.fr/linguistique-variationniste [32] https://lejournal.cnrs.fr/ferdinand-brunot [33] https://lejournal.cnrs.fr/cocoon [34] https://lejournal.cnrs.fr/hauts-de-france [35] https://lejournal.cnrs.fr/patois [36] https://lejournal.cnrs.fr/bases-de-donnees [37] http://www.facebook.com/sharer/sharer.php?s=100&p%5Burl%5D=https%3A//lejournal.cnrs.fr/print/3106&p%5Btitle%5D=Un%20laboratoire%20mobile%20pour%20les%20langues%20parl%C3%A9es%20de%20France&p%5Bimages%5D%5B0%5D=&p%5Bsummary%5D= [38] https://lejournal.cnrs.fr/printmail/3106