Sections

« Molière est bien l’auteur de ses pièces »

« Molière est bien l’auteur de ses pièces »

27.11.2019, par
"Une collaboration", lithographie représentant Jean-Baptiste Poquelin dit Molière (à gauche) et Pierre Corneille (à droite), d'après une œuvre du peintre français Jean-Léon Gérôme (1824-1904) datée de 1863. La paternité des œuvres de Molière est discutée depuis la théorie de l'écrivain Pierre Louÿs en 1919 selon laquelle Corneille en serait le véritable auteur.
La « langue de Molière » serait-elle en réalité… celle de Corneille ? L’idée circule depuis le début du XXe siècle. Mais d'après une nouvelle enquête statistique sur les textes, cette thèse reste infondée : le célèbre auteur est bien à l’origine de son théâtre. Explications avec Florian Cafiero, coauteur de l’étude.

Vous publiez, avec Jean-Baptiste Camps1, une étude2 sur la paternité des œuvres de Molière. Pourquoi existe-t-il un doute sur le fait que Molière ait lui-même écrit ses pièces ?
Florian Cafiero3 :
Dans deux articles publiés en 1919, le poète et romancier Pierre Louÿs juge troublantes des similitudes entre le théâtre de Molière et celui de Corneille. Il pense avoir découvert une formidable supercherie littéraire et avance que tous les chefs-d’œuvre de Molière auraient en fait été écrits par Corneille. Cette idée connaît quelques variantes au fil du XXe siècle. Molière, étant l’acteur principal des pièces en question, se serait vu attribuer le statut d’auteur, comme il était d’usage à l’époque ; mais Corneille aurait écrit tous ses textes.

D’autres hypothèses sont moins radicales. Molière aurait été un génie du théâtre mais un mauvais lettré ; il aurait exposé ses idées à Corneille, qui se serait chargé de les coucher sur le papier avec style. Cette théorie se diffuse plus largement à partir de 2001. Cette année-là, une analyse statistique pilotée par Cyril et Dominique Labbé lui donne une nouvelle jeunesse, en prétendant avoir prouvé la thèse dite « cornélienne ». D’autres études ont suivi et sont allées dans le même sens. Nous contestons cependant ces résultats au vu de nos propres travaux : toutes nos données convergent vers l’idée que Molière serait bien l’auteur de ses pièces.

Portrait de Molière (à gauche), peint en 1657 par Nicolas Mignard (1606-1668), représentant le dramaturge en César, personnage qu'il interprète dans la pièce de Corneille "La mort de Pompée". Et portrait de Pierre de Corneille (à droite) peint par Charles Le Brun (1619-1690) en 1647.
Portrait de Molière (à gauche), peint en 1657 par Nicolas Mignard (1606-1668), représentant le dramaturge en César, personnage qu'il interprète dans la pièce de Corneille "La mort de Pompée". Et portrait de Pierre de Corneille (à droite) peint par Charles Le Brun (1619-1690) en 1647.

Comment avez-vous procédé pour tester ces hypothèses ?
F. C. : Le principe général consiste à mesurer un degré de ressemblance entre chacun des textes, puis à regrouper ces derniers en ensembles homogènes grâce à des algorithmes dit de « partitionnement de données ». Pour cela, on commence par identifier les éléments révélant la plume de l’auteur : les formes lexicales, grammaticales, les préfixes, les rimes, etc. On repère aussi ce que l’on appelle des « mots outils » – « de », « alors », « si », « donc », etc. – utilisés de façon presque inconsciente, et souvent propres à chaque auteur. On soumet ensuite des textes de Corneille, de Molière et d’autres auteurs à un algorithme, sans lui indiquer qui a écrit quoi, et on lui demande comment il les regrouperait, en fonction des différentes propriétés relevées. La puissance de calcul des ordinateurs permet ainsi d’appréhender un grand volume de textes avec beaucoup de précision.
 
 

En étudiant des textes uniquement sous l'angle du vocabulaire, on risque de les regrouper en fonction de leur sujet plutôt qu’en fonction de leur auteur.

En quoi votre étude vous semble-t-elle plus fiable que les précédentes analyses statistiques, penchant pour « la thèse cornélienne » ?
F. C. : Les méthodes de calcul pour identifier un auteur ont aujourd’hui beaucoup progressé. Un des changements majeurs vient de la manière dont on mesure la dissemblance entre les textes. On a longtemps utilisé des calculs adaptés au monde « physique », comme la distance euclidienne. Mais les études de ces dernières années ont montré que cette analogie entre distance physique et distance entre texte est erronée, et entraîne des biais importants. Nous utilisons donc des géométries « non-euclidiennes » particulières, dont on a pu prouver qu’elles étaient les plus adaptées pour des textes de cette langue et de cette longueur.

Nous avons par ailleurs eu à disposition de nombreux textes numérisés de cette époque, en particulier grâce au remarquable travail de Paul Fièvre de la Bibliothèque nationale de France. Ceci nous a permis d’effectuer nos calculs sur un plus grand nombre d’œuvres, et d’inclure d’autres auteurs parfois moins célèbres dans nos analyses. Nous avons ainsi travaillé sur de nombreuses propriétés des textes, quand on n’étudiait auparavant que le vocabulaire du texte. Or en étudiant des textes uniquement sous cet angle, on risque de les regrouper en fonction de leur sujet plutôt qu’en fonction de leur auteur.

Étudier avec les moyens d’aujourd’hui des pièces du théâtre classique vous a-t-il posé des contraintes particulières ?
F. C. : La langue littéraire du XVIIe siècle est éloignée de la nôtre, il a donc fallu concevoir certains outils spécifiquement pour elle. Avec l’aide de notre collègue Simon Gabay, de l'Université de Neuchâtel, nous avons par exemple entraîné une intelligence artificielle spécifiquement pour le théâtre de l’époque ; elle nous a permis de détecter de manière fiable la nature grammaticale de chaque mot de notre corpus, ou de retrouver leurs racines. Ensuite, les pièces du théâtre classique sont particulièrement ressemblantes, ce qui peut poser de graves problèmes pour nos analyses. Elles obéissent à des normes plus ou moins formelles, relatives à la manière dont l’action doit se dérouler, aux sujets que l’on peut aborder, aux personnages que l’on peut représenter, etc. Elles tirent souvent leur inspiration de pièces antérieures, italiennes, espagnoles, ou latines.

(...) travailler sur des textes de l’époque demande d’infinies précautions. Il faut faire les bons calculs, mais aussi être au fait du contexte littéraire, et des histoires derrière les pièces. 

S’ajoutent à cela quelques pièges. Il n’est par exemple pas exclu que différents auteurs adaptent une même pièce. C’est le cas par exemple de L’Amphitryon, écrit par Plaute dans l’Antiquité, repris à la fois par Molière sous le même titre et par Jean de Rotrou avec Les Sosies. Ils peuvent également retravailler la pièce d’un confrère : Thomas Corneille, le frère de Pierre, a ainsi mis en vers le Dom Juan de Molière sous le titre Le Festin de Pierre. Enfin, les emprunts entre auteurs de l’époque, voire les plagiats, ne sont pas si rares. Tous ces phénomènes peuvent créer des rapprochements artificiels, et nous faire commettre des erreurs. 

Pour toutes ces raisons, travailler sur des textes de l’époque demande d’infinies précautions. Il faut faire les bons calculs, mais aussi être au fait du contexte littéraire, et des histoires derrière les pièces. C’est pourquoi nous avons fait preuve d’une grande prudence et poursuivi nos recherches pendant plusieurs années avant de présenter nos résultats.

Monographie imprimée datant de 1668 de la pièce de théâtre "Amphitryon" par Molière (à gauche) et page de titre de la pièce "Le Festin de Pierre", versifiée par Thomas Corneille (1625-1709) en 1683.
Monographie imprimée datant de 1668 de la pièce de théâtre "Amphitryon" par Molière (à gauche) et page de titre de la pièce "Le Festin de Pierre", versifiée par Thomas Corneille (1625-1709) en 1683.

Votre méthode est-elle une façon de concilier sciences humaines et formelles dans ce type de débat ?
F. C. : L’imperméabilité qui perdure parfois entre ces deux mondes se brise lentement, mais elle est parfois dommageable. D’un côté, les chercheurs en littérature ont souvent maintenu que Molière était bien l’auteur de ses œuvres, mais ils ne pouvaient pas répondre aux arguments statistiques qu’on leur opposait. De l'autre, des statisticiens, peut-être moins au fait de la manière d’appréhender ce type de littérature, n’avaient pas forcément les outils pour remettre leurs calculs en question. 

Nous avons eu la chance d’arriver dans ce débat sans a priori : à l’origine, nous cherchions juste un exemple amusant pour intéresser nos étudiants à la linguistique computationnelle.

Nous avons eu la chance d’arriver dans ce débat sans a priori : à l’origine, nous cherchions juste un exemple amusant pour intéresser nos étudiants à la linguistique computationnelle. En essayant de comprendre avec eux ce que les statistiques pouvaient apporter à ce problème, et en nous plongeant dans la littérature de l’époque et sa critique, nous avons compris qu’il fallait probablement reprendre les études précédentes. Nous nous inscrivons pour notre part dans le champ des humanités numériques, entremêlant les apports des sciences humaines et formelles. Une nouvelle génération de chercheurs travaille à l’interface de ces deux mondes, et commence à obtenir des résultats très enthousiasmants

Envisagez-vous de vous attaquer au cas de Shakespeare, historiquement controversé ?
F. C. : Ce serait d’autant plus intéressant qu’il est aussi à l’origine du débat sur Molière ! Historiquement, Pierre Louÿs a publié ses articles après qu’Abel Lefranc, alors professeur au Collège de France, a mis en doute la paternité des œuvres de Shakespeare. Il serait plus difficile de trancher ce débat, car le nombre de personnes à qui l’on prête une possible paternité des textes est très important. Pour Molière, seuls Pierre Corneille et parfois son frère ont été considérés comme des candidats sérieux. S’agissant de Shakespeare, en revanche, près de soixante-dix noms ont été avancés ! Ce serait un travail de titan d'évaluer toutes ces hypothèses, a fortiori dans une langue qui n’est pas la nôtre… Mais pourquoi pas ?

Dans l’immédiat, nos projets de recherche portent sur les auteurs du Moyen Âge. Cette fois, il ne s’agit pas de tester l’hypothèse d’une supercherie ou d’un recours à un pseudonyme. Nous disposons d’un grand nombre de textes anonymes, et il serait intéressant d’essayer de les regrouper par auteur. Même si derrière, on ne peut pas les nommer, cela donnerait du corps et de la personnalité à une période littéraire par ailleurs négligée. 

À lire 
"Why Molière most likely did write his plays", Florian Cafiero, Jean-Baptiste Camps, Science Advances, 5 : eaax55489, 27 novembre 2019.

Notes
  • 1. Chercheur au Centre Jean-Mabillon (Ecole nationale des Chartes-PSL).
  • 2. "Why Molière most likely did write his plays", Florian Cafiero, Jean-Baptiste Camps, Science Advances, 5 : eaax55489, 2019.
  • 3. Florian Cafiero est ingénieur de recherche au Groupe d'étude des méthodes de l'analyse sociologique de la Sorbonne (Gemass – unité CNRS/Sorbonne Université), spécialiste en humanités numériques et en linguistique computationnelle.
Aller plus loin

Auteur

Fabien Trécourt

Formé à l’École supérieure de journalisme de Lille, Fabien Trécourt travaille pour la presse magazine spécialisée et généraliste. Il a notamment collaboré aux titres Sciences humaines, Philosophie magazine, Cerveau & Psycho, Sciences et Avenir ou encore Ça m’intéresse.

Commentaires

1 commentaire

Seules 9 des 33 pièces présentées par Molière ont été étudiées et fort mal. La méthode de MM. Cafiero et Camps est incapable de reconnaître : Boursault, Chevalier, Dancourt, Donneau de Visé, Gillet de la Tessonnerie, Pierre Corneille, Thomas Corneille, La Fontaine, Ouville, Quinault, Régnard, Rotrou… et Molière. Voir ma réponse complète en ligne : https://www.researchgate.net/publication/337569312
Pour laisser votre avis sur cet article
Connectez-vous, rejoignez la communauté
du journal CNRS