L’intelligence artificielle peut-elle déchiffrer les tablettes cunéiformes ? | CNRS Le journal

Accéder à la navigation

Haut de page Nos blogs

Partager l'article

Vous êtes ici

© Cécile Michel / Mission archéologique de Kültepe (tablettes cunéiformes du Musée des civilisations anatoliennes à Ankara)

Brèves Mésopotamiennes

A propos

Bienvenue sur le blog de Cécile Michel, destiné à vous faire découvrir trois mille ans d’histoire d’un Proche-Orient aux racines complexes et multiples, à travers les découvertes et les avancées de la recherche en assyriologie et en archéologie orientale. (Version anglaise ici)

Les auteurs du blog

Cécile Michel

Assyriologue, directrice de recherche au CNRS dans le laboratoire Archéologies et Sciences de l’Antiquité

A la une

L’intelligence artificielle peut-elle déchiffrer les tablettes cunéiformes ?

14.06.2026, par Cécile Michel

Mis à jour le 29.06.2026

Du cunéiforme au code : portion d'un texte hittite cunéiforme trouvé à Boğazkale (Turquie) en 2024, avec en surimpression du langage XML. Image © Daniel Schwemer, Université de Wuerzburg

De très nombreux textes cunéiformes restent à déchiffrer, éditer et analyser pour reconstruire l’histoire du Proche-Orient et du Moyen-Orient anciens. L’IA remplacera-t-elle les assyriologues dans quelques années ? La question revient de plus en plus.

Peut-on apprendre aux ordinateurs à déchiffrer les écritures cunéiformes ? J’évoquais déjà ce sujet en 2019, en expliquant la complexité du travail face à une écriture dont la forme des signes a beaucoup évolué sur plus de trois millénaires d’usage, qui utilise trois systèmes (logographique, syllabique, alphabétique), et qui est employée par une petite quinzaine de langues appartenant à des familles linguistiques différentes. À cela, il faut ajouter qu’il s’agit d’une écriture en 3D manuscrite et donc sujette aux variations des mains de scribes.

En mai 2023, une équipe d’informaticiens et d’assyriologues de Tel-Aviv a déclaré avoir créé un nouveau programme de type Google Translate, utilisant la traduction automatique neuronale, qui permettrait une traduction automatique des tablettes cunéiformes1. Pour cela, les chercheurs ont utilisé l’une des bases de données en ligne de tablettes cunéiformes, Open Richly Annotated Cuneiform Corpus2, qui intègre des textes en akkadien de différentes périodes et de genres variés.

De la copie cunéiforme aux caractères informatiques

À la lecture de l’article scientifique, il s’avère que le corpus utilisé comprend principalement des inscriptions royales assyriennes, souvent gravées dans la pierre et relativement stéréotypées, ainsi que de la documentation administrative et épistolaire des souverains assyriens écrite dans l’argile – soit un total d’environ 8000 textes de longueurs très variables, dont plus de 7000 datent du I^er millénaire av. J.-C.

Le programme ne travaille pas sur les photos des objets inscrits, mais sur la copie cunéiforme du texte réalisée par l’assyriologue et dont les signes sont convertis en caractères Unicode3. La réalisation de copies cunéiformes est une première étape fondamentale pour la compréhension du texte, car l’assyriologue doit identifier le bon signe, puis la bonne lecture parmi de multiples possibilités.

Le programme de traduction automatique est testé soit à partir de la translitération faite par l’assyriologue, soit à partir des caractères cunéiformes Unicode. Dans le premier cas, selon les auteurs, le taux de compréhension est de 3,7/10 et, dans le second, de 3,6/10. On est là très loin d’une traduction, et nous pouvons imaginer l’importance des contresens pouvant changer le cours de l’histoire !

On notera encore que le site sur lequel les auteurs proposent de mettre à disposition de tous leur outil se nomme The Babylonian Engine4. Or les textes en dialecte babylonien représentent moins de 4 % du corpus ayant servi à l’apprentissage du programme. Enfin, le site semble déjà obsolète puisque les versions bêta et démo ne fonctionnent pas.

Tablettes en 3D

La même année, un autre projet a été développé en Allemagne par un informaticien de l’université de Halle-Wittemberg avec des assyriologues de Mayence. Les chercheurs ont utilisé des modèles 3D de 2000 tablettes de la collection Hilprecht conservées à l’université d’Iena et dont la surface était abîmée – des textes difficiles à déchiffrer, donc.

Près de 500 textes avaient toutefois déjà été transcrits et traduits. Grâce à un système de reconnaissance optique de caractères5, il s’agit de reconnaître les signes en 3D en partie effacés et de les convertir en texte lisible.

Reconstruire les puzzles

Toujours en 2023, une équipe de Würzburg, alliée aux chercheurs de Mayence, a mis en ligne le Thesaurus Linguarum Hethaeorum digitalis (TLH^dig, dont la version 0.3 est aujourd’hui accessible6). Il s’agit d’un outil de recherche consacré aux textes hittites, une langue indo-européenne employée en Anatolie, principalement dans la seconde moitié du II^emillénaire av. J.-C.

Beaucoup des tablettes de grande taille ont été brisées en de nombreux morceaux dont les chercheurs s’appliquent à reconstruire les puzzles. Le Thesaurus compte plus de 22 000 textes transcrits7, ce qui permet de rechercher des textes hittites en cunéiforme ou en translitération.

Ce thésaurus a aussi servi à créer un nouvel outil utilisant l’intelligence artificielle appelé Palaeographicum8, qui reconnaît les variations individuelles de signes cunéiformes9 sur des photos numérisées, et facilite donc l’identification des fragments d’une même tablette. Une prochaine étape serait d’apprendre à l’ordinateur à reconnaître les différentes mains de scribe, permettant aux assyriologues d’analyser la production de chaque scribe.

Fragment de traité hittite entre Muwattalli II du Hatti et Alakshandu de Wilusha, Hattousa (Hattusha), 1300 av. J.-C. (© The Trustees of the British Museum10 CC BY-BC-SA 4.0).

Cet outil témoigne d’une avancée importante, mais il ne peut être appliqué qu’aux tablettes cunéiformes de chancellerie exhumées à Boğazkale, l’ancienne Hattousa (Hattusha), capitale des Hittites. Celles-ci étaient produites par des scribes éduqués. Leur surface d’écriture est presque plate et les signes y sont imprimés de manière particulièrement régulière.

L’intelligence artificielle peut donc apporter un appui non négligeable aux chercheurs, les aidant à relier entre eux des textes mentionnant un même individu, un site géographique ou un mot au sein d’un vaste corpus numérisé. Mais on est encore très loin du déchiffrement des textes par la machine. À chaque étape (lecture des signes, translitération, traduction) l’assyriologue utilise son savoir des graphies des signes, de la langue, du contexte dans lequel le texte a été écrit pour en comprendre le sens.

Consultez aussi
Je vous écris de Mésopotamie, il y a 4000 ans
Les plus vieux traités de paix
Sur les traces de communautés juives en Arabie

Notes

1. G. Gutherz, et al., « Translating Akkadian to English with neural machine translation », PNAS Nexus, 2023 : https://doi.org/10.1093/pnasnexus/pgad096
2. Voir : https://oracc.museum.upenn.edu/
3. L’Unicode est un standard informatique qui code tout caractère de toute langue et de tout système d’écriture de façon unifiée : https://home.unicode.org/
4. Voir : https://digitalpasts.github.io/docs/BEn.html
5. « AI: Researchers develop automatic text recognition for ancient cuneiform tablets », université Martin Luther de Halle-Wittemberg : https://idw-online.de/de/news824299
6. Voir : https://smaw.de.dariah.eu/TLHdig/
7. Voir : https://tinyurl.com/tlhd-thesaurus
8. Voir : http://idw-online.de/de/news870943
9. Voir : https://tinyurl.com/5f3xtsp9
10. Voir : https://www.britishmuseum.org/collection/object/W_1913-1011-22