Logo du CNRS Le Journal Logo de CSA Research

Grande enquête « CNRS Le Journal »

Votre avis nous intéresse.

Le CNRS a mandaté l’institut CSA pour réaliser une enquête de satisfaction auprès de ses lecteurs.

Répondre à cette enquête ne vous prendra que quelques minutes.

Un grand merci pour votre participation !

Grande enquête « CNRS Le Journal »

Sections

Stockage de données : la révolution sur ADN

Stockage de données : la révolution sur ADN

23.11.2021, par
Mis à jour le 25.11.2021
Deux déclarations révolutionnaires fondatrices stockées et encapsulées dans de l’ADN ont fait leur entrée aux Archives nationales le 23 novembre. Derrière ce projet, la technologie DNA Drive, développée par les chercheurs Stéphane Lemaire et Pierre Crozet.

Deux capsules métalliques, contenant chacune 100 milliards de copies de la Déclaration des droits de l’homme et du citoyen de 1789, et la Déclaration des droits de la femme et de la citoyenne, rédigée par Olympe de Gouges en 1791, ont rejoint les plus précieux documents des Archives nationales. Ces archives, les toutes premières conservées sous forme d’ADN, vont ainsi rejoindre la célèbre Armoire de Fer, monumental coffre-fort construit en 1790, aux côtés de l’ensemble des constitutions françaises, du journal de Louis XVI, du mètre et du kilogramme étalons en platine, ou encore du testament de Louis XIV. Derrière le symbole, une possible révolution technologique : après le papier et le silicium, l’ADN sera-t-il le prochain support de l’information ?

Les limites du stockage magnéto-optique

En 2020, l’humanité a produit 45 zettaoctets1 de données numériques. Ce volume devrait atteindre 175 Zo en 2025. Face à cette croissance vertigineuse des données, les supports actuels (optiques, bandes magnétiques ou disques durs) semblent avoir atteint leurs limites : fragiles, ils ont une espérance de vie de 5 à 7 ans ; énergivores, les data centers qui les accueillent consomment désormais près de 2 % de la production électrique mondiale ; volumineux, enfin, car la surface occupée par ces infrastructures ne cesse de croître elle aussi : 167 km2 à l’échelle mondiale.

À gauche : Déclaration des droits de l’homme et du citoyen. Extrait du procès-verbal de la séance de l’Assemblée constituante du 2 octobre 1789 et billet de la main du roi Louis XVI du 5 octobre 1789. À droite : première page de la brochure "Les droits de la femme" dans laquelle est publiée la Déclaration des droits de la femme et de la citoyenne, par Olympe de Gouges, septembre 1791.
À gauche : Déclaration des droits de l’homme et du citoyen. Extrait du procès-verbal de la séance de l’Assemblée constituante du 2 octobre 1789 et billet de la main du roi Louis XVI du 5 octobre 1789. À droite : première page de la brochure "Les droits de la femme" dans laquelle est publiée la Déclaration des droits de la femme et de la citoyenne, par Olympe de Gouges, septembre 1791.

Or, avec l’essor de l’intelligence artificielle et l’avènement du big data, la demande en octets n’est pas près de diminuer. « En matière de stockage de données générées, nous vivons à crédit depuis quelques années. Si nous sommes aujourd’hui capables d’en stocker 30 %, sans rupture technologique, ce chiffre pourrait tomber à 3 % dans les prochaines décennies », alerte Stéphane Lemaire, chercheur au Laboratoire de biologie computationnelle et quantitative2. Pourtant, stockée sur de l’ADN, l’intégralité des données mondiales pourrait tenir dans le volume d’une boîte à chaussures. L’ADN constituerait ainsi une solution envisagée et envisageable pour les données dites froides (environ 70 % des données générées chaque année), rarement consultées mais néanmoins précieuses, telles les archives.

La piste biologique

L’idée d’utiliser l’ADN comme support d’information numérique n’est pas nouvelle : dès 1959, le physicien américain Richard Feynman, prix Nobel en 1965, l'avait déjà suggérée. Mais ce n’est qu’en 2012 que celle-ci s’est concrétisée. « Toutefois, les technologies de stockage actuelles sont toutes basées sur des méthodes chimiques, physiques et mathématiques ; la piste biologique n’avait pas encore été explorée », souligne Stéphane Lemaire.

Les technologies de stockage actuelles sont toutes basées sur des méthodes chimiques, physiques et mathématiques ; la piste biologique n’avait pas encore été explorée.

Depuis trois ans, le biologiste travaille avec Pierre Crozet, maître de conférences à Sorbonne Université, au développement d’une nouvelle technologie baptisée DNA Drive. L’idée : utiliser les mécanismes hérités de la biologie pour éditer et copier facilement les données sur des grands fragments d’ADN. Leur projet, « La Révolution de l’ADN »3, impliquant également des historiens, des philosophes, des informaticiens et des archivistes, est né en 2018. Tout est parti d'un article sur la technologie de stockage sur ADN, publié dans le journal d’une association étudiante inter-université, Alma Mater.

Mis au défi par les étudiants, Stéphane Lemaire s’est appuyé sur les compétences en biologie moléculaire de son équipe pour encoder de l’information sur ADN.

Capsules contenant les deux textes encodés sur ADN. (Capsules DNAshell© par Imagene.)
Capsules contenant les deux textes encodés sur ADN. (Capsules DNAshell© par Imagene.)

Mais pas n’importe quelle information. En guise de preuve de concept, leur choix s’est porté sur deux textes aux fortes valeurs symboliques et historiques : la Déclaration des droits de l’homme et du citoyen, et la Déclaration des droits de la femme et de la citoyenne d’Olympe de Gouge. Leur ambition affichée : résoudre la question du stockage de l’information et de sa pérennité par un procédé plus écologique, économique et accessible à tous.

DNA Drive : une technologie bio-inspirée, bio-compatible, bio-sécurisée

Le procédé est simple : la donnée numérique binaire (0 ou 1) est transformée en donnée quaternaire (les quatre nucléotides de l’ADN : A,T,C G où A=C=0 et T=G=1 pour un code à 1 bit/base).

La lecture de l’information peut être effectuée avec des séquenceurs d’ADN nomades qui font aujourd’hui la taille d’une clé USB.

La conversion des données est assurée par un algorithme permettant de générer des séquences ADN au format DNA Drive. « La séquence est ensuite stockée, comme dans le vivant, sur de longs fragments dADN en double hélice, appelés plasmides ou chromosomes », précise Stéphane LemaireLes molécules d’ADN du DNA Drive sont conçues pour être manipulables par des cellules, comme des bactéries, qui ont la possibilité de copier ou d’éditer l’information ainsi encodée. 

Elles sont également bio-sécurisées afin que l’ADN ne porte aucune information génétique biologiquement significative. « Enfin, la lecture de l’information peut être effectuée, comme pour les oligonucléotides, avec des séquenceurs d’ADN nomades qui font aujourd’hui la taille d’une clé USB », ajoute le chercheur.

Chaque capsule peut contenir une quantité d’ADN correspondant à 5000 To de données numériques.
Chaque capsule peut contenir une quantité d’ADN correspondant à 5000 To de données numériques.

L’encodage prend plusieurs jours ; le décodage, plusieurs heures. Le DNA Drive se veut une solution de stockage écoresponsable : durable, écologique, et ultra-compacte, elle peut être conservée durant des millénaires dans des capsules métalliques à l’abri de l’eau, de l’air et de la lumière sans apport énergétique4.

Sur leur lancée, Stéphane Lemaire et Pierre Crozet ont créé en 2021 une start-up, Biomemory, avec un entrepreneur du numérique, Erfane Arwani. « Mais il nous reste encore de nombreux défis à relever, souligne Pierre Crozet. Nous allons maintenant travailler à perfectionner notre technologie, bénéficiant des améliorations qui seront faites tant dans la synthèse que le séquençage de l’ADN pour en réduire les coûts. L’objectif est que le DNA Drive soit viable et exploitable dans les data centers d’ici 2030» ♦

À lire sur notre site
Des molécules pour stocker l’information
Stockage de données : les promesses de l’ADN synthétique

 

Notes
  • 1. 1 Zo : mille milliards de milliards d’octets.
  • 2. Unité CNRS/Sorbonne Université.
  • 3. Le projet a été également mené en partenariat avec Twist Bioscience, entreprise américaine spécialiste de la synthèse d’ADN, et Imagene, entreprise française spécialiste de la conservation à long terme de l’ADN. Cette dernière a mis au point les capsules.
  • 4. Chaque capsule peut contenir une quantité d’ADN correspondant à 5 000 To de données numériques.

Commentaires

4 commentaires

Bonjour, Il serait professionnel de votre part d'apporter la précision dans votre article, que les capsules d'ADN que vous montrez à 2 reprises dans votre article, ne sont pas de Mr Lemaire, ni de la technologie DNAdrive, ni de la société Biomemory mais bien de la société Imagene, et que ce sont des DNAshells, nom et technique brevetés par Imagène. J'ose esperer que le CNRS ne souhaite pas faire croire à ses lecteurs que Mr Lemaire aurait tout inventé. Si les francais commencent à se tirer dans les pattes pour des technologies si disruptives et qui vont etre tant convoitées, c'est mal parti.

Bonjour, Il serait professionnel de votre part d'apporter la précision dans votre article, que les capsules d'ADN que vous montrez à 2 reprises dans votre article, ne sont pas de Mr Lemaire, ni de la technologie DNAdrive, ni de la société Biomemory mais bien de la société Imagene, et que ce sont des DNAshells, nom et technique brevetés par Imagène. J'ose esperer que le CNRS ne souhaite pas faire croire à ses lecteurs que Mr Lemaire aurait tout inventé. Si les francais commencent à se tirer dans les pattes pour des technologies si disruptives et qui vont etre tant convoitées, c'est mal parti.

Bonjour, Vous avez tout à fait raison. Ce projet a été mené en partenariat avec Imagene qui a développé la technologie de stockage à long terme à température ambiante DNAShell, comme l'indique très clairement la légende de la photo. Imagene était présent lors de la conférence de presse aux Archives nationales et son rôle et sa technologie y ont été mis en valeur. Je vous invite à consulter le dossier de presse, mis en ligne par le CNRS (https://www.cnrs.fr/fr/premiere-mondiale-depot-darchives-numeriques-encodees-sur-adn-aux-archives-nationales) qui apporte plus de précisions sur Imagene et son importance dans ce projet.

Comme il l’est dit dans cet article, l’ADN peut être conservé effectivement pendant des dizaines de milliers d’années sans consommation d’énergie. Cependant d’une part, cette longévité ne peut être atteinte qu’au prix d’une stricte absence d’eau, d’air et de lumière (protection fournie seulement par les capsules, à l’exclusion de tous les autres procédés actuellement disponibles) et d’autre part, la preuve de cette stabilité et sa mesure ont demandé des études approfondies conduites par la société imagene. Ces études sont résumées dans un article récent « https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0259868 » (PLOS ONE e0259868 16 (11) 2021 Long term conservation of DNA at ambient temperature. Implications for DNA data storage.) Jacques Bonnet, professeur émérite, directeur scientifique d'imagene
Pour laisser votre avis sur cet article
Connectez-vous, rejoignez la communauté
du journal CNRS