Vous êtes ici
Stockage de données : la révolution sur ADN
Deux capsules métalliques, contenant chacune 100 milliards de copies de la Déclaration des droits de l’homme et du citoyen de 1789, et la Déclaration des droits de la femme et de la citoyenne, rédigée par Olympe de Gouges en 1791, ont rejoint les plus précieux documents des Archives nationales. Ces archives, les toutes premières conservées sous forme d’ADN, vont ainsi rejoindre la célèbre Armoire de Fer, monumental coffre-fort construit en 1790, aux côtés de l’ensemble des constitutions françaises, du journal de Louis XVI, du mètre et du kilogramme étalons en platine, ou encore du testament de Louis XIV. Derrière le symbole, une possible révolution technologique : après le papier et le silicium, l’ADN sera-t-il le prochain support de l’information ?
Les limites du stockage magnéto-optique
En 2020, l’humanité a produit 45 zettaoctets1 de données numériques. Ce volume devrait atteindre 175 Zo en 2025. Face à cette croissance vertigineuse des données, les supports actuels (optiques, bandes magnétiques ou disques durs) semblent avoir atteint leurs limites : fragiles, ils ont une espérance de vie de 5 à 7 ans ; énergivores, les data centers qui les accueillent consomment désormais près de 2 % de la production électrique mondiale ; volumineux, enfin, car la surface occupée par ces infrastructures ne cesse de croître elle aussi : 167 km2 à l’échelle mondiale.
Or, avec l’essor de l’intelligence artificielle et l’avènement du big data, la demande en octets n’est pas près de diminuer. « En matière de stockage de données générées, nous vivons à crédit depuis quelques années. Si nous sommes aujourd’hui capables d’en stocker 30 %, sans rupture technologique, ce chiffre pourrait tomber à 3 % dans les prochaines décennies », alerte Stéphane Lemaire, chercheur au Laboratoire de biologie computationnelle et quantitative2. Pourtant, stockée sur de l’ADN, l’intégralité des données mondiales pourrait tenir dans le volume d’une boîte à chaussures. L’ADN constituerait ainsi une solution envisagée et envisageable pour les données dites froides (environ 70 % des données générées chaque année), rarement consultées mais néanmoins précieuses, telles les archives.
La piste biologique
L’idée d’utiliser l’ADN comme support d’information numérique n’est pas nouvelle : dès 1959, le physicien américain Richard Feynman, prix Nobel en 1965, l'avait déjà suggérée. Mais ce n’est qu’en 2012 que celle-ci s’est concrétisée. « Toutefois, les technologies de stockage actuelles sont toutes basées sur des méthodes chimiques, physiques et mathématiques ; la piste biologique n’avait pas encore été explorée », souligne Stéphane Lemaire.
Depuis trois ans, le biologiste travaille avec Pierre Crozet, maître de conférences à Sorbonne Université, au développement d’une nouvelle technologie baptisée DNA Drive. L’idée : utiliser les mécanismes hérités de la biologie pour éditer et copier facilement les données sur des grands fragments d’ADN. Leur projet, « La Révolution de l’ADN »3, impliquant également des historiens, des philosophes, des informaticiens et des archivistes, est né en 2018. Tout est parti d'un article sur la technologie de stockage sur ADN, publié dans le journal d’une association étudiante inter-université, Alma Mater.
Mis au défi par les étudiants, Stéphane Lemaire s’est appuyé sur les compétences en biologie moléculaire de son équipe pour encoder de l’information sur ADN.
Mais pas n’importe quelle information. En guise de preuve de concept, leur choix s’est porté sur deux textes aux fortes valeurs symboliques et historiques : la Déclaration des droits de l’homme et du citoyen, et la Déclaration des droits de la femme et de la citoyenne d’Olympe de Gouge. Leur ambition affichée : résoudre la question du stockage de l’information et de sa pérennité par un procédé plus écologique, économique et accessible à tous.
DNA Drive : une technologie bio-inspirée, bio-compatible, bio-sécurisée
Le procédé est simple : la donnée numérique binaire (0 ou 1) est transformée en donnée quaternaire (les quatre nucléotides de l’ADN : A,T,C G où A=C=0 et T=G=1 pour un code à 1 bit/base).
La conversion des données est assurée par un algorithme permettant de générer des séquences ADN au format DNA Drive. « La séquence est ensuite stockée, comme dans le vivant, sur de longs fragments d’ADN en double hélice, appelés plasmides ou chromosomes », précise Stéphane Lemaire. Les molécules d’ADN du DNA Drive sont conçues pour être manipulables par des cellules, comme des bactéries, qui ont la possibilité de copier ou d’éditer l’information ainsi encodée.
Elles sont également bio-sécurisées afin que l’ADN ne porte aucune information génétique biologiquement significative. « Enfin, la lecture de l’information peut être effectuée, comme pour les oligonucléotides, avec des séquenceurs d’ADN nomades qui font aujourd’hui la taille d’une clé USB », ajoute le chercheur.
L’encodage prend plusieurs jours ; le décodage, plusieurs heures. Le DNA Drive se veut une solution de stockage écoresponsable : durable, écologique, et ultra-compacte, elle peut être conservée durant des millénaires dans des capsules métalliques à l’abri de l’eau, de l’air et de la lumière sans apport énergétique4.
Sur leur lancée, Stéphane Lemaire et Pierre Crozet ont créé en 2021 une start-up, Biomemory, avec un entrepreneur du numérique, Erfane Arwani. « Mais il nous reste encore de nombreux défis à relever, souligne Pierre Crozet. Nous allons maintenant travailler à perfectionner notre technologie, bénéficiant des améliorations qui seront faites tant dans la synthèse que le séquençage de l’ADN pour en réduire les coûts. L’objectif est que le DNA Drive soit viable et exploitable dans les data centers d’ici 2030. » ♦
À lire sur notre site
Des molécules pour stocker l’information
Stockage de données : les promesses de l’ADN synthétique
- 1. 1 Zo : mille milliards de milliards d’octets.
- 2. Unité CNRS/Sorbonne Université.
- 3. Le projet a été également mené en partenariat avec Twist Bioscience, entreprise américaine spécialiste de la synthèse d’ADN, et Imagene, entreprise française spécialiste de la conservation à long terme de l’ADN. Cette dernière a mis au point les capsules.
- 4. Chaque capsule peut contenir une quantité d’ADN correspondant à 5 000 To de données numériques.
Mots-clés
Partager cet article
Auteur
Anne-Sophie Boutaud est journaliste à CNRS Le journal.
Commentaires
Bonjour,
PMAD le 24 Novembre 2021 à 10h45Bonjour,
PMAD le 24 Novembre 2021 à 10h45Bonjour,
Stéphane Lemaire le 26 Novembre 2021 à 00h25Comme il l’est dit dans cet
Jacques Bonnet le 26 Novembre 2021 à 18h25Connectez-vous, rejoignez la communauté
du journal CNRS