jeudi, novembre 7, 2024

Stockage de données : la révolution sur ADN

0 commentaire

Deux déclarations révolutionnaires fondatrices stockées et encapsulées dans de l’ADN ont fait leur entrée aux Archives nationales le 23 novembre. Derrière ce projet, la technologie DNA Drive, développée par les chercheurs Stéphane Lemaire et Pierre Crozet.

Deux capsules métalliques, contenant chacune 100 milliards de copies de la Déclaration des droits de l’homme et du citoyen de 1789, et la Déclaration des droits de la femme et de la citoyenne, rédigée par Olympe de Gouges en 1791, ont rejoint les plus précieux documents des Archives nationales. Ces archives, les toutes premières conservées sous forme d’ADN, vont ainsi rejoindre la célèbre Armoire de Fer, monumental coffre-fort construit en 1790, aux côtés de l’ensemble des constitutions françaises, du journal de Louis XVI, du mètre et du kilogramme étalons en platine, ou encore du testament de Louis XIV. Derrière le symbole, une possible révolution technologique : après le papier et le silicium, l’ADN sera-t-il le prochain support de l’information ?

Les limites du stockage magnéto-optique

En 2020, l’humanité a produit 45 zettaoctets1 de données numériques. Ce volume devrait atteindre 175 Zo en 2025. Face à cette croissance vertigineuse des données, les supports actuels (optiques, bandes magnétiques ou disques durs) semblent avoir atteint leurs limites : fragiles, ils ont une espérance de vie de 5 à 7 ans ; énergivores, les data centers qui les accueillent consomment désormais près de 2 % de la production électrique mondiale ; volumineux, enfin, car la surface occupée par ces infrastructures ne cesse de croître elle aussi : 167 kmà l’échelle mondiale.À gauche : Déclaration des droits de l’homme et du citoyen. Extrait du procès-verbal de la séance de l’Assemblée constituante du 2 octobre 1789 et billet de la main du roi Louis XVI du 5 octobre 1789. À droite : première page de la brochure « Les droits de la femme » dans laquelle est publiée la Déclaration des droits de la femme et de la citoyenne, par Olympe de Gouges, septembre 1791. Archives nationales, AE/II/2983 et AE/II/2982; Gallica.bnf.fr / Bibliothèque nationalePartager

Or, avec l’essor de l’intelligence artificielle et l’avènement du big data, la demande en octets n’est pas près de diminuer. « En matière de stockage de données générées, nous vivons à crédit depuis quelques années. Si nous sommes aujourd’hui capables d’en stocker 30 %, sans rupture technologique, ce chiffre pourrait tomber à 3 % dans les prochaines décennies », alerte Stéphane Lemaire, chercheur au Laboratoire de biologie computationnelle et quantitative2. Pourtant, stockée sur de l’ADN, l’intégralité des données mondiales pourrait tenir dans le volume d’une boîte à chaussures. L’ADN constituerait ainsi une solution envisagée et envisageable pour les données dites froides (environ 70 % des données générées chaque année), rarement consultées mais néanmoins précieuses, telles les archives.

La piste biologique

L’idée d’utiliser l’ADN comme support d’information numérique n’est pas nouvelle : dès 1959, le physicien américain Richard Feynman, prix Nobel en 1965, l’avait déjà suggérée. Mais ce n’est qu’en 2012 que celle-ci s’est concrétisée. « Toutefois, les technologies de stockage actuelles sont toutes basées sur des méthodes chimiques, physiques et mathématiques ; la piste biologique n’avait pas encore été explorée », souligne Stéphane Lemaire.Les technologies de stockage actuelles sont toutes basées sur des méthodes chimiques, physiques et mathématiques ; la piste biologique n’avait pas encore été explorée.

Depuis trois ans, le biologiste travaille avec Pierre Crozet, maître de conférences à Sorbonne Université, au développement d’une nouvelle technologie baptisée DNA Drive. L’idée : utiliser les mécanismes hérités de la biologie pour éditer et copier facilement les données sur des grands fragments d’ADN. Leur projet, « La Révolution de l’ADN »3, impliquant également des historiens, des philosophes, des informaticiens et des archivistes, est né en 2018. Tout est parti d’un article sur la technologie de stockage sur ADN, publié dans le journal d’une association étudiante inter-université, Alma Mater.

Mis au défi par les étudiants, Stéphane Lemaire s’est appuyé sur les compétences en biologie moléculaire de son équipe pour encoder de l’information sur ADN.Capsules contenant les deux textes encodés sur ADN. Stéphane Lemaire / CNRS – Sorbonne UniversitéPartager

Mais pas n’importe quelle information. En guise de preuve de concept, leur choix s’est porté sur deux textes aux fortes valeurs symboliques et historiques : la Déclaration des droits de l’homme et du citoyen, et la Déclaration des droits de la femme et de la citoyenne d’Olympe de Gouge. Leur ambition affichée : résoudre la question du stockage de l’information et de sa pérennité par un procédé plus écologique, économique et accessible à tous.

DNA Drive : une technologie bio-inspirée, bio-compatible, bio-sécurisée

Le procédé est simple : la donnée numérique binaire (0 ou 1) est transformée en donnée quaternaire (les quatre nucléotides de l’ADN : A,T,C G où A=C=0 et T=G=1 pour un code à 1 bit/base).La lecture de l’information peut être effectuée avec des séquenceurs d’ADN nomades qui font aujourd’hui la taille d’une clé USB.

La conversion des données est assurée par un algorithme permettant de générer des séquences ADN au format DNA Drive. « La séquence est ensuite stockée, comme dans le vivant, sur de longs fragments dADN en double hélice, appelés plasmides ou chromosomes », précise Stéphane Lemaire. Les molécules d’ADN du DNA Drive sont conçues pour être manipulables par des cellules, comme des bactéries, qui ont la possibilité de copier ou d’éditer l’information ainsi encodée. 

Elles sont également bio-sécurisées afin que l’ADN ne porte aucune information génétique biologiquement significative. « Enfin, la lecture de l’information peut être effectuée, comme pour les oligonucléotides, avec des séquenceurs d’ADN nomades qui font aujourd’hui la taille d’une clé USB », ajoute le chercheur.Chaque capsule peut contenir une quantité d’ADN correspondant à 5000 To de données numériques. Philippe TranPartager

L’encodage prend plusieurs jours ; le décodage, plusieurs heures. Le DNA Drive se veut une solution de stockage écoresponsable : durable, écologique, et ultra-compacte, elle peut être conservée durant des millénaires dans des capsules métalliques à l’abri de l’eau, de l’air et de la lumière sans apport énergétique4.

Sur leur lancée, Stéphane Lemaire et Pierre Crozet ont créé en 2021 une start-up, Biomemory, avec un entrepreneur du numérique, Erfane Arwani. « Mais il nous reste encore de nombreux défis à relever, souligne Pierre Crozet. Nous allons maintenant travailler à perfectionner notre technologie, bénéficiant des améliorations qui seront faites tant dans la synthèse que le séquençage de l’ADN pour en réduire les coûts. L’objectif est que le DNA Drive soit viable et exploitable dans les data centers d’ici 2030. » ♦

Notes

  • 1.1 Zo : mille milliards de milliards d’octets.
  • 2.Unité CNRS/Sorbonne Université.
  • 3.Le projet a été également mené en partenariat avec Twist Bioscience, entreprise américaine spécialiste de la synthèse d’ADN, et Imagene, entreprise française spécialiste de la conservation à long terme de l’ADN.
  • 4.Chaque capsule peut contenir une quantité d’ADN correspondant à 5 000 To de données numériques.

Source: CNRS