A la une
Le bon fonctionnement de l'organisme et l’équilibre biologique reposent sur une multitude de processus vitaux accomplis par les cellules. Au cœur de ces fonctions cellulaires se trouvent des interactions cruciales entre les protéines et les molécules d'ARN, qui influencent un large éventail de processus biologiques. L’étude de ces interactions reste complexe mais la recherche progresse grâce à l'amélioration des techniques expérimentales et des outils bioinformatiques. Le projet ESPRINet, mené par des scientifiques de l’I2BC s'inscrit dans cette démarche, cherchant à élucider les mécanismes moléculaires sous-jacents. Ces recherches enrichissent les connaissances des biologistes et ouvrent la voie à la mise au point de nouvelles solutions thérapeutiques, avec des implications potentielles à long terme pour la médecine.
Depuis plusieurs décennies, un important travail a été mené sur les structures 3D des protéines ainsi que sur des protéines en interaction avec d’autres protéines. Les interactions entre les protéines et les acides nucléiques, en particulier l’ARN, restent cependant moins étudiées, notamment car les données disponibles sont moins nombreuses.
« L’idée générale du projet est d’essayer d’exploiter différents types de données pour améliorer la capacité à prédire ces interactions, et en particulier leur structure tridimensionnelle », résume Jessica Andreani, chercheuse CEA à l’Institut de Biologie Intégrative de la Cellule (I2BC1) et coordinatrice du projet ESPRINet (integrating heterogeneous Evolutionary, Structural and omics data to predict Protein-RNA Interaction Networks). Ce dernier est financé par l’Agence nationale de la recherche (ANR), dont l’objectif est de soutenir l’excellence de la recherche et l’innovation française sur le plan national, européen et international.
Pour prédire ces interactions, l’équipe dispose de quelques milliers de complexes protéine-ARN déjà connus et dont les structures 3D sont disponibles. « Nous voulions analyser ces données structurales et les exploiter pour pouvoir prédire de nombreux complexes dont la structure 3D n’est pas connue à l’heure actuelle », indique la scientifique. Face aux limites des méthodes actuelles, le projet utilise également d’autres types de données, et notamment des données « évolutives ».
« Les protéines dérivent d’ancêtres communs, il y a donc une relation évolutive, appelée ‘‘homologie’’, qui permet, à partir d’un complexe protéine-ARN connu chez une espèce, de prédire la structure 3D du complexe de la protéine et de l’ARN homologues chez l’humain, explique Jessica Andreani. Bien évidemment, au cours de l’évolution, des changements s’opèrent, aussi bien pour les protéines que pour les ARN, mais la structure 3D des interactions est maintenue. » Le projet ESPRINet a donc d’abord cherché à comprendre les détails atomiques expliquant comment ces interactions sont maintenues malgré les changements qui ont eu lieu au cours de l’évolution.
Il s’est pour cela appuyé sur les données de structures protéine-ARN déjà connues, afin d’étudier des paires de complexes homologues, et de déterminer à quel point la séquence en acides aminés de la protéine et la séquence en nucléotides de l’ARN sont similaires entre les deux complexes. Deux mille paires ont ainsi été analysées2.
« Certaines paires sont très fortement similaires, même avec moins de 20% de similitudes – c’est-à-dire avec seulement un acide aminé sur cinq qui est le même –, l’interaction protéine-ARN continue à se passer exactement de la même manière : quand on observe les complexes en visualisation 3D, les régions d’interaction se ressemblent beaucoup », souligne la chercheuse de l’I2BC.
En rentrant dans les détails de la chimie, les différences deviennent notables puisque les groupes chimiques portés par les acides aminés ont changé. ESPRINet a donc cherché à comprendre les interactions clefs qui sont maintenues et formeraient ainsi le « ciment » de ces interactions, et celles qui changent. Le tout afin d’être ensuite en mesure de prédire une interaction protéine-ARN à partir d’un complexe homologue connu.
En plus des données structurales et des données évolutives, l’équipe du projet ESPRINet a également travaillé sur des données de préférences de liaisons. « Des scientifiques, qui étudient une protéine connue pour lier l’ARN, vont regarder, parmi une banque de motifs d’ARN possibles, quels motifs sont préférentiellement liés par cette protéine, détaille la scientifique. Ce type de données est orthogonal à la structure 3D mais on peut imaginer qu’il a tout de même un lien : si tel motif est lié et pas un autre, c’est probablement parce que, au niveau des liaisons chimiques qui se forment, il y a une spécificité. »
Pour ce volet de l’analyse, la quantité de données disponibles est limitante : il faut à la fois disposer de la structure tridimensionnelle et des données expérimentales de motifs de liaison. « Pour l’instant, nous disposons d’environ 200 cas. Mais nous essayons malgré tout d’examiner si le motif trouvé expérimentalement correspond à la structure 3D, et comment cela peut nous informer sur la prédiction structurale », note la coordinatrice d’ESPRINet.
Le projet ESPRINet a pris fin durant l’été 2024 mais les recherches vont se poursuivre, notamment avec les développements rapides qu’a connu le domaine de l’intelligence artificielle. « Initialement, nous voulions utiliser les données dans des méthodes prédictives classiques, mais nous nous tournons finalement de plus en plus vers des méthodes d’apprentissage profond, précise Jessica Andreani. Même si nous sommes encore limités par la quantité de données dont nous disposons, cela représente un axe prometteur pour la prédiction des interactions protéine-ARN. »
Dans l’immédiat, l’objectif d’ESPRINet est fondamental. Il permettra notamment à des biologistes d’utiliser les prédictions de structure pour les guider dans leurs expériences. De plus, l’équipe du projet a développé un site internet3, avec la plateforme de bio-informatique de l’I2BC, qui permet aux biologistes de visualiser toutes les données étudiées. « Cela leur permet de voyager dans les interfaces protéine-ARN, image Jessica Andreani. À l’heure actuelle, les biologistes peuvent seulement explorer les données que nous avons déjà traitées, mais le projet futur est de faire évoluer ce site internet vers un serveur de prédiction grâce à l’intelligence artificielle. »
Au-delà du volet fondamental, ESPRINet a aussi des objectifs thérapeutiques, à bien plus long terme. « L’étude des interactions protéine-ARN a permis de soulever leur importance dans un certain nombre de pathologies, souligne la chercheuse. Cela pourrait donc aider à interpréter des maladies, mais aussi permettre de développer des solutions thérapeutiques. » Ces recherches pourraient également ouvrir la voie pour la conception de nouvelles molécules, par exemple dans le domaine des biotechnologies.
____________________________
1 L’I2BC est une unité mixte de recherche CEA/CNRS/Université Paris-Saclay/Inrae/Inserm, située à Gif-sur-Yvette.
2 https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1012650
3 https://bioi2.i2bc.paris-saclay.fr/django/rnaprotdb/