Donner du sens à la science

Comment calculer le prix du calcul

Comment calculer le prix du calcul

18.07.2019, par
Le nouveau supercalculateur Jean-Zay, installé à l’Idris, centre de calcul intensif du CNRS, est un des ordinateurs financés et mis à la disposition de la recherche française. Mais comment achète-t-on un tel engin ? Qu’apportera-t-il à l’intelligence artificielle ? Éléments de réponse dans ce billet de Denis Veynante publié avec Libération.

Une fois par mois, retrouvez sur notre site les Inédits du CNRS, des analyses scientifiques originales publiées en partenariat avec Libération.

Acheter un supercalculateur n’est pas une mince affaire. Outre le montant de l’investissement – environ 25 millions d’euros pour la première tranche de la machine Jean-Zay (désormais un des ordinateurs les plus puissants de France !), qui sera suivie d’une seconde fin 2020 –, le marché des supercalculateurs est très particulier. Il ne s’agit pas d’essayer, puis de choisir une voiture chez un concessionnaire. Tout d’abord, la plupart des vendeurs de machines ne sont que des intégrateurs : ils achètent les principaux composants de la machine, processeurs, accélérateurs de calcul, mémoire, espaces de stockage, éléments du réseau interne, etc. à des fournisseurs… qui sont souvent les mêmes pour tous les vendeurs !
 

Le nouveau supercalculateur Jean-Zay, acquis en janvier 2019, est installé à l’Institut du développement et des ressources en informatique scientifique (Idris) du CNRS.
Le nouveau supercalculateur Jean-Zay, acquis en janvier 2019, est installé à l’Institut du développement et des ressources en informatique scientifique (Idris) du CNRS.

Marché de la mémoire tendu

Ainsi, sous des marques différentes peuvent se cacher des machines avec les mêmes processeurs Intel, accélérateurs graphiques NVIDIA, baies flash DDN, réseau Mellanox, etc. Les différences viennent alors de la qualité de l’intégration de ces composants dans la machine, de l’organisation physique du réseau interne (la rapidité des communications entre les différents éléments est un facteur clé des performances globales), voire de l’environnement logiciel, tandis que les prix dépendent en partie de ceux que les vendeurs obtiennent de leurs fournisseurs, variant notamment avec les quantités qu’ils achètent.
 

 

À la consommation électrique propre de la machine, s’ajoute celle nécessaire à son refroidissement (la quasi-totalité de l’électricité utilisée par le calculateur est transformée en chaleur), de 20 % à 50 % de plus.

Petit détail : le marché mondial de la mémoire est très tendu et son prix dépend du cours au jour de la livraison au constructeur (et non au jour de la commande), et peut s’envoler brutalement… si les fournisseurs de Smartphones passent de grosses commandes ! Bien évidemment, des clauses de réactualisation du montant ou de la configuration sont prévues dans les contrats. Le calculateur choisi ne peut pas être essayé avant achat : le marché du calcul intensif concerne un nombre limité de machines et un constructeur ne peut pas se permettre d’immobiliser pour des clients potentiels une machine test de ce prix. Le voudrait-il que ce serait impossible : les développements technologiques sont si rapides que le client recherche la machine la plus performante possible… qui souvent n’existe pas encore au moment où il la commande.

Ainsi, l’achat de la machine Jean-Zay, financé par Genci1, a été signé avant que les processeurs Intel Cascade Lake qui l’équipent soient disponibles. Cette situation inconfortable oblige l’acheteur à faire confiance et les constructeurs à tester les programmes des clients sur des machines qui ne sont même pas une version réduite du calculateur cible, puis à extrapoler pour promettre par contrat des performances qu’ils n’ont pas pu vérifier et qui leur vaudront des pénalités en cas de défaillance. Comme si Renault proposait de livrer dans six mois une voiture qu’il n’a pas encore testée en garantissant par contrat une consommation de 3,5 l /100 km !
 
 

Solution énergétique

À propos de consommation : un supercalculateur est un gouffre énergétique. La machine Jean-Zay réclame une puissance électrique de l’ordre d’un mégawatt pour une facture annuelle de plus d’un million d’euros. Ce montant est énorme mais, d’une génération à l’autre, les calculateurs sont de plus en plus puissants, plus petits et consomment moins à puissance comparable (la facture énergétique est devenue un critère de choix). À la consommation électrique propre de la machine, s’ajoute celle nécessaire à son refroidissement (la quasi-totalité de l’électricité utilisée par le calculateur est transformée en chaleur), typiquement de 20 à 50 % de plus.
 

Le supercalculateur Jean-Zay permettra d’étendre les modes d'utilisation classiques du calcul de haute performance à de nouveaux usages pour l’intelligence artificielle.
Le supercalculateur Jean-Zay permettra d’étendre les modes d'utilisation classiques du calcul de haute performance à de nouveaux usages pour l’intelligence artificielle.

Dans le cas de Jean-Zay, une économie substantielle proviendra d’une climatisation différente. La génération précédente de calculateurs utilisait de l’eau froide (12 °C en entrée de calculateur) tandis que les nouveaux processeurs supportent une température de fonctionnement supérieure et seront refroidis directement par circulation d’eau chaude dans les cartes électroniques. L’eau entrera à 32 °C dans la machine pour ressortir à 42 °C. Refroidir de l’eau à 32 °C nécessite évidemment moins d’énergie que pour la refroidir à 12 °C : en caricaturant à peine, il suffit de faire passer les tuyaux à l’extérieur du bâtiment, au moins l’hiver. En fait, la chaleur disponible sera ici récupérée pour contribuer au chauffage des bâtiments du campus.
 
 

L’originalité du supercalculateur Jean-Zay est d’inclure une partie dédiée aux recherches en intelligence artificielle dans le cadre du plan AI for Humanity.

L’originalité du supercalculateur Jean-Zay est d’inclure une partie dédiée aux recherches en intelligence artificielle (AI) dans le cadre du plan AI for Humanity voulu par le président de la République. Qu’est-ce que cela signifie ? Pas seulement qu’une communauté de recherche qui n’a pas encore l’habitude d’utiliser les centres nationaux de calcul a accès à la machine mais aussi que celle-ci inclut une partie adaptée à ses besoins. Les utilisateurs recherchent tous des vitesses de calcul de plus en plus élevées. Pendant longtemps, ce gain de vitesse a été obtenu par l’augmentation de la performance individuelle des processeurs.

 
Ce temps est révolu pour deux raisons : d’une part, la gravure des processeurs approche des limites physiques permises par des technologies qui reposent sur le silicium (des ruptures technologiques, tel l’ordinateur quantique, ne seront pas opérationnelles avant longtemps), d’autre part, augmenter la vitesse des processeurs fait croître drastiquement la consommation énergétique. Du coup, augmenter les performances requiert d’autres solutions : faire travailler de nombreux processeurs ensemble (machines massivement parallèles), développer des accélérateurs vectoriels capables de traiter simultanément un vecteur et non plus un seul nombre, ou encore d’autres types d’accélérateurs, notamment des processeurs graphiques (GPU: Graphic Processor Unit).
 

L’allié de l'IA

Malheureusement, plus les architectures de machines sont complexes, moins elles sont polyvalentes. Certaines sont mieux adaptées que d’autres à un problème donné. Les processeurs graphiques  n’ont pas été développés pour le calcul intensif mais… pour les jeux vidéo. Ils ont été conçus pour le traitement rapide d’images. Voilà le lien avec l’intelligence artificielle ou plus exactement l’apprentissage dont un des buts est de faire reconnaître à la machine un objet sur une image : un chat, une tumeur cancéreuse, etc.
 
Plus la machine analysera d’images, plus elle se perfectionnera et reconnaîtra à coup sûr l’objet recherché. C’est d’ailleurs l’atout de l’intelligence artificielle en imagerie médicale : un médecin spécialiste se perfectionnera en examinant tout au plus quelques dizaines d’images par jour tandis que la machine peut en apprendre des dizaines ou des centaines de milliers si sa capacité de traitement est suffisante. D’un point de vue informatique, une collection d’images n’est qu’une base de données volumineuse et les techniques développées initialement pour l’imagerie s’appliquent à d’autres domaines. Ces processeurs graphiques sont particulièrement bien adaptés au traitement de grandes masses de données, ce dont ont besoin les techniques d’apprentissage d’intelligence artificielle, quelle que soit l’application visée. La machine Jean-Zay disposera dans un premier temps de 1044 GPU, très loin des quelques GPU qui équipent aujourd’hui les postes de travail des chercheurs en intelligence artificielle et leur offrira de nouvelles possibilités. Ils pourront évidemment aussi être utilisés par les chercheurs d’autres disciplines qui ont besoin de puissance de calcul. ♦

 
 
Les points de vue, les opinions et les analyses publiés dans cette rubrique n’engagent que leur auteur. Ils ne sauraient constituer une quelconque position du CNRS.

Notes
  • 1. Genci, société civile créée en 2007, est détenue à 49 % par l’État représenté par le ministère de l’Enseignement supérieur et la Recherche, 20 % par le CEA, 20 % par le CNRS, 10 % par les Universités r et 1 % par Inria.