r/actutech

Contenus originaux pour le subreddit r/actutech

Sierra - La fin de vie d'un supercalculateur légendaire

 

Sierra - La fin de vie d'un supercalculateur légendaire

Le gouvernement américain a décidé qu'il était temps pour Sierra de tirer sa révérence. Ce superordinateur de pointe a eu une existence particulièrement impressionnante. Résidant au cœur du Laboratoire national Lawrence Livermore en Californie, il a accompli ses ultimes tâches en octobre dernier avant d'être définitivement déconnectée, à l'âge de sept ans.

Autrefois classée comme le deuxième supercalculateur le plus rapide au monde, Sierra était un véritable prodige de l'ingénierie. Conçu il y a plus de dix ans, il combinait des milliers de processeurs IBM Power9 et de GPU Nvidia Volta V100. Sa mission principale ? Réaliser des simulations ultra-sécurisées et complexes pour l'agence fédérale des États-Unis chargée de préserver la sécurité nationale grâce aux applications militaires de la physique nucléaire. Mais alors, pourquoi détruire une machine fonctionnelle, fruit d'un investissement dépassant les 325 millions de dollars ?

Le maintien en vie d'un supercalculateur obéit à ce que les experts en informatique appellent la « courbe de la baignoire ». À sa naissance, la machine subit une phase de test où les composants défectueux d'usine sont remplacés. Ensuite, elle entre dans son âge d'or, une longue période de stabilité. Avec le temps, l'usure prend malgré tout le dessus et le taux de panne remonte inexorablement.

Conserver Sierra aurait fini par devenir un gouffre technique. Les pièces de rechange d'IBM et de Nvidia ne sont plus produites et son système d'exploitation n'est plus pris en charge. En informatique de pointe, sept ans représentent une vie entière. Il est tout à fait compréhensible de ressentir une forme de nostalgie pour une machine qui a tant coûté et tant calculé, mais la réalité technique est implacable. Si les ressources étaient inépuisables, on ferait tourner ces machines à l'infini. Mais ce n'est pas le cas.

L'autre grande raison de la mise à la retraite de Sierra porte le nom d'El Capitan. Ce successeur, mis en service en 2025, est un véritable monstre de puissance technologique. Là où Sierra atteignait un sommet respectable de 94,64 pétaflops, El Capitan pulvérise les compteurs avec 1,809 exaflops, le rendant environ 19 fois plus rapide. Bien qu'il consomme énormément plus d'énergie (36 mégawatts, de quoi alimenter 36 000 foyers, contre 11 mégawatts pour Sierra), son efficacité brute rend le maintien de son aînée tout simplement obsolète.

Il n'y a pas de gros interrupteur rouge pour éteindre un supercalculateur. Le processus s'est fait par étapes. D'abord la sauvegarde des données scientifiques, puis l'interdiction d'installer de nouvelles pièces et enfin la « déshydratation », consistant à drainer les milliers de litres d'eau utilisés pour la refroidir. Contrairement à certaines machines qui finissent dans des musées ou sont revendues, Sierra contenait des données classées secret défense liées à l'arsenal nucléaire. Son démantèlement a donc été extrême pour éviter toute fuite de sécurité:

  •     Les batteries ont été retirées et envoyées au recyclage.
  •     Les composants structurels et les processeurs ont été broyés.
  •     La mémoire flash, capable de retenir des données sans courant, a été réduite en une fine poudre.
  •     Les disques magnétiques ont été effacés à l'aide d'un puissant démagnétiseur avant d'être déchiquetés.


Seule son infrastructure parasismique, enfouie sous le plancher, a été conservée pour accueillir El Capitan. Dire adieu à une telle machine peut sembler triste. Par le passé, certains laboratoires organisaient même des pots de départ avec des gâteaux pour honorer la fin de service de leurs serveurs. Mais pour les ingénieurs, c'est le cycle naturel de la technologie.

L'avenir nous réserve peut-être une autre approche. Les experts envisagent un futur où la modularité matérielle permettra de mettre à jour indéfiniment un même supercalculateur sans avoir à le détruire complètement. Une autre possibilité, plus sobre, est que le ralentissement de la loi de Moore nous empêche de créer des puces suffisamment novatrices pour justifier le remplacement total de ces géants de calcul. 

Commentaires