L’Inde développe un processeur de calcul haute performance (HPC) basé sur ARM pour alimenter son premier supercalculateur exascale, qui devrait être prêt cette année. Le processeur, appelé AUM, a été développé par le Centre pour le développement de l’informatique avancée (C-DAC), un organisme scientifique autonome relevant du ministère de l’Électronique et des Technologies de l’information (MeitY).
AUM est basé sur un nœud de 5 nanomètres et comportera 96 cœurs, ce qui, selon C-DAC, le placera devant le processeur Fujitsu A64FX qui alimente le Fugaku, le deuxième supercalculateur le plus rapide au monde. C-DAC affirme qu’AUM offrira 4,6 téraflops par socket de puissance de calcul, soit plus que les 2,7 téraflops par socket rassemblés par Fugaku.
À l’heure actuelle, le processeur ARM le plus puissant de la planète est le processeur A64FX à 48 cœurs de Fujitsu, créé comme moteur de calcul fortement vectoriel pour le supercalculateur « Fugaku » du RIKEN Lab au Japon. Nvidia s’apprête à expédier son processeur Arm « Grace » à 72 cœurs, qui n’a pas encore reçu de nom de produit mais CG100 semble logique. Et tous deux vont faire face à une concurrence intense de la part d’un nouveau venu basé en Inde.
Il y a une chance non nulle que le processeur AUM HPC conçu par le Center for Development of Advanced Computing (C-DAC) puisse surpasser à la fois l’A64FX et Grace et même donner à la puce Graviton3 à 64 cœurs d’Amazon et aux Altra, Altra Max et Ampère Computing. Les processeurs AmpereOne sont à la hauteur des charges de travail plus génériques.
C-DAC a déclaré qu’elle recherchait une collaboration de l’industrie pour la conception de systèmes sur puces (SOC) et de serveurs, ainsi que pour déployer et commercialiser des solutions basées sur le processeur AUM.
Le développement d’AUM fait partie de la mission nationale indienne de supercalcul, annoncée en 2015 et visant à faire passer le pays de l’assemblage à la fabrication, puis à la « conception et fabrication » de supercalculateurs, y compris le réseau HPC, la pile logicielle, le processeur HPC et les technologies de refroidissement liquide.
C-DAC se voit confier la tâche de construire un réseau de 24 supercalculateurs dotés d’une puissance de calcul combinée de plus de 64 pétaflops. Plus de la moitié d’entre eux ont déjà été déployés dans plusieurs instituts techniques en Inde, notamment l’IIT, l’Institut indien des sciences (IISC) et l’Institut indien d’enseignement et de recherche scientifiques (IISER) de Pune.
Pour créer le processeur AUM, les techniciens de C-DAC ont étudié le processeur A64FX et le système Fugaku chez RIKEN ainsi que son prédécesseur le processeur Sparc64-VIIIfx et le supercalculateur K, et ont vu ce que nous voyons tous dans les données de référence HPCG depuis sa première publication. . Autrement dit : obtenir un meilleur rapport entre la bande passante mémoire et les opérations en virgule flottante par seconde améliore les performances des applications réelles. Le système K a un rapport octets/flops de 0,5 et a fourni 5,2 % des performances HPL maximales au test HPCG, contre un rapport octets/flops de 0,38 et une note maximale de 3 % pour Fugaku. (En d’autres termes, les performances ont évolué dans la mauvaise direction avec le saut générationnel chez RIKEN.) C-DAC a donc décidé d’essayer d’augmenter le ratio de bande passante mémoire par flop au-dessus de 0,5. De plus, C-DAC souhaitait rester à l’écart des GPU et autres accélérateurs et utiliser des vecteurs relativement petits, plus faciles à optimiser, tout en fournissant un mélange de mémoires principales HBM et DDR et de nombreuses voies d’E/S PCI-Express avec cohérence CXL. soutien aux accélérateurs.
C-DAC a également développé un serveur nommé Rudra et une interconnexion haut débit appelée Trinetra, qui connecte les supercalculateurs.
Mint a rapporté l’année dernière que les superordinateurs déployés en Inde ne comptent pas parmi les plus puissants au monde. Selon les données du Top 500, seuls cinq supercalculateurs indiens figurent dans leur liste et aucun d’entre eux ne figure dans le top 100. En comparaison, la Chine et les États-Unis représentent près des deux tiers des supercalculateurs du Top 500.
La puissance de calcul d’un supercalculateur se mesure en opérations à virgule flottante par seconde ou FLOPS. Un pétaflops équivaut à 1 000 000 000 000 000 (un quadrillion) de FLOPS, soit mille téraflops.
Frontier, le supercalculateur le plus rapide au monde, situé aux États-Unis, offre une vitesse de pointe de 1 685 pétaflops, tandis que le Fugaku du Japon a une vitesse de 537 pétaflops. Param Siddhi, qui offre une performance maximale de 5,27 pétaflops, est actuellement le supercalculateur le plus rapide d’Inde.
Cela dit, le développement d’un supercalculateur exascale piloté par un processeur local constituera une réalisation majeure pour l’Inde et stimulera également les efforts de recherche et développement dans le pays.