Huawei a récemment dévoilé la nouvelle architecture de son système d'IA, le CloudMatrix 384 Supernode. Ce système est équipé de pas moins de 384 puces Ascend 910C, offrant une puissance de calcul totale atteignant 300 PFLOPS, soit environ 1,7 fois supérieure aux performances de la GB200 NVL72 de NVIDIA. Cela marque une riposte impressionnante de la Chine face aux sanctions américaines sur les semi-conducteurs. Cependant, cette stratégie Privilégier la quantité à la qualité s'accompagne d'un coût énergétique important, avec une consommation quotidienne près de quatre fois supérieure à celle de son concurrent.
CloudMatrix 384 Supernode est désormais opérationnel dans le centre de données de Wuhu, en Anhui, Chine. En interne, Huawei décrit ce système comme une solution Niveau atomique AI, avec pour principal concurrent l’architecture NVL72 de NVIDIA. Cette dernière est équipée de 72 GPU Blackwell, connectés via une liaison NVLink ultra-rapide, offrant une puissance de calcul totale de 180 PFLOPS. Bien que les performances d’un seul Ascend 910C soient environ un tiers de celles de Blackwell, Huawei a surpassé le système phare de NVIDIA grâce à un empilement 5 fois supérieur, couplé à une capacité mémoire 3,6 fois plus grande et une bande passante mémoire 2,1 fois plus élevée.
Huawei collabore également avec la start-up chinoise SiliconFlow, prévoyant d'utiliser l'architecture CloudMatrix pour soutenir le modèle d'inférence autonome développé en interne, DeepSeek-R1. Ce déploiement démontre que la Chine progresse régulièrement dans la dé-américanisation de son infrastructure informatique IA, approfondissant ainsi le conflit technologique entre la Chine et les États-Unis.
Bien que le CloudMatrix 384 fasse preuve d’innovation dans sa conception système, notamment grâce à des interconnexions optiques massives et des optimisations logicielles, son efficacité énergétique laisse à désirer. La consommation totale d’énergie est 3,9 fois supérieure à celle du NVL72, avec une consommation par FLOP 2,3 fois plus élevée, une consommation par bande passante mémoire de 1,8 fois plus par TB/S, et un ratio de consommation de capacité mémoire 1,1 fois plus important. Bien que ces chiffres attirent l’attention en Europe et aux États-Unis, en Chine, l’approvisionnement en électricité ne constitue pas une contrainte majeure.
Selon le rapport de SemiAnalysis, la Chine s'appuie encore majoritairement sur la production d'électricité à base de charbon, tout en continuant d'étendre ses capacités en énergie solaire, hydraulique, éolienne et nucléaire. Le rythme de croissance énergétique y est le plus rapide au monde : depuis 2011, la capacité des réseaux électriques ajoutée équivaut à celle de l'ensemble du réseau des États-Unis. Cet avantage énergétique permet à la Chine de faire des compromis sur l'efficacité afin de bénéficier d'une capacité d'expansion de l'IA à plus grande échelle.
Le rapport indique que l'architecture CloudMatrix comprend 16 racks, dont 12 sont des racks de calcul, chacun contenant 32 puces Ascend. Les 4 racks restants servent de cœurs d'interconnexion optique. Le système global utilise jusqu'à 6 912 émetteurs-récepteurs 400G LPO (modules optiques enfichables linéaires), remplaçant les câbles traditionnels en cuivre, ce qui améliore la densité et la capacité d'extension de l'interconnexion. Ce point présente une certaine similitude avec l'architecture DGX H100 NVL256Ranger que NVIDIA avait prévue mais n'a pas produite en série.
Bien qu'Ascend 910C soit entièrement conçu par Huawei, son processus de fabrication reste fortement dépendant de la chaîne d'approvisionnement étrangère, notamment avec la mémoire à large bande passante HBM provenant de Corée du Sud, les wafers fournis par TSMC à Taiwan, ainsi que les équipements de fabrication de semi-conducteurs fabriqués aux États-Unis, aux Pays-Bas et au Japon. Selon des sources, TSMC pourrait faire face à une amende pouvant atteindre 1 milliard de dollars pour avoir contourné les sanctions en fournissant des wafers.
Huawei a également acheté environ 2,9 millions de puces à nu à TSMC via une société tierce, Sophgo, capables de produire 800 000 unités d'Ascend 910B et 1,05 million d'Ascend 910C. Parallèlement, Samsung est également devenu le principal fournisseur de HBM pour la Chine. Il est rapporté que Huawei a accumulé jusqu'à 13 millions de modules empilés HBM, suffisants pour prendre en charge l'emballage de 1,6 million de puces Ascend.
Bien que la technologie de la fonderie chinoise locale SMIC ne soit pas encore totalement au niveau des procédés avancés, elle est en train d’accroître sa capacité de production à Shanghai, Shenzhen et Pékin. Il est prévu que sa production mensuelle atteigne 50 000 tranches de silicium cette année. Si elle peut continuer à bénéficier de l'approvisionnement en matériaux photorésistants étrangers ainsi que du support pour l'entretien des outils, la production de SMIC pourrait encore s'améliorer.
Dans l’ensemble, le CloudMatrix 384 incarne la stratégie de la Chine visant à compenser son retard dans la fabrication de semi-conducteurs par l’intégration systémique. Bien que les performances individuelles de cette puce ne rivalisent pas avec celles de NVIDIA, Huawei a brillamment exploité le regroupement à grande échelle et l’expansion via les réseaux optiques, permettant ainsi d’atteindre Dépassement en virage en termes de performances globales de calcul, réduisant ainsi l’écart avec les géants technologiques occidentaux.



