華為は最近、最新のAIシステムアーキテクチャ「CloudMatrix 384 Supernode」を発表しました。このシステムはなんと384個のAscend 910Cチップを搭載し、全体の算力は300 PFLOPSに達します。これはNVIDIAのGB200 NVL72の性能を約1.7倍上回り、アメリカの半導体禁輸措置を受ける中での中国の力強い反撃を象徴しています。しかし、この量で質を補う戦略には高い電力消費という代償も伴い、1日あたりの消費電力は競合製品の約4倍に達します。
CloudMatrix 384 Supernodeはすでに中国安徽省蕪湖にあるデータセンターで稼働しています。華為の内部ではこのシステムを原子力レベルAIソリューションと位置づけており、主な競争相手はNVIDIAのNVL72アーキテクチャです。NVL72には72基のBlackwell GPUが搭載されており、高速なNVLinkで接続されていて、全体の計算能力は180 PFLOPSとなっています。Ascend 910Cの1基あたりの性能はBlackwellの約3分の1ですが、華為は5倍のコンポーネント数、3.6倍のメモリ容量、そして2.1倍のメモリ帯域幅を組み合わせることで、NVIDIAのフラッグシップシステムを上回ることに成功しました。
華為は中国のスタートアップ企業SiliconFlowとも提携し、CloudMatrixアーキテクチャを活用して自主開発の推論モデルDeepSeek-R1をサポートする計画を進めています。この展開は、中国がAI計算基盤の米国依存脱却を着実に進めていることを示しており、中米間のテクノロジー対立がさらに深まる様相を見せています。
CloudMatrix 384は、システム設計において革新的な要素を取り入れており、大規模な光学相互接続やソフトウェアの最適化を実現していますが、その電力効率は低い水準にとどまっています。総消費電力はNVL72の3.9倍に達し、1FLOPあたりの電力消費量は2.3倍、1TB/Sのメモリ帯域幅当たりの電力消費量は1.8倍、さらにメモリ容量当たりの消費電力比は1.1倍という結果です。これらのデータは欧米で注目を集める可能性がありますが、中国においては電力供給が大きな制約とはならない点が特徴的です。
SemiAnalysisのレポートによると、中国は依然として石炭火力発電が主流でありながら、太陽光発電、水力発電、風力発電、さらには原子力発電の拡大を続けています。そのエネルギー成長速度は世界でトップクラスであり、2011年以降に追加された電力網の容量は、アメリカ全体の電力網の規模に匹敵するとされています。このような電力の優位性により、中国は効率を多少犠牲にしても、AIの拡張能力を大幅に高めることが可能になっています。
報告によると、CloudMatrixアーキテクチャは16台のラックで構成されており、そのうち12台は計算用ラックで、各ラックには32個のAscendチップが搭載されています。残りの4台は光学インターコネクトのコアとして機能します。システム全体では、最大6,912個の400G LPO(リニアプラガブル光モジュール)トランシーバーを使用しており、従来の銅線を置き換えることで、インターコネクトの密度と拡張性を向上させています。この点は、NVIDIAが計画していたものの量産されなかったDGX H100 NVL256レンジャーアーキテクチャと一定の類似性があります。
Ascend 910Cは完全に華為(Huawei)が設計したものの、その製造プロセスは依然として海外サプライチェーンに大きく依存しています。具体的には、韓国製のHBM高帯域幅メモリ、台湾のTSMCが提供するウェハ、そしてアメリカ、オランダ、日本製の半導体製造設備が含まれます。なお、TSMCは制裁を回避してウェハを供給した疑いにより、最大10億米ドルの罰金を科される可能性があるとされています。
華為はまた、第三者企業Sophgoを通じてTSMCから約2.9百万個のウェハーダイを購入しており、80万個のAscend 910Bと105万個のAscend 910Cを生産することが可能です。同時に、サムスンは中国の主要なHBMサプライヤーとなっており、華為は1,300万組ものHBMスタックコンポーネントを備蓄していると言われています。これにより、160万個のAscendチップのパッケージングを支援することが可能です。
中国本土のウェハ代工メーカーであるSMIC(中芯國際)は、技術的にはまだ先進的なプロセスの段階に完全には達していないものの、上海、深圳、北京での生産能力を拡大しています。今年の月間生産量は5万枚のウェハに達すると予測されています。また、海外からフォトレジスト材料やツールメンテナンスの支援を引き続き受けることができれば、SMICの生産量はさらなる向上の余地があると言えます。
全体的に見ると、CloudMatrix 384は、中国がシステム統合を通じて半導体製造の不足を補おうとする戦略を示しています。一つのチップの性能ではNVIDIAに及ばないものの、華為は大規模なスタック技術と光学ネットワーク拡張を活用することで、計算全体の性能においてカーブで追い越しを実現し、西洋のテクノロジー大手との距離を縮めました。



