隨着雲端科技不斷演變,AWS 正在持續探索這項技術的廣闊潛力。最近推出的 Amazon EC2 Capacity Blocks,專為機器學習和人工智慧應用而設,與 EC2 UltraClusters 功能相結合,實現高達 3,200 Gbps 的網絡速度,旨在引領企業面對日益增長的 AI 和 ML 需求。
EC2 Capacity Blocks 的核心是 UltraClusters,這是一個為高性能計算以及大型機器學習任務所設計的集群系統,包含數千個加速的 EC2 實例,形成一個高度集成的計算網絡。透過第二代彈性網絡適配器(Elastic Fabric Adapter, EFA)技術,這些集群能夠達成千兆位級別的網絡性能,確保數據能於各個實例之間快速流動,猶如團隊討論般的高效。
這項技術的另一大亮點在於其加入了 P5e 實例,這是 NVIDIA 最新 H100 GPUs 驅動的實例,能夠滿足高效能運算需求。UltraClusters 中的 P5e 實例具備高達 3,200 Gbps 的網絡吞吐量,不單提升了數據傳輸的速度,更讓研究與開發團隊的效率達到前所未有的水準。想像一下,當進行對大型語言模型的訓練時,參數能夠在數百個 GPU 之間隨意流動,幾乎無延遲地進行即時推理,這正是 P5e 實例所能達成的卓越表現。
AWS 的核心理念不僅在於提供卓越的性能,更重視在迅速變化的科技環境中,灵活性與成本效益的發揮。因此,EC2 Capacity Blocks 讓使用者能在 1 至 28 天內靈活預留資源,展現了為關鍵項目分配專用資源與避免高性能運算設施的長期承諾之間的完美平衡。
這項技術的影響遍及各個領域,包括加速氣候模型的建設、藥物研發,甚至在自然語言處理和計算機視覺等領域構建更複雜的 AI 模型。初創企業將能以更低的成本使用到超級電腦水平的資源,而大型企業可以以前所未有的靈活性推動其 AI 計劃的進行。
自推出以來,Amazon EC2 Capacity Blocks 收到業界的正面回應。Amplify Partners 形容這些產品對初創企業的變革能力,Canva 則計劃利用 EC2 Capacity Blocks 來訓練更大型的模型。其他如 Leonardo.Ai 和 OctoML 也對這項技術的彈性和客製化資源能力表達了興奮。這些回應強調了該技術的多功能性,為各行各業的 AI 創新注入動力。
AWS 準備進一步開展更具創新和激動人心的研究項目。現時,EC2 Capacity Blocks 已在美國的俄亥俄州、北維珍尼亞州、俄勒岡州和澳洲墨爾本開放,未來將擴展至更多 AWS 服務地區,為全球各行各業的創新進程持續注入新的活力。