OpenAI 於 6 月 24 日聯同 Broadcom 公布首款自研 AI 晶片 Jalapeño,定位為專攻大型語言模型(LLM)推理的 Intelligence Processor,直接針對目前由 NVIDIA Blackwell 主導的數據中心推理市場。
專為 LLM 推理而設,不做通用運算
Jalapeño 的設計核心是減少資料在運算單元、記憶體與網絡之間的搬移,針對 LLM 推理的效能瓶頸而設計。OpenAI 主導架構方向,Broadcom 負責晶片實作與 Tomahawk 網絡技術,Celestica 則負責電路板、機架與系統整合。
工程樣本已在實驗室完成以目標頻率及功耗的運行測試,負載包括 GPT 5.3 Codex Spark。OpenAI 表示早期測試的每瓦效能顯著優於現有方案,但完整技術報告仍需數月。目前未有與 NVIDIA Blackwell 或 Google TPU 在相同條件下的直接比較數據,效能優勢尚待獨立驗證。
從設計到製造定稿只用 9 個月
OpenAI 稱 Jalapeño 由初始設計至製造定稿僅耗時 9 個月,部分設計工序以自家 AI 模型輔助完成。不過,官方未披露製程節點、HBM 記憶體配置、晶片面積、實際推理延遲及每 token 成本,技術社群的質疑亦集中在這些未公開細節。
2026 年底首批部署,實際表現待服務數據驗證
首批部署目標為 2026 年底,其後發展為多代運算平台。若效率優勢成立,用家或可感受到 ChatGPT 回應速度提升、Codex 多步驟任務等待時間縮短,以及 API 成本與繁忙時段容量改善。OpenAI 能否藉此減少對 NVIDIA 的依賴,最終仍要看可重複比較的 benchmark 數據與正式上線後的服務表現。



