OpenAI芯片Jalapeño于6月24日对外公布,定位为专攻大型语言模型(LLM)推理的Intelligence Processor,目标直接挑战目前由NVIDIA Blackwell主导的数据中心推理市场。
OpenAI芯片的定位与合作分工
Jalapeño由OpenAI与Broadcom联合发布,OpenAI主导架构方向,Broadcom负责芯片实现与Tomahawk网络技术整合,Celestica负责电路板、机架与系统集成。
专为LLM推理设计,非通用计算芯片
芯片设计核心在于减少数据在计算单元、内存与网络之间的搬移,Jalapeño针对大型语言模型推理常见的性能瓶颈进行优化,而非面向通用浮点或图形计算。
OpenAI表示,该架构把瓶颈点作为设计目标,试图通过系统级联动提升推理效率,以改善模型响应延迟与能耗表现。
工程样本测试与公开信息的局限
OpenAI称工程样本已在实验室以目标频率与功耗完成运行测试,测试负载包括GPT 5.3 Codex Spark,早期结果显示每瓦效能显著优于现有方案。
但官方并未披露关键技术细节,包括制程节点、HBM高带宽内存配置、芯片面积、实际推理延迟与每token成本,技术社区对这些未公开项提出质疑。
目前尚无在相同条件下与NVIDIA Blackwell或Google TPU的可比数据,因此OpenAI对外的效能主张需要通过独立基准测试与上线后服务数据来验证。
从设计到定稿仅用9个月,部分环节由AI辅助
OpenAI表示,Jalapeño从初始设计到制造定稿仅耗时9个月,部分设计流程以自家AI模型辅助完成,显示其在产品开发流程中尝试用AI加速工程设计。
尽管设计周期短,但由于缺乏制造与性能等关键细节披露,业界仍关注后续的可重复测试结果与量产稳定性。
部署计划与对生态的潜在影响
OpenAI设定的首批部署目标为2026年底,并计划随后发展为多代运算平台,若实际效率优势成立,用户可能在ChatGPT响应速度、Codex多步任务等待时间以及API成本与高峰期容量上看到改善。
但能否借此减少对NVIDIA的依赖,仍取决于公开、可重现的benchmark比较以及正式上线后服务表现,外界将以独立测试与营运数据为最终评判标准。
总体而言,Jalapeño将是对现有数据中心推理生态的重要补充,技术细节公开与第三方验证将决定其能否长期影响市场格局。

