OpenAI芯片Jalapeño面向LLM推理，2026年底首批部署

OpenAI芯片Jalapeño于6月24日对外公布，定位为专攻大型语言模型（LLM）推理的Intelligence Processor，目标直接挑战目前由NVIDIA Blackwell主导的数据中心推理市场。

OpenAI芯片的定位与合作分工

Jalapeño由OpenAI与Broadcom联合发布，OpenAI主导架构方向，Broadcom负责芯片实现与Tomahawk网络技术整合，Celestica负责电路板、机架与系统集成。

芯片设计核心在于减少数据在计算单元、内存与网络之间的搬移，Jalapeño针对大型语言模型推理常见的性能瓶颈进行优化，而非面向通用浮点或图形计算。

OpenAI表示，该架构把瓶颈点作为设计目标，试图通过系统级联动提升推理效率，以改善模型响应延迟与能耗表现。

OpenAI称工程样本已在实验室以目标频率与功耗完成运行测试，测试负载包括GPT 5.3 Codex Spark，早期结果显示每瓦效能显著优于现有方案。

但官方并未披露关键技术细节，包括制程节点、HBM高带宽内存配置、芯片面积、实际推理延迟与每token成本，技术社区对这些未公开项提出质疑。

目前尚无在相同条件下与NVIDIA Blackwell或Google TPU的可比数据，因此OpenAI对外的效能主张需要通过独立基准测试与上线后服务数据来验证。

OpenAI表示，Jalapeño从初始设计到制造定稿仅耗时9个月，部分设计流程以自家AI模型辅助完成，显示其在产品开发流程中尝试用AI加速工程设计。

尽管设计周期短，但由于缺乏制造与性能等关键细节披露，业界仍关注后续的可重复测试结果与量产稳定性。

OpenAI设定的首批部署目标为2026年底，并计划随后发展为多代运算平台，若实际效率优势成立，用户可能在ChatGPT响应速度、Codex多步任务等待时间以及API成本与高峰期容量上看到改善。

但能否借此减少对NVIDIA的依赖，仍取决于公开、可重现的benchmark比较以及正式上线后服务表现，外界将以独立测试与营运数据为最终评判标准。

总体而言，Jalapeño将是对现有数据中心推理生态的重要补充，技术细节公开与第三方验证将决定其能否长期影响市场格局。