OpenAI เมื่อวันที่ 24 มิถุนายน ประกาศร่วมกับ Broadcom เปิดตัวชิป AI รุ่นแรกที่พัฒนาขึ้นเองชื่อ Jalapeño ซึ่งวางตำแหน่งเป็นชิปเพื่อการอนุมานสำหรับโมเดลภาษาใหญ่ (LLM) โดยตรง เพื่อเจาะตลาดการประมวลผลสำหรับศูนย์ข้อมูลที่ปัจจุบันมี NVIDIA Blackwell เป็นผู้นำ
ออกแบบสำหรับการอนุมาน LLM โดยเฉพาะ ไม่ใช่การประมวลผลทั่วไป
จุดเน้นการออกแบบของ Jalapeño คือการลดการเคลื่อนย้ายข้อมูลระหว่างหน่วยประมวลผล หน่วยความจำ และเครือข่าย เพื่อแก้ปัญหาคอขวดของการอนุมาน LLM OpenAI รับหน้าที่กำหนดทิศทางสถาปัตยกรรม ขณะที่ Broadcom รับผิดชอบการผลิตชิปและเทคโนโลยีเครือข่าย Tomahawk และ Celestica รับบทเรื่องแผงวงจร แร็ค และการรวมระบบ
ตัวอย่างวิศวกรรมผ่านการทดสอบในห้องปฏิบัติการที่ความถี่และการบริโภคพลังงานตามเป้าหมาย โดยโหลดทดสอบรวมถึง GPT 5.3 Codex Spark ทาง OpenAI ระบุว่า ประสิทธิภาพต่อวัตต์ในการทดสอบเบื้องต้นดีกว่าโซลูชันที่มีอยู่อย่างมีนัยสำคัญ แต่รายงานทางเทคนิคฉบับสมบูรณ์ยังต้องใช้เวลาหลายเดือน และยังไม่มีข้อมูลการเปรียบเทียบโดยตรงภายใต้เงื่อนไขเดียวกันกับ NVIDIA Blackwell หรือ Google TPU จึงต้องรอการยืนยันจากการทดสอบอิสระ
จากการออกแบบจนถึงสรุปการผลิต ใช้เวลาเพียงเก้าเดือน
OpenAI ระบุว่า Jalapeño ใช้เวลาตั้งแต่การออกแบบต้นแบบจนถึงยืนยันรูปแบบการผลิตเพียงเก้าเดือน โดยบางขั้นตอนของการออกแบบได้รับการช่วยเหลือจากโมเดล AI ภายในบริษัท อย่างไรก็ตาม องค์กรยังไม่เปิดเผยรายละเอียดสำคัญเช่น เทคโนโลยีการผลิต (process node) การจัดวางหน่วยความจำ HBM ขนาดของชิป ความหน่วงของการอนุมานจริง หรือค่าใช้จ่ายต่อ token ซึ่งเป็นประเด็นที่ชุมชนวิศวกรรมให้ความสนใจและตั้งคำถาม
ตั้งเป้าปรับใช้ชุดแรกปลายปี พ.ศ. 2569 (2026) ผลการใช้งานจริงรอการยืนยัน
เป้าหมายการปรับใช้ชุดแรกถูกตั้งไว้ปลายปี พ.ศ. 2569 (2026) โดยมีแผนพัฒนาต่อเป็นแพลตฟอร์มคอมพิวติ้งหลายรุ่น หากข้อได้เปรียบด้านประสิทธิภาพเป็นจริง ผู้ใช้อาจสัมผัสได้ถึงความเร็วตอบสนองของ ChatGPT ที่ดีขึ้น ระยะรอในงานหลายขั้นตอนของ Codex สั้นลง รวมถึงต้นทุนการใช้ API และความจุในช่วงที่มีความต้องการสูงจะดีขึ้น แต่ OpenAI จะลดการพึ่งพา NVIDIA ได้หรือไม่นั้น ยังขึ้นกับข้อมูล benchmark ที่สามารถทำซ้ำได้และผลการให้บริการจริงหลังการใช้งานเชิงพาณิชย์

