
一句话看懂:OpenAI 联合博通推出首款自研芯片 Jalapeño(墨西哥辣椒),专为大模型推理设计,9个月完成流片,目标年底部署。此举绕开英伟达训练芯片的正面竞争,直指推理成本与能效的底层控制权。
事件核心:发生了什么
北京时间6月25日,OpenAI 展示了与博通联合打造的定制 AI 芯片 Jalapeño。这款芯片从零开始为大模型推理设计,而非通用训练。合作分工上,OpenAI 负责根据自身模型与产品需求定义芯片架构;博通负责实现、网络和连接技术;加拿大制造商 Celestica 提供系统级集成;台积电负责制造。硬件负责人 Richard Ho 表示,芯片在 GPT-5.3-Codex-Spark 模型上的功耗和性能均达到目标,散热表现优于预期。从设计到流片仅用9个月,OpenAI 表示其中使用了自身 AI 模型辅助部分设计环节。首批芯片计划今年年底前在微软等合作伙伴处投入商业使用,2025年启动批量生产。OpenAI 的目标是到2029年通过自研芯片实现10吉瓦计算能力。
为什么重要
Jalapeño 的核心策略是避开与英伟达在训练芯片上的正面交锋,专注推理。当前推理调用量正快速增长,且对成本、能效、延迟比训练更敏感。英伟达的通用 GPU(如 Blackwell)兼具训练与推理能力,但 ASIC 定制芯片可在特定推理任务上实现更高效率与更低成本。博通 CEO Hock Tan 称,Jalapeño 相比典型 AI GPU 可节省约50%成本。这标志着头部 AI 公司正从“租用算力”转向“自研芯片+全栈控制”。网友评论指出,竞争优势正从模型本身转移至基础设施——掌控芯片、算力与网络的玩家将在未来十年胜出。同时,AI 开始参与芯片设计本身,有望降低整个行业的计算门槛。
对用户/开发者/创作者的影响
对普通用户而言,Jalapeño 的直接效果可能体现在 ChatGPT、Codex 等产品的响应速度更快、成本更低,甚至可能出现更低价格的 API 调用费率。对开发者和创作者而言,OpenAI 全栈控制意味着未来模型迭代与硬件优化将更紧密,开发体验有望简化。不过,若 OpenAI 未来不对外开放这款芯片的售卖(目前未公开是否计划商用),则对使用英伟达或 AMD 硬件的开发者影响有限。真正受影响的是 Groq 等主打低成本推理的芯片公司,它们将面临来自大模型巨头自研硬件的直接竞争。对需大量采购推理硬件的企业,未来可能面临更多自研芯片替代选项,但短期内供应链仍以英伟达为主。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,Jalapeño 能否在年底前如期部署到微软等生产环境,并量产出货。第二,OpenAI 是否计划将后续芯片版本对外出售,这将决定它对推理芯片市场(如 Groq、甚至英伟达推理产品线)的冲击程度。第三,内存供给瓶颈——SK 海力士已宣布2026年 HBM 产能售罄,Micron 亦显示供给紧张将持续,这将成为制约定制芯片大规模落地的现实因素。
来源:InfoQ CN


