AI 设计9个月就能媲美Blackwell？OpenAI “辣芯”绕开英伟达正面战场，但老黄的GPU大盘不稳了

一句话看懂：OpenAI 联合博通推出首款自研芯片 Jalapeño（墨西哥辣椒），专为大模型推理设计，9个月完成流片，目标年底部署。此举绕开英伟达训练芯片的正面竞争，直指推理成本与能效的底层控制权。

事件核心：发生了什么

北京时间6月25日，OpenAI 展示了与博通联合打造的定制 AI 芯片 Jalapeño。这款芯片从零开始为大模型推理设计，而非通用训练。合作分工上，OpenAI 负责根据自身模型与产品需求定义芯片架构；博通负责实现、网络和连接技术；加拿大制造商 Celestica 提供系统级集成；台积电负责制造。硬件负责人 Richard Ho 表示，芯片在 GPT-5.3-Codex-Spark 模型上的功耗和性能均达到目标，散热表现优于预期。从设计到流片仅用9个月，OpenAI 表示其中使用了自身 AI 模型辅助部分设计环节。首批芯片计划今年年底前在微软等合作伙伴处投入商业使用，2025年启动批量生产。OpenAI 的目标是到2029年通过自研芯片实现10吉瓦计算能力。

为什么重要

Jalapeño 的核心策略是避开与英伟达在训练芯片上的正面交锋，专注推理。当前推理调用量正快速增长，且对成本、能效、延迟比训练更敏感。英伟达的通用 GPU（如 Blackwell）兼具训练与推理能力，但 ASIC 定制芯片可在特定推理任务上实现更高效率与更低成本。博通 CEO Hock Tan 称，Jalapeño 相比典型 AI GPU 可节省约50%成本。这标志着头部 AI 公司正从“租用算力”转向“自研芯片+全栈控制”。网友评论指出，竞争优势正从模型本身转移至基础设施——掌控芯片、算力与网络的玩家将在未来十年胜出。同时，AI 开始参与芯片设计本身，有望降低整个行业的计算门槛。

对用户/开发者/创作者的影响

对普通用户而言，Jalapeño 的直接效果可能体现在 ChatGPT、Codex 等产品的响应速度更快、成本更低，甚至可能出现更低价格的 API 调用费率。对开发者和创作者而言，OpenAI 全栈控制意味着未来模型迭代与硬件优化将更紧密，开发体验有望简化。不过，若 OpenAI 未来不对外开放这款芯片的售卖（目前未公开是否计划商用），则对使用英伟达或 AMD 硬件的开发者影响有限。真正受影响的是 Groq 等主打低成本推理的芯片公司，它们将面临来自大模型巨头自研硬件的直接竞争。对需大量采购推理硬件的企业，未来可能面临更多自研芯片替代选项，但短期内供应链仍以英伟达为主。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，Jalapeño 能否在年底前如期部署到微软等生产环境，并量产出货。第二，OpenAI 是否计划将后续芯片版本对外出售，这将决定它对推理芯片市场（如 Groq、甚至英伟达推理产品线）的冲击程度。第三，内存供给瓶颈——SK 海力士已宣布2026年 HBM 产能售罄，Micron 亦显示供给紧张将持续，这将成为制约定制芯片大规模落地的现实因素。

来源：InfoQ CN

AI 设计9个月就能媲美Blackwell？OpenAI “辣芯”绕开英伟达正面战场，但老黄的GPU大盘不稳了

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

点击这里进入

Mistral AI发布OCR4 模型：支持 170 种语言，输出质量超越GPT与Gemini

法国 AI 初创企业 Mistral AI 发布 OCR4模型:覆盖170种语言，交互体验更人性化

发表回复取消回复