
一句话看懂:OpenAI 联合博通在九个月内完成其首款推理芯片 Jalapeño 的设计与流片,从零开始为自家大模型定制硬件,并计划 2026 年底部署。这是 OpenAI 从模型公司向全栈基础设施公司转变的关键一步,可能直接影响未来大模型的运行成本与交互体验。
事件核心:发生了什么
OpenAI 与博通合作,设计并流片了首款名为 Jalapeño 的智能处理器(Intelligence Processor)。该芯片专为大模型推理场景从零设计,而非基于现有 AI 芯片的改造。项目从空白设计到流片仅用九个月,OpenAI 称其为“史上最快的高性能先进半导体 ASIC 开发周期”。博通负责芯片实现与量产准备,Celestica 负责板卡和系统组装。据官方早期测试,Jalapeño 的每瓦性能将“大幅优于”目前业界最强水平,工程样片已在运行包括 GPT‑5.3‑Codex‑Spark 在内的真实机器学习任务,频率和功耗均按量产目标测试。
为什么重要
这一芯片发布标志着 OpenAI 战略从“训练最强模型 + 提供产品”正式延伸至硬件底层。通过自研推理芯片,OpenAI 试图掌控架构、kernel、内存系统、网络和调度等全栈环节,构建“更好的基础设施→更高算力效率→更强模型→更好产品→更多收入→再投资下一代基础设施”的飞轮。以算力驱动经济的逻辑下,自研芯片可以让 OpenAI 更精准地优化推理成本与延迟,避免依赖通用硬件带来的性能折损。同时,博通总裁提到,2026 年起将与 OpenAI 及微软等伙伴共同铺开吉瓦级数据中心,这一规模相当于大型核电站的发电级别,表明 OpenAI 对算力的投入正在从芯片延伸至整个数据中心基建。
对用户/开发者/创作者的影响
若 Jalapeño 如期部署,最直接的体现是 ChatGPT、Codex、API 等产品的响应速度更快、服务更稳定。由于芯片针对推理场景做极致优化(减少内存搬运、配平算力与网络),实际使用中模型回答延迟可能进一步降低,API 调用成本有望下降。对于依赖 OpenAI 模型的开发者,这意味着更低的使用门槛和更稳定的峰值表现;对于内容创作者,交互式生成体验(如代码补全、图像生成、对话式创作)会更流畅。不过,目前公开信息显示最终性能数据尚未公布,实际效果需等大规模部署后才能验证。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,Jalapeño 的量产时间与部署范围是否在 2026 年底按计划落地,以及首批部署的数据中心选址与合作伙伴构成。第二,OpenAI 是否会开放该芯片的生态支持(如开发者能否直接调优)或仅用于内部服务优化。第三,竞争对手(如英伟达、AMD、Google TPU 团队)是否会跟进或调整产品策略,尤其是在推理芯片领域的定价和定制化方案。第四,监管环境变化——吉瓦级数据中心建设涉及能耗、土地和排放等问题,可能影响项目推进节奏。
来源:36氪 · 24小时热榜


