OpenAI 发布首款芯片，只花了九个月

一句话看懂：OpenAI 联合博通在九个月内完成其首款推理芯片 Jalapeño 的设计与流片，从零开始为自家大模型定制硬件，并计划 2026 年底部署。这是 OpenAI 从模型公司向全栈基础设施公司转变的关键一步，可能直接影响未来大模型的运行成本与交互体验。

事件核心：发生了什么

OpenAI 与博通合作，设计并流片了首款名为 Jalapeño 的智能处理器（Intelligence Processor）。该芯片专为大模型推理场景从零设计，而非基于现有 AI 芯片的改造。项目从空白设计到流片仅用九个月，OpenAI 称其为“史上最快的高性能先进半导体 ASIC 开发周期”。博通负责芯片实现与量产准备，Celestica 负责板卡和系统组装。据官方早期测试，Jalapeño 的每瓦性能将“大幅优于”目前业界最强水平，工程样片已在运行包括 GPT‑5.3‑Codex‑Spark 在内的真实机器学习任务，频率和功耗均按量产目标测试。

为什么重要

这一芯片发布标志着 OpenAI 战略从“训练最强模型 + 提供产品”正式延伸至硬件底层。通过自研推理芯片，OpenAI 试图掌控架构、kernel、内存系统、网络和调度等全栈环节，构建“更好的基础设施→更高算力效率→更强模型→更好产品→更多收入→再投资下一代基础设施”的飞轮。以算力驱动经济的逻辑下，自研芯片可以让 OpenAI 更精准地优化推理成本与延迟，避免依赖通用硬件带来的性能折损。同时，博通总裁提到，2026 年起将与 OpenAI 及微软等伙伴共同铺开吉瓦级数据中心，这一规模相当于大型核电站的发电级别，表明 OpenAI 对算力的投入正在从芯片延伸至整个数据中心基建。

对用户/开发者/创作者的影响

若 Jalapeño 如期部署，最直接的体现是 ChatGPT、Codex、API 等产品的响应速度更快、服务更稳定。由于芯片针对推理场景做极致优化（减少内存搬运、配平算力与网络），实际使用中模型回答延迟可能进一步降低，API 调用成本有望下降。对于依赖 OpenAI 模型的开发者，这意味着更低的使用门槛和更稳定的峰值表现；对于内容创作者，交互式生成体验（如代码补全、图像生成、对话式创作）会更流畅。不过，目前公开信息显示最终性能数据尚未公布，实际效果需等大规模部署后才能验证。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，Jalapeño 的量产时间与部署范围是否在 2026 年底按计划落地，以及首批部署的数据中心选址与合作伙伴构成。第二，OpenAI 是否会开放该芯片的生态支持（如开发者能否直接调优）或仅用于内部服务优化。第三，竞争对手（如英伟达、AMD、Google TPU 团队）是否会跟进或调整产品策略，尤其是在推理芯片领域的定价和定制化方案。第四，监管环境变化——吉瓦级数据中心建设涉及能耗、土地和排放等问题，可能影响项目推进节奏。

来源：36氪 · 24小时热榜

OpenAI 发布首款芯片，只花了九个月

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

谷歌发布 Gemini3.5Flash，原生集成计算机使用工具，替代2.5框架

​打破多模型切换壁垒！谷歌将“电脑操作”原生塞进 Gemini 3.5 Flash

AI 框选即问！谷歌 Chrome 149 携手 Gemini 3.5 Flash 升级截屏交互

发表回复取消回复

打破多模型切换壁垒！谷歌将“电脑操作”原生塞进 Gemini 3.5 Flash