OpenAI 和 Broadcom 宣布推出专为 LLM 大规模推理而设计的芯片

OpenAI 与芯片厂商 Broadcom 联合推出了一款名为 Jalapeño 的专用 ASIC 芯片,专为大型语言模型的推理任务设计,目标是降低对英伟达等外部供应商的依赖,并提升数据中心推理场景下的能效表现。

OpenAI 和 Broadcom 宣布推出专为 LLM 大规模推理而设计的芯片

一句话看懂:OpenAI 与芯片厂商 Broadcom 联合推出了一款名为 Jalapeño 的专用 ASIC 芯片,专为大型语言模型的推理任务设计,目标是降低对英伟达等外部供应商的依赖,并提升数据中心推理场景下的能效表现。

事件核心:发生了什么

OpenAI 和 Broadcom 于近日正式宣布了这款专为大语言模型推理而设计的 ASIC 芯片“Jalapeño”。据双方联合公告,该芯片完全围绕 LLM 推理任务从头设计,Broadcom 的设计团队与 OpenAI 的研发人员进行了密切沟通,并参考了 OpenAI 对未来模型和产品的路线图。整个芯片从设计到投产耗时约 9 个月。

OpenAI 表示,早期测试显示,Jalapeño 在每瓦性能上“显著优于现有先进方案”,但该公司尚未完成完整的性能评估,详细的性能报告将在未来几个月内发布。两家公司称,Jalapeño 将在今年年底前部署到数据中心中,且这只是双方长期芯片合作计划的第一代产品。

为什么重要

当前 AI 推理系统主要运行在英伟达的 GPU 或通用计算芯片上,而 Jalapeño 是为了 LLM 推理场景定制的专用芯片,理论上能提供更高效率。其意义在于两点:一是 OpenAI 借此向“全栈自研”迈出关键一步,减少在算力层面对英伟达等外部供应商的依赖;二是在当前全球算力紧张的背景下,定制芯片是 AI 公司从同等硬件资源中压榨出更多推理容量的重要手段。

对于 Broadcom 而言,此次合作标志着其定制芯片业务在 AI 浪潮中的进一步拓展——此前该公司已为多个超大规模云厂商提供定制芯片,这次直接切入大模型公司的核心推理硬件需求。

对用户/开发者/创作者的影响

对于普通 ChatGPT 或 Codex 用户而言,短期内无法直接感受到 Jalapeño 的存在。但如果该芯片按期部署,且确如 OpenAI 宣称的那样能效大幅提升,未来可能带来两个直接好处:一是 OpenAI 可以将节省的算力成本部分让利给用户,例如降低 API 调用价格或提高免费额度;二是在同等算力预算下,模型回答的响应速度(推理延迟)有望进一步优化。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

对于开发者和企业采购决策者而言,Jalapeño 是否兼容现有模型调度框架、是否对非 OpenAI 模型仅做定制优化,都是需要观察的重点。如果该芯片最终仅在 OpenAI 内部使用且绑定自有模型,则对第三方开发者的生态影响有限;若 Broadcom 未来对外销售类似芯片,则可能改变 AI 推理硬件的市场竞争格局。

值得关注的后续

第一,Jalapeño 详细的性能报告预计在几个月内发布,届时需关注其在吞吐量、延迟和能效上对英伟达 H100/B200 等现有硬件的具体优势。第二,该芯片是否会在年底前顺利规模部署,以及部署之后的实际运营表现,是验证此次合作成果的关键节点。第三,其他大模型公司如 Anthropic 或 xAI 是否跟进类似的定制芯片策略,也值得持续留意。

来源:Ars Technica

celebrityanime
celebrityanime
文章: 9817

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注