OpenAI 和 Broadcom 宣布推出专为 LLM 大规模推理而设计的芯片

一句话看懂：OpenAI 与芯片厂商 Broadcom 联合推出了一款名为 Jalapeño 的专用 ASIC 芯片，专为大型语言模型的推理任务设计，目标是降低对英伟达等外部供应商的依赖，并提升数据中心推理场景下的能效表现。

事件核心：发生了什么

OpenAI 和 Broadcom 于近日正式宣布了这款专为大语言模型推理而设计的 ASIC 芯片“Jalapeño”。据双方联合公告，该芯片完全围绕 LLM 推理任务从头设计，Broadcom 的设计团队与 OpenAI 的研发人员进行了密切沟通，并参考了 OpenAI 对未来模型和产品的路线图。整个芯片从设计到投产耗时约 9 个月。

OpenAI 表示，早期测试显示，Jalapeño 在每瓦性能上“显著优于现有先进方案”，但该公司尚未完成完整的性能评估，详细的性能报告将在未来几个月内发布。两家公司称，Jalapeño 将在今年年底前部署到数据中心中，且这只是双方长期芯片合作计划的第一代产品。

为什么重要

当前 AI 推理系统主要运行在英伟达的 GPU 或通用计算芯片上，而 Jalapeño 是为了 LLM 推理场景定制的专用芯片，理论上能提供更高效率。其意义在于两点：一是 OpenAI 借此向“全栈自研”迈出关键一步，减少在算力层面对英伟达等外部供应商的依赖；二是在当前全球算力紧张的背景下，定制芯片是 AI 公司从同等硬件资源中压榨出更多推理容量的重要手段。

对于 Broadcom 而言，此次合作标志着其定制芯片业务在 AI 浪潮中的进一步拓展——此前该公司已为多个超大规模云厂商提供定制芯片，这次直接切入大模型公司的核心推理硬件需求。

对用户/开发者/创作者的影响

对于普通 ChatGPT 或 Codex 用户而言，短期内无法直接感受到 Jalapeño 的存在。但如果该芯片按期部署，且确如 OpenAI 宣称的那样能效大幅提升，未来可能带来两个直接好处：一是 OpenAI 可以将节省的算力成本部分让利给用户，例如降低 API 调用价格或提高免费额度；二是在同等算力预算下，模型回答的响应速度（推理延迟）有望进一步优化。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

对于开发者和企业采购决策者而言，Jalapeño 是否兼容现有模型调度框架、是否对非 OpenAI 模型仅做定制优化，都是需要观察的重点。如果该芯片最终仅在 OpenAI 内部使用且绑定自有模型，则对第三方开发者的生态影响有限；若 Broadcom 未来对外销售类似芯片，则可能改变 AI 推理硬件的市场竞争格局。

值得关注的后续

第一，Jalapeño 详细的性能报告预计在几个月内发布，届时需关注其在吞吐量、延迟和能效上对英伟达 H100/B200 等现有硬件的具体优势。第二，该芯片是否会在年底前顺利规模部署，以及部署之后的实际运营表现，是验证此次合作成果的关键节点。第三，其他大模型公司如 Anthropic 或 xAI 是否跟进类似的定制芯片策略，也值得持续留意。

来源：Ars Technica

OpenAI 和 Broadcom 宣布推出专为 LLM 大规模推理而设计的芯片

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

显示 HN：Mcplexer.com

[问与答] ChatGPT Plus 和 ChatGPT Pro 实际应用差别明显哇？

英伟达刚刚摘得人工智能领域的新桂冠。这意味着NVDA股票的投资者有了新的买入理由。

发表回复取消回复