OpenAI 和 Broadcom 推出 LLM 优化的推理芯片

OpenAI 与芯片设计公司 Broadcom 联合推出一款专门为大型语言模型推理阶段优化的芯片,旨在降低推理成本、提升响应速度,这可能改变当前依赖通用 GPU 的算力格局。

OpenAI 和 Broadcom 推出 LLM 优化的推理芯片

一句话看懂:OpenAI 与芯片设计公司 Broadcom 联合推出一款专门为大型语言模型推理阶段优化的芯片,旨在降低推理成本、提升响应速度,这可能改变当前依赖通用 GPU 的算力格局。

事件核心:发生了什么

据 Hacker News 消息,OpenAI 和 Broadcom 宣布合作推出了一款针对大语言模型推理任务优化的专用芯片。该芯片并非用于模型训练,而是专注于推理(inference)环节,即在模型训练完成后,实际处理用户请求时的计算过程。目前公开信息显示,这款芯片的设计思路是解决 LLM 推理时的高延迟和能耗问题,具体的技术参数、量产时间以及 OpenAI 是否会在自身 API 服务中优先部署,尚未完全披露。

为什么重要

当前大多数 AI 推理任务运行在英伟达等厂商的通用 GPU 上,这些芯片虽然强大,但并非为 Transformer 架构的推理任务量身定制。推理专用芯片的出现,意味着 OpenAI 正在试图摆脱对单一算力供应商的完全依赖,从软件能力向硬件自研延伸。Broadcom 在定制芯片(ASIC)设计领域具有深厚积累,双方合作可能加速推理成本的下降,并影响整个 AI 基础设施的供应链重构。这也反映出头部 AI 公司在算力自主化上的紧迫性——谁控制芯片,谁就掌握了推理效率和定价权。

对用户/开发者/创作者的影响

对于使用 OpenAI API 的开发者而言,如果推理成本降低,意味着调用 GPT 系列模型的价格可能进一步下探,催生更多高频或低利润场景的 AI 应用落地。对于创作者来说,更快的推理速度可以缩短响应时间,提升交互体验。对于企业采购决策者,这预示着未来算力供应商的选择可能更加多元,不再局限于传统的 GPU 云租赁模式。不过,目前该芯片是否已实测部署、性能提升幅度具体多少,仍需等待更多官方数据。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,这款芯片是否会率先部署在 OpenAI 的 ChatGPT 或 API 服务中,以及部署后的实际成本和性能变化。第二,英伟达等现有 GPU 厂商是否会有针对推理场景的快速响应或定制化产品推出。第三,其他自研大模型的公司(如 Google、Anthropic)是否会在硬件合作上跟进类似路径,形成新的芯片定制热潮。

来源:hackernews

celebrityanime
celebrityanime
文章: 9748

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注