拒绝天价账单!OpenAI、Anthropic 自研芯片,剑指英伟达“暴利”护城河

OpenAI 已推出自研推理芯片 Jalapeño,Anthropic 也接触三星探讨芯片合作。两家头部大模型公司正从“买算力”转向“定义算力”,目的不是取代英伟达,而是通过定制硬件优化推理成本,为大规模 AI 产品商业化铺路。

拒绝天价账单!OpenAI、Anthropic 自研芯片,剑指英伟达“暴利”护城河

一句话看懂:OpenAI 已推出自研推理芯片 Jalapeño,Anthropic 也接触三星探讨芯片合作。两家头部大模型公司正从“买算力”转向“定义算力”,目的不是取代英伟达,而是通过定制硬件优化推理成本,为大规模 AI 产品商业化铺路。

事件核心:发生了什么

6月24日,OpenAI 与博通发布首款自研 AI 推理芯片 “Jalapeño”,专为大语言模型推理设计,计划年底部署,台积电制造,Celestica 构建服务器系统,样片已运行 OpenAI 的 GPT-5.3-Codex-Spark 模型。几乎同时,Anthropic 被曝已与三星接洽,探讨自研 AI 芯片的合作,尽管其对外回应仍强调将维持包含谷歌、Amazon 和英伟达芯片在内的多供应商架构。

值得注意的是,Anthropic 早在今年4月就已传出探索自研芯片的消息,而其在2月招聘的“Accelerator Platform”团队负责人和 GPU 效能工程师,已明确指向要建立能将不同代际、不同供应商芯片(TPU、Trainium、GPU)抽象为统一平台的能力。这表明其芯片计划并非突发,而是长期技术路线的一部分。

为什么重要

这一举措直接指向 AI 商业化的核心痛点:推理成本。训练决定模型上限,但推理决定商业化下限。随着 ChatGPT、Claude、Codex 等产品从“偶尔使用”变为“持续运行”,每一次 token 消耗都转化为真实账单。通用 GPU 服务于整个市场,而自研芯片可针对自身高频、稳定的推理场景优化,把单位 token 成本打下来。

但自研并非要“去英伟达”。OpenAI 仍与英伟达达成至少 10GW 数据中心合作,Anthropic 也保持多供应商路线。更实际的意义在于:增加供应紧张时的产能入口、将推理迁移到更适配的硬件、在谈判中掌握更多筹码,以及使模型路线图与硬件路线图长期协同。Anthropic 接触三星,更可能是在提前绑定韩国半导体供应链——内存、代工、封装和长期产能。

对用户/开发者/创作者的影响

对开发者而言,自研芯片的直接收益是 API 成本可能降低。OpenAI 已明确表示,芯片带来的性价比提升将体现为更快的响应、更低的构建成本。对使用 Claude 或 ChatGPT 的企业用户,这意味着大规模部署 AI Agent 或工作流时,算力账单有望变得更可预期,高峰期访问也更稳定。对普通创作者,短期内响应速度可能改善,但更深远的影响是:当推理成本降低,更多免费或低价的产品层级将可能推出。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,OpenAI 的 Jalapeño 能否在年底按时部署,性能/瓦特表现是否如宣传般“显著优于当前最先进水平”,这将直接验证自研芯片的商业前景。第二,Anthropic 与三星的合作能否从接洽走向实质代工协议,特别是三星作为全球唯二拥有逻辑芯片代工业务的内存巨头,能否借此提升其代工市场份额。第三,若自研方案成功,其他模型公司(如 Google 的 DeepMind、Meta 的 AI 团队)是否会加速建立自己的硬件路线,进而改变整个 AI 芯片供应格局。

来源:InfoQ CN

celebrityanime
celebrityanime
文章: 11293

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注