拒绝天价账单！OpenAI、Anthropic 自研芯片，剑指英伟达“暴利”护城河

一句话看懂：OpenAI 已推出自研推理芯片 Jalapeño，Anthropic 也接触三星探讨芯片合作。两家头部大模型公司正从“买算力”转向“定义算力”，目的不是取代英伟达，而是通过定制硬件优化推理成本，为大规模 AI 产品商业化铺路。

事件核心：发生了什么

6月24日，OpenAI 与博通发布首款自研 AI 推理芯片 “Jalapeño”，专为大语言模型推理设计，计划年底部署，台积电制造，Celestica 构建服务器系统，样片已运行 OpenAI 的 GPT-5.3-Codex-Spark 模型。几乎同时，Anthropic 被曝已与三星接洽，探讨自研 AI 芯片的合作，尽管其对外回应仍强调将维持包含谷歌、Amazon 和英伟达芯片在内的多供应商架构。

值得注意的是，Anthropic 早在今年4月就已传出探索自研芯片的消息，而其在2月招聘的“Accelerator Platform”团队负责人和 GPU 效能工程师，已明确指向要建立能将不同代际、不同供应商芯片（TPU、Trainium、GPU）抽象为统一平台的能力。这表明其芯片计划并非突发，而是长期技术路线的一部分。

为什么重要

这一举措直接指向 AI 商业化的核心痛点：推理成本。训练决定模型上限，但推理决定商业化下限。随着 ChatGPT、Claude、Codex 等产品从“偶尔使用”变为“持续运行”，每一次 token 消耗都转化为真实账单。通用 GPU 服务于整个市场，而自研芯片可针对自身高频、稳定的推理场景优化，把单位 token 成本打下来。

但自研并非要“去英伟达”。OpenAI 仍与英伟达达成至少 10GW 数据中心合作，Anthropic 也保持多供应商路线。更实际的意义在于：增加供应紧张时的产能入口、将推理迁移到更适配的硬件、在谈判中掌握更多筹码，以及使模型路线图与硬件路线图长期协同。Anthropic 接触三星，更可能是在提前绑定韩国半导体供应链——内存、代工、封装和长期产能。

对用户/开发者/创作者的影响

对开发者而言，自研芯片的直接收益是 API 成本可能降低。OpenAI 已明确表示，芯片带来的性价比提升将体现为更快的响应、更低的构建成本。对使用 Claude 或 ChatGPT 的企业用户，这意味着大规模部署 AI Agent 或工作流时，算力账单有望变得更可预期，高峰期访问也更稳定。对普通创作者，短期内响应速度可能改善，但更深远的影响是：当推理成本降低，更多免费或低价的产品层级将可能推出。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，OpenAI 的 Jalapeño 能否在年底按时部署，性能/瓦特表现是否如宣传般“显著优于当前最先进水平”，这将直接验证自研芯片的商业前景。第二，Anthropic 与三星的合作能否从接洽走向实质代工协议，特别是三星作为全球唯二拥有逻辑芯片代工业务的内存巨头，能否借此提升其代工市场份额。第三，若自研方案成功，其他模型公司（如 Google 的 DeepMind、Meta 的 AI 团队）是否会加速建立自己的硬件路线，进而改变整个 AI 芯片供应格局。

来源：InfoQ CN

拒绝天价账单！OpenAI、Anthropic 自研芯片，剑指英伟达“暴利”护城河

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

issue: Content injection in chat with files attached to the chat directly with File Context off and Native tools on

RuntimeError: convolution(): expected the second dimension of the weight tensor

Google Drive Node: Service Accounts do not have storage quota

发表回复取消回复