人工智能的运行成本很高，部分原因是当今大多数工作负载都在法学硕士预科设计的通用硬件上运行。 Etched 是第一个专门为现代推理而设计的系统。 https://t.co/KluYZIZATE

AI 推理成本居高不下，Etched 想用专用硬件改写算力博弈

一句话看懂：Etched 宣布结束隐身状态，成功完成 A0 流片，并已获得超过 10 亿美元客户合同。这家公司声称，其从零设计的新系统在推理吞吐量、延迟和能效上达到了当前最佳水平，目标是解决大模型运行成本过高的硬件瓶颈。

事件核心：发生了什么

2026 年 6 月 30 日，Replit 创始人 Amjad Masad 在 X 上发布观点称，当前 AI 运行成本高昂的核心原因之一是大部分推理工作负载仍在为“大语言模型（LLM）出现前设计的通用硬件”上运行。他同时转发了 Etched 的最新动态：这家隐形公司已正式露面，完成了 A0 流片，并通报了超过 10 亿美元客户合同以及 8 亿美元融资。Etched 表示，早期客户测试显示，其硬件系统在推理工作负载上已实现业界领先（SOTA）的吞吐量、延迟和能效，首批机柜将于今年夏季出货。

为什么重要

如果 Etched 的量产表现与测试一致，这将对 AI 算力格局产生结构性冲击。目前，多数云端推理依赖 NVIDIA 等厂商的 GPU，这些芯片在设计之初主要针对并行训练任务，对大模型连续推理场景并非最优解。Etched 专门为“现代推理”设计的专用系统，理论上能以更低能耗和成本支撑大规模 API 调用、对话服务和实时 AI 应用。10 亿美元客户合同的存在表明，部分大客户已经认为这条路可行。这直接挑战了“通用 GPU 通吃一切”的行业共识，并可能加速推理硬件从通用型向专用化的分化。

对用户/开发者/创作者的影响

对于使用大模型 API 或自建推理服务的开发者和企业，Etched 的落地可能意味着长期以来的痛点——成本过高、响应延迟波动大、能效比低——有望缓解。如果专用推理单元能在同等预算下提供更低的延迟或更高的并发处理能力，那么开发者的应用逻辑将更倾向于实时 AI 功能设计，而非处处考虑成本妥协。对于普通用户，这可能不会直接感知到硬件更换，但会体现在 AI 服务定价下降或响应速度提升上。对创作者而言，更便宜的推理成本意味着更低的图像生成、文本处理门槛，有利于更多实验性项目涌现。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

有几个关键观察点值得持续跟踪：第一，Etched 的首批机柜是否按时出货，且性能能否在真实商业部署中复现其客户测试数据；第二，价格信息是否公开，以及性价比与现有 GPU 方案的对比；第三，NVIDIA 等现有主导者的反应，包括是否加速推出针对推理优化的产品线。目前公开信息显示 Etched 已获得可观资金支持，但专用硬件的生态壁垒依然存在，开发者习惯于现有 API 和框架的便捷性，新硬件的软件栈适配将是另一场硬仗。

来源：Follow Builders · X · Amjad Masad

人工智能的运行成本很高，部分原因是当今大多数工作负载都在法学硕士预科设计的通用硬件上运行。 Etched 是第一个专门为现代推理而设计的系统。 https://t.co/KluYZIZATE

AI 推理成本居高不下，Etched 想用专用硬件改写算力博弈

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

AI 推理成本居高不下，Etched 想用专用硬件改写算力博弈

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

Claude Sonnet 5 延续了 Anthropic 将价格上涨隐藏在代币利率不变背后的模式

克劳德代码中的隐藏代码秘密标记中国用户

OpenAI 预告新硬件

发表回复取消回复