
一句话看懂:AI 芯片初创公司 Etched 结束了长达数月的隐身模式,宣布累计完成 8 亿美元融资并签下超过 10 亿美元客户合同。其设计的 Sohu 芯片专为 Transformer 模型打造,计划于今年夏季开始交付机架级推理系统,这标志着 AI 推理专用硬件从概念走向规模化交付的关键一步。
事件核心:发生了什么
Etched 由哈佛辍学生 Gavin Uberti 和 Robert Wachen 于 2022 年创立,目前团队规模超过 400 人,成员多来自英伟达、博通、谷歌 TPU 团队以及 SK 海力士等企业。该公司开发的 Sohu 芯片直接将 Transformer 模型架构硬件化,而非依赖通用 GPU 执行推理任务。目前公开信息显示,Etched 已实现台积电 N4P 工艺的 A0 芯片一次性流片成功,正在与客户验证首款机架级产品。
此次融资中,最新一轮为去年 12 月完成的 5 亿美元融资,投后估值达 50 亿美元。领投方包括 Stripes,参投方有彼得·蒂尔、Positive Sum、Ribbit Capital 等机构和个人。量化交易巨头 Jane Street 还主导了一轮此前未公开的融资,对 Etched 的累计投资已超过 1 亿美元。Etched 在圣何塞总部建有多数据中心和原型实验室,并在台湾设有工厂,目标到 2027 年实现吉瓦级产能。
为什么重要
随着 AI 行业重心从模型训练转向推理,推理芯片市场正吸引大量资本涌入。与英伟达等通用 GPU 厂商不同,Etched 选择了一条更极致的路线:芯片只为 Transformer 模型设计,放弃通用性以换取更高的能效比和推理速度。这种“架构专用化”策略挑战了当前 GPU 主导的推理市场格局。Etched 还是少数提供完整机架系统而非仅芯片的初创企业之一,这种集成方案可能让企业在部署时获得即插即用的优势,同时也意味着它必须直接与服务器整机厂商竞争。
对用户/开发者/创作者的影响
对于普通用户和开发者而言,Etched 的 Sohu 芯片如果如期出货并大规模部署,很可能在未来一至两年内降低大模型推理成本,尤其是高频调用 Transformer 模型的应用场景。具体影响体现在以下几点:
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
1. API 调用成本下降:专用推理芯片的能效优势意味着提供大模型 API 的厂商(如 OpenAI、Anthropic 以及基于开源模型的服务商)可能获得更低算力成本,进而降低面向开发者的 API 定价。
2. 边缘推理场景拓展:更高效的推理芯片有助于将大模型部署到实时性要求较高的边缘设备或本地服务器,减少对云端的依赖,加速 AI 应用在工业、自动驾驶、本地内容创作等场景的落地。
3. 模型开发选择增加:开发者未来在部署模型时,将有更多硬件选项,不再局限于 GPU。如果 Etched 的产品能被主流框架支持,可能会改变部分开发者在推理优化和部署策略上的决策。
值得关注的后续
1. 产品实际出货与客户验证进展:Etched 计划今年夏季出货首款机架级系统。届时需关注客户验证结果,特别是首次流片芯片在实际推理场景中的性能、稳定性以及与主流框架(如 PyTorch、TensorFlow、TensorRT)的兼容性。
2. 竞品跟进与市场格局变化:英伟达、AMD 以及 Groq、Cerebras 等专用芯片厂商是否会在推理专用领域加速布局,或调整产品策略以应对 Etched 的竞争,将直接影响推理芯片市场的长期格局。
3. 量产能力与产能保障:Etched 宣称目标 2027 年实现吉瓦级产能,但芯片量产过程中良率、供应链稳定性以及客户订单履约情况是关键待验证点。Jane Street 等金融机构的持续投资能否转化为稳定的产能保障,也需要持续跟踪。
来源:Readhub · AI


