这家Agent 公司从 Claude 切到 DeepSeek v4:一年省下数百万美元,迁移工作量却是预期的 100 倍

AI 代理平台 Lindy 将全部生产流量从 Anthropic 的 Claude 切换到 DeepSeek v4,每年节省数百万美元推理成本,但迁移和评估工作量远超预期。这反映了在推理成本高企的背景下,企业正被迫在模型性能和成本之间做出艰难选择。

这家Agent 公司从 Claude 切到 DeepSeek v4:一年省下数百万美元,迁移工作量却是预期的 100 倍

一句话看懂:AI 代理平台 Lindy 将全部生产流量从 Anthropic 的 Claude 切换到 DeepSeek v4,每年节省数百万美元推理成本,但迁移和评估工作量远超预期。这反映了在推理成本高企的背景下,企业正被迫在模型性能和成本之间做出艰难选择。

事件核心:发生了什么

前 Uber 工程师 Flo Crivello 创立的无代码 AI 代理平台 Lindy,正式将所有面向用户的生产流量从 Anthropic 的 Claude 模型切换至 DeepSeek v4。该决策背后是 Lindy 对模型未来 6-9 个月的持续评估,以及 DeepSeek v4 发布后两个月的密集测试。Crivello 表示,这一迁移每年可为公司节省数百万美元的推理费用,同时在电子邮件收件箱分类、预起草回复等核心用例上获得了性能提升。然而,迁移工作量比最初预期高出约 100 倍,核心难点在于系统性的在线与离线评估、提示词调整以及用户留存影响的观察。Lindy 选择通过美国推理服务商 Atlas Cloud 托管 DeepSeek v4,未考虑自托管方案。

为什么重要

Lindy 的迁移并非孤立事件,它揭示了 AI 行业正在经历的结构性分化。此前 Uber 在 Claude Code 上的 AI 预算在四个月内耗尽,GitHub Copilot 也因成本问题放弃了统一费率——推理成本已成为可持续 AI 部署的最大障碍。在此背景下,DeepSeek 等低成本开源模型的崛起,将市场清晰地分为“超高端闭源前沿”与“廉价开源替代”两端,中间地带正在消失。Lindy 的判断是:对于大规模消耗 Token 的公司而言,不行动是不负责任的。这也促使 Linux 基金会成立 Tokenomics 基金会,尝试建立统一的 AI Token 成本标准,这正是行业尚未形成有效成本控制的直接反映。

对 AI 开发者和企业采购的影响

对于开发者和企业采购决策者而言,Lindy 的案例提供了几个关键信号。第一,模型切换的成本并不仅是 API 定价的差异,而是需要投入大量人力进行提示词适配、自动化任务评估和用户留存验证,迁移难度远超预期。第二,性能差距正在缩小,但在复杂工作流自动化等领域,开源模型仍落后于闭源前沿模型,这也意味着企业需要根据具体任务场景做精细化选择。第三,地缘政治因素不可回避:Lindy 明确选择由美国服务商托管的 DeepSeek v4 以回应数据主权关切,显示模型产地和合规托管能力已成为采购决策的重要变量。

值得关注的后续

首先,Anthropic 是否会大幅降价以赢回 Lindy 这样的核心客户?Crivello 明确表示“如果 Anthropic 下一次发布能让他们重新赢得业务,我不会感到惊讶,但他们需要大幅降价”。其次,DeepSeek v4 在复杂工作流自动化上的短板是否会迫使 Lindy 在某些任务中回流到 Opus 等更高阶模型?Crivello 透露,当任务失败时,仍然可能升级到 Opus,但将是少数情况。最后,开源推理服务提供商(如 Atlas Cloud)是否会因为此类大规模迁移案例的出现而迎来更多企业订单,值得持续关注——这直接影响到下一代 AI 基础设施的竞争格局。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

来源:InfoQ CN

celebrityanime
celebrityanime
文章: 9896

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注