
一句话看懂:浏览器自动化产品 Retriever 披露,通过将核心推理模型从昂贵的闭源 API 切换为开源的 DeepSeek Flash,实现了超过 100 倍的成本下降,同时保持可用性能。这打破了开发者付费补贴模型厂商自家代理产品的尴尬局面。
事件核心:发生了什么
AI 代理产品(如浏览器自动代理、AI IDE、客服代理)长期依赖闭源前沿模型的 API。每次浏览器操作——截图、分析、点击、再截图——都需要调用一次模型,一个完整工作流可能需要 40 到 100 次 API 调用。Retriever 团队在其技术博客中指出,过去两年默认的浏览器代理架构实质上是“用模型当运行时”,把推理变成了持续的收费项。现在,通过改用 DeepSeek Flash(一个开源、廉价、长上下文、强代码能力的文本模型),他们重写了架构:只用一次模型调用生成一个 JavaScript 执行计划,后续由浏览器端的工具函数(harness)在本地快速执行。一个需要 40-100 次模型调用的工作流,缩减为一次规划调用加几次定向提取。
为什么重要
这一变化动摇了闭源模型厂商对代理产品市场的定价权。此前,开发者支付昂贵的 API 费用,而模型实验室利用这笔利润补贴自家的代理应用和订阅服务,形成了一种“开发者付费资助竞争者”的扭曲商业模式。DeepSeek Flash 的出现切断了这一链条:它足够聪明地完成代码生成(编译浏览器工作),且推理成本极低,使开源模型能胜任生产环境。一旦模型不再是稀缺资源,推理服务商开始价格竞争,闭源厂商从每一次代理循环中抽税的逻辑就不成立了。报道提到,微软已在权衡将 DeepSeek 用于 Copilot Cowork 的底层模型,推动代理定价转向按用量计费。
对用户/开发者/创作者的影响
对于构建浏览器代理、工作流自动化、搜索整理等产品的开发者,这意味着可以大幅降低 API 成本,同时获得更快的响应速度。Retriever 的实践显示,纯文本模型(不依赖截图)利用浏览器已有 DOM 信息,比截图-视觉模型方案成本低两个数量级。开发者的产品护城河将从“接入哪个模型”转移到“构建更好的工具函数”(如 getPageTree、click、type、extract 等可调用的 DSL)。对于普通用户,底层可能意味着更便宜的 AI 助手、更快的自动化脚本,以及未来更丰富的开源代理生态。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,DeepSeek Flash 的代码能力在实际生产中的稳定性仍需更多第三方验证,尤其是复杂多步骤流程是否容易出错。第二,闭源模型厂商(如 OpenAI、Anthropic)是否会降价或改变代理产品捆绑策略以应对。第三,这种“代码即计划”的架构是否会被更多代理框架采纳,进而改变整个 AI 代理工具链的工程范式。
来源:www.rtrvr.ai


