小龙虾彻底凉了?清华团队连夜开源Agent神器,Token成本狂降70%

小龙虾彻底凉了?清华团队连夜开源Agent神器,Token成本狂降70%

小龙虾彻底凉了?清华团队连夜开源Agent神器,Token成本狂降70%

一句话看懂:清华大学THUNLP实验室联合面壁智能、OpenBMB与AI9stars团队,开源了一个名为PilotDeck的智能体操作系统,解决了此前Agent工具成本高、项目隔离弱、记忆黑盒等三大工程化痛点。其智能路由方案在测试中可将Token成本降低约70%,同时保持或略优于全强模型的效果。

事件核心:发生了什么

过去一年,以OpenClaw为代表的初代Agent工具曾迅速走红,能让AI主动执行多步骤任务,但因缺少成熟的代码壁垒和生态支撑,声量快速下降。近日,清华团队开源的PilotDeck试图填补这一空白。

PilotDeck的核心创新在于三方面:一是WorkSpace(工作舱)架构,每个项目拥有独立的文件系统、记忆和技能,彼此完全隔离,不串记忆;二是智能路由,在子Agent级别分配模型而非每次请求切换,减少KV-cache中断带来的性能损失,同时支持用户通过自然语言定义路由规则,实测在社交媒体内容生成场景下,路由后花费2.83美元,不开路由需12.58美元,省了约70%;三是白盒化记忆管理,所有记忆标有时间戳、来源路径和类型,用户可直接修改或删除错误记忆,并支持“Dream”后台整理和一键回滚。

PilotDeck已在GitHub和官方网站完全开源(GitHub传送门),团队还展示了其同时运行奶茶店模拟游戏、全球AI融资数据大屏、程序员性格测试三个不同任务的能力。

为什么重要

PilotDeck的发布标志着Agent工具从“大玩具”向“生产力工具”迈出了关键一步。此前Agent面临的核心矛盾是:用得好但成本太高,或者能省钱但效果打折扣、记忆不透明。PilotDeck的智能路由并非简单的“好模型做难题、差模型做简单题”,而是通过子Agent级别的持续上下文连接,在节省成本和保持效果之间找到了一条更优路径。

另外,WorkSpace三层隔离架构(文件、记忆、技能)让团队协作和多项目管理变得可行——每个项目拥有完整的AI生存环境,而非简单的文件夹隔离。这种设计更接近真实开发场景中的“微服务”思维,有助于Agent从单用户玩具向企业级工具演进。

对用户/开发者/创作者的影响

对普通用户:可以直接部署开源版本,用低得多的成本运行复杂Agent任务,比如自动写报告、做数据分析、生成视频素材等,且不必担心项目间记忆混淆。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

对开发者:开源意味着可以自定义路由规则、连接本地模型、改造记忆机制。PilotDeck支持本地模型做子Agent,敏感数据不出本机,云端模型负责思考、本地模型负责执行,兼顾省钱与隐私,适合需要私有化部署的企业场景。

对创作者:可以在不同WorkSpace中并行运行多个创意项目(比如同时做短视频脚本和互动页面),每个项目拥有独立的AI记忆和技能库,不会互相干扰。记忆白盒化还意味着可以手动纠正AI的错误理解,降低“AI越用越偏”的风险。

值得关注的后续

1. 生态扩展速度:PilotDeck的Skill应用商店目前安装的game-asset-finder、minimax-pdf等工具还较少,能否吸引更多开发者贡献插件和技能,将决定其长期竞争力。
2. 竞品跟进:Claude的Cowork、Cursor等工具已有项目隔离能力,但PilotDeck在记忆白盒化和智能路由方面的差异化设计,可能促使它们加速迭代同类功能。
3. 开源护城河:完全开源的策略能快速积累用户和贡献者,但也面临被商业公司“套壳”的风险。团队如何平衡开源生态与商业变现,值得后续观察。

来源:36氪 · 24小时热榜

celebrityanime
celebrityanime
文章: 4181

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注