腾讯开源 Agent 记忆技术方案,Token 消耗最高降低 61%

腾讯开源 Agent 记忆技术方案,Token 消耗最高降低 61%

腾讯开源 Agent 记忆技术方案,Token 消耗最高降低 61%

一句话看懂:腾讯云于5月14日正式开源了 TencentDB Agent Memory,这是一套专为 AI Agent 设计的记忆压缩方案,能在大幅降低 Token 成本的同时提升任务成功率。对依赖长链推理的开发者而言,这是首个可低成本落地的“记忆卸载”开源方案。

事件核心:发生了什么

5月14日,腾讯云通过官方公众号宣布,将 TencentDB Agent Memory 面向全球开源。该方案直击 Agent 在长任务场景中的核心痛点:工具调用产生的大量网页内容、代码日志和中间结果会迅速占满上下文窗口,导致 Token 成本飙升。TencentDB Agent Memory 通过两项关键技术解决此问题:一是“Mermaid 任务画布”,将 Agent 的任务过程组织成结构化任务图,保留任务状态、步骤摘要和执行关系,使上下文只需保留一张轻量级画布;二是“上下文卸载(Context Offloading)”,将原始信息(如网页内容、日志)转移到外部文件系统,上下文仅留摘要和索引,按需恢复。测试数据显示,在网页搜索场景中 Token 消耗最高降低 61%、成功率相对提升 52%;代码修复场景 Token 消耗降低 33%、完成率提升 10%;复杂长文档场景 Token 消耗降低 31%、准确率提升 8%。此外,该项目还包含长期个性化记忆模块,可将 Agent 对用户画像的理解准确率从 48% 提升至 76%。目前,该方案已在 GitHub 开源,支持 OpenClaw、Hermes 等主流 Agent 框架,一行命令即可安装使用。

为什么重要

当前 AI Agent 在代码开发、网页搜索、研究分析等场景中的任务链路持续变长,业界常见解决方案(如扩大上下文窗口或简单摘要压缩)在长任务场景中仍面临上下文膨胀和任务状态混乱问题。TencentDB Agent Memory 的突破在于将“记忆卸载”从概念级实现为可部署的开源技术,为开发者提供了一条明确的降本增效路径。此举不仅直接降低了 Agent 运行的经济门槛(Token 成本),更通过“任务画布”机制提升了复杂任务的成功率。从行业竞争角度看,腾讯云正在加速 Agent 技术生态布局——上个月刚开源了 Agent 执行底座 Cube(两周 GitHub Star 超5000),此次再开源记忆层,形成了从执行到底层存储的完整技术栈,意图吸引更多开发者进入其生态,推动 Agent 从单轮对话向长周期自主任务演进。

对用户/开发者/创作者的影响

对开发者而言,这是首个可零配置上手的开源记忆装卸方案,无需额外配置数据库或外部服务,任务记录以普通文件形式保存,便于调试和审计。在开发长链 Agent(如自动化编码、多轮网页搜索)时,可显著降低 API 调用成本。对于依赖 GPT-4 等高价模型的项目,Token 成本削减至原先的 39%(降低 61%)意味着使用场景的扩展空间被打开。对普通用户,若开发者采用此方案,未来 Agent 产品(如智能客服、自动化助手)将能处理更复杂的多步操作,而不会因聊天历史过长而“失忆”或中断。对企业采购者,在评估 Agent 平台时,应关注其是否具备类似记忆管理能力,这直接关系到长周期任务的成功率和运维成本。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

1. 产品落地与生态扩大:目前该方案支持 OpenClaw、Hermes 等框架,但能否快速集成到 LangChain、AutoGPT 等更广泛社区中使用,将影响其实际覆盖范围。2. 竞品跟进:OpenAI 等平台正在研究自身的长上下文和记忆机制,腾讯云此举可能加速业界对 Agent 记忆标准方案的制定。3. 实际场景落地效果:公开测试数据基于腾讯内部场景,但开发者需验证在复杂真实业务(如多 Agent 协作、跨天任务)中的具体成本节省和成功率提升是否稳定。

来源:量子位 · 每日最新

celebrityanime
celebrityanime
文章: 6685

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注