你的AI Agent越用越蠢?港中大、浙大戳破“记忆”的谎言

你的AI Agent越用越蠢?港中大、浙大戳破“记忆”的谎言

你的AI Agent越用越蠢?港中大、浙大戳破“记忆”的谎言

一句话看懂:香港中文大学与浙江大学在2026年4月30日发表的预印本论文指出,当前AI Agent所谓的“长期记忆”本质只是“备忘录”——只能检索,无法抽象为规则。这解释了为何Agent长期使用后会“越用越蠢”,并给出了让模型真正“学会”而非“记住”的架构方向。

事件核心:发生了什么

这篇题为《从备忘录到学习》(From Memo to Learning)的论文在arXiv上线后,10天内引发国际社区广泛讨论。AI领域知名账号@dair_ai在X平台转发获得超过26,100次浏览与700余次点赞。论文的核心论点分为三部分:
1. 现有记忆方案的共性缺陷:向量存储、RAG、便签本和上下文窗口管理,本质上都是基于检索的“查找”,而非真正的记忆。论文用样本复杂度理论证明,检索式系统处理组合式新任务需要存储Ω(k²)个案例,而权重记忆只需O(d)个示例,且增大上下文窗口无法突破这个组合覆盖度上限。
2. 三大结构性缺陷:信息量不等于能力(权重不变导致Agent始终是“新手”)、泛化天花板(从未见过“A+B”组合便无法处理)、结构性安全漏洞——引用的MINJA攻击注入成功率达98.2%,PoisonedRAG攻击仅需5条文本即可实现90%成功率。
3. 神经科学基础方案:借鉴互补学习系统(CLS)理论——哺乳动物大脑通过海马体(快速记录)和新皮层(缓慢整合成规则)的协作实现记忆。论文将当前Agent比作“永远不睡觉的人”,只记笔记不升华为知识。

为什么重要

论文指出了当前Agent系统的根本问题:所有主流系统(包括基于Cursor、Claude等工具构建的长期Agent)都存在“记忆但不学习”的悖论。这不是模型性能或RAG配置问题,而是架构层面缺失了“从情景存储到权重巩固”的通道。论文提出的双系统共存架构(保留检索式记忆的同时,增加LoRA、MEMIT、TTT层等异步巩固通道),为Agent从“工具”向“智能系统”进化提供了理论蓝图。这对AI行业而言,意味着必须重新设计Agent的持续学习基础设施,而非简单地扩大上下文窗口或向量库。

对用户/开发者/创作者的影响

对普通用户:你遇到的Agent“越用越蠢”不是错觉。无论是写代码、做研究还是管理客户,长期依赖后Agent不会真正理解你的项目逻辑,每次对话都像“重新认识你”。用户应降低对当前Agent“越来越懂你”的预期。
对开发者:论文呼吁系统构建者“实现从情景存储到权重的巩固通道”,而不是继续扩大向量库。基准设计者需引入“跨时间组合泛化(CGT)”指标来真实衡量Agent是否在“学习”而非“记住”。持续学习研究社区应重新关注Agent场景,因为它天然提供连续经验流。
对创作者:使用Agent生成内容时需警惕“记忆投毒”风险,恶意内容一旦注入长期记忆会在所有后续会话中循环,且当前几乎无法在结构层面防御。论文引用的攻击成功率数据应引发创作者对Agent安全性的重新评估。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

1. 理论落地速度:论文提出的双系统共识是否会迅速被主流Agent框架(如LangChain、AutoGPT等)采纳?目前公开信息显示,论文提供了具体技术路径(如TTT层、自我蒸馏),但尚未公布复现实验或开源代码。
2. 行业基准更新:Benchmark设计者是否会快速引入CGT作为新指标?这直接关系到Agent“学习能力”评估标准的改变。
3. 安全研究跟进:记忆投毒的高成功率(98.2%)是否会催生新的防御机制,或将Agent模型本身的权重更新工艺(如持续微调)纳入安全考量。

来源:36氪 · 24小时热榜

celebrityanime
celebrityanime
文章: 3031

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注