你的AI Agent越用越蠢？港中大、浙大戳破“记忆”的谎言

一句话看懂：香港中文大学与浙江大学在2026年4月30日发表的预印本论文指出，当前AI Agent所谓的“长期记忆”本质只是“备忘录”——只能检索，无法抽象为规则。这解释了为何Agent长期使用后会“越用越蠢”，并给出了让模型真正“学会”而非“记住”的架构方向。

事件核心：发生了什么

这篇题为《从备忘录到学习》（From Memo to Learning）的论文在arXiv上线后，10天内引发国际社区广泛讨论。AI领域知名账号@dair_ai在X平台转发获得超过26,100次浏览与700余次点赞。论文的核心论点分为三部分：
1. 现有记忆方案的共性缺陷：向量存储、RAG、便签本和上下文窗口管理，本质上都是基于检索的“查找”，而非真正的记忆。论文用样本复杂度理论证明，检索式系统处理组合式新任务需要存储Ω(k²)个案例，而权重记忆只需O(d)个示例，且增大上下文窗口无法突破这个组合覆盖度上限。
2. 三大结构性缺陷：信息量不等于能力（权重不变导致Agent始终是“新手”）、泛化天花板（从未见过“A+B”组合便无法处理）、结构性安全漏洞——引用的MINJA攻击注入成功率达98.2%，PoisonedRAG攻击仅需5条文本即可实现90%成功率。
3. 神经科学基础方案：借鉴互补学习系统（CLS）理论——哺乳动物大脑通过海马体（快速记录）和新皮层（缓慢整合成规则）的协作实现记忆。论文将当前Agent比作“永远不睡觉的人”，只记笔记不升华为知识。

为什么重要

论文指出了当前Agent系统的根本问题：所有主流系统（包括基于Cursor、Claude等工具构建的长期Agent）都存在“记忆但不学习”的悖论。这不是模型性能或RAG配置问题，而是架构层面缺失了“从情景存储到权重巩固”的通道。论文提出的双系统共存架构（保留检索式记忆的同时，增加LoRA、MEMIT、TTT层等异步巩固通道），为Agent从“工具”向“智能系统”进化提供了理论蓝图。这对AI行业而言，意味着必须重新设计Agent的持续学习基础设施，而非简单地扩大上下文窗口或向量库。

对用户/开发者/创作者的影响

对普通用户：你遇到的Agent“越用越蠢”不是错觉。无论是写代码、做研究还是管理客户，长期依赖后Agent不会真正理解你的项目逻辑，每次对话都像“重新认识你”。用户应降低对当前Agent“越来越懂你”的预期。
对开发者：论文呼吁系统构建者“实现从情景存储到权重的巩固通道”，而不是继续扩大向量库。基准设计者需引入“跨时间组合泛化（CGT）”指标来真实衡量Agent是否在“学习”而非“记住”。持续学习研究社区应重新关注Agent场景，因为它天然提供连续经验流。
对创作者：使用Agent生成内容时需警惕“记忆投毒”风险，恶意内容一旦注入长期记忆会在所有后续会话中循环，且当前几乎无法在结构层面防御。论文引用的攻击成功率数据应引发创作者对Agent安全性的重新评估。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

1. 理论落地速度：论文提出的双系统共识是否会迅速被主流Agent框架（如LangChain、AutoGPT等）采纳？目前公开信息显示，论文提供了具体技术路径（如TTT层、自我蒸馏），但尚未公布复现实验或开源代码。
2. 行业基准更新：Benchmark设计者是否会快速引入CGT作为新指标？这直接关系到Agent“学习能力”评估标准的改变。
3. 安全研究跟进：记忆投毒的高成功率（98.2%）是否会催生新的防御机制，或将Agent模型本身的权重更新工艺（如持续微调）纳入安全考量。

来源：36氪 · 24小时热榜

你的AI Agent越用越蠢？港中大、浙大戳破“记忆”的谎言