为什么人工智能会忘记你说过的话(以及如何解决这个问题)

为什么人工智能会忘记你说过的话(以及如何解决这个问题)

为什么人工智能会忘记你说过的话(以及如何解决这个问题)

一句话看懂:人工智能模型不会“记住”你的每一次对话,它们依赖一个固定大小的“上下文窗口”。当你贴入长文档或与模型进行长时间对话后,模型会逐渐丢失较早部分的信息,甚至给出自信但错误的回答。这不是幻觉,而是模型的注意力被稀释了。

事件核心:发生了什么

在dev.to上,一位AWS工程师以“桌面”为比喻,解释了AI模型为何会“忘记”你说过的话。每个模型都有一个固定的上下文窗口(token数量限制),这个窗口必须同时容纳你的输入、模型输出、对话历史和系统指令。在Anthropic的Claude模型(如Opus)上,有用户反馈,模型在经过长时间对话后主动要求“保存上下文,明天继续”。这其实是一个好的信号,因为更多模型会在不警告用户的情况下,悄悄降低回答的准确性。这种现象被称为“迷失在中间”(lost in the middle),即模型在处理长输入时,往往记住开头和结尾,而中间部分的信息被弱化。例如,一段20页的法律合同,当你问及第7页的条款时,模型可能漏掉、错误引用或从完全不相关的部分提取。而对话场景中,简单的一问一答(约350个token)重复20次后,token数就会超过7,000,足够填满一些早期模型的上下文窗口。

为什么重要

这个机制揭示了AI产品体验的一个核心矛盾。上下文窗口既是内存单位,也是成本单位——用户每次发送消息,实际上是在重新发送并支付整个对话历史的费用。虽然新模型(如支持128k token或更高)的桌面变大了,但“桌面上的所有内容并不能被同等关注”。这意味着,模型的能力上限(窗口大小)和实际可用性(注意力分散)之间存在巨大鸿沟。对于开发者而言,如果只关注模型的最大窗口数,而忽略其在长上下文上的实际表现,就可能在构建文档问答、客服聊天或代码分析工具时,遇到隐蔽但致命的信息丢失问题。这也解释了为什么许多产品(如ChatGPT的记忆功能、Claude的Projects)要在基础模型之上建立外部持久化层——因为模型本身并不具备真正的长期记忆。

对用户/开发者/创作者的影响

对普通用户来说,最直接的教训是:不要依赖AI记住对话早期的一切。如果会话超过10-20轮交互,建议主动总结重要信息,或重新开启一个新会话。对于需要处理长文档的用户(如合同审查、论文阅读),即使模型标称有百万token窗口,也要假设模型会忽略中间部分。关键信息应放在输入的开头或结尾,或者通过分多个提示的方式,将大文档拆解为小段分别询问。对开发者而言,必须正视“迷失在中间”这一现实。在构建需要长上下文的应用时,应主动监控token消耗,并考虑使用外部向量数据库或摘录机制来管理知识,而不是将整个文档或历史直接塞入模型提示词。同时,在评估模型时,应将“长上下文中的检索与推理能力”列为与“准确性”同等重要的维度。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,模型厂商是否会开始提供“上下文使用率”和“注意力分布”的可视化工具,帮助用户和开发者感知模型正在关注哪些部分。第二,长上下文优化的技术路线(如稀疏注意力、滑动窗口注意力、外部检索增强)是否会成为模型发布时的标准配置,而非单纯比拼上下文窗口数量。第三,是否有产品(如协作工具、AI助手)开始将“会话摘要自动生成”作为标配功能,以在用户关闭会话前自动保存关键信息,防止长对话时的遗忘问题。

来源:dev.to

celebrityanime
celebrityanime
文章: 7248

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注