知识的转基因危机：AI 将使多数人沦为认知肉鸡？

一句话看懂：当AI生成的内容不仅充斥网络，还开始渗透文学奖、正式出版物等“信任高地”，且缺乏任何“转基因”式标签与监管时，普通人的信息筛选成本与认知风险正在急剧攀升。一篇发表于《自然》的论文已证明，AI模型用AI生成数据训练几轮后会发生“模型崩溃”——信息生态正在不可逆地变质。

事件核心：发生了什么

2026年5月，英国文学杂志《Granta》公布英联邦短篇小说奖获奖作品，其中一篇加勒比地区获奖小说被大量读者及检测工具高度怀疑为AI生成。几乎同时，一本名为《真相的未来：AI如何重塑现实》的新书被《纽约时报》发现多处引用为AI编造，而该书主题正是警告AI侵蚀真相。这两起事件并非发生在垃圾内容农场，而是发生在文学奖与知名出版社层面，暴露出“信任基础设施”的漏洞。此外，2024年《自然》杂志发表了来自牛津、剑桥等机构的论文，从数学上证明AI用前代AI数据训练会导致“模型崩溃”；2026年4月arXiv上的一篇论文运用流行病学SIR模型模拟，指出AI生成内容在信息生态中的“再生数R₀大于1”，意味着其扩散已能自我维持。

为什么重要

这不仅是作弊或虚假信息问题，而是“知识的转基因化”进入不可逆阶段。在食品领域，转基因作物有审批、毒性测试与强制标签（如欧盟要求≥0.9%生物工程成分必须标注，美国自2022年起强制要求标签）。但在信息领域，目前没有任何机构对AI生成的内容做“认知安全性审查”，也没有强制标签告知消费者“此句由AI生成”。斯坦福2026年AI指数报告显示，互联网超一半新内容已由AI生成或辅助生成，2023年这一比例还不到10%。Google Gemini 3发布后，研究者发现其给出的“正确答案”中56%无可用来源。当检索增强（RAG）搜索池中的AI内容污染率达到67%时，用户有超过80%概率接触到被污染的结果。这意味着，普通人自以为在“查证”，实则是在一个已被污染的信息水库里接水。

对用户/开发者/创作者的影响

对普通用户：信息摄入正在分层。上层是少数有辨别力的人使用的可溯源信息源（通常不在算法推荐与免费信息流中）；下层是算法推送、AI批量产出的“看起来像专业内容”的内容。大多数人没有选择哪个层的自由。用户需要主动养成交叉验证习惯，并留意工具是否提供“AI生成”标签。
对开发者与创作者：MIT写作教授Micah Nathan指出，价值不在于产出句子的动作，而在于“产出过程中发生在你身上的转变”——写作是发现自己思考的过程。滥用AI辅助可能导致“路没铺成”。对于构建AI产品的开发者，需警惕模型崩溃风险，尤其是当训练语料中混入未标记的AI生成数据时，输出质量将不可逆退化。可考虑在模型训练中引入更严格的来源筛选与合成数据检测。

值得关注的后续

文学奖与出版业的反应：Granta是否会启动对获奖作品的正式调查或修改投稿规则？《真相的未来》的出版社是否会推出更正版本或标注使用AI辅助的说明？
监管与标签推动：欧盟《AI法案》的落地是否将加速对“AI生成内容”的强制性标签要求？美国或中国是否会借鉴转基因食品的监管逻辑，推动信息领域的“知情权”法案？
模型训练生态的反馈机制：面对“模型崩溃”的数学证明，闭源与开源大模型厂商是否会在训练流程中引入“合成数据检测”与“来源溯源”步骤？中小开发者如何避免自己的模型陷入“数字衔尾蛇”循环？