
一句话看懂:当AI生成的内容不仅充斥网络,还开始渗透文学奖、正式出版物等“信任高地”,且缺乏任何“转基因”式标签与监管时,普通人的信息筛选成本与认知风险正在急剧攀升。一篇发表于《自然》的论文已证明,AI模型用AI生成数据训练几轮后会发生“模型崩溃”——信息生态正在不可逆地变质。
事件核心:发生了什么
2026年5月,英国文学杂志《Granta》公布英联邦短篇小说奖获奖作品,其中一篇加勒比地区获奖小说被大量读者及检测工具高度怀疑为AI生成。几乎同时,一本名为《真相的未来:AI如何重塑现实》的新书被《纽约时报》发现多处引用为AI编造,而该书主题正是警告AI侵蚀真相。这两起事件并非发生在垃圾内容农场,而是发生在文学奖与知名出版社层面,暴露出“信任基础设施”的漏洞。此外,2024年《自然》杂志发表了来自牛津、剑桥等机构的论文,从数学上证明AI用前代AI数据训练会导致“模型崩溃”;2026年4月arXiv上的一篇论文运用流行病学SIR模型模拟,指出AI生成内容在信息生态中的“再生数R₀大于1”,意味着其扩散已能自我维持。
为什么重要
这不仅是作弊或虚假信息问题,而是“知识的转基因化”进入不可逆阶段。在食品领域,转基因作物有审批、毒性测试与强制标签(如欧盟要求≥0.9%生物工程成分必须标注,美国自2022年起强制要求标签)。但在信息领域,目前没有任何机构对AI生成的内容做“认知安全性审查”,也没有强制标签告知消费者“此句由AI生成”。斯坦福2026年AI指数报告显示,互联网超一半新内容已由AI生成或辅助生成,2023年这一比例还不到10%。Google Gemini 3发布后,研究者发现其给出的“正确答案”中56%无可用来源。当检索增强(RAG)搜索池中的AI内容污染率达到67%时,用户有超过80%概率接触到被污染的结果。这意味着,普通人自以为在“查证”,实则是在一个已被污染的信息水库里接水。
对用户/开发者/创作者的影响
- 对普通用户:信息摄入正在分层。上层是少数有辨别力的人使用的可溯源信息源(通常不在算法推荐与免费信息流中);下层是算法推送、AI批量产出的“看起来像专业内容”的内容。大多数人没有选择哪个层的自由。用户需要主动养成交叉验证习惯,并留意工具是否提供“AI生成”标签。
- 对开发者与创作者:MIT写作教授Micah Nathan指出,价值不在于产出句子的动作,而在于“产出过程中发生在你身上的转变”——写作是发现自己思考的过程。滥用AI辅助可能导致“路没铺成”。对于构建AI产品的开发者,需警惕模型崩溃风险,尤其是当训练语料中混入未标记的AI生成数据时,输出质量将不可逆退化。可考虑在模型训练中引入更严格的来源筛选与合成数据检测。
值得关注的后续
- 文学奖与出版业的反应:Granta是否会启动对获奖作品的正式调查或修改投稿规则?《真相的未来》的出版社是否会推出更正版本或标注使用AI辅助的说明?
- 监管与标签推动:欧盟《AI法案》的落地是否将加速对“AI生成内容”的强制性标签要求?美国或中国是否会借鉴转基因食品的监管逻辑,推动信息领域的“知情权”法案?
- 模型训练生态的反馈机制:面对“模型崩溃”的数学证明,闭源与开源大模型厂商是否会在训练流程中引入“合成数据检测”与“来源溯源”步骤?中小开发者如何避免自己的模型陷入“数字衔尾蛇”循环?
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
来源:Readhub · AI
![[分享创造] 时隔两年,终于完成了我的第一款 AI 聊天应用](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_5-499-768x403.jpg)

