高考前一天，五个 AI 出了同一道作文题

一句话看懂：在2026年高考前一天，AI模型Claude、ChatGPT、Gemini、豆包和Kimi被要求独立出高考作文题。结果五道题目内核高度一致，都围绕“科技便利 vs 人文深度”展开。这揭示了一个根本矛盾：AI作为统计模型天生擅长归纳趋势，却无法完成“反预期”的命题创新。

事件核心：发生了什么

研究者给Claude、ChatGPT、Gemini、豆包、Kimi五大模型分配了相同任务：先分析2011–2025年高考作文命题原则、官方评析及社会热点，再出一道2026年作文题。各模型研究方法差异显著——Claude搭建了含总纲、官方渠道、关键专家（如张开、温儒敏）的四层研究框架，豆包输出最长的逐年真题年鉴，ChatGPT耗时34分钟制作Excel索引表。但所有模型都读出了“立德树人、反套作、思辨性”的核心要求。

最终五道题目意象各异（“零摩擦生活”“快捷键时代”“尺度”“方向感”“风景”），内核却全部收敛于“技术让生活便捷，但消解了人类深层人文价值”。即使Claude因操作失误少读5年真题，出题方向也未偏离。这并非巧合——2024年新课标I卷的AI相关题目在语料中权重极高，放大了模型对“AI时代的人”这一主题的注意力。

为什么重要

这次实验点明了AI在创意内容生成中的结构性局限。AI本质是“求同机器”，输出的是概率最高的最大公约数。高考作文命题的核心技术恰好相反——“反预期”“反宿构”，好的题目必须做到“意料之外，情理之中”。AI能完美模拟已有风格（五道题混入教辅卷中难以分辨），甚至梳理命题规则的能力超过普通教研人员，但无法跳出现有趋势制造意外。这解释了为何大模型在需要打破常规、创造新范式的任务上（如文学构思、战略突破）始终力不从心：它无法输出统计概率以外的“低概率高价值”解。

此外，实验暴露了模型对语料分布的过度依赖。近年围绕“AI与人”议题产生的评论、解读文本量巨大，形成了极强的方向信号。当所有模型都被这一信号压倒时，命题的同质化就不可避免——这本质上是一种更精密但也更僵化的“押题”。

对用户/开发者/创作者的影响

内容创作者与教育工作者：未来AI辅助写作/命题时，必须人工介入“反预期”环节。AI适合做资料梳理、规则学习、正态分布内的模拟，但最终创意决策需要人类施加减法——刻意避开AI给出的概率最高选项，转而寻找“第二、第三可能”。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

大模型开发者与产品经理：实验表明，即便给出庞大信息库，模型间的结果收敛率仍极高。这提示在创意类场景中，需要引入对抗性思路（如让两个模型互相否定优先性方案），或加入“要求输出偏离主流预测”的约束条件，以拓宽输出分布。

AI调研与创作工具用户：当使用AI生成营销方案、选题策划、产品概念时，应预判其结论容易陷入“最大公约数陷阱”。应强制工具提供多套方案，并明确标注每套方案与已有趋势的偏离度（如“本方案与多数人预期相似度90%”），辅助用户做差异化决策。

值得关注的后续

1. 2026年高考真题揭晓后，可对照验证命题组是否刻意绕开了AI预测的“科技 vs 人文”框架。若答案是肯定的，将进一步印证反AI结构化出题的必要性。

2. 关注是否有开发者尝试“反AI命题模型”——通过训练时加入“故意偏离统计分布”的负样本，或引入对立判别器，让模型学会产出“情理之中但意料之外”的内容。这或许会成为创意AI的下一个技术方向。

3. OpenAI、Google等厂商是否会在ChatGPT、Gemini等产品的API中增加“创意新颖度”输出参数，允许用户调节生成内容与已有语料分布的距离，是一个值得跟踪的产品动向。

来源：Readhub · AI

高考前一天，五个 AI 出了同一道作文题