我教 ChatGPT 不信任自己，突然它不再产生幻觉

一句话看懂：一位资深AI记者通过修改提示词，让ChatGPT以“敌意审计员”身份审视自己的回答，大幅降低了虚构事实的“幻觉”现象。这一简单方法揭示了当前大模型在默认状态下过度自信的根源，也为普通用户提供了低成本改善可靠性的实用策略。

事件核心：发生了什么

TechRadar记者Eric Hal Schwartz在测试中发现，在向ChatGPT提问事实性问题时，只需在提示词末尾追加一段“敌意审计员”指令，即可显著减少模型产生幻觉。该指令的核心是要求ChatGPT“默认假设无支撑的细节为假”，并“明确标记所有不确定、推断或弱支持的陈述”。实测中，ChatGPT的表现从原来的“90%有用且真实”变为更加谨慎：例如在周末旅行规划中，它主动标注了“列车时刻表可能已过时”和“餐厅营业时间未经独立确认”等风险。即使在简单家务问题——如空气净化器尺寸适配咨询中，模型也改变了“直接肯定”的默认回复模式，转而提示用户注意“天花板高度、滤网状态和实际气流”等变量。该记者强调，这种方法并未完全消除幻觉，但极大提升了模型对推理弱点的透明度。

为什么重要

目前公开信息显示，大语言模型产生“自信幻觉”的根本原因在于其训练目标：生成听起来合理、能维持流畅对话的响应，而非严格确保事实准确性。这种设计让模型在面对不确定信息时倾向于编造。Schwartz的发现揭示了一个关键洞察——通过修改推理阶段的系统提示，可以部分抵消模型在预训练阶段养成的“过度自信”倾向。这对整个AI行业有显著意义：一方面，它证明**推理策略（prompt engineering）依然是降低幻觉最简单、最廉价的手段**，无需重新训练模型或增加算力投入；另一方面，它暗示当前主流大模型在“不确定性表达”方面的能力仍有巨大提升空间，未来可能需要将类似“敌意审计”机制内化进模型的基础能力中。对于OpenAI、Anthropic等公司而言，若能让模型默认具备这种自我怀疑机制，将直接提升产品在企业合规、医疗、法律等高可靠性场景下的可用性。

对用户/开发者/创作者的影响

对普通用户：如果你经常用ChatGPT查询事实、撰写报告或规划行程，强烈建议在提示词中加入类似“作为敌意审计员，默认假设无支撑细节为假”的指令。这不会增加任何成本，却能显著降低被错误信息误导的风险。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

对开发者：在构建基于大模型的应用程序时，可以将“自我怀疑机制”作为**系统提示（system prompt）**的一部分，而非仅在用户输入时添加。尤其对于需要高可信度的客服、搜索、教育类应用，这能有效减少用户对AI输出的盲目信任。

对于AI产品经理：该实验说明，当前模型在推理阶段依然高度依赖提示词的控制方式。未来可以考虑在产品UI层增加“严谨模式”或“审计模式”开关，让用户一键切换对话风格，比单纯依赖模型自身的改进要快得多。

值得关注的后续

1. 是否会被模型厂商内置：OpenAI、谷歌或Anthropic是否会在未来版本中默认加入类似“不确定性标记”机制，从而减少用户手动调整提示词的依赖。

2. 对API成本的影响：更长的提示词会占用更多token，是否会在某些场景下显著增加推理费用？对于高频调用场景（如批量内容生成），用户需平衡可信度与成本。

3. 竞品反应：其他大模型（如Claude、Gemini）是否对类似“敌意审计”提示敏感？不同模型在自我怀疑能力上的表现差异，可能成为用户选择模型的一个新指标。

来源：TechRadar

我教 ChatGPT 不信任自己，突然它不再产生幻觉