会“伪装”的AI：最新研究表明人们普遍认定人工智能比人类更自信

一句话看懂：滑铁卢大学与伦敦大学学院的研究证实，即使AI与人类给出完全相同的回答，人们仍会主观认为AI更自信，这种“自信幻觉”可能导致用户对错误答案过度信赖，揭示了大模型交互设计中的信任盲区。

事件核心：发生了什么

5月18日发表在《传播心理学》期刊上的研究显示，滑铁卢大学和伦敦大学学院团队通过对比实验发现，当AI和人类提供完全一致的答案时，测试参与者普遍认为AI的回答“更有把握”。研究者将这一现象称为AI的“自信幻觉”。
这种偏见源于人类对AI能力的先验假设——大众默认AI在多数领域比人类更强，从而自动将“能力优秀”等同于“答案确定”。同时，由于大语言模型缺乏人类交流中的声调、表情、肢体语言等不确定性信号，用户只能凭响应速度、决策流畅度等外在线索主观判断AI的自信程度。

为什么重要

这项研究直接挑战了当前AI产品的交互设计逻辑。多数生成式AI（如ChatGPT、Claude）在输出回答时，并不提供模型对自身答案的“置信度”评分，而用户又天然倾向于高估AI的确定性。这种信任不对称催生了实际风险：用户可能在AI表现欠佳时仍盲目采纳建议，尤其是在消费决策、健康咨询、代码审查等场景下。
对行业而言，研究提示开发者在追求回答流畅度的同时，必须正视“自信幻觉”对用户判断的扭曲——如果不加以干预，即便模型准确率提升，错误的信任分配仍会导致决策失误。

对用户/开发者/创作者的影响

普通用户：应警惕对AI答案的“默认信任”。当AI在较短时间内给出肯定回复时，需主动追问推理过程，或交叉验证数据来源，避免被流畅但不准确的回答误导。
开发者和产品经理：当前的大模型API（如OpenAI的GPT-4o、Anthropic的Claude 3）未原生提供置信度输出接口。团队可在前端设计中加入“不确定性提示”功能，比如对低概率推理给出“此答案可靠性较低”的标签，或在对话中明确展示模型置信度分数。
创作者与内容生产者：使用AI辅助写作时，应对生成内容进行事实核查，尤其不要将AI对不确定问题的“自信”表述直接视为可靠信息源。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

研究团队已宣布将开展新一轮研究，目标是在人机交互中探索可直观传达模型置信度的通信方式。未来，大语言模型可能在回答中默认附带一个“置信度标识”，但三个关键变量值得跟踪：一是该功能是否会进入主流模型的API参数中（如类似GPT-4的logprobs扩展）；二是不同置信度显示策略（数字、颜色、文字）对用户信任调整的实际效果；三是在监管层面（如欧盟AI法案要求“透明性”），这类功能是否会被纳入合规要件。

来源：AIbase

会“伪装”的AI：最新研究表明人们普遍认定人工智能比人类更自信