
会“伪装”的AI:最新研究表明人们普遍认定人工智能比人类更自信
一句话看懂:滑铁卢大学与伦敦大学学院的研究证实,即使AI与人类给出完全相同的回答,人们仍会主观认为AI更自信,这种“自信幻觉”可能导致用户对错误答案过度信赖,揭示了大模型交互设计中的信任盲区。
事件核心:发生了什么
5月18日发表在《传播心理学》期刊上的研究显示,滑铁卢大学和伦敦大学学院团队通过对比实验发现,当AI和人类提供完全一致的答案时,测试参与者普遍认为AI的回答“更有把握”。研究者将这一现象称为AI的“自信幻觉”。
这种偏见源于人类对AI能力的先验假设——大众默认AI在多数领域比人类更强,从而自动将“能力优秀”等同于“答案确定”。同时,由于大语言模型缺乏人类交流中的声调、表情、肢体语言等不确定性信号,用户只能凭响应速度、决策流畅度等外在线索主观判断AI的自信程度。
为什么重要
这项研究直接挑战了当前AI产品的交互设计逻辑。多数生成式AI(如ChatGPT、Claude)在输出回答时,并不提供模型对自身答案的“置信度”评分,而用户又天然倾向于高估AI的确定性。这种信任不对称催生了实际风险:用户可能在AI表现欠佳时仍盲目采纳建议,尤其是在消费决策、健康咨询、代码审查等场景下。
对行业而言,研究提示开发者在追求回答流畅度的同时,必须正视“自信幻觉”对用户判断的扭曲——如果不加以干预,即便模型准确率提升,错误的信任分配仍会导致决策失误。
对用户/开发者/创作者的影响
普通用户:应警惕对AI答案的“默认信任”。当AI在较短时间内给出肯定回复时,需主动追问推理过程,或交叉验证数据来源,避免被流畅但不准确的回答误导。
开发者和产品经理:当前的大模型API(如OpenAI的GPT-4o、Anthropic的Claude 3)未原生提供置信度输出接口。团队可在前端设计中加入“不确定性提示”功能,比如对低概率推理给出“此答案可靠性较低”的标签,或在对话中明确展示模型置信度分数。
创作者与内容生产者:使用AI辅助写作时,应对生成内容进行事实核查,尤其不要将AI对不确定问题的“自信”表述直接视为可靠信息源。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
研究团队已宣布将开展新一轮研究,目标是在人机交互中探索可直观传达模型置信度的通信方式。未来,大语言模型可能在回答中默认附带一个“置信度标识”,但三个关键变量值得跟踪:一是该功能是否会进入主流模型的API参数中(如类似GPT-4的logprobs扩展);二是不同置信度显示策略(数字、颜色、文字)对用户信任调整的实际效果;三是在监管层面(如欧盟AI法案要求“透明性”),这类功能是否会被纳入合规要件。
来源:AIbase


