双子座在我的爱好上对我撒了谎,这让我知道了它真正的问题是什么

双子座在我的爱好上对我撒了谎,这让我知道了它真正的问题是什么

双子座在我的爱好上对我撒了谎,这让我知道了它真正的问题是什么

一句话看懂:Google Gemini 在与用户讨论一项重返爱好的话题时,提供了虚假、看似合理的规则建议。这一亲身经历揭示了当前大语言模型的根本缺陷:其生成内容可信度不可靠,容易在用户信任的状态下误导决策。

事件核心:发生了什么

2026年6月7日,Android Police 编辑 Mark Jansen 发表亲身测试。这位长期跟踪 Android 生态的科技记者承认自己是“AI 新手”,曾使用过早期的 Bard(后更名为 Gemini)。为了重新体验新一代聊天机器人,他与 Google Gemini 讨论了自己重新捡起的一项爱好(原文未指明具体项目)。Gemini 给予了相当好的上手建议,甚至解释了围绕该爱好构建“军队”(由语境推测指模型对战或收藏类爱好)的规则。然而,Jansen 在后续实际验证中发现,Gemini 所说的规则中有部分是虚构的错误信息。

为什么重要

这并非个例幻觉,而是大语言模型核心缺陷在用户信任场景下的集中暴露。当前包括 Gemini、ChatGPT、Claude 在内的主流模型,本质上都是基于概率合成文本的“统计预测机器”,缺乏对事实的检验机制。当用户以诚恳求知的心态提问——尤其是问答内容涉及小众规则或主观判断时——模型倾向于以自信的语气“填充”答案,而不是坦诚“不知道”。这导致了一个严重问题:用户无法依靠直觉判断 AI 是否在说谎,因为 AI 在说谎时和说真话时的语气没有区别。

对用户/开发者/创作者的影响

普通用户:不应该信任聊天机器人在涉及事实核查、规则解读、法律建议、健康指导等场景下的任何输出。所有关键结论必须回查原始资料。尤其在面对“规则类”或“操作指南类”问题(例如游戏规则、组装说明书、烹饪剂量、代码文档)时,AI 给出正确率不足 100% 的建议可能带来实际损失。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

开发者/创作者:在构建基于 AI 的产品或应用时,必须引入“来源引用”或“可信度评分”机制。单纯依赖模型原生的信念感输出,在产品规模化后将导致不可控的用户投诉和信任崩塌。Google 也需考虑加快在 Gemini 回答中添加可追溯来源的引用功能,以及提供“不确定”或“需要验证”等置信度提示。

对 AI 行业:这一案例再次提醒行业,竞争正从“模型能力有多强”转向“模型有多可信任”。仅追求参数数量、对话流畅性和多模态能力,而忽视事实正确性和不确定性表达,将导致产品在真实场景中产生反噬。

值得关注的后续

1. Gemini 是否会在对话中增加“事实核对”提示:类似 Google Search 已实现的“来源面板”是否会被引入 Gemini 移动端。2. Google 是否会为此类幻觉提供仲裁机制:例如用户在反馈“规则与事实不符”后,Google 是否会在后台验证并修正特定模型回答。3. 同类竞品(ChatGPT、Claude)在类似场景中的表现:目前公开信息显示,没有公开对比测试证明哪一种模型在此类“小众规则”场景中的错误率更低。

来源:Android Police

celebrityanime
celebrityanime
文章: 6252

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注