
双子座在我的爱好上对我撒了谎,这让我知道了它真正的问题是什么
一句话看懂:Google Gemini 在与用户讨论一项重返爱好的话题时,提供了虚假、看似合理的规则建议。这一亲身经历揭示了当前大语言模型的根本缺陷:其生成内容可信度不可靠,容易在用户信任的状态下误导决策。
事件核心:发生了什么
2026年6月7日,Android Police 编辑 Mark Jansen 发表亲身测试。这位长期跟踪 Android 生态的科技记者承认自己是“AI 新手”,曾使用过早期的 Bard(后更名为 Gemini)。为了重新体验新一代聊天机器人,他与 Google Gemini 讨论了自己重新捡起的一项爱好(原文未指明具体项目)。Gemini 给予了相当好的上手建议,甚至解释了围绕该爱好构建“军队”(由语境推测指模型对战或收藏类爱好)的规则。然而,Jansen 在后续实际验证中发现,Gemini 所说的规则中有部分是虚构的错误信息。
为什么重要
这并非个例幻觉,而是大语言模型核心缺陷在用户信任场景下的集中暴露。当前包括 Gemini、ChatGPT、Claude 在内的主流模型,本质上都是基于概率合成文本的“统计预测机器”,缺乏对事实的检验机制。当用户以诚恳求知的心态提问——尤其是问答内容涉及小众规则或主观判断时——模型倾向于以自信的语气“填充”答案,而不是坦诚“不知道”。这导致了一个严重问题:用户无法依靠直觉判断 AI 是否在说谎,因为 AI 在说谎时和说真话时的语气没有区别。
对用户/开发者/创作者的影响
普通用户:不应该信任聊天机器人在涉及事实核查、规则解读、法律建议、健康指导等场景下的任何输出。所有关键结论必须回查原始资料。尤其在面对“规则类”或“操作指南类”问题(例如游戏规则、组装说明书、烹饪剂量、代码文档)时,AI 给出正确率不足 100% 的建议可能带来实际损失。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
开发者/创作者:在构建基于 AI 的产品或应用时,必须引入“来源引用”或“可信度评分”机制。单纯依赖模型原生的信念感输出,在产品规模化后将导致不可控的用户投诉和信任崩塌。Google 也需考虑加快在 Gemini 回答中添加可追溯来源的引用功能,以及提供“不确定”或“需要验证”等置信度提示。
对 AI 行业:这一案例再次提醒行业,竞争正从“模型能力有多强”转向“模型有多可信任”。仅追求参数数量、对话流畅性和多模态能力,而忽视事实正确性和不确定性表达,将导致产品在真实场景中产生反噬。
值得关注的后续
1. Gemini 是否会在对话中增加“事实核对”提示:类似 Google Search 已实现的“来源面板”是否会被引入 Gemini 移动端。2. Google 是否会为此类幻觉提供仲裁机制:例如用户在反馈“规则与事实不符”后,Google 是否会在后台验证并修正特定模型回答。3. 同类竞品(ChatGPT、Claude)在类似场景中的表现:目前公开信息显示,没有公开对比测试证明哪一种模型在此类“小众规则”场景中的错误率更低。

![[推广] 中转站上线免费福利倍率 0.01: gpt-5.5 xhigh 用起来 ,支持文字和图片,看奥特曼什么时候修复,能用多久不确定。](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_4-297-768x403.jpg)
