双子座在我的爱好上对我撒了谎，这让我知道了它真正的问题是什么

一句话看懂：Google Gemini 在与用户讨论一项重返爱好的话题时，提供了虚假、看似合理的规则建议。这一亲身经历揭示了当前大语言模型的根本缺陷：其生成内容可信度不可靠，容易在用户信任的状态下误导决策。

事件核心：发生了什么

2026年6月7日，Android Police 编辑 Mark Jansen 发表亲身测试。这位长期跟踪 Android 生态的科技记者承认自己是“AI 新手”，曾使用过早期的 Bard（后更名为 Gemini）。为了重新体验新一代聊天机器人，他与 Google Gemini 讨论了自己重新捡起的一项爱好（原文未指明具体项目）。Gemini 给予了相当好的上手建议，甚至解释了围绕该爱好构建“军队”（由语境推测指模型对战或收藏类爱好）的规则。然而，Jansen 在后续实际验证中发现，Gemini 所说的规则中有部分是虚构的错误信息。

为什么重要

这并非个例幻觉，而是大语言模型核心缺陷在用户信任场景下的集中暴露。当前包括 Gemini、ChatGPT、Claude 在内的主流模型，本质上都是基于概率合成文本的“统计预测机器”，缺乏对事实的检验机制。当用户以诚恳求知的心态提问——尤其是问答内容涉及小众规则或主观判断时——模型倾向于以自信的语气“填充”答案，而不是坦诚“不知道”。这导致了一个严重问题：用户无法依靠直觉判断 AI 是否在说谎，因为 AI 在说谎时和说真话时的语气没有区别。

对用户/开发者/创作者的影响

普通用户：不应该信任聊天机器人在涉及事实核查、规则解读、法律建议、健康指导等场景下的任何输出。所有关键结论必须回查原始资料。尤其在面对“规则类”或“操作指南类”问题（例如游戏规则、组装说明书、烹饪剂量、代码文档）时，AI 给出正确率不足 100% 的建议可能带来实际损失。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

开发者/创作者：在构建基于 AI 的产品或应用时，必须引入“来源引用”或“可信度评分”机制。单纯依赖模型原生的信念感输出，在产品规模化后将导致不可控的用户投诉和信任崩塌。Google 也需考虑加快在 Gemini 回答中添加可追溯来源的引用功能，以及提供“不确定”或“需要验证”等置信度提示。

对 AI 行业：这一案例再次提醒行业，竞争正从“模型能力有多强”转向“模型有多可信任”。仅追求参数数量、对话流畅性和多模态能力，而忽视事实正确性和不确定性表达，将导致产品在真实场景中产生反噬。

值得关注的后续

1. Gemini 是否会在对话中增加“事实核对”提示：类似 Google Search 已实现的“来源面板”是否会被引入 Gemini 移动端。2. Google 是否会为此类幻觉提供仲裁机制：例如用户在反馈“规则与事实不符”后，Google 是否会在后台验证并修正特定模型回答。3. 同类竞品（ChatGPT、Claude）在类似场景中的表现：目前公开信息显示，没有公开对比测试证明哪一种模型在此类“小众规则”场景中的错误率更低。

来源：Android Police

双子座在我的爱好上对我撒了谎，这让我知道了它真正的问题是什么