
xAI被曝曾利用Claude输出数据训练编码模型,因Anthropic撤销权限转入地下提取
一句话看懂:埃隆·马斯克旗下AI公司xAI被曝在过去数月里,直接使用竞争对手Anthropic的Claude模型输出数据,训练其Grok编码模型。Anthropic在2026年1月撤销了xAI的API权限后,xAI工程师转而通过个人账户和第三方服务继续提取数据。
事件核心:发生了什么
据《The Information》报道,xAI曾长时间、系统性地利用Anthropic旗下旗舰模型Claude的输出数据,来训练其Grok模型的编码能力。这一做法在2026年1月被Anthropic发现并撤销了xAI的官方API访问权限。然而,xAI并未停止,而是转入“地下”——其工程师开始通过个人账户以及第三方中间服务商Blackbox AI持续提取Claude的输出数据。此外,马斯克此前已在法庭上承认,xAI曾“部分”使用OpenAI的模型进行训练,并辩称这种利用头部模型输出进行合成数据迁移的做法是“行业惯例”。
为什么重要
这一事件暴露了生成式AI行业在高品质训练数据日渐枯竭背景下的普遍焦虑。随着合规的开源数据触及天花板,类似“知识蒸馏”和边缘性合成数据提取,已成为后发厂商追赶一线梯队的一条灰色捷径。xAI的做法折射出当前AI竞争中的一个现实:单纯依靠堆计算资源和依赖外部数据提升模型性能的模式正面临瓶颈。同时,xAI自身也面临内部动荡——其预训练团队已缩减至不足5人,包括4位Grok代码负责人在内的多位联合创始人近几个月已离职。近期还发生员工误删关键训练数据导致两到三周工作成果丢失的事故,目前xAI不得不依赖从SpaceX临时租赁计算资源来维持运营。
对用户/开发者/创作者的影响
对于依赖Grok进行代码生成的开发者而言,xAI当前的技术依赖和核心团队流失,可能影响模型的迭代速度和稳定性,甚至存在服务中断或质量下降的风险。对于AI应用开发者来说,这一案例提示使用合成数据进行模型训练时,需要更审慎地考虑数据来源的合规性和潜在的法律风险。对于普通用户,目前公开信息显示,xAI的产品正常运转,但企业内核的不稳定可能在未来影响产品体验。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,xAI能否在团队大规模流失后保持产品更新节奏,尤其是Grok的编码能力是否会出现停滞。第二,Anthropic是否会采取法律或商业措施进一步限制xAI的数据提取行为,以及监管机构是否会对这类“地下提取”行为介入调查。第三,xAI目前依赖从SpaceX租赁算力的模式能否长期支撑业务发展,以及其是否能在基础创新和组织稳定性上找到更有力的支撑。
来源:AIbase


