
一句话看懂:Meta因一起内部数据安全事故,紧急叫停了名为“模型能力计划(MCI)”的AI训练项目。该项目通过记录员工键盘输入、鼠标轨迹等行为数据来训练AI,但近期因数据安全屏障崩溃,导致大量敏感信息泄露给全体员工,迫使Meta按下暂停键。此事再次暴露了AI大模型训练中数据边界与员工隐私保护的尖锐矛盾。
事件核心:发生了什么
2026年6月23日,Meta紧急暂停了其内部AI训练项目“模型能力计划(MCI)”。该项目原本旨在通过采集内部员工在办公期间的键盘敲击、鼠标移动轨迹以及语音转文字记录等行为数据,来提升AI模型的多模态能力。然而,由于一次严重的数据泄露事故,该项目所收集的大量高度敏感信息——包括员工私人对话、工作绩效数据——意外地被Meta所有员工访问。Meta发言人称,公司设计该项目时已建立隐私保护机制,目前没有证据显示有员工违规访问泄露数据,但公司已决定完全暂停项目并进行彻底调查。
为什么重要
这一事件是“用员工行为数据训练AI”商业模式的一次重大警示。Meta并非唯一尝试从内部操作数据中提取训练素材的科技公司,但这次事故表明,即便大型企业内部的数据隔离机制也可能存在漏洞。当企业加速使用多模态数据(如行为轨迹、语音记录)来训练大模型时,如何在提升模型能力与确保数据合规、员工隐私之间找到平衡,已成为整个生成式AI行业面临的紧迫挑战。尤其对于Meta这类在开源与闭源大模型(如Llama系列)之间摇摆的公司,内部数据安全事故可能会动摇开发者社区对其数据治理能力的信任。
对用户/开发者/创作者的影响
对于普通用户和内容创作者:Meta的MCI项目虽然仅限于内部员工,但它揭示了企业可能正利用自身最熟悉、最易获取的行为数据进行AI训练——这种“监控即训练”的逻辑若扩散至消费者产品,用户日常操作的所有数字痕迹都可能成为训练素材。对于开发者与AI应用公司:该事件提醒所有依赖内部数据训练的企业,必须设计更严格的数据隔离与权限管理机制。一旦出现泄露,不仅面临隐私合规风险,还可能引发员工及公众的信任危机。同时,它也可能促使监管机构对“企业使用员工/用户行为数据训练AI”出台更明确的规则。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
1. Meta的调查结果是否会公开,以及公司是否会对MCI项目采取永久取消或调整设计方案的处理方式。2. 此事是否会影响Meta在Llama系列大模型上的开源策略——毕竟敏感数据泄露可能让企业更谨慎地开放训练方法论。3. 其他拥有大量内部员工数据的大型科技公司(如Google、Microsoft)是否也会重新评估或暂停类似的行为数据采集训练项目,从而引发行业性的合规自查浪潮。
来源:AIbase


