
一句话看懂:Anthropic 于 2026 年 6 月公布 Project Fetch 第二阶段实验结果:Claude Opus 4.7 在无需人类干预的情况下,自主完成操控机器人犬(robodog)的复杂任务,整体速度比此前最快的人类团队快约 20 倍,比未使用 AI 辅助的人类团队快 37 倍以上。这标志着大模型在物理世界自主操作能力上的显著跃升。
事件核心:发生了什么
2024 年 8 月,Anthropic 开展了 Project Fetch 第一阶段实验,对比有 Claude Opus 4.1 辅助和完全依靠人类自身能力的两组员工完成操控机器人犬(包括连接传感器、编程控制、检测并抓取沙滩球等任务)的表现。当时,Opus 4.1 无法自主完成任务,甚至卡在连接机器人这一初步步骤上。
2026 年 6 月 18 日,Anthropic 发布了第二阶段实验结果。这一次,研究员仅负责将运行 Claude Code 的笔记本接入机器人犬、输入初始提示、批准命令并允许模型进入下一任务。Claude Opus 4.7 在自适应思维模式下(effort 设为最高)自主完成了第一阶段中至少一个人类团队能完成的全部任务。在四个两组人类团队均完成的任务上,Opus 4.7 平均比无 AI 团队快 37 倍以上,比有 AI 团队快 18 倍以上。同时,Opus 4.7 生成的代码量比 Claude 辅助的人类团队少近 10 倍,且大部分代码首次运行即有效。
为什么重要
Opus 4.7 本次表现验证了 Anthropic 此前在网络安全领域观察到的模式:模型先辅助人类,然后人类辅助模型,最终模型能独立完成大部分任务。如今这一模式开始在 AI 与物理世界的交叉领域(机器人操控)显现。尽管当前实验不涉及更底层的机器人控制策略(如具体驱动策略),且 Claude 在精确移动沙滩球(即实际“抓取”环节)上仍存在困难,但自主编写并运行复杂机器人控制代码的速度和可靠性已显著提升。
这一结果暗示,大模型正在快速缩小从“数字大脑”到“物理执行”的差距,对机器人编程、自动化运维等领域的潜在影响不容忽视。
对用户/开发者/创作者的影响
对于开发者而言,Claude Code 结合高性能模型(如 Opus 4.7)意味着,未来在编写机器人控制软件、传感器数据读取、路径规划等任务上,AI 可大幅降低人工调试时间。企业内部非机器人专家可以直接通过自然语言描述任务目标,由模型自主完成编程与验证。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
对于企业采购决策者,该实验表明:在大模型应用选型时,不应仅关注文本或代码生成基准,还应关注模型与物理硬件接口的整合能力。模型在真实硬件上自主完成任务的能力正成为新的评估维度。
对于普通用户,当前尚不涉及消费级机器人产品的直接升级,但该技术路线若持续落地,可能催生更易用的“一次性配置、自主执行”的智能硬件应用。
值得关注的后续
首先,Claude Opus 4.7 是否会在 API 层面开放“自主操作物理硬件”的能力,以及在什么定价和延迟条件下提供,将直接影响开发者的采纳意愿。其次,竞品如 OpenAI(ChatGPT 与机器人项目)、Google DeepMind(RT 系列)是否会在类似实验上发布可比结果,将形成直接对比。最后,该技术若进入实际部署,相关硬件兼容性(如机器人型号、传感器 API)和模型的安全性(自主控制物理设备时的纠错与中止机制)是监管和市场关注的焦点。


