连续入选 ICRA 最佳论文,RoboScience 机器科学如何突破具身智能泛化瓶颈?

连续入选 ICRA 最佳论文,RoboScience 机器科学如何突破具身智能泛化瓶颈?

连续入选 ICRA 最佳论文,RoboScience 机器科学如何突破具身智能泛化瓶颈?

一句话看懂:RoboScience 机器科学连续两年在机器人顶会 ICRA 上斩获或入围最佳论文奖,其核心技术方向直指具身智能最棘手的泛化问题——机器人如何将学到的操作技能迁移到从未见过的新物体、新手和硬件上。团队已将这类成果整合进自研的 VLOA 大模型框架,并开始探索从实验室走向零售、物流等真实场景的产业化路径。

事件核心:发生了什么

在 2026 年 6 月举行的 ICRA 2026 上,RoboScience 机器科学首席科学家邵林团队的论文《Bi-Adapt: Few-Shot Bimanual Adaptation for Novel Categories of 3D Objects via Semantic Correspondence》入围机器人操作与运动方向最佳论文奖提名。这已是该团队连续第二次在 ICRA 获得该方向的高级别认可——2025 年,他们曾以通用灵巧抓取框架 D(R,O) Grasp 斩获该方向最佳论文奖,成为近五年亚洲机构首次以第一单位身份获此殊荣的团队。本届 ICRA,邵林团队共有 10 篇论文被录用。

为什么重要

两项获奖论文共同指向具身智能走向真实世界前的核心瓶颈:泛化操作能力。传统机器人操作方案要么针对单一物体手工设计动作,要么依赖大量昂贵数据训练,难以应对真实世界中物体形状、机器人硬件形态的无穷变化。Bi-Adapt 框架的核心突破在于,机器人仅需少量试错,就能将双臂操作经验迁移到全新的物体类别上,在仿真中达到了 59%–70% 的成功率。D(R,O) Grasp 则解决了不同灵巧手之间如何复用同一套抓取能力的问题,通过统一表示(点云空间距离关系),一个模型即可适配多达五种不同形态的灵巧手。这些技术正在被整合进 RoboScience 提出的 VLOA(Vision-Language-Object-Action)大模型框架,该框架以物体 3D 点云轨迹作为统一接口,试图将来自互联网视频、仿真数据和真实操作的多元数据纳入同一个学习体系,从而突破现有 VLA 路线因数据格式不统一而面临的规模化瓶颈。

对用户/开发者/创作者的影响

对具身智能研究者和开发者而言,Bi-Adapt 和 D(R,O) Grasp 所展示的跨类别、跨硬件迁移能力,意味着未来部署机器人技能的门槛将显著降低——不必再为每种新物体或新机械臂从头训练模型。对企业采购方(如零售、物流企业)来说,RoboScience 计划于今年实现面向商业场景的标准化机器人本体产品量产,其自研的物理仿真平台 RoboMirage 也可能成为评估和预部署工具。对于内容创作者和 AI 应用开发者,虽然目前尚不涉及直接的工具调用,但 VLOA 框架的开放程度与开发者生态(如是否提供 API、仿真环境接入等)将是值得关注的信号。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,Bi-Adapt 和 D(R,O) Grasp 的开源计划与复现门槛,将直接影响其在学术社区的影响力扩散速度。第二,VLOA 大模型能否在 RoboScience 与京东、商汤等产业合作方之间跑通完整的数据闭环和落地案例,而非停留在论文或演示视频中。第三,随着公司获得多轮产业资本注资并计划量产机器人产品,其实际部署的稳定性和成本控制能力能否匹配零售、物流等场景的需求,将成为判断其“技术落地”成色的关键指标。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 6121

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注