RoboScience 机器科学发布 Visics 通用具身大模型,实现跨本体、跨物体、跨任务|最前线

RoboScience 机器科学发布了自研的 Visics 通用具身大模型,首次公开了其 VLOA 技术架构,通过提出“物体3D点云轨迹”作为统一中间表征,尝试解决当前机器人操作中泛化能力差、精细操作难的核心瓶颈。这项技术的关键在于,它让机器人学会理解“抓取”这个动作本身,而非只是机械地复刻特定硬件在特定任务…

RoboScience 机器科学发布 Visics 通用具身大模型,实现跨本体、跨物体、跨任务|最前线

一句话看懂:RoboScience 机器科学发布了自研的 Visics 通用具身大模型,首次公开了其 VLOA 技术架构,通过提出“物体3D点云轨迹”作为统一中间表征,尝试解决当前机器人操作中泛化能力差、精细操作难的核心瓶颈。这项技术的关键在于,它让机器人学会理解“抓取”这个动作本身,而非只是机械地复刻特定硬件在特定任务下的动作坐标。

事件核心:发生了什么

6月24日,通用具身智能企业 RoboScience 机器科学发布了 Visics 通用具身大模型,并详细披露了其核心技术架构 VLOA(Vision-Language-Object-Action)。模型采用双引擎架构,由“具身世界模型”和“通用操作模型”独立运转:前者通过海量互联网视频学习物体在真实世界中的运动规律,后者则负责将物体运动轨迹转化为机器人可执行的控制指令。该公司同时推出了自研高精度仿真引擎 RoboMirage,结合全自动视频数据标注管线,能将单条数据获取成本压缩至传统方案的 1/20 至 1/200,计划在 2026 年构建超 1T 的高质量操作轨迹数据集。目前,Visics 模型已在家具拼装、灵巧抓取、动态流水线等真实场景中展示了应用能力。

为什么重要

当前机器人操作行业面临三大核心瓶颈:泛化能力差(换一台机器人或换一个物体就无法工作)、精细操作难、长程任务误差累积。过去两年,行业主流训练方法让模型直接学习机器人关节运动轨迹,导致学到的能力严重绑定特定硬件和场景。Visics 大模型的突破在于,它建立了一套以“物体”为中心的统一底层表征——Object Trajectory,这相当于给具身智能领域找到了类似大语言模型中“文本 Token”的统一基础格式。这种分层解耦的设计,理论上能让模型实现跨本体(适配任意机器人)、跨物体(操作刚体、铰链件、软质可形变体)、跨任务(自主完成多样化任务)的全域泛化,对推动具身智能从实验室走向规模化落地具有重要意义。

对用户/开发者/创作者的影响

对于机器人本体制造商和灵巧手公司,Visics 技术若能落地,将显著降低其集成成本和研发周期——开发者无需为每一类机器人硬件重复训练模型。对零售、物流、康养服务等需要处理海量 SKU 和非标物件场景的企业,这项技术意味着自动化拣选和补货的方案有了更泛化的行业可行性。目前 RoboScience 正与多家商业伙伴开展试点合作,计划在年内实现面向工业与商业场景的标准化机器人本体产品量产。对于 AI 领域的投资机构和从业者,这是具身智能赛道从“硬编任务”走向“底层通用模型”的重要路线分歧信号。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,产品落地节奏。Visics 模型目前展示的是实验场景成果,其量产标准化机器人本体产品是否能在真实物流、商超等场景中保持高性能,是验证技术路线可靠性的关键。第二,数据飞轮的实际规模。公司宣称每周数据产能达数十万小时、2026年目标超1T 数据集,但高昂的仿真与标注成本是否真能持续压低,以及这些数据在复杂物理世界中的迁移效率,仍需长期观察。第三,行业竞争格局。在 Visics 之前,国内外的具身智能公司多采用端到端轨迹学习或行为克隆路线,若 Visics 的物体中心表征方案被验证成功,可能引发一批竞品在该技术方向的跟进与调整。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 9908

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注