RoboScience 机器科学发布 Visics 通用具身大模型，实现跨本体、跨物体、跨任务｜最前线

一句话看懂：RoboScience 机器科学发布了自研的 Visics 通用具身大模型，首次公开了其 VLOA 技术架构，通过提出“物体3D点云轨迹”作为统一中间表征，尝试解决当前机器人操作中泛化能力差、精细操作难的核心瓶颈。这项技术的关键在于，它让机器人学会理解“抓取”这个动作本身，而非只是机械地复刻特定硬件在特定任务下的动作坐标。

事件核心：发生了什么

6月24日，通用具身智能企业 RoboScience 机器科学发布了 Visics 通用具身大模型，并详细披露了其核心技术架构 VLOA（Vision-Language-Object-Action）。模型采用双引擎架构，由“具身世界模型”和“通用操作模型”独立运转：前者通过海量互联网视频学习物体在真实世界中的运动规律，后者则负责将物体运动轨迹转化为机器人可执行的控制指令。该公司同时推出了自研高精度仿真引擎 RoboMirage，结合全自动视频数据标注管线，能将单条数据获取成本压缩至传统方案的 1/20 至 1/200，计划在 2026 年构建超 1T 的高质量操作轨迹数据集。目前，Visics 模型已在家具拼装、灵巧抓取、动态流水线等真实场景中展示了应用能力。

为什么重要

当前机器人操作行业面临三大核心瓶颈：泛化能力差（换一台机器人或换一个物体就无法工作）、精细操作难、长程任务误差累积。过去两年，行业主流训练方法让模型直接学习机器人关节运动轨迹，导致学到的能力严重绑定特定硬件和场景。Visics 大模型的突破在于，它建立了一套以“物体”为中心的统一底层表征——Object Trajectory，这相当于给具身智能领域找到了类似大语言模型中“文本 Token”的统一基础格式。这种分层解耦的设计，理论上能让模型实现跨本体（适配任意机器人）、跨物体（操作刚体、铰链件、软质可形变体）、跨任务（自主完成多样化任务）的全域泛化，对推动具身智能从实验室走向规模化落地具有重要意义。

对用户/开发者/创作者的影响

对于机器人本体制造商和灵巧手公司，Visics 技术若能落地，将显著降低其集成成本和研发周期——开发者无需为每一类机器人硬件重复训练模型。对零售、物流、康养服务等需要处理海量 SKU 和非标物件场景的企业，这项技术意味着自动化拣选和补货的方案有了更泛化的行业可行性。目前 RoboScience 正与多家商业伙伴开展试点合作，计划在年内实现面向工业与商业场景的标准化机器人本体产品量产。对于 AI 领域的投资机构和从业者，这是具身智能赛道从“硬编任务”走向“底层通用模型”的重要路线分歧信号。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，产品落地节奏。Visics 模型目前展示的是实验场景成果，其量产标准化机器人本体产品是否能在真实物流、商超等场景中保持高性能，是验证技术路线可靠性的关键。第二，数据飞轮的实际规模。公司宣称每周数据产能达数十万小时、2026年目标超1T 数据集，但高昂的仿真与标注成本是否真能持续压低，以及这些数据在复杂物理世界中的迁移效率，仍需长期观察。第三，行业竞争格局。在 Visics 之前，国内外的具身智能公司多采用端到端轨迹学习或行为克隆路线，若 Visics 的物体中心表征方案被验证成功，可能引发一批竞品在该技术方向的跟进与调整。

来源：Readhub · AI

RoboScience 机器科学发布 Visics 通用具身大模型，实现跨本体、跨物体、跨任务｜最前线

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

AI 再强大，我们还是在商业逻辑之下

Token 消耗激增，Gartner 预测到 2028 年 AI 编程成本将超过人类开发者平均薪资

豆包收费，这是好事儿

发表回复取消回复