苹果前技术负责人带队，打造具身大模型，刚融资十亿！

RoboScience（机器科学）于近日宣布完成十亿元A轮融资，这家专注于具身智能技术研发的公司，正以惊人的融资速度和研发节奏，搅动行业格局。

这家公司成立于2024年，总部位于北京市海淀区，核心团队背景豪华：创始人兼CEO田野本科毕业于中科大，硕士毕业于斯坦福AI Lab（师从吴恩达），曾任苹果公司AI Platform技术负责人，曾带领团队打造了被誉为“苹果的PyTorch与CUDA”的核心基础设施平台。创始人兼首席科学家邵林为新加坡国立大学助理教授，其提出的UniGrasp架构已成为数据驱动灵巧手抓取的基准性方法。

VLOA大模型：定义“通用智能”的新范式

RoboScience的核心产品是其自主研发的端到端VLOA（Vision-Language-Object-Action）大模型。该模型由两大支柱构成：具身世界模型与具身操作大模型。前者旨在理解物理世界并生成可执行的未来规划，具备确保物理约束、预测未来任务并生成多解概率分布、以及实现长周期轨迹时空一致性等能力；后者则通过“物理引擎-仿真数据-端到端训练”闭环，解决泛化性与灵巧操作难题。

在数据层面，RoboScience已积累超过100万小时数据集（上千万video clips），并以每周数十万小时的速度增长；同时，通过自研多模态物理引擎，积累了100亿次全空间物体的manipulation操作数据（10B manipulation操作数据集），支撑模型对刚体、铰链体、可形变体等全空间物体的各类操作任务，并支持跨本体操作和含视觉、触觉、力觉的多模态数据输入。

十亿融资加速“通用智能”规模化落地

本轮融资前的三轮融资已累计超3亿元，投资方包括零一创投、京东、招商局创投、商汤国香资本、普华资本等。本次十亿元A轮融资资金将主要用于研发VLOA大模型技术、推进机器人本体的研发与量产，以及加速通用具身智能解决方案的规模化落地。

具身智能赛道的竞争已进入白热化阶段。RoboScience采取的“世界模型+操作大模型”双轮驱动策略，试图打造一个可适用于任何任务、任何对象与任何机器人的通用智能系统。这种从底座技术到本体量产的全面押注，其战略意图显然不是做一家单纯的软件公司，而是力争成为具身智能时代的“基础设施级玩家”，其技术路线和工业化能力值得持续关注。

我的看法：黄金团队能否跑通“通用”之路？

具身智能行业的瓶颈，一直在于模型在真实物理世界中的泛化能力。RoboScience用海量互联网视频数据预训练VLOA大模型，再结合物理引擎生成百亿级操作数据，这一思路从数据规模看极具竞争力。苹果出身的CEO带队，也让人对其工程化落地能力抱有期待。但真正的挑战在于：这种基于海量数据和世界模型的“通用”方案，能否在成本可控的前提下，真正解构并应用于千变万化的真实工业和服务场景。如果成功，它或许能成为具身智能领域的“GPT时刻”。