
苹果前技术负责人带队,打造具身大模型,刚融资十亿!
RoboScience(机器科学)于近日宣布完成十亿元A轮融资,这家专注于具身智能技术研发的公司,正以惊人的融资速度和研发节奏,搅动行业格局。
这家公司成立于2024年,总部位于北京市海淀区,核心团队背景豪华:创始人兼CEO田野本科毕业于中科大,硕士毕业于斯坦福AI Lab(师从吴恩达),曾任苹果公司AI Platform技术负责人,曾带领团队打造了被誉为“苹果的PyTorch与CUDA”的核心基础设施平台。创始人兼首席科学家邵林为新加坡国立大学助理教授,其提出的UniGrasp架构已成为数据驱动灵巧手抓取的基准性方法。
VLOA大模型:定义“通用智能”的新范式
RoboScience的核心产品是其自主研发的端到端VLOA(Vision-Language-Object-Action)大模型。该模型由两大支柱构成:具身世界模型与具身操作大模型。前者旨在理解物理世界并生成可执行的未来规划,具备确保物理约束、预测未来任务并生成多解概率分布、以及实现长周期轨迹时空一致性等能力;后者则通过“物理引擎-仿真数据-端到端训练”闭环,解决泛化性与灵巧操作难题。
在数据层面,RoboScience已积累超过100万小时数据集(上千万video clips),并以每周数十万小时的速度增长;同时,通过自研多模态物理引擎,积累了100亿次全空间物体的manipulation操作数据(10B manipulation操作数据集),支撑模型对刚体、铰链体、可形变体等全空间物体的各类操作任务,并支持跨本体操作和含视觉、触觉、力觉的多模态数据输入。
十亿融资加速“通用智能”规模化落地
本轮融资前的三轮融资已累计超3亿元,投资方包括零一创投、京东、招商局创投、商汤国香资本、普华资本等。本次十亿元A轮融资资金将主要用于研发VLOA大模型技术、推进机器人本体的研发与量产,以及加速通用具身智能解决方案的规模化落地。
具身智能赛道的竞争已进入白热化阶段。RoboScience采取的“世界模型+操作大模型”双轮驱动策略,试图打造一个可适用于任何任务、任何对象与任何机器人的通用智能系统。这种从底座技术到本体量产的全面押注,其战略意图显然不是做一家单纯的软件公司,而是力争成为具身智能时代的“基础设施级玩家”,其技术路线和工业化能力值得持续关注。
我的看法:黄金团队能否跑通“通用”之路?
具身智能行业的瓶颈,一直在于模型在真实物理世界中的泛化能力。RoboScience用海量互联网视频数据预训练VLOA大模型,再结合物理引擎生成百亿级操作数据,这一思路从数据规模看极具竞争力。苹果出身的CEO带队,也让人对其工程化落地能力抱有期待。但真正的挑战在于:这种基于海量数据和世界模型的“通用”方案,能否在成本可控的前提下,真正解构并应用于千变万化的真实工业和服务场景。如果成功,它或许能成为具身智能领域的“GPT时刻”。


