
数亿元融资落地!国内最早布局“人类学习”路线的具身公司,用人类视角重做具身智能
一句话看懂:具身智能公司“深度机智”完成数亿元新一轮融资,是行业内最早聚焦“人类学习”路线的团队。其核心思路是让机器人先通过人类视角数据理解物理世界规律,再学会执行任务,而非单纯模仿动作轨迹。公司已基于这一路线发布具身基座模型体系PhysBrain 1.0,并在五大国际权威评测中取得领先成绩。
事件核心:发生了什么
深度机智(由北京中关村学院与中关村人工智能研究院联合孵化)宣布完成新一轮数亿元融资。资方包括中关村资本、诚通科创基金、普华资本、蓝湖资本等十余家机构,涵盖国资、头部财务投资及产业资本。
公司成立于2025年左右,是国内最早系统化定义“人类学习”路线的具身智能团队。围绕今年3月发布的PhysBrain 1.0基座模型,核心成果包括:在WorldArena榜单中,其世界模型Z-WM_v1以64.96分超越此前榜首;在SimplerEnv测试中,PhysBrain 1.0平均成功率达80.2%,超过国际标杆π0.5的57.1%;在LIBERO等多任务基准中,平均成功率最高达到98.8%。团队还构建了行业首个规模化人类经验采集体系,包括数十万小时人类第一视角多模态数据集DeepAct。
为什么重要
具身智能过去两年的主流路线是“轨迹拟合”——用海量仿真或真机数据让机器人模仿动作,但模型缺乏对物理因果关系的理解,导致动作刻板、泛化能力弱。全球头部团队(如Figure、Tesla、英伟达)自2025年下半年起,开始全面转向人类视角行为数据,以提升模型的常识理解与通用能力。
深度机智的出现,意味着中国在“人类学习”这一新路线上提前完成了全栈布局。公司并非只做单点模型或硬件,而是打通了“人类数据采集—模型训练—拟人体验证”的闭环。这种从“先理解后执行”出发的系统工程,如果持续推进,可能改变具身智能领域“数据成本高、模型泛化差”的瓶颈。
对用户/开发者/创作者的影响
对于机器人开发者:深度机智目前主要聚焦基座模型与算法输出,尚未开放公开API或平台。但公司已发布千小时人类数据驱动的VLM增强方案,并展示出对万小时级真机训练数据的超越效果,这意味着未来如果开放模型或数据接口,可大幅降低中小团队在真机数据采集上的硬件和时间成本。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
对于行业采购者(如制造、物流、家庭服务):PhysBrain 1.0在双臂操作、家庭任务等场景的泛化表现已进入SOTA水平,若搭配其工业级全尺寸拟人体Prime实现落地,有望在2027年前后进入产业化验证阶段,届时将影响具身机器人采购的选型标准。
值得关注的后续
1. 落地节奏与商业化:深度机智目前的工业级拟人体Prime仍处于展示阶段,需观察其在真实产线或家庭场景中的实际运行稳定性与成本结构。2. 竞品跟进:全球已有Figure、Tesla等巨头转向人类视角数据,中国国内可能很快出现更多跟随者,竞争将聚焦数据采集规模与模型效率。3. 开源生态与开发者平台:若公司未来开放模型权重或数据工具,将显著影响具身智能开发者的技术栈选择。当前尚未公布相关计划。
来源:量子位 · 每日最新


