
一句话看懂:由中关村学院与中关村人工智能研究院孵化的物理AI公司「深度机智」,完成数亿元新一轮融资。其核心是提出并践行“人类学习”技术路线——用人类第一视角数据训练机器人基座模型,并已通过零样本验证,比特斯拉、英伟达等海外巨头同类布局早了近一年。
事件核心:发生了什么
6月26日,深度机智宣布完成数亿元融资,由国寿长三角科创基金领投,老股东及多家市场化资本跟投。该公司成立于2025年5月,由中科大的陈凯(曾任微软亚洲研究院首席研究员)和室友张翼博联合创办。团队独创的“人类学习”路线,核心是利用人类第一视角数据(如戴上智能眼镜录制的交互视频)训练机器人,而非依赖传统的机器人真机数据或仿真数据。2026年6月,深度机智完成了零样本验证:机器人未经过任何本体专项训练,仅凭基于人类数据训练的单一模型,就完成了全新的简单任务(如“推胡萝卜”的泛化行为),证明了该路线的可行性。目前,其教育机器人、数采设备、遥操作系统等产品已进入真实客户场景,累计获得数千万元订单。
为什么重要
物理AI(具身智能)长期受困于通用基座模型缺失、数据标注成本高、泛化能力弱。深度机智的路线跳出了“仿真数据+真机数据”的传统框架,改为利用现成的人类第一视角视频数据。这意味着:机器人学习不再需要为每个场景重新采集海量真实数据,而是可以通过理解人类与世界的交互方式,直接迁移通用常识。如果这一范式成功,将大幅降低机器人进入新场景的适配成本,并可能改变整个具身智能行业的技术竞争格局——从拼硬件Demo转向拼数据路线和基座模型能力。目前公开信息显示,深度机智在技术布局上早于特斯拉、Generalist AI、英伟达等海外巨头的同类探索约一年,且已获得国家级机构(中关村学院、央视《新闻联播》)背书。
对用户/开发者/创作者的影响
企业采购方:深度机智的“沿途下蛋”商业化策略,意味着教育、护理、工业等真实需求场景现在可以采购其数采设备、遥操作系统和机器人本体,用于工作流程记录或技能沉淀。这些产品本质上是基座模型开发过程中的中间副产品,价格和交付模式可能更灵活。
AI/机器人开发者:如果路线持续验证成功,未来开发者可能不再需要花费大量精力处理仿真环境和真机数据标注,而是可以直接使用人类第一视角数据(如公开的智能眼镜视频)训练具身模型。这意味着开发门槛降低,生态可能转向“模型市场”而非“硬件市场”。
创作者与内容生产方:人类第一视角视频(如第一人称Vlog、教学视频)本身成为高价值训练数据,拥有大量此类数据的个人或机构(如视频平台、教育培训机构),未来可能进入数据授权或标注合作市场。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
1. 零样本验证的扩展范围:目前验证仅限于基础任务,成功率和复杂度仍需提升。后续需关注其基座模型能否在更复杂、更高精度的工业场景(如精密装配)中通过零样本或小样本完成迁移。
2. 海外追赶速度:特斯拉、英伟达等巨头是否会在2026下半年密集公布类似“人类学习”路线成果,以及深度机智的“先发优势”能否转化为数据和模型壁垒。
3. 数据合规与隐私:人类第一视角数据涉及大量个人空间和交互隐私,随着采集设备普及和数据集扩大,国内类似《数据安全法》的监管是否会对该路线形成合规门槛。
来源:Readhub · AI


