
超越 Figure AI!全球首个机器人训练楼盘开盘:30 万套中国住宅,机器人拎包入住
一句话看懂:大晓机器人联合港中文MMLab发布Kairos-Homeworld,首次将30万套中国真实住宅户型转化为机器人可交互的3D仿真训练环境,配套开源4B参数世界模型Kairos 3.0-4B,为具身智能规模化训练提供了从“大脑”到“训练场”的完整基础设施。
事件核心:发生了什么
大晓机器人今日正式开源Kairos-Homeworld框架,这是全球首个支持全屋三维生成与物体级全交互的机器人训练系统。核心资源包括:30万套中国真实住宅户型数据集(相当于RPLAN数据集的近4倍)以及5000个完整可交互的3D家庭场景。系统采用分层生成框架:首先由大语言模型规划户型布局,再依次放置家具并自动纠错(碰撞率从0.20降至0.05),最后为物体赋予材质、密度、摩擦系数等物理属性,支持机器人进行抓取、移动等操作。同时,团队还开源了4B参数世界模型Kairos 3.0-4B,在THOR平台上实现1:1.5的实时生成速度,推理速度比NVIDIA Cosmos 2.5快72倍,且显存需求仅23.5GB(Cosmos 2.5需70.2GB)。该模型采用“理解-生成-预测”一体化架构,融合物理规律文本、人类行为数据和真机交互三类训练数据,能够预测倒水时的液体流速、叠石头时的重力平衡等物理规律,并支持单臂、双臂及灵巧手等不同机器人形态。
为什么重要
这项工作的意义在于系统性地解决了具身智能规模化训练的两大瓶颈。北美Figure AI曾通过与房地产巨头Brookfield合作获得10万套住宅训练资源,但受限于真实房源总量和维护成本。相比之下,Kairos-Homeworld的数字化路线使新增场景边际成本趋近于零,且首次系统性地将中国家庭的空间结构(如封闭式厨房、独立阳台、干湿分离卫生间)纳入训练体系,避免了此前基于欧美家庭数据集训练导致的“水土不服”。同时,Kairos 3.0-4B作为首个专为世界模型设计混合线性注意力算子的产品,将时间复杂度从O(n²)降至O(n),首次让世界模型具备了部署到机器人端侧实时运行的能力,并兼容沐曦、海光、壁仞等国产GPU。按英伟达具身负责人Jim Fan提出的路线图,这两项工作恰好对应了具身智能规模化发展所需的世界模型、数据与环境三块核心拼图。
对用户/开发者/创作者的影响
对具身智能开发者而言,这是目前唯一基于中国家庭场景的开源训练环境,可直接用于导航、多房间整理、家务任务等场景的模型训练,降低了从零构建仿真环境的成本。对机器人企业,Kairos 3.0-4B的端侧实时运行能力(10秒任务仅需9.5秒)意味着可以在不依赖云端算力的前提下,让机器人实现实时物理预测。此外,大晓机器人近期完成了由蚂蚁集团领投的天使轮融资,资金将投入世界模型和研发范式的落地,后续可能会推出商业化版本或API服务。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
一是Kairos-Homeworld是否能被主流机器人企业(如宇树、云鲸等)实际采用并验证训练效果;二是Kairos 3.0-4B与Figure AI、特斯拉等公司的闭源世界模型在真实场景下的性能对比;三是随着30万套户型的持续迭代,是否会出现针对餐饮、办公等场景的垂直训练数据集。目前公开信息显示,两项工作均已开源,但尚未公布具体的产品落地时间表。
来源:Readhub · AI


