
一句话看懂:银河通用机器人发布了全球首个人形机器人全身实时运控的基础模型 AstraBrain-WBC 0.5,基于约 2 万小时、20 亿帧人类动作数据训练,能在零样本下执行舞蹈、拳击等复杂动作。这标志着人形机器人运控正从“单技能训练”迈入“基础模型”时代,首次验证了类似 GPT 的缩放法则(Scaling Law)在该领域的可行性。
事件核心:发生了什么
6 月 19 日,银河通用机器人正式发布 AstraBrain-WBC 0.5,这是其“银河星脑”技术体系下的“通用小脑”基础模型。该模型采用 GPT 风格的因果 Transformer 架构,将全身控制定义为连续序列预测问题。训练数据规模达行业最大:约 2 万小时人类动作数据,覆盖舞蹈、运动、工业操作等场景,动作空间覆盖范围相比传统数据集 AMASS 提升约 4-5 倍。模型参数规模达 8040 万(接近 GPT-1 量级),在 29 自由度机器人上实现了全身协同控制,并在单张 RTX 4090 显卡上实现低于 1.5 毫秒的端到端推理延迟。研究团队已开源论文、代码及技术成果。
为什么重要
过去人形机器人的运控模型多采用浅层 MLP 网络,容量有限,训练数据仅数千小时、参数规模约 1000 万,且难以随数据增长持续提升性能。AstraBrain-WBC 0.5 首次在运控领域验证了类似 GPT 的 Scaling Law:当数据规模从百万级扩展至 20 亿帧、模型规模持续增长时,零样本泛化能力持续增强,跟踪误差下降、成功率从 83.26% 提升至 92.58%。这意味着人形机器人运动控制从“专家技能集合”走向了“运动基础模型”,能力增长路径变得可规模扩展,为机器人规模化进入零售、工业与服务场景提供了底层运控能力支撑。
对用户/开发者/创作者的影响
对开发者:模型全面开源,大幅降低了人形机器人全身控制模型的训练门槛。研究机构可基于此基座模型快速生成高质量 VLA 操作数据,加速具身智能应用开发。对创作者:利用泛化动作跟踪能力,可实时生成舞蹈、演艺等复杂动作内容,过去需数周训练的动作设计,未来有望快速部署。对企业用户:在应急救援、危险环境处置等场景中,机器人能通过全身遥操作率先进入高风险区域执行任务。目前公开信息显示,银河通用希望借此推动机器人基础模型生态共建,加速技术落地。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
1. 产品落地验证:AstraBrain-WBC 0.5 能否在真实零售、工业场景中稳定运行,并支撑具身智能“大脑”完成端到端任务闭环。
2. 生态竞争格局:开源策略能否吸引大量开发者与机构共建生态,类似 GAEA、SONIC 等竞品是否会跟进大模型训练路线。
3. 规模化成本:模型参数超 8000 万、推理依赖 4090 显卡,未来量产时是否面临算力成本或边缘部署的挑战。
来源:Readhub · AI


