阿里发布首个具身大模型 Qwen-Robot 系列:三个模型支持协同运转

阿里巴巴正式发布千问具身智能大模型 Qwen-Robot 系列,涵盖操作、导航、世界模型三大核心模型,旨在为不同形态的机器人提供统一的通用底座,解决机器人从实验室走向真实场景的核心难题。

阿里发布首个具身大模型 Qwen-Robot 系列:三个模型支持协同运转

一句话看懂:阿里巴巴正式发布千问具身智能大模型 Qwen-Robot 系列,涵盖操作、导航、世界模型三大核心模型,旨在为不同形态的机器人提供统一的通用底座,解决机器人从实验室走向真实场景的核心难题。

事件核心:发生了什么

6月16日,阿里巴巴发布 Qwen-Robot 系列,这是千问大模型家族首个完整的具身智能模型矩阵,包含三个模型:VLA 操作模型 Qwen-RobotManip、VLN 移动模型 Qwen-RobotNav 与世界模型 Qwen-RobotWorld。其中,Qwen-RobotManip 采用80维统一动作表征,全程仅基于开源数据训练,在横跨30项真实任务、4个机器人平台的三方测评中包揽前两名;Qwen-RobotNav 统一了语言指令导航、目标搜索、自动驾驶等五大任务;Qwen-RobotWorld 可推演模拟机器人下一时刻的合理动作与状态。三个模型既可独立部署,也可协同运转。

为什么重要

当前全球具身智能正处于从实验室研发向商业化应用跨越的关键阶段,核心难题是让机器人在未知环境中理解自然语言指令并稳定执行任务。传统 VLA 模型迁移能力不足,更换机器人平台或场景后性能明显下降。Qwen-Robot 系列通过打通动作表征与空间感知的通用性,让不同形态的机器人“统一听懂同一个模型”,并且全程仅使用开源数据训练,打破了行业依赖私有采集数据的常规路径。这一技术路线如果能大规模落地,可能显著降低机器人开发商接入具身智能的门槛,并加速物流、制造、家庭服务等场景的机器人商业化进程。

对用户/开发者/创作者的影响

对于机器人开发者和企业用户而言,Qwen-Robot 系列提供了可直接调用的通用接口,Qwen-RobotNav 原生支持多种智能体框架,意味着开发者在部署导航能力时无需手动切换模型。对于硬件厂商,搭载 Qwen-RobotManip 的机器人仅需少量交互反馈即可自动适配不同硬件平台,硬件适配成本有望下降。对于内容创作者和普通用户,目前公开信息显示该系列尚未开放面向消费级产品的API或公测,短期内不会直接影响普通用户的使用体验。但值得留意的是,如果阿里后续推出类似“机器人操作系统”的 SaaS 服务,个人或小微企业也能通过 API 调用为机器人赋予新能力。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,Qwen-Robot 系列是否开放 API 或开源模型权重,开发者社区能否低成本接入;第二,阿里能否在华为、优必选等竞争对手的具身智能产品加速落地的背景下,通过开源策略形成生态壁垒;第三,在机器人从实验室走向真实场景的过程中,该系列能否在长时间尺度下保持稳定性和泛化能力,尤其是在家庭、医疗等对安全性和鲁棒性要求极高的场景中。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 8028

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注