机器人进化新引擎:阿里发布具身智能大模型Qwen-Robot系列

6月16日,阿里正式发布Qwen-Robot系列具身智能大模型,包含三个核心子模型,旨在为机器人提供统一的“通用基础”,解决传统模型在多平台切换时性能下降和任务执行不灵活的问题。

机器人进化新引擎:阿里发布具身智能大模型Qwen-Robot系列

一句话看懂:6月16日,阿里正式发布Qwen-Robot系列具身智能大模型,包含三个核心子模型,旨在为机器人提供统一的“通用基础”,解决传统模型在多平台切换时性能下降和任务执行不灵活的问题。

事件核心:发生了什么

阿里推出的Qwen-Robot系列包含三个独立且可协作的子模型。首先是Qwen-RobotManip,负责核心操作,采用统一动作表征,基于超过38,000小时的开源数据预训练,在第三方评测中,其不同版本在任务成功率上包揽前两名,并能完成从开水龙头到双臂炸薯条等复杂任务。其次是Qwen-RobotNav,赋予机器人“导航”与“跑腿”能力,将任务指令理解、目标搜索和自主移动的五个功能统一在同一框架内,其“任务自适应观察机制”让机器人不再依赖固定记忆策略,能灵活地在未知空间中寻找目标。最后是Qwen-RobotWorld,这是一个物理世界模型,可以模拟下一秒的物理状态和动作,帮助机器人在实际操作前进行轨迹推演,克服训练数据不足的瓶颈。

为什么重要

具身智能正从实验室走向真实世界。此前,不同机器人平台适配不同模型导致开发成本高、迁移困难。阿里此次以矩阵形式发布,首次在Qwen家族内构建了完整的具身智能体系。从实际操作能力到空间导航再到物理模拟,三者形成闭环,意味着机器人不再仅依赖预设程序,而是获得了更接近人类的“感知-推理-行动”能力。对于整个行业,这为机器人规模化部署提供了标准化的“通用大脑”,可能加速服务机器人、工业机器人和特种机器人的落地节奏。

对用户/开发者/创作者的影响

对于机器人开发者来说,Qwen-Robot系列有望降低模型接入门槛。统一的动作表征和导航框架意味着开发者不必为每个机器人平台训练专用模型,可复用阿里云端推理能力。对于商业应用用户(如仓储、餐厅、家庭服务),机器人将更准确地理解自然语言指令并自主导航,用户体验从“被动执行”向“主动服务”转变。对于AI研究者和内容创作者,物理世界模型Qwen-RobotWorld可能成为新的仿真工具,用于生成机器人动作数据,降低训练成本。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

一是模型开源与API开放情况:目前公开信息显示是否开源或收费仍待明确,这直接决定开发者生态的规模。二是竞品反应:谷歌、特斯拉以及国内厂商(如百度、腾讯)在具身智能领域均有布局,阿里此次完整矩阵将迫使对手加速迭代。三是实际场景落地的验证:在工业装配、仓库拣货等真实场景中,Qwen-Robot是否能保持实验室中的高成功率,是判断其商业价值的关键。

来源:AIbase

celebrityanime
celebrityanime
文章: 8052

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注