多模态智能体再迎重磅升级！阿里正式发布Qwen3.7-Plus，视觉与工作流全方位蜕变

一句话看懂：6月2日，阿里正式发布通义千问系列新款多模态智能体模型Qwen3.7-Plus，重点升级了视觉-语言能力，同时强化了Agent工作流中的工具调用与任务连续性，旨在提升复杂任务场景下的落地表现。

事件核心：发生了什么

阿里通过通义千问官方渠道宣布推出Qwen3.7-Plus。该模型延续了Qwen3.7在原生文本处理上的能力，并在视觉-语言层面进行了一次明显的升级。具体变化包括：能更好地理解复杂图像和视频内容，并将视觉识别转化为逻辑推理能力。此外，该模型在编程代码生成、多工具调用（Tool-use）以及长时间复杂生产力工作流（Productivity Workflows）上保持了较高的任务连续性和决策稳定性。业内人士分析，这显示出国内大模型在边缘侧和复杂工作流应用方向上的核心基础正在迭代。

为什么重要

当前大模型竞争已明显转向多模态与智能体方向。Qwen3.7-Plus的推出意味着阿里正在将视觉理解与智能体动作规划做更深度的融合，这直接关系到企业级自动化任务与长时间智能调度场景能否真正落地。对于整个行业而言，这进一步推高了开源与闭源模型的性能天花板，也为后续更广泛的工业智能化及具身机器人应用提供了更具想象力的算力基础。这场技术路线的升级，实质上是将大模型从“能理解”推向“能做事”的关键一步。

对用户/开发者/创作者的影响

对于开发者，Qwen3.7-Plus在Agent链上的增强意味着可以构建更复杂的自动化流程，例如涉及图像识别、逻辑判断与多步骤API调用的任务，这将减少开发环节中的中间件手工拼接成本。对于内容创作者，模型能更好理解视频和图像，有望用于更精准的多模态内容审核、自动配图或视频摘要生成。对于企业用户，该模型的长任务连续性和工具使用能力，可用于优化客服工单自动流转、供应链数据分析等复杂工作流，但需关注实际部署后的推理成本与稳定度。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

目前公开信息显示，Qwen3.7-Plus的产品形态和商业化路径尚未完全披露。后续值得关注三点：第一，该模型是否通过阿里云API正式对公众开放，以及定价策略是否影响现有用户迁移。第二，竞品如百度的文心系列、字节的豆包系列是否会同步跟进，在视觉与工作流融合上推出对标产品。第三，Qwen3.7-Plus的开源程度和开发者生态建设情况，这直接决定其能否在社区中建立起二次开发壁垒。

来源：AIbase

多模态智能体再迎重磅升级！阿里正式发布Qwen3.7-Plus，视觉与工作流全方位蜕变