阿里云千问大模型 Qwen3.7-Max-Preview 首发亮相 Arena AI

一句话看懂：阿里云千问最新旗舰模型 Qwen3.7-Max-Preview 与 Qwen3.7-Plus-Preview 已上线 Arena AI 评测平台，并将在 5 月 20 日的阿里云峰会上正式发布。该模型在文本与视觉领域的专业评测中均进入前十，是阿里云在大模型竞争中的一次重要技术亮相。

事件核心：发生了什么

根据IT之家报道，阿里云于 2026 年 5 月 19 日悄然将 Qwen3.7-Max-Preview 和 Qwen3.7-Plus-Preview 两款预览模型部署上线，用户可以访问 Qwen Chat 及 Arena AI（原 LMArena）进行体验。目前这两款模型仅支持思考模式，搜索与代码解释器工具暂未开放。在官方公布的评测排名中，Qwen3.7-Max Preview 在文本综合排名中位列第 13（阿里通义千问在实验室排行中列第 6），在细分领域表现更为突出：数学第 7、专家级应用第 9、软件与 IT 第 9、编程第 10。视觉方面，Qwen3.7 Plus Preview 综合排名第 16，使阿里通义千问在视觉榜的实验室排名中升至第 5。在专家级提示场景“专家竞技场”中，该模型同样获得第 9 名。

为什么重要

Qwen3.7-Max-Preview 的发布，标志着阿里云在旗舰大模型路线上再次加速。在全球 AI 评测平台 Arena AI 上获得多个细分领域前十的成绩，表明阿里云在数学推理、编程、专家级应用等高价值场景中具备持续优化能力。与同期开源的轻量模型（如 Qwen3.5 系列、Qwen3.6-27B）不同，本次 Preview 版本采取闭源预览策略，意在通过公开评测验证技术实力，为即将到来的阿里云峰会积累市场声量。此举也意味着大模型竞争正从“参数规模竞赛”转向“实测榜单和专业场景落地”的阶段。

对用户/开发者/创作者的影响

对于使用通义千问 API 或 Qwen Chat 的开发者而言，Preivew 模型以“仅思考模式”上线，说明当前阶段阿里云更侧重于验证模型的推理和认知能力，而非提供完整工具链。如果开发者的应用场景集中在数学、编程、专业文案等强逻辑需求上，该模型值得进行初期评测。但对于需要搜索增强（RAG）或代码执行的应用场景，需等待后续工具补齐。企业用户应关注 5 月 20 日峰会是否能放出正式版本的定价、API 调用方案以及更详细的基准测试对比。对内容创作者而言，该模型在“专家级应用”维度的表现意味着其在高端文案、技术内容生成上或有显著提升。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，5 月 20 日阿里云峰会是否能发布正式版 Qwen3.7 模型的完整能力图谱和定价策略，这将直接影响企业采购和开发者接入意愿。第二，当前 Preview 模型仅支持思考模式，搜索与代码解释器缺失，后续是否会在正式版补齐这些工具，将决定模型能否应用于更多实际生产流程。第三，Arena AI 排行榜上的排名会随着其他厂商模型（如 OpenAI、百度、智谱等）的更新而动态变化，Qwen3.7 能否长期保持前列，需要持续跟踪后续评测数据。

来源：IT之家 (ITHome)

阿里云千问大模型 Qwen3.7-Max-Preview 首发亮相 Arena AI