阿里云千问大模型 Qwen3.7-Max-Preview 首发亮相 Arena AI

阿里云千问大模型 Qwen3.7-Max-Preview 首发亮相 Arena AI

阿里云千问大模型 Qwen3.7-Max-Preview 首发亮相 Arena AI

一句话看懂:阿里云千问最新旗舰模型 Qwen3.7-Max-Preview 与 Qwen3.7-Plus-Preview 已上线 Arena AI 评测平台,并将在 5 月 20 日的阿里云峰会上正式发布。该模型在文本与视觉领域的专业评测中均进入前十,是阿里云在大模型竞争中的一次重要技术亮相。

事件核心:发生了什么

根据IT之家报道,阿里云于 2026 年 5 月 19 日悄然将 Qwen3.7-Max-Preview 和 Qwen3.7-Plus-Preview 两款预览模型部署上线,用户可以访问 Qwen Chat 及 Arena AI(原 LMArena)进行体验。目前这两款模型仅支持思考模式,搜索与代码解释器工具暂未开放。在官方公布的评测排名中,Qwen3.7-Max Preview 在文本综合排名中位列第 13(阿里通义千问在实验室排行中列第 6),在细分领域表现更为突出:数学第 7、专家级应用第 9、软件与 IT 第 9、编程第 10。视觉方面,Qwen3.7 Plus Preview 综合排名第 16,使阿里通义千问在视觉榜的实验室排名中升至第 5。在专家级提示场景“专家竞技场”中,该模型同样获得第 9 名。

为什么重要

Qwen3.7-Max-Preview 的发布,标志着阿里云在旗舰大模型路线上再次加速。在全球 AI 评测平台 Arena AI 上获得多个细分领域前十的成绩,表明阿里云在数学推理、编程、专家级应用等高价值场景中具备持续优化能力。与同期开源的轻量模型(如 Qwen3.5 系列、Qwen3.6-27B)不同,本次 Preview 版本采取闭源预览策略,意在通过公开评测验证技术实力,为即将到来的阿里云峰会积累市场声量。此举也意味着大模型竞争正从“参数规模竞赛”转向“实测榜单和专业场景落地”的阶段。

对用户/开发者/创作者的影响

对于使用通义千问 API 或 Qwen Chat 的开发者而言,Preivew 模型以“仅思考模式”上线,说明当前阶段阿里云更侧重于验证模型的推理和认知能力,而非提供完整工具链。如果开发者的应用场景集中在数学、编程、专业文案等强逻辑需求上,该模型值得进行初期评测。但对于需要搜索增强(RAG)或代码执行的应用场景,需等待后续工具补齐。企业用户应关注 5 月 20 日峰会是否能放出正式版本的定价、API 调用方案以及更详细的基准测试对比。对内容创作者而言,该模型在“专家级应用”维度的表现意味着其在高端文案、技术内容生成上或有显著提升。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,5 月 20 日阿里云峰会是否能发布正式版 Qwen3.7 模型的完整能力图谱和定价策略,这将直接影响企业采购和开发者接入意愿。第二,当前 Preview 模型仅支持思考模式,搜索与代码解释器缺失,后续是否会在正式版补齐这些工具,将决定模型能否应用于更多实际生产流程。第三,Arena AI 排行榜上的排名会随着其他厂商模型(如 OpenAI、百度、智谱等)的更新而动态变化,Qwen3.7 能否长期保持前列,需要持续跟踪后续评测数据。

来源:IT之家 (ITHome)

celebrityanime
celebrityanime
文章: 2761

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注