等不及正式版?Qwen3.7 预览模型已可体验!数学/编程/多模态全面进阶,思考模式先睹为快

等不及正式版?Qwen3.7 预览模型已可体验!数学/编程/多模态全面进阶,思考模式先睹为快

等不及正式版?Qwen3.7 预览模型已可体验!数学/编程/多模态全面进阶,思考模式先睹为快

一句话看懂:阿里通义千问于5月19日悄然上线Qwen3.7系列的Max和Plus两个预览版模型,主打强化推理与多模态能力,已在Arena AI排行榜上取得数学推理第7、编程第10的实战成绩,正式版预计在5月20日的阿里云峰会上发布。

事件核心:发生了什么

两个预览模型分别为定位旗舰性能的Qwen3.7-Max-Preview和高性能平衡版的Qwen3.7-Plus-Preview,已可通过千问Chat及第三方评测平台Arena AI体验。值得注意的是,Max预览版目前仅开放了“思考模式”(推理专用),搜索、代码解释器等工具链尚未解锁;Plus版则支持多模态能力。根据Arena AI的文本能力排行榜,Qwen3.7-Max-Preview综合排名第13,帮助阿里通义在大模型实验室全球排名中升至第6。细分领域表现更加突出:数学推理第7、专家级应用第9、软件与IT领域第9、编程能力第10。在视觉能力评估中,Qwen3.7-Plus-Preview整体排名第16,带动通义在视觉榜单所有实验室中跃居第5。

为什么重要

此次前瞻性发布的节奏表明阿里已进入大模型迭代的密集冲刺阶段。预览版模型在未开放全部工具能力的情况下,已在高难度数学推理和编程等专业场景中进入全球前10,这直接挑战了当前闭源旗舰(如OpenAI o系列)和开源社区头部模型(如DeepSeek、Llama系列)的竞争格局。同时,“思考模式”与多模态能力并行推进的技术路线,显示出通义千问不再单纯卷参数量,而是试图在推理深度与跨模态理解上形成差异化优势。如果即将到来的阿里云峰会同时公布API定价或开源计划,将直接影响到开发者选型和企业采购决策。

对用户/开发者/创作者的影响

对普通用户:目前可通过千问Chat免费体验思考模式,数学和逻辑题正确率有望提升,日常使用效率明显改善。对开发者与创作群体:Qwen3.7-Plus的早期多模态能力(如视觉理解、图像与文字交叉推理)值得关注,尤其在图文工作流和自动化内容生成中可能取代部分专用小模型。由于预览版限制工具调用,建议开发者在正式版发布后再评估API集成。同时,Arena AI排名显示其在代码生成和软件工程场景已有竞争力,AI编程助手类和自动化测试工具团队可提前测试。对企业IT决策者:如果正式版保持或低于当前主流旗舰API定价,将极大降低企业部署大模型推理应用的成本门槛。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

1. 阿里云峰会(5月20日)是否同步提供API定价与开源权重,将决定模型能否形成生态规模。2. 预览版在“专家级”高难度任务(Arena Expert Arena)已排到第9,若正式版能稳定进入前5,将直接影响企业级金融、法律、生物等专业领域的选型。3. 工具链(搜索、代码沙箱)正式开放后,竞品(如DeepSeek、GPT-4o)是否会跟进类似的“先推理后工具”模式?值得观察。

来源:AIbase

celebrityanime
celebrityanime
文章: 2781

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注