阿里通义千问重磅升级:新旗舰Qwen3. 7 预览版全球首发亮相

阿里通义千问重磅升级:新旗舰Qwen3. 7 预览版全球首发亮相

阿里通义千问重磅升级:新旗舰Qwen3.7预览版全球首发亮相

一句话看懂:阿里云于5月19日正式发布通义千问下一代大模型的预览版本——Qwen3.7-Max-Preview与Qwen3.7-Plus-Preview,主打“思考模式”,在数学、编程等专业领域进入全球前十,直接对标闭源与开源旗舰模型。

事件核心:发生了什么

5月19日,阿里云通义千问系列推出重大迭代,两款新模型Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview在Arena AI平台与官方Qwen Chat同步上线。根据官方产品特点,预览阶段两款模型仅支持“思考模式”,聚焦高级逻辑推理与深度计算,暂时不开放网页搜索、代码解释器等辅助工具。从评测成绩来看,Qwen3.7-Max-Preview在文本综合排名中进入全球前13,推动通义千问实验室综合排名升至全球第六;而在细分榜单中,该模型数学能力排名全球第7,专家级应用、软件与IT、纯编程能力均跻身全球前十。另一款高性能模型Qwen3.7-Plus-Preview在视觉领域综合排名全球第16,使得通义千问整体视觉实验室榜单排名提升至全球第五。

为什么重要

这次升级是通义千问在“推理模型”路线上的关键布局。目前公开信息显示,阿里云选择以纯思考模式作为新旗舰的起点,意味着在训练侧对高阶逻辑推理进行了专门优化,而非简单堆叠参数或依赖外部工具补足短板。这一策略直接瞄准了当前大模型竞争中最激烈的推理能力领域,与OpenAI o系列、Claude 3 Opus等形成正面竞争。从评测成绩看,Qwen3.7-Max-Preview在数学和编程上进入前十,表明阿里云在技术侧取得了可验证的突破,正在拉近与头部闭源模型的差距。同时,榜单排名的集体跃升,也间接证明了通义千问在中文语料优化、多模态融合等方面持续投入的效果。

对用户/开发者/创作者的影响

  • 普通用户:通过Qwen Chat可直接体验新预览版,但需要接受目前没有联网搜索和代码解释器的限制。如果日常需求是复杂逻辑问答、数学推理或专业分析,可以尝试,但若依赖实时信息或文件处理,建议等待正式版。
  • 开发者和企业:预览版释放了明确的信号——阿里云正在强化API侧的推理能力,未来可能推出针对数学、编程等垂直场景的专用接口。对于需要高准确度代码生成和数学计算的开发者,可以提前申请测试,评估其在RAG(检索增强生成)和智能代理场景下的实际表现。
  • AI行业从业者:预览版的推出强化了国内大模型在推理赛道的竞争,预计其他头部厂商(如百度、字节、百川等)也会加速推出类似产品。对于算力投资者,这意味着对高阶推理模型的训练和推理需求将进一步上升。

值得关注的后续

  1. 正式发布时间点:预览版暗示了阿里云很可能在即将召开的阿里云峰会上正式发布Qwen3.7,届时是否开源、是否开放API定价策略,将直接影响开发者和企业用户的采用意愿。
  2. 非思考模式是否恢复:当前仅支持思考模式,如果正式版重新接入网页搜索和代码解释器,Qwen3.7的实用性和竞争力将大幅提升,否则可能面临“强推理但弱服务”的定位挑战。
  3. 竞品反应与价格战:Qwen3.7-Max-Preview的评测成绩接近闭源顶级模型,若阿里云选择低价或部分免费开放API,可能引发新一轮推理模型降价,下游AI应用厂商应密切注意成本变化。
GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

来源:AIbase

celebrityanime
celebrityanime
文章: 2846

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注