速度翻倍！阶跃星辰开源 Step 3.7 Flash 大模型

一句话看懂：2026年5月29日，阶跃星辰正式开源其新一代Flash模型Step 3.7 Flash，专为智能体（Agent）的工业化落地设计，推理速度提升至每秒400 Tokens，并在代码编写、在线搜索等场景做了系统级优化。

事件核心：发生了什么

阶跃星辰今日发布了名为Step 3.7 Flash的开源大模型。该模型采用稀疏混合专家架构（MoE），总参数量达到196B。在推理效率方面，模型最高可实现每秒生成400 Tokens的输出速度，显著缩短了高频多轮交互中的等待延迟。同时，模型原生支持多模态理解，能够直接解析UI界面、图表、文档等复杂视觉信息，并可将视觉内容转化为结构化数据甚至执行代码。在检索方面，模型增强了联网搜索与图片搜索能力，可在开放网络中跨文本和图像获取多源信息并进行交叉验证。

为什么重要

Step 3.7 Flash的发布意味着阶跃星辰在智能体落地的关键环节——高吞吐、低延迟推理上给出了具体解决方案。目前公开信息显示，模型在长链条、多轮Agent工作流中展现出较高的稳定性，能够驱动API、浏览器、终端及Office工具，降低了任务执行出错或偏离的概率。此外，模型对主流Agent开发框架和工具调用协议进行了深度兼容优化，有助于降低开发者接入门槛，推动开源生态内智能体应用从实验走向规模化部署。这也表明，中国大模型厂商在Agent工业化方向上的竞争正从模型能力比拼，升级到工程优化与生态适配的层面。

对用户/开发者/创作者的影响

对开发者而言，Step 3.7 Flash的开源意味着可以直接获取一个高吞吐、支持多模态的模型底座，用于构建聊天、自动化工作流、代码生成等应用，且无需依赖闭源API。对创作者和内容从业者来说，模型原生处理UI截屏、图表和文档的能力，为自动化信息提取、数据可视化生成以及交互式内容创作提供了新可能。但需要注意的是，部署如此规模的MoE模型仍需要相当的算力资源，小型团队可能需要借助云服务或推理优化工具才能充分发挥其能力。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

首先，Step 3.7 Flash的实际推理速度与稳定性在社区真实负载下能否保持官方数据，有待开发者实测验证。其次，该模型开源后是否带动国内其他大模型厂商加速推出同类定向Agent优化的模型，以及价格策略（如API调用成本）上是否出现竞争性调整，值得观察。第三，复杂Agent工作流在多工具协作时的可靠性和安全性（例如权限控制、数据泄漏风险）仍是行业尚未完全解决的挑战，Step 3.7 Flash在真实生产环境中的表现值得持续追踪。

来源：AIbase

速度翻倍！阶跃星辰开源 Step 3.7 Flash 大模型