
速度翻倍!阶跃星辰开源 Step 3.7 Flash 大模型
一句话看懂:2026年5月29日,阶跃星辰正式开源其新一代Flash模型Step 3.7 Flash,专为智能体(Agent)的工业化落地设计,推理速度提升至每秒400 Tokens,并在代码编写、在线搜索等场景做了系统级优化。
事件核心:发生了什么
阶跃星辰今日发布了名为Step 3.7 Flash的开源大模型。该模型采用稀疏混合专家架构(MoE),总参数量达到196B。在推理效率方面,模型最高可实现每秒生成400 Tokens的输出速度,显著缩短了高频多轮交互中的等待延迟。同时,模型原生支持多模态理解,能够直接解析UI界面、图表、文档等复杂视觉信息,并可将视觉内容转化为结构化数据甚至执行代码。在检索方面,模型增强了联网搜索与图片搜索能力,可在开放网络中跨文本和图像获取多源信息并进行交叉验证。
为什么重要
Step 3.7 Flash的发布意味着阶跃星辰在智能体落地的关键环节——高吞吐、低延迟推理上给出了具体解决方案。目前公开信息显示,模型在长链条、多轮Agent工作流中展现出较高的稳定性,能够驱动API、浏览器、终端及Office工具,降低了任务执行出错或偏离的概率。此外,模型对主流Agent开发框架和工具调用协议进行了深度兼容优化,有助于降低开发者接入门槛,推动开源生态内智能体应用从实验走向规模化部署。这也表明,中国大模型厂商在Agent工业化方向上的竞争正从模型能力比拼,升级到工程优化与生态适配的层面。
对用户/开发者/创作者的影响
对开发者而言,Step 3.7 Flash的开源意味着可以直接获取一个高吞吐、支持多模态的模型底座,用于构建聊天、自动化工作流、代码生成等应用,且无需依赖闭源API。对创作者和内容从业者来说,模型原生处理UI截屏、图表和文档的能力,为自动化信息提取、数据可视化生成以及交互式内容创作提供了新可能。但需要注意的是,部署如此规模的MoE模型仍需要相当的算力资源,小型团队可能需要借助云服务或推理优化工具才能充分发挥其能力。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
首先,Step 3.7 Flash的实际推理速度与稳定性在社区真实负载下能否保持官方数据,有待开发者实测验证。其次,该模型开源后是否带动国内其他大模型厂商加速推出同类定向Agent优化的模型,以及价格策略(如API调用成本)上是否出现竞争性调整,值得观察。第三,复杂Agent工作流在多工具协作时的可靠性和安全性(例如权限控制、数据泄漏风险)仍是行业尚未完全解决的挑战,Step 3.7 Flash在真实生产环境中的表现值得持续追踪。
来源:AIbase


