阶跃星辰开源 Step 3.7 Flash 模型，最高生成速度每秒 400 Tokens

一句话看懂：阶跃星辰于5月29日开源了Step 3.7 Flash模型，这是一款主打低延迟、高吞吐的MoE架构模型，推理速度可达400 Tokens/s，专为Agent、搜索和多模态工作流场景优化。

事件核心：发生了什么

阶跃星辰正式发布并开源了其最新一代的Flash模型——Step 3.7 Flash。该模型采用稀疏MoE架构，总参数量为196B（视觉部分另含1.8B ViT），激活参数量为11B。其最大亮点在于推理速度，最高可达每秒400 Tokens，大幅降低了响应延迟。根据官方介绍，该模型原生支持UI、图表、文档等复杂视觉信息的理解与执行，并强化了联网检索与图像搜索能力，能在开放信息环境中进行多源证据交叉比对。此外，Step 3.7 Flash在工具调用和Agent生态兼容上做了深度优化，目前已适配Claude Code、KiloCode、RooCode等主流Agent框架，以及MCP等工具调用协议。相关模型和API已在GitHub、Hugging Face、ModelScope及阶跃星辰开放平台上架。

为什么重要

Step 3.7 Flash的发布，进一步印证了2025年AI开源社区两个明确的技术走向：一是Agent生产化对模型响应速度的要求正在逼近“实时”水平，400 Tokens/s的速度足以支撑高频多轮交互；二是MoE架构从单纯的参数堆叠转向实用性优化，11B的激活参数量能在性能与成本之间取得较好平衡。对于国内大模型开源生态而言，阶跃星辰的持续开源动作（继Step 3.5 Flash之后）正在积累开发者适配经验，这对其赴港IPO的长期叙事或有正面作用。同时，该模型对Agent框架的广泛兼容，意味着开发者无需等待生态成熟即可部署，这降低了从闭源大模型迁移到开源方案的门槛。

对用户/开发者/创作者的影响

对AI应用开发者而言，Step 3.7 Flash提供了一条低延迟、长程任务可控的开源路线，尤其适合需要频繁调用工具（如API、浏览器、Office）的Agent应用。目前公开信息显示，该模型已预适配多款主流Agent框架，这减少了集成和微调的工作量。对于内容创作者或企业用户，如果希望搭建内部的高效图像搜索或文档处理工作流，该模型的原生多模态能力可能降低部署复杂度。不过，196B的总参数意味着本地推理仍需较高算力条件，开发者应权衡云端API调用（阶跃星辰已提供国内与海外平台）与私有化部署的成本。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

未来一到两个季度，有以下几个观察点值得关注：第一，Step 3.7 Flash能否在Cline、Roo Code等主流开源Agent工具中获得实际装机量的快速提升，这是检验兼容优化的最好方式；第二，北京、上海等地的AI开发者社区是否会基于该模型推出新的Agent样板项目，这直接影响其生态扩展速度；第三，随着腾讯等资本方进入阶跃星辰股东序列，该模型在腾讯系内部应用（如云服务、办公场景）的落地情况，可能成为衡量其商业化潜力的重要参考。

来源：IT之家 (ITHome)

阶跃星辰开源 Step 3.7 Flash 模型，最高生成速度每秒 400 Tokens