阶跃星辰开源 Step 3.7 Flash 模型,最高生成速度每秒 400 Tokens

阶跃星辰开源 Step 3.7 Flash 模型,最高生成速度每秒 400 Tokens

阶跃星辰开源 Step 3.7 Flash 模型,最高生成速度每秒 400 Tokens

一句话看懂:阶跃星辰于5月29日开源了Step 3.7 Flash模型,这是一款主打低延迟、高吞吐的MoE架构模型,推理速度可达400 Tokens/s,专为Agent、搜索和多模态工作流场景优化。

事件核心:发生了什么

阶跃星辰正式发布并开源了其最新一代的Flash模型——Step 3.7 Flash。该模型采用稀疏MoE架构,总参数量为196B(视觉部分另含1.8B ViT),激活参数量为11B。其最大亮点在于推理速度,最高可达每秒400 Tokens,大幅降低了响应延迟。根据官方介绍,该模型原生支持UI、图表、文档等复杂视觉信息的理解与执行,并强化了联网检索与图像搜索能力,能在开放信息环境中进行多源证据交叉比对。此外,Step 3.7 Flash在工具调用和Agent生态兼容上做了深度优化,目前已适配Claude Code、KiloCode、RooCode等主流Agent框架,以及MCP等工具调用协议。相关模型和API已在GitHub、Hugging Face、ModelScope及阶跃星辰开放平台上架。

为什么重要

Step 3.7 Flash的发布,进一步印证了2025年AI开源社区两个明确的技术走向:一是Agent生产化对模型响应速度的要求正在逼近“实时”水平,400 Tokens/s的速度足以支撑高频多轮交互;二是MoE架构从单纯的参数堆叠转向实用性优化,11B的激活参数量能在性能与成本之间取得较好平衡。对于国内大模型开源生态而言,阶跃星辰的持续开源动作(继Step 3.5 Flash之后)正在积累开发者适配经验,这对其赴港IPO的长期叙事或有正面作用。同时,该模型对Agent框架的广泛兼容,意味着开发者无需等待生态成熟即可部署,这降低了从闭源大模型迁移到开源方案的门槛。

对用户/开发者/创作者的影响

对AI应用开发者而言,Step 3.7 Flash提供了一条低延迟、长程任务可控的开源路线,尤其适合需要频繁调用工具(如API、浏览器、Office)的Agent应用。目前公开信息显示,该模型已预适配多款主流Agent框架,这减少了集成和微调的工作量。对于内容创作者或企业用户,如果希望搭建内部的高效图像搜索或文档处理工作流,该模型的原生多模态能力可能降低部署复杂度。不过,196B的总参数意味着本地推理仍需较高算力条件,开发者应权衡云端API调用(阶跃星辰已提供国内与海外平台)与私有化部署的成本。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

未来一到两个季度,有以下几个观察点值得关注:第一,Step 3.7 Flash能否在Cline、Roo Code等主流开源Agent工具中获得实际装机量的快速提升,这是检验兼容优化的最好方式;第二,北京、上海等地的AI开发者社区是否会基于该模型推出新的Agent样板项目,这直接影响其生态扩展速度;第三,随着腾讯等资本方进入阶跃星辰股东序列,该模型在腾讯系内部应用(如云服务、办公场景)的落地情况,可能成为衡量其商业化潜力的重要参考。

来源:IT之家 (ITHome)

celebrityanime
celebrityanime
文章: 5148

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注