
商汤最强 Lite 模型来了,Token 消耗直降 60%,限时免费调用
一句话看懂:商汤科技于5月8日发布轻量化多模态智能体模型 SenseNova 6.7 Flash-Lite,采用原生多模态架构,在信息搜索等场景下Token消耗较纯文本智能体降低60%,并同步开启Token Plan限时免费活动(首月每5小时1500次调用),同时将办公技能集SenseNova-Skills在GitHub开源。
事件核心:发生了什么
商汤发布了日日新系列最新模型SenseNova 6.7 Flash-Lite。该模型放弃了“语言+视觉”拼接式设计,取消视觉转文本中间层,直接处理网页、文档、图表等办公内容,实现“看、想、做”一体化。在ClawEval、MathVision等基准测试中,模型以更小参数量取得同级多项SOTA,领先GPT-4、Gemini 3.1 Pro等前沿模型。伴随模型上线,商汤推出Token Plan限时免费活动:开发者首月可每5小时获得1500次无门槛调用额度。同时,办公技能包SenseNova-Skills在GitHub开源,涵盖信息图生成、PPT创作、Excel数据分析、深度调研等功能,并原生支持OpenClaw、Hermes Agent等智能体框架。
为什么重要
此次发布标志着商汤在轻量化多模态模型路径上的明确推进。原生多模态架构直接降低了长链路办公任务(如数据分析、深度调研、PPT生成)的推理成本,信息搜索场景下Token消耗较纯文本智能体直降60%,这一数据对开发者在高频互动、生产级部署场景中具有实际商业价值。同时,通过免费Token额度、Skills开源和Agent框架适配,商汤构建了一套从模型到工具链的完整生态闭环,降低了开发者接入门槛,也向市场释放了加速AI办公场景落地的明确信号。目前公开信息显示,商汤正以此模型切入金融、制造、医疗、教育等行业的核心工作流。
对用户/开发者/创作者的影响
对普通用户:可通过“办公小浣熊”(office.xiaohuanxiong.com)免配置使用,直接体验数据分析、图表制作、报告撰写、PPT生成等功能。
对开发者:模型兼容OpenAI API,可平滑接入主流Agent框架。通过GitHub即可获取全套Skills组件并使用免费Token Plan配额进行开发测试,首月每5小时1500次的免费额度降低了初创团队和个人开发者的试错成本。
对企业采购/创作者:官方案例显示,该模型处理近90万行销售数据后能自动识别异常值、生成结构完整的数据分析报告,并能产出具备一致风格、10页篇幅的流程图PPT。这意味着在信息检索、商业报告、流程文档生成等场景下,工具已具备初步可用性。
值得关注的后续
1. 长链路稳定性的验证:商汤展示了数据分析、PPT制作等长链路案例,但连续高频生产环境中的抗噪能力、自主纠错能力和长时序记忆一致性,还需要更多用户实测反馈验证。
2. 免费额度期后的定价策略:首月免费活动后,Token Plan是否继续低价或调整计费方式,将直接影响开发者生态的粘性规模。
3. 竞品跟进节奏:GPT-4、Gemini等模型在办公场景中同样具备多模态能力,商汤以“Token消耗直降60%”作为差异化卖点,后续同级别轻量化模型的竞争或将加剧。
来源:Readhub · AI


