商汤最强 Lite 模型来了，Token 消耗直降 60%，限时免费调用

一句话看懂：商汤科技于5月8日发布轻量化多模态智能体模型 SenseNova 6.7 Flash-Lite，采用原生多模态架构，在信息搜索等场景下Token消耗较纯文本智能体降低60%，并同步开启Token Plan限时免费活动（首月每5小时1500次调用），同时将办公技能集SenseNova-Skills在GitHub开源。

事件核心：发生了什么

商汤发布了日日新系列最新模型SenseNova 6.7 Flash-Lite。该模型放弃了“语言+视觉”拼接式设计，取消视觉转文本中间层，直接处理网页、文档、图表等办公内容，实现“看、想、做”一体化。在ClawEval、MathVision等基准测试中，模型以更小参数量取得同级多项SOTA，领先GPT-4、Gemini 3.1 Pro等前沿模型。伴随模型上线，商汤推出Token Plan限时免费活动：开发者首月可每5小时获得1500次无门槛调用额度。同时，办公技能包SenseNova-Skills在GitHub开源，涵盖信息图生成、PPT创作、Excel数据分析、深度调研等功能，并原生支持OpenClaw、Hermes Agent等智能体框架。

为什么重要

此次发布标志着商汤在轻量化多模态模型路径上的明确推进。原生多模态架构直接降低了长链路办公任务（如数据分析、深度调研、PPT生成）的推理成本，信息搜索场景下Token消耗较纯文本智能体直降60%，这一数据对开发者在高频互动、生产级部署场景中具有实际商业价值。同时，通过免费Token额度、Skills开源和Agent框架适配，商汤构建了一套从模型到工具链的完整生态闭环，降低了开发者接入门槛，也向市场释放了加速AI办公场景落地的明确信号。目前公开信息显示，商汤正以此模型切入金融、制造、医疗、教育等行业的核心工作流。

对用户/开发者/创作者的影响

对普通用户：可通过“办公小浣熊”（office.xiaohuanxiong.com）免配置使用，直接体验数据分析、图表制作、报告撰写、PPT生成等功能。

对开发者：模型兼容OpenAI API，可平滑接入主流Agent框架。通过GitHub即可获取全套Skills组件并使用免费Token Plan配额进行开发测试，首月每5小时1500次的免费额度降低了初创团队和个人开发者的试错成本。

对企业采购/创作者：官方案例显示，该模型处理近90万行销售数据后能自动识别异常值、生成结构完整的数据分析报告，并能产出具备一致风格、10页篇幅的流程图PPT。这意味着在信息检索、商业报告、流程文档生成等场景下，工具已具备初步可用性。

值得关注的后续

1. 长链路稳定性的验证：商汤展示了数据分析、PPT制作等长链路案例，但连续高频生产环境中的抗噪能力、自主纠错能力和长时序记忆一致性，还需要更多用户实测反馈验证。
2. 免费额度期后的定价策略：首月免费活动后，Token Plan是否继续低价或调整计费方式，将直接影响开发者生态的粘性规模。
3. 竞品跟进节奏：GPT-4、Gemini等模型在办公场景中同样具备多模态能力，商汤以“Token消耗直降60%”作为差异化卖点，后续同级别轻量化模型的竞争或将加剧。

来源：Readhub · AI

商汤最强 Lite 模型来了，Token 消耗直降 60%，限时免费调用