
一句话看懂:2026年6月15日,百度企业级通用智能体产品“度小满”(DuMate)宣布核心引擎升级,通过自研Harness引擎和工程优化,在保持智能能力不变的前提下,将任务执行的Token消耗降低了75%,用户点券消耗同步下降四分之三。
事件核心:发生了什么
百度DuMate于2026年3月首次推出,定位于企业级通用AI智能体,支持本地化部署。本次升级的核心在于底层Harness引擎和工程层面的协同优化。据百度官方公布的数据,升级后智能体在执行任务时的Token消耗减少75%,而智能水平和任务完成质量未受影响。这意味着企业用户在使用DuMate进行AI应用部署时,直接运营成本可同步下降75%。目前国内通用智能体产品普遍面临大模型推理成本高企的瓶颈,百度DuMate是首个公开宣称实现此量级成本压缩的国产通用智能体。
为什么重要
在大模型应用落地的竞争格局中,Token消耗是制约企业大规模部署AI应用的核心成本瓶颈。此前业界多在模型训练阶段降低成本,而在推理与任务执行环节的成本控制仍缺乏系统性突破。百度通过工程层面的深度优化(而非单纯依赖模型压缩或量化),在维持智能体“智商”不变的前提下实现了成本的大幅削减。这一成果若得到可靠复现,意味着企业级AI应用从“买得起”到“用得爽”之间的大门被进一步打开,可能倒逼其他大厂和创业公司在推理成本上展开新一轮竞争。
对用户/开发者/创作者的影响
企业IT采购决策者:可以重新评估AI智能体产品的总拥有成本(TCO)。如果DuMate的75%成本降低是普遍且可持续的,企业原本因算力预算过高而推迟的AI部署计划可能加速落地。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
AI应用开发者:需要关注Harness引擎的技术路线和开放程度。如果百度后续选择将相关优化经验以API或开源工具的形式输出,将直接影响开发者在选择Agent框架时的技术栈决策。
内容创作者与运营团队:虽然不直接接触底层技术,但更低的Token成本可能意味着企业级AI产品的功能套餐变便宜,或出现更多免费增值选项,进而影响日常的AI工具使用体验和预算。
值得关注的后续
1. 效果验证与复现:目前公开信息仅来自百度官方,第三方独立评测是否支持“智商不减”的结论,将是行业信任的关键。建议关注百度是否提供标准测试集或开放试用。
2. 竞品跟进节奏:阿里、字节、腾讯等企业的通用智能体产品是否会发布类似的成本压缩方案?这将影响企业用户的选择倾向。
3. 落地场景扩展:百度DuMate主推本地部署,低成本的实现能否促使更多中小企业从“试用”转向“批量部署”,将是衡量该升级商业价值的重要指标。
来源:AIbase

![[Bug]: Sync recursive retrieval misses `ref_doc_id` in dedup key](https://www.chat-gpts.plus/wp-content/uploads/2026/06/21033-2bfb3103-768x403.jpg)
![[Claude] [开源] CCL:我做了一个 Claude Code 启动器,把 ccswitch 干掉了](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_3-595-768x403.jpg)