智商不减、成本砍掉四分之三!百度通用智能体DuMate完成关键进化

一句话看懂：2026年6月15日，百度企业级通用智能体产品“度小满”（DuMate）宣布核心引擎升级，通过自研Harness引擎和工程优化，在保持智能能力不变的前提下，将任务执行的Token消耗降低了75%，用户点券消耗同步下降四分之三。

事件核心：发生了什么

百度DuMate于2026年3月首次推出，定位于企业级通用AI智能体，支持本地化部署。本次升级的核心在于底层Harness引擎和工程层面的协同优化。据百度官方公布的数据，升级后智能体在执行任务时的Token消耗减少75%，而智能水平和任务完成质量未受影响。这意味着企业用户在使用DuMate进行AI应用部署时，直接运营成本可同步下降75%。目前国内通用智能体产品普遍面临大模型推理成本高企的瓶颈，百度DuMate是首个公开宣称实现此量级成本压缩的国产通用智能体。

为什么重要

在大模型应用落地的竞争格局中，Token消耗是制约企业大规模部署AI应用的核心成本瓶颈。此前业界多在模型训练阶段降低成本，而在推理与任务执行环节的成本控制仍缺乏系统性突破。百度通过工程层面的深度优化（而非单纯依赖模型压缩或量化），在维持智能体“智商”不变的前提下实现了成本的大幅削减。这一成果若得到可靠复现，意味着企业级AI应用从“买得起”到“用得爽”之间的大门被进一步打开，可能倒逼其他大厂和创业公司在推理成本上展开新一轮竞争。

对用户/开发者/创作者的影响

企业IT采购决策者：可以重新评估AI智能体产品的总拥有成本（TCO）。如果DuMate的75%成本降低是普遍且可持续的，企业原本因算力预算过高而推迟的AI部署计划可能加速落地。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

AI应用开发者：需要关注Harness引擎的技术路线和开放程度。如果百度后续选择将相关优化经验以API或开源工具的形式输出，将直接影响开发者在选择Agent框架时的技术栈决策。

内容创作者与运营团队：虽然不直接接触底层技术，但更低的Token成本可能意味着企业级AI产品的功能套餐变便宜，或出现更多免费增值选项，进而影响日常的AI工具使用体验和预算。

值得关注的后续

1. 效果验证与复现：目前公开信息仅来自百度官方，第三方独立评测是否支持“智商不减”的结论，将是行业信任的关键。建议关注百度是否提供标准测试集或开放试用。

2. 竞品跟进节奏：阿里、字节、腾讯等企业的通用智能体产品是否会发布类似的成本压缩方案？这将影响企业用户的选择倾向。

3. 落地场景扩展：百度DuMate主推本地部署，低成本的实现能否促使更多中小企业从“试用”转向“批量部署”，将是衡量该升级商业价值的重要指标。

来源：AIbase

智商不减、成本砍掉四分之三!百度通用智能体DuMate完成关键进化

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

OpenAI API v1/models returns nothing that v1/internal/model/list does

[Bug]: Sync recursive retrieval misses `ref_doc_id` in dedup key

[Claude] [开源] CCL：我做了一个 Claude Code 启动器，把 ccswitch 干掉了

发表回复取消回复