
不卷Token总量,华为云改卷token生产力:Agentic Infra背后,AI云竞争进入下半场
一句话看懂:6月5日,华为云在INSPIRE创想者大会上提出Agentic Infra基础设施范式,并发布通智一体化集群、记忆存储、调度引擎等全套产品。华为云明确表示不比拼Token总量,而是强调每个Token在医疗、制造等真实行业场景中带来的生产力提升。
事件核心:发生了什么
华为云在本次大会上系统性地重新定义了AI基础设施的竞争维度。CEO周跃峰提出,Agentic AI对基础设施提出了四类新要求:高效Token生成、长程记忆、灵活算力调度、安全自治。为此,华为云发布了AICS灵衢智算集群(最高200 EFLOPS、Token时延降至10毫秒内)、AMS Agentic记忆存储(PB级空间、支持天级任务)、CCE Volcano Next通智一体化调度引擎(资源利用率提升30%以上),以及AgentSphere智能体运行环境(沙箱启动100毫秒级)。同时,新一代ModelArts Next训推平台新增RL强化学习服务和模型路由能力,调度精准率超95%、成本平均降低20%。华为云还联合20余家模型厂商发布“百模千态”生态合作计划,并推出企业级智能体平台智果AgentArts及开源版openJiuwen。
为什么重要
这次发布标志着AI云竞争从“堆算力、拼模型参数”进入“拼基础设施工程化能力”的下半场。华为云明确拒绝以Token总量或MaaS收入作为核心指标,转而强调Token在国计民生行业中的实际生产力转化。其背后的逻辑是:国产化算力路线(鲲鹏、昇腾)需要更高效的基础设施配套,才能弥补算力规模上与“万国牌”集群的差距。通过将AI基础设施从“训练推理”扩展到“智能体长期运行环境”,华为云试图构建一个更适合企业长程任务的云底座,这与其他云厂商当前侧重消费级应用的策略形成差异化。此外,码道CodeArts代码智能体用户突破10万并正式商用,表明华为云正将AI编程工具作为连接“碳基与硅基”的核心入口,战略投入级别被定性为“范弗里特弹药量”。
对用户/开发者/创作者的影响
对于企业IT决策者和开发者而言,华为云的Agentic Infra降低了部署长程智能体的技术门槛:记忆存储和调度引擎可减少自建成本,ModelArts的RLaaS服务能让非强化学习专家也快速优化模型。对行业用户(医疗、制造、金融等),华为云的“行业AI梦工厂”四个专区提供了预集成的场景化方案,可能节省从模型选型到基础设施适配的试错时间。不过,目前产品多处于发布或公测阶段,实际效果和定价仍需验证。对于个人创作者和中小开发者,华为云的国产算力路线意味着更多技术路线选择,但生态成熟度和文档完善度尚需时间检验。
值得关注的后续
第一,AgentArts企业级平台和开源版openJiuwen是否能吸引开发者构建生态,特别是对比已有大量开源的LangChain等框架。第二,华为云提出的“训推共池”和“碎片整合”调度方案,实际落地中能否达到30%的利用率提升,以及能否吸引更多企业从自建转向公共云。第三,码道CodeArts商用后的定价策略和开发者反馈,将直接反映华为云在AI编程工具市场的竞争力。
来源:InfoQ CN


