昇腾管推理、鲲鹏管Agent,Agentic AI 让 CPU 重回舞台中央

昇腾管推理、鲲鹏管Agent,Agentic AI 让 CPU 重回舞台中央

昇腾管推理、鲲鹏管Agent,Agentic AI 让 CPU 重回舞台中央

一句话看懂:在2026年鲲鹏昇腾开发者大会上,华为明确了AI算力的分工:昇腾负责大模型推理与训练,鲲鹏CPU则扛起Agent(智能体)编排与系统承载重任。这一变化意味着,随着Agentic AI走向复杂化,CPU不再是配角,而是集群算力规划中的独立约束。

事件核心:发生了什么

华为在大会上披露了基于昇腾超节点与鲲鹏的协同架构,并首次将深度学习模型DeepSeek-V4适配至昇腾芯片。关键信息包括:

  • 昇腾芯片新增SIMD与SIMT混合编程能力,950代际产品支持FP8、MXFP4等低精度格式,以提升训练效率和推理吞吐。
  • 灵衢互联实现总线级全连接,单跳通信延迟200纳秒,支持NPU与CPU直接通信,目标是将大规模AI集群视为“一台计算机”。
  • 鲲鹏CPU的算力规划占比从传统AI集群中的10%提升至40%以上,华为预计未来CPU与NPU的配比可能达到1:1甚至更高。
  • 开源CANN底层软件栈,开放50多个源码仓,支持Triton、TileLang等第三方编程生态,降低开发门槛。

为什么重要

这一架构转变意味着中国AI生态开始从“单卡/单服务器”走向“系统级协同”,且不再唯GPU论。具体意义有三:

  • 国产芯片从“能跑”进入“跑得好”阶段:DeepSeek-V4适配昇腾,说明国产大模型与国产芯片的协同已越过可用门槛,进入优化推理效率、降低Token成本的深水区。
  • Agentic AI带来算力需求重构:Agent需要多轮规划、工具调用、记忆检索和状态管理,这些任务天然依赖CPU的异步控制流,而非GPU/NPU的密集矩阵运算。CPU成为决定吞吐与时延的新瓶颈。
  • 开源与开放正成为竞争力核心:华为通过开源CANN、支持Triton生态,试图吸引更多算法工程师和算子开发者,而不仅仅是靠封闭硬件绑定用户。

对用户/开发者/创作者的影响

  • AI应用开发者:如果使用国产推理API(如基于昇腾的服务),未来可能享受更低Token成本,尤其在长上下文或Agent场景下。但需注意,底层硬件生态依然在快速迭代,开发者可能需要适配Python编程接口(如PyAsc)而非直接使用CUDA风格代码。
  • 企业IT采购决策者:采购国产AI集群时,应关注CPU规划比例,避免高估NPU/GPU的单卡能力,低估Agent场景下的CPU瓶颈。华为提出的“HBM+DDR+SSD”三级记忆架构也提醒企业,内存与存储配置直接影响Agent的长上下文推理成本。
  • AI框架/算法研究者:昇腾对Triton、TileLang等第三方生态的支持,意味着未来可以在昇腾芯片上试验新的并行计算范式,而不再必须依赖华为自有的AscendC语言。

值得关注的后续

  1. 产品落地与价格:DeepSeek-V4适配昇腾后,能否在公开API或云端服务中以更低单价提供,将直接影响市场接受度。
  2. 竞品跟进:AMD、Intel等厂商是否针对Agent场景推出更强调CPU+GPU协同的架构?目前公开信息显示,英伟达主要聚焦GPU扩展,CPU在Agent负载中的角色尚未被等效强调。
  3. 开发者生态规模:昇腾开源的50多个源码仓能否吸引外部贡献者,以及CANN对Triton生态的支持是否真实可用,将决定其长期竞争力。
GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

来源:InfoQ CN

celebrityanime
celebrityanime
文章: 4116

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注