
别盯着GPU了,英特尔甩出重磅大招,能否终结英伟达的算力垄断?
一句话看懂:在COMPUTEX 2026上,英特尔CEO陈立武提出,AI进入智能体(Agentic AI)时代后,算力需求将不再由GPU主导,CPU、RDU与GPU需分工协作。英特尔发布了基于18A制程的至强6+处理器(288核/576MB缓存)和一套全新的异构解耦推理方案,试图在AI基础设施重新分工中抢占关键位置,以打破英伟达在训练和推理算力上的垄断局面。
事件核心:发生了什么
英特尔在COMPUTEX 2026主题演讲中,明确了智能体AI对算力生态的颠覆性影响。陈立武指出,单个智能体的Token消耗量相比单轮推理可增加1000倍,且工作流程涉及反复“思考、规划、行动、反思”,导致传统以GPU为主的推理链路效率低下。为此,英特尔联合SambaNova、Vista Equity Partners、Cambium Capital推出完全解耦推理方案,由至强6处理器负责系统编排,SambaNova SN40 RDU承担解码,NVIDIA Blackwell GPU负责预填充,实现“各司其职”。同时,至强6+处理器作为云端核心,单个液冷机架(32U)可提供36864个核心,功耗约100kW。端侧则由第三代酷睿Ultra(已发布)和锐炫G3系列(面向掌机,本月上市)覆盖,与Perplexity展示了本地-云端混合推理系统。
为什么重要
这标志着AI算力竞争从“GPU峰值性能”转向“系统协同效率”。长期以来,英伟达凭借CUDA生态和H100/B200等GPU在大模型训练和推理中占据绝对优势。英特尔此次策略的核心在于:智能体推理需要高频任务编排、数据迁移和工具调用,这恰恰是CPU的强项。如果智能体成为主流应用形态,数据中心内CPU与GPU的配置比例可能从1:8变为1:1,甚至更高CPU密度,这将直接威胁英伟达“算力核心”的地位。此外,英特尔强调定制芯片(如与Google合作的IPU、与Ericsson合作的无线芯片),意图通过行业定制化扩大覆盖面,实现“无处不在”的算力渗透。
对用户/开发者/创作者的影响
对于开发者而言,英特尔的解耦推理方案提供了更灵活的硬件选择:如果构建智能体应用(如自动写代码、多工具调用),可以更多依赖CPU降低成本,而不必为每步推理购买昂贵的GPU算力。对于企业IT采购者,机架级方案(36864核/100kW)可能在成本效率上优于等效GPU集群,尤其适合部署内部知识库、客户服务等高频智能体系统。对于AIPC用户,第三代酷睿Ultra支持的本地-云端混合推理意味着隐私敏感任务(如文档总结)可直接在本地完成,低优先级任务再上传云端,降低对API依赖和Token开支。普通用户感知可能有限,但智能体应用的响应速度和隐私性未来有望改善。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,18A制程的量产进度:至强6+处理器能否按时交付并达到宣称的能效,直接影响客户落地。第二,合作方SambaNova的RDU(SN40)在真实智能体负载中的表现,能否替代一部分GPU解码任务,决定解耦方案推广力度。第三,竞品反应:AMD的EPYC和英伟达的Grace Hopper超级芯片也可能调整AI推理架构,英特尔能否在12-18个月内形成生态壁垒仍是变数。
来源:36氪 · 24小时热榜


