别盯着GPU了，英特尔甩出重磅大招，能否终结英伟达的算力垄断？

一句话看懂：在COMPUTEX 2026上，英特尔CEO陈立武提出，AI进入智能体（Agentic AI）时代后，算力需求将不再由GPU主导，CPU、RDU与GPU需分工协作。英特尔发布了基于18A制程的至强6+处理器（288核/576MB缓存）和一套全新的异构解耦推理方案，试图在AI基础设施重新分工中抢占关键位置，以打破英伟达在训练和推理算力上的垄断局面。

事件核心：发生了什么

英特尔在COMPUTEX 2026主题演讲中，明确了智能体AI对算力生态的颠覆性影响。陈立武指出，单个智能体的Token消耗量相比单轮推理可增加1000倍，且工作流程涉及反复“思考、规划、行动、反思”，导致传统以GPU为主的推理链路效率低下。为此，英特尔联合SambaNova、Vista Equity Partners、Cambium Capital推出完全解耦推理方案，由至强6处理器负责系统编排，SambaNova SN40 RDU承担解码，NVIDIA Blackwell GPU负责预填充，实现“各司其职”。同时，至强6+处理器作为云端核心，单个液冷机架（32U）可提供36864个核心，功耗约100kW。端侧则由第三代酷睿Ultra（已发布）和锐炫G3系列（面向掌机，本月上市）覆盖，与Perplexity展示了本地-云端混合推理系统。

为什么重要

这标志着AI算力竞争从“GPU峰值性能”转向“系统协同效率”。长期以来，英伟达凭借CUDA生态和H100/B200等GPU在大模型训练和推理中占据绝对优势。英特尔此次策略的核心在于：智能体推理需要高频任务编排、数据迁移和工具调用，这恰恰是CPU的强项。如果智能体成为主流应用形态，数据中心内CPU与GPU的配置比例可能从1:8变为1:1，甚至更高CPU密度，这将直接威胁英伟达“算力核心”的地位。此外，英特尔强调定制芯片（如与Google合作的IPU、与Ericsson合作的无线芯片），意图通过行业定制化扩大覆盖面，实现“无处不在”的算力渗透。

对用户/开发者/创作者的影响

对于开发者而言，英特尔的解耦推理方案提供了更灵活的硬件选择：如果构建智能体应用（如自动写代码、多工具调用），可以更多依赖CPU降低成本，而不必为每步推理购买昂贵的GPU算力。对于企业IT采购者，机架级方案（36864核/100kW）可能在成本效率上优于等效GPU集群，尤其适合部署内部知识库、客户服务等高频智能体系统。对于AIPC用户，第三代酷睿Ultra支持的本地-云端混合推理意味着隐私敏感任务（如文档总结）可直接在本地完成，低优先级任务再上传云端，降低对API依赖和Token开支。普通用户感知可能有限，但智能体应用的响应速度和隐私性未来有望改善。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，18A制程的量产进度：至强6+处理器能否按时交付并达到宣称的能效，直接影响客户落地。第二，合作方SambaNova的RDU（SN40）在真实智能体负载中的表现，能否替代一部分GPU解码任务，决定解耦方案推广力度。第三，竞品反应：AMD的EPYC和英伟达的Grace Hopper超级芯片也可能调整AI推理架构，英特尔能否在12-18个月内形成生态壁垒仍是变数。

来源：36氪 · 24小时热榜

别盯着GPU了，英特尔甩出重磅大招，能否终结英伟达的算力垄断？