
一句话看懂:英特尔与 AMD 联合成立的 x86 生态系统咨询小组(EAG)发布了 ACE 规范 1.15 版本,通过统一指令集和新增矩阵运算能力,正式将 x86 架构的 AI 算力从碎片化状态拉回正轨。这不仅是两家宿敌的技术“破冰”,更意味着未来开发者训练和部署大模型时,不必再为不同 CPU 的 AI 指令集兼容性而头疼。
事件核心:发生了什么
2026 年 6 月 19 日,由英特尔和 AMD 联合发起的 x86 生态系统咨询小组(EAG)公布了 ACE 规范 1.15 版本。ACE 全称为 AI Compute Extensions,是一组专为 AI 与机器学习设计的 x86 指令集。其核心改进包括:引入“图块寄存器”(tile register)状态来优化矩阵乘法运算——这是深度神经网络中最频繁的计算环节;同时将其纳入 AVX10 框架,正式支持低精度格式(如 BF16、FP8、MX FP4 等)。在部署路线图上,AMD 已明确 Zen 6 将加入新 AI 数据类型支持,Zen 7 直接配备新矩阵引擎;英特尔后续产品也将全面采用 ACE 指令集。
为什么重要
此前 x86 生态的 AI 加速长期依赖 AVX-512 指令集,但由于英特尔和 AMD 各自实现方式不同,导致软件层需要针对不同 CPU 分别优化,造成严重的碎片化问题。ACE 规范从设计之初就要求两家共同承诺支持,且未来产品更迭不会轻易废弃。这意味着 AI 推理框架和编译器开发者可以基于统一的指令集编写代码,无需再区分“英特尔版”和“AMD 版”。对于大模型推理、图像生成、科学计算等对矩阵运算极度依赖的场景,ACE 有望将单个 CPU 的 AI 算力密度提升数倍,同时降低低精度训练和推理的迁移成本。
对用户/开发者/创作者的影响
对通用 AI 开发者:过去在 x86 机器上做 AI 推理时常遇到“AVX-512 未启用”或“某指令集不支持”的报错。ACE 统一后,你可以在主流 Intel 和 AMD 处理器上使用同一套 SIMD 代码,显著降低调试和适配成本。对大模型训练和推理团队:ACE 支持的 FP8、MX FP4 等低精度格式,能有效降低显存带宽消耗和功耗,在处理器不升级情况下可能直接缩短推理延迟。对内容创作者和普通用户:长期来看,采用 ACE 的 x86 芯片在本地运行 Stable Diffusion、LLaMA 等模型时,效果会更稳定且速度更快,无需频繁关注 CPU 兼容性列表。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
1. Zen 6 与英特尔下一代产品能否如期落地 ACE 硬件支持? AMD 已明确 Zen 6 将搭载“新 AI 数据类型支持”,但具体算力指标和功耗表现仍需实物验证。
2. 软件生态的迁移速度。 编译器(如 LLVM、GCC)、深度学习框架(如 PyTorch、TensorFlow)何时能原生调用 ACE 指令集,将决定开发者能否在年内体验到统一指令集的优势。
3. ARM 架构的回应。 x86 生态通过 ACE 弥补了 AI 算力短板,但苹果 M 系列与 NVIDIA Grace 已在低精度推理上有深厚积累,ACE 的实际性能提升能否逆转 ARM 在 AI 场景的吸引力,需要后续基准测试数据。


