[x86] AI 计算扩展 (ACE) 规范

英特尔与AMD联合定义了全新的x86 AI计算扩展(ACE)规范,用于替代英特尔此前独家的AMX矩阵扩展。这意味着x86阵营在AI指令集上走向统一,但也宣告了英特尔AMX技术的过渡性命运,与当年苹果放弃自有AMX、转投Arm SME的路径如出一辙。

[x86] AI 计算扩展 (ACE) 规范

一句话看懂:英特尔与AMD联合定义了全新的x86 AI计算扩展(ACE)规范,用于替代英特尔此前独家的AMX矩阵扩展。这意味着x86阵营在AI指令集上走向统一,但也宣告了英特尔AMX技术的过渡性命运,与当年苹果放弃自有AMX、转投Arm SME的路径如出一辙。

事件核心:发生了什么

英特尔和AMD共同发布了”AI Compute Extension”(ACE)规范。该规范是对英特尔现有AMX(高级矩阵扩展)的替代和延伸——ACE继承了AMX的部分特性,但并非完全兼容。目前最新的英特尔服务器P核CPU已搭载AMX,而AMD从未实现AMX支持,未来也不会再实现,因为ACE将成为双方统一的矩阵AI计算扩展标准。

值得注意的是,x86阵营在AI推理的底层指令集上正在弥合分歧。与此同时,x86也补齐了VNNI点积指令的有符号/无符号变体,解决了多年来与Arm ISA之间存在的u8与i8混合计算的兼容性痛点(此前开发者不得不将输入严格限制在[0,127]范围内以保证跨平台兼容)。

为什么重要

ACE的诞生标志着x86体系在AI推理加速上从”各自为战”走向”联合定义”。从行业比较看:苹果早期的AMX最终被与Arm共同定义的SME替代;英特尔AMX的处境与之相似,未来也将被ACE取代。矩阵扩展相比向量扩展能更有效地降低内存访问与计算操作的比例,从而显著提升AI推理效率。

另一个关键信号是AVX-512的普及进程。目前所有新发布的英特尔CPU均已支持AVX-512(Panther Lake、Wildcat Lake、Clearwater Forest等第一批今年初发布的产品是最后一批不支持的型号)。AMD的Zen 4/5/6 CPU均已支持AVX-512。这一局面使得AI算力的底层指令集基础趋向统一,降低开发者的适配成本。

对用户/开发者/创作者的影响

对AI推理开发者:ACE的推出意味着未来在x86 CPU上进行AI推理可以依赖统一的矩阵计算指令,不必再区分英特尔AMX和AMD不支持AMX的尴尬。对于需要跨平台(x86 + Arm)部署的开发者,VNNI指令集补全有符号/无符号组合后,将避免此前因输入范围限制导致的精度或兼容性问题。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

对硬件采购者:ACE规范的落地需要新一代CPU硬件支持,目前公布的发布日期已推迟到明年,主因是内存价格问题抑制了升级需求。如果企业短期内计划采购AI推理服务器,建议关注新CPU是否明确标注ACE支持。

对模型部署者:CPU端的矩阵扩展能有效降低推理时的内存带宽压力,对低延迟、高吞吐的CPU推理场景(如边缘端、实时服务)是实质利好。但ACE目前规范聚焦AI推理,尚未像Arm SME或GPU那样覆盖FP64等全数值格式的通用矩阵运算。

值得关注的后续

  1. ACE何时落地首批商用CPU:英特尔与AMD新一代服务器CPU的发布时间因内存价格因素双双推迟至明年,首批支持ACE的产品大概率在2025年亮相。
  2. ACE规范是否覆盖更高精度计算:目前ACE对标的是AI推理场景,社区有声音希望扩展到FP64全精度矩阵运算(类似Arm SME方向),这取决于后续规范修订。
  3. AVX-512在移动端/笔记本端的普及:目前AVX-512仍未覆盖大多数新款笔记本和迷你主机CPU,英特尔在企业笔记本市场份额仍领先AMD,x86 AI指令集在轻薄端的落地节奏值得关注。

来源:hackernews

celebrityanime
celebrityanime
文章: 8495

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注