英特尔 AMD 世纪破冰完善 x86 生态,ACE 规范 1.15 公布增强 AI 算力

x86 生态咨询小组(EAG)发布 ACE 规范 1.15 版本,新增原生矩阵乘法引擎与低精度数据格式支持,旨在提升 x86 在 AI/机器学习负载下的算力表现。ACE(AI Compute Extensions)在 AVX 向量指令基础上引入“图块寄存器”等状态与数据移动/处理指令,并纳入 AVX10 下的格式转换指令以完善低精度支持。文中回顾了英特尔与 AMD 于 2024 年联合成立 EAG 的背景,并指出 AMD 路线图:Zen 6 将引入新 AI 数据类型与更多 AI 管线,Zen 7 将配备新矩阵引擎与 AI 数据格式扩展。ACE 支持多种数据格式,包括 INT8/INT32/FP32/BF16/FP16/FP8 及 MX 联盟定义的多种 FP8/FP6/FP4 格式等。

6 月 20 日消息,科技媒体 Wccftech 昨日(6 月 19 日)发布博文,报道称 x86 生态系统咨询小组(EAG)发布 ACE 规范 1.15 版本,通过原生矩阵乘法引擎和低精度格式增强 x86 架构的 AI 性能。

IT之家注:为应对 AI 任务的挑战,英特尔和 AMD 公司于 2024 年“世纪破冰”,联合成立了 EAG 小组,协调 x86 架构的未来演进方向,进一步推动 x86 生态规范化和标准化。

ACE 全称为 AI Compute Extensions,是一组专为加速人工智能与机器学习负载设计的 x86 指令集,其核心目标是优化矩阵乘法运算(深度学习中最频繁的计算操作)和低精度数据格式处理。

在长期愿景方面,此前 AVX-512 指令集因各厂商不同实现导致软件生态碎片化,ACE 从设计之初就要求 AMD 与英特尔共同承诺支持,且未来产品更迭不会轻易废弃。

技术细节方面,ACE 在现有 AVX 向量指令基础上,新增了“图块寄存器”(tile register)状态,并定义了数据移动与处理操作。ACE 还纳入 AVX10 框架下的专用格式转换指令,进一步完善低精度数据支持。

在部署路线图上,AMD 明确 Zen 6 将引入“新 AI 数据类型支持”与“更多 AI 管线”,Zen 7 则直接配备“新矩阵引擎”与“AI 数据格式扩展”。

在数据支持范围上,ACE 支持 INT8、INT32、FP32、BF16、FP16、E8M0、FP8,以及 MX 联盟定义的 MX FP8(SE5M2/SE4M3)、MX FP6(SE3M2/SE2M3)、MX FP4(SE2M1)和 MX INT8 等。

参考

  • AI Compute Extensions (ACE) Specification

版权声明:本站文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

评论加载中...