英特尔晒 Arc Pro B70 显卡成绩，AI 推理性能较 B60 飙升 80%

本文报道并解读了英特尔在 MLPerf v6.0 推理基准中的成绩与宣传。核心为英特尔与 Wccftech 报道称全新 Arc Pro B70 在 AI 推理上相比上代 B60 提升约 80%，并在四卡（4×B70、128GB 总显存）+ 至强 6 平台上测试可驱动 1200 亿参数模型，B70 在多卡运行时可提供最多 1.6 倍的 KV 缓存容量以提升长文本处理能力；测试数据同时展示多项 token/s 指标（GPT-OSS-120B、llama2-70b-99、llama3.1-8b），但结果并非在所有场景下 B70 都优于 B60 Dual（部分测试 B60 Dual 得分更高），说明“飙升 80%”可能为有针对性的对比口径。文章还强调至强 6 的 AMX/AVX-512 加速及英特尔的软件栈优化，并指出通过软件升级现有 B60 用户可获取约 18% 性能提升。

4 月 2 日消息，科技媒体 Wccftech 昨日（4 月 1 日）发布博文，报道称基于英特尔发布的 MLPerf v6.0 基准测试结果，在 AI 推理性能方面，全新 Arc Pro B70 显卡较上代 B60 飙升 80%。

本次核心测试平台采用四卡并联方案，搭载四张 Arc Pro B70 显卡（总显存达 128GB）与最新至强 6 处理器，能轻松驾驭 1200 亿参数的大型语言模型。与竞品相比，B70 在多卡协同运行时，最多可提供 1.6 倍的 KV 缓存容量，极大地提升了长文本处理能力。

IT之家附上相关测试结果如下：

英特尔 MLPerf v6.0 GPT-OSS-120B 推理基准测试：

GPU Config	Offline (Tokens/s)	Server (Tokens/s)
4 x Arc Pro B70 (128 GB)	1536.90	951.67
4 x Arc Pro B60 Dual (192 GB)	1601.91	884.24
4 x Arc Pro B60 (96 GB)	841.04	452.19

英特尔 MLPerf v6.0 llama2-70b-99 推理基准测试：

GPU Config	Offline (Tokens/s)	Server (Tokens/s)
4 x Arc Pro B70 (128 GB)	2459.18	1698.57
4 x Arc Pro B60 Dual (192 GB)	3270.66	2199.50
4 x Arc Pro B60 (96 GB)	1697.66	1106.26

英特尔 MLPerf v6.0 llama3.1 8b 推理基准测试：

GPU Config	Offline (Tokens/s)	Server (Tokens/s)
4 x Arc Pro B60 Dual (192 GB)	52.83	49.17
4 x Arc Pro B70 (128 GB)	36.07	32.58
4 x Arc Pro B60 (96 GB)	26.15	24.57
4 x Arc Pro B50 (64 GB)	13.45	9.27
2 x Xeon 6 (128 Cores)	9.61	3.68

该媒体指出提升 AI 推理效率的关键，不仅看显卡，处理器同样是核心枢纽。至强 6 处理器凭借内置的 AMX 和 AVX-512 加速引擎，实现最高 90% 的代际性能飞跃。

除硬件迭代外，英特尔持续深耕 AI 软件栈优化。测试数据显示，现有 Arc Pro B60 显卡用户无需更换硬件，仅通过软件升级即可直接获得 18% 的性能提升。