本文报道并解读了英特尔在 MLPerf v6.0 推理基准中的成绩与宣传。核心为英特尔与 Wccftech 报道称全新 Arc Pro B70 在 AI 推理上相比上代 B60 提升约 80%,并在四卡(4×B70、128GB 总显存)+ 至强 6 平台上测试可驱动 1200 亿参数模型,B70 在多卡运行时可提供最多 1.6 倍的 KV 缓存容量以提升长文本处理能力;测试数据同时展示多项 token/s 指标(GPT-OSS-120B、llama2-70b-99、llama3.1-8b),但结果并非在所有场景下 B70 都优于 B60 Dual(部分测试 B60 Dual 得分更高),说明“飙升 80%”可能为有针对性的对比口径。文章还强调至强 6 的 AMX/AVX-512 加速及英特尔的软件栈优化,并指出通过软件升级现有 B60 用户可获取约 18% 性能提升。
4 月 2 日消息,科技媒体 Wccftech 昨日(4 月 1 日)发布博文,报道称基于英特尔发布的 MLPerf v6.0 基准测试结果,在 AI 推理性能方面,全新 Arc Pro B70 显卡较上代 B60 飙升 80%。
本次核心测试平台采用四卡并联方案,搭载四张 Arc Pro B70 显卡(总显存达 128GB)与最新至强 6 处理器,能轻松驾驭 1200 亿参数的大型语言模型。与竞品相比,B70 在多卡协同运行时,最多可提供 1.6 倍的 KV 缓存容量,极大地提升了长文本处理能力。
IT之家附上相关测试结果如下:
英特尔 MLPerf v6.0 GPT-OSS-120B 推理基准测试:
| GPU Config | Offline (Tokens/s) | Server (Tokens/s) |
|---|---|---|
| 4 x Arc Pro B70 (128 GB) | 1536.90 | 951.67 |
| 4 x Arc Pro B60 Dual (192 GB) | 1601.91 | 884.24 |
| 4 x Arc Pro B60 (96 GB) | 841.04 | 452.19 |
英特尔 MLPerf v6.0 llama2-70b-99 推理基准测试:
| GPU Config | Offline (Tokens/s) | Server (Tokens/s) |
|---|---|---|
| 4 x Arc Pro B70 (128 GB) | 2459.18 | 1698.57 |
| 4 x Arc Pro B60 Dual (192 GB) | 3270.66 | 2199.50 |
| 4 x Arc Pro B60 (96 GB) | 1697.66 | 1106.26 |
英特尔 MLPerf v6.0 llama3.1 8b 推理基准测试:
| GPU Config | Offline (Tokens/s) | Server (Tokens/s) |
|---|---|---|
| 4 x Arc Pro B60 Dual (192 GB) | 52.83 | 49.17 |
| 4 x Arc Pro B70 (128 GB) | 36.07 | 32.58 |
| 4 x Arc Pro B60 (96 GB) | 26.15 | 24.57 |
| 4 x Arc Pro B50 (64 GB) | 13.45 | 9.27 |
| 2 x Xeon 6 (128 Cores) | 9.61 | 3.68 |

该媒体指出提升 AI 推理效率的关键,不仅看显卡,处理器同样是核心枢纽。至强 6 处理器凭借内置的 AMX 和 AVX-512 加速引擎,实现最高 90% 的代际性能飞跃。
除硬件迭代外,英特尔持续深耕 AI 软件栈优化。测试数据显示,现有 Arc Pro B60 显卡用户无需更换硬件,仅通过软件升级即可直接获得 18% 的性能提升。