英特尔晒 Arc Pro B70 显卡成绩,AI 推理性能较 B60 飙升 80%

本文报道并解读了英特尔在 MLPerf v6.0 推理基准中的成绩与宣传。核心为英特尔与 Wccftech 报道称全新 Arc Pro B70 在 AI 推理上相比上代 B60 提升约 80%,并在四卡(4×B70、128GB 总显存)+ 至强 6 平台上测试可驱动 1200 亿参数模型,B70 在多卡运行时可提供最多 1.6 倍的 KV 缓存容量以提升长文本处理能力;测试数据同时展示多项 token/s 指标(GPT-OSS-120B、llama2-70b-99、llama3.1-8b),但结果并非在所有场景下 B70 都优于 B60 Dual(部分测试 B60 Dual 得分更高),说明“飙升 80%”可能为有针对性的对比口径。文章还强调至强 6 的 AMX/AVX-512 加速及英特尔的软件栈优化,并指出通过软件升级现有 B60 用户可获取约 18% 性能提升。

4 月 2 日消息,科技媒体 Wccftech 昨日(4 月 1 日)发布博文,报道称基于英特尔发布的 MLPerf v6.0 基准测试结果,在 AI 推理性能方面,全新 Arc Pro B70 显卡较上代 B60 飙升 80%。

本次核心测试平台采用四卡并联方案,搭载四张 Arc Pro B70 显卡(总显存达 128GB)与最新至强 6 处理器,能轻松驾驭 1200 亿参数的大型语言模型。与竞品相比,B70 在多卡协同运行时,最多可提供 1.6 倍的 KV 缓存容量,极大地提升了长文本处理能力。

IT之家附上相关测试结果如下:

英特尔 MLPerf v6.0 GPT-OSS-120B 推理基准测试:

GPU ConfigOffline (Tokens/s)Server (Tokens/s)
4 x Arc Pro B70 (128 GB)1536.90951.67
4 x Arc Pro B60 Dual (192 GB)1601.91884.24
4 x Arc Pro B60 (96 GB)841.04452.19

英特尔 MLPerf v6.0 llama2-70b-99 推理基准测试:

GPU ConfigOffline (Tokens/s)Server (Tokens/s)
4 x Arc Pro B70 (128 GB)2459.181698.57
4 x Arc Pro B60 Dual (192 GB)3270.662199.50
4 x Arc Pro B60 (96 GB)1697.661106.26

英特尔 MLPerf v6.0 llama3.1 8b 推理基准测试:

GPU ConfigOffline (Tokens/s)Server (Tokens/s)
4 x Arc Pro B60 Dual (192 GB)52.8349.17
4 x Arc Pro B70 (128 GB)36.0732.58
4 x Arc Pro B60 (96 GB)26.1524.57
4 x Arc Pro B50 (64 GB)13.459.27
2 x Xeon 6 (128 Cores)9.613.68

该媒体指出提升 AI 推理效率的关键,不仅看显卡,处理器同样是核心枢纽。至强 6 处理器凭借内置的 AMX 和 AVX-512 加速引擎,实现最高 90% 的代际性能飞跃。

除硬件迭代外,英特尔持续深耕 AI 软件栈优化。测试数据显示,现有 Arc Pro B60 显卡用户无需更换硬件,仅通过软件升级即可直接获得 18% 的性能提升。

版权声明:本站文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

评论加载中...