微软援引《Joule》研究称,在大规模在线推理场景下,单次典型 AI 查询的耗电仅约 0.16–0.60 瓦时,较此前估计低 1/4 到 1/20;保守估计的冷却用水为 0.0–0.067 毫升(中位数约 1/100 茶匙,甚至少于一滴)。研究指出,系统规模越大、调度与硬件越优化,单位查询能效越高;在日均 10 亿次查询场景下,基础能耗约 0.7 吉瓦时,经过优化可降至约 0.3 吉瓦时,即使 10% 为长任务,总体能耗仍可下降一半以上。
6 月 16 日消息,微软昨日(6 月 15 日)发布博文,援引《Joule》研究指出,AI 在大规模部署下的能耗与用水量显著低于外界早前估计。
该研究认为在大规模推理场景下,外界对 AI 大语言模型的关注点,不应该只放在单个模型的训练 / 推理规模,更应该注重用户典型调用下的“每次查询”。
该研究指出一次常规典型 AI 调用,耗电 0.16 至 0.60 瓦时(watt-hours),约等于一台 40 瓦电脑运行 15 至 60 秒,或 1000 瓦微波炉工作 0.6 至 2 秒。相比此前文献和媒体报道,新研究的数据低至 1/4 到 1/20。

水资源方面,保守估计下,典型查询的冷却用水为 0.0 至 0.067 毫升,中位数约相当于 1/100 茶匙,甚至少于 1 滴。微软还提到,随着零用水数据中心设计推广,这一数字还有继续下降的空间。IT之家附上相关截图如下:

微软指出规模越大,单位查询效率通常越高。大系统可同时处理更多请求,并在模型、调度、硬件多个层面叠加优化。就像大型航空公司更容易通过统一调度节省燃料,云平台也能把效率改进扩散到每一次推理。
在 10 亿次日查询场景下,基础耗电约 0.7 吉瓦时;若加入效率优化,可降至约 0.3 吉瓦时。即使 10% 请求属于代码生成、多步推理等长任务,整体能耗仍可比基线下降一半以上。