微软称保守假设下，典型 AI 查询耗水量少于 1 滴水

微软援引《Joule》研究称，在大规模在线推理场景下，单次典型 AI 查询的耗电仅约 0.16–0.60 瓦时，较此前估计低 1/4 到 1/20；保守估计的冷却用水为 0.0–0.067 毫升（中位数约 1/100 茶匙，甚至少于一滴）。研究指出，系统规模越大、调度与硬件越优化，单位查询能效越高；在日均 10 亿次查询场景下，基础能耗约 0.7 吉瓦时，经过优化可降至约 0.3 吉瓦时，即使 10% 为长任务，总体能耗仍可下降一半以上。

6 月 16 日消息，微软昨日（6 月 15 日）发布博文，援引《Joule》研究指出，AI 在大规模部署下的能耗与用水量显著低于外界早前估计。

该研究认为在大规模推理场景下，外界对 AI 大语言模型的关注点，不应该只放在单个模型的训练 / 推理规模，更应该注重用户典型调用下的“每次查询”。

该研究指出一次常规典型 AI 调用，耗电 0.16 至 0.60 瓦时（watt-hours），约等于一台 40 瓦电脑运行 15 至 60 秒，或 1000 瓦微波炉工作 0.6 至 2 秒。相比此前文献和媒体报道，新研究的数据低至 1/4 到 1/20。

水资源方面，保守估计下，典型查询的冷却用水为 0.0 至 0.067 毫升，中位数约相当于 1/100 茶匙，甚至少于 1 滴。微软还提到，随着零用水数据中心设计推广，这一数字还有继续下降的空间。IT之家附上相关截图如下：

微软指出规模越大，单位查询效率通常越高。大系统可同时处理更多请求，并在模型、调度、硬件多个层面叠加优化。就像大型航空公司更容易通过统一调度节省燃料，云平台也能把效率改进扩散到每一次推理。

在 10 亿次日查询场景下，基础耗电约 0.7 吉瓦时；若加入效率优化，可降至约 0.3 吉瓦时。即使 10% 请求属于代码生成、多步推理等长任务，整体能耗仍可比基线下降一半以上。