微软发布 Web IQ:专为 AI 智能体打造的搜索 API,减少 Token 消耗并提升响应速度

微软在 Build 2026 上推出 Microsoft Web IQ,一套为 AI 智能体打造的搜索 API。Web IQ 基于必应多年积累并自下而上重构,旨在为智能体提供语义标定所需的上下文信息、网页文档、新闻、图片和视频等内容。与面向人类的搜索不同,Web IQ 返回高度浓缩、便于解析的页面以减少 Token 消耗并加快响应;微软称 95% 请求在 165 毫秒内响应,速度约为同类产品的 2.5 倍。目前已用于微软 Copilot 与 OpenAI 的 ChatGPT。

6 月 3 日消息,微软现已推出 Microsoft Web IQ 服务,本质上是一套专门为 AI 智能体打造的搜索 API。

微软在 Microsoft Build 2026 大会中表示,Web IQ 能够帮助 AI 工具连接到互联网,获取各类信息资源。但具体工作方式与传统的、面向人类的搜索引擎有所不同。

微软搜索与 AI 部门总裁 Jordi Ribas 在接受外媒 CNET 采访时表示,Web IQ 是针对 AI 智能体提供的解决方案,可提供上下文信息、网页文档、新闻、图片和视频等内容,让 AI 智能体建立语义标定(IT之家注:grounding)

尽管 AI 与人类搜索信息的方式不同,但微软还是依靠必应(Bing)多年来积攒的经验构建 Web IQ。

Ribas 表示:“我们充分利用了必应过去二十年的一切能力,同时从底层开始重新构建整套架构,确保这套工具能为 AI 智能提供量体裁衣的搜索结果”。

人类搜索与 AI 智能体搜索之间的最大差别在于信息呈现方式。对于人类而言,搜索引擎需要根据用户意图,对搜索结果进行最佳排序;而对 AI 智能体来说,它只需要一个内容全面高度浓缩的信息页面以便在不消耗过多 Token 的情况下进行解析

因此,Web IQ 必须能够快速提供高质量的搜索结果,并以紧凑形式返回信息。

Ribas 透露,Web IQ 拥有业界领先的搜索结果质量、Token 效率及响应延迟。其中 95% 的请求能够在 165 毫秒内得到响应,同时在 Token 利用效率方面也表现突出。微软声称,其速度大约是市场上其他同类产品的 2.5 倍。

目前,Web IQ API 已被用于微软自家 AI 产品 Copilot以及 OpenAI 旗下 ChatGPT。未来还会有其他公司利用这套系统,但 Ribas 目前无法透露具体名单。

微软 Build 2026 开发者大会专题

版权声明:本站文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

评论加载中...