继 Phi-4-mini 后:微软宣布为 Edge 浏览器引入更高效的 Aion-1.0-Instruct 模型与翻译 API,支持 145 种以上语言

微软在 Build 2026 上宣布扩展 Edge 的端侧 AI 能力:推出 Aion-1.0-Instruct 小语言模型的开发者预览(更小更快、计划7月开源至 Hugging Face),在 Edge 148 中引入基于端侧任务专用模型的语言检测与翻译 API(支持145种以上语言),并在 Edge Canary/Dev 通道试验性提供本地化的 Web Speech API 语音识别。此系列更新旨在替代之前基于 Phi-4-mini 的写作辅助,使模型能在低性能 GPU 或无 GPU 的设备上运行,提升隐私与离线可用性、降低延迟与翻译成本,方便开发者在浏览器中构建 AI 驱动的 Web 体验。

6 月 3 日消息,在今日开幕的 Build 2026 开发者大会上,微软宣布在去年为 Edge 浏览器推出基于 Phi-4-mini 模型的写作辅助 API 基础上扩展了其端侧 AI 能力,新增了模型和 API。本次更新主要包括三项内容:

  • Aion-1.0-Instruct 小语言模型的开发者预览版(用于早期测试和反馈);
  • Edge 148 版本中由端侧任务专用模型驱动的语言检测和翻译 API;
  • 以及在 Edge Canary 和 Dev 通道中提供的实验性 Web Speech API 端侧语音识别功能。

微软表示,过去一年中,Edge 浏览器的写作辅助 API 一直基于 Phi-4-mini 模型。这是一个 40 亿参数的模型,在文本理解、推理和指令遵循方面表现出色,但其硬件要求限制了它在不同设备上的可用性。

因此,微软即日起在 Edge Canary 和 Dev 通道中引入了 Aion-1.0-Instruct 小语言模型的开发者预览版。该模型更小、更快、更高效,可扩展到更多设备 —— 包括 GPU 性能较低的设备,以及通过 CPU 推理支持无 GPU 的设备,同时为广泛的 Web 使用场景提供良好的输出质量。

该预览版允许开发者在真实 Web 场景中评估 Aion-1.0-Instruct,测试 API 互操作性并提供反馈,该模型计划于 7 月以开源形式发布到 Hugging Face。

在 Edge 148 预览版中,全新的语言检测和翻译 API 已正式可用。这些 API 允许网站和浏览器扩展识别文本语言并在语言对之间进行翻译,基于端侧任务专用模型,支持 145 种以上语言,并针对 Web 翻译负载进行了优化。

开发者可以在网站或扩展中使用 JavaScript 调用这些 API,相比云服务,可获得更好的用户隐私、网络独立性以及零翻译成本。

在最新的 Edge Canary 和 Dev 通道中,微软还引入了处理语音的端侧任务专用模型,实现了 Web Speech API 的本地语音识别。该实现将语音转文字过程在用户设备上本地完成,可改善用户隐私、降低延迟,并支持低网络连接或无网络场景。开发者只需在现有 Web Speech API 代码中做少量修改,例如设置 recognition.processLocally = true,即可启用端侧语音识别。

微软表示,借助 Aion-1.0-Instruct 小语言模型、新的语言检测和翻译 API 以及端侧语音识别,开发者可以利用内置于浏览器的模型打造基于 AI 的 Web 体验,无需依赖专用硬件、云服务或特定领域专业知识。

微软 Build 2026 开发者大会专题

版权声明:本站文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

评论加载中...