继 Phi-4-mini 后：微软宣布为 Edge 浏览器引入更高效的 Aion-1.0-Instruct 模型与翻译 API，支持 145 种以上语言

微软在 Build 2026 上宣布扩展 Edge 的端侧 AI 能力：推出 Aion-1.0-Instruct 小语言模型的开发者预览（更小更快、计划7月开源至 Hugging Face），在 Edge 148 中引入基于端侧任务专用模型的语言检测与翻译 API（支持145种以上语言），并在 Edge Canary/Dev 通道试验性提供本地化的 Web Speech API 语音识别。此系列更新旨在替代之前基于 Phi-4-mini 的写作辅助，使模型能在低性能 GPU 或无 GPU 的设备上运行，提升隐私与离线可用性、降低延迟与翻译成本，方便开发者在浏览器中构建 AI 驱动的 Web 体验。

6 月 3 日消息，在今日开幕的 Build 2026 开发者大会上，微软宣布在去年为 Edge 浏览器推出基于 Phi-4-mini 模型的写作辅助 API 基础上扩展了其端侧 AI 能力，新增了模型和 API。本次更新主要包括三项内容：

Aion-1.0-Instruct 小语言模型的开发者预览版（用于早期测试和反馈）；
Edge 148 版本中由端侧任务专用模型驱动的语言检测和翻译 API；
以及在 Edge Canary 和 Dev 通道中提供的实验性 Web Speech API 端侧语音识别功能。

微软表示，过去一年中，Edge 浏览器的写作辅助 API 一直基于 Phi-4-mini 模型。这是一个 40 亿参数的模型，在文本理解、推理和指令遵循方面表现出色，但其硬件要求限制了它在不同设备上的可用性。

因此，微软即日起在 Edge Canary 和 Dev 通道中引入了 Aion-1.0-Instruct 小语言模型的开发者预览版。该模型更小、更快、更高效，可扩展到更多设备 —— 包括 GPU 性能较低的设备，以及通过 CPU 推理支持无 GPU 的设备，同时为广泛的 Web 使用场景提供良好的输出质量。

该预览版允许开发者在真实 Web 场景中评估 Aion-1.0-Instruct，测试 API 互操作性并提供反馈，该模型计划于 7 月以开源形式发布到 Hugging Face。

在 Edge 148 预览版中，全新的语言检测和翻译 API 已正式可用。这些 API 允许网站和浏览器扩展识别文本语言并在语言对之间进行翻译，基于端侧任务专用模型，支持 145 种以上语言，并针对 Web 翻译负载进行了优化。

开发者可以在网站或扩展中使用 JavaScript 调用这些 API，相比云服务，可获得更好的用户隐私、网络独立性以及零翻译成本。

在最新的 Edge Canary 和 Dev 通道中，微软还引入了处理语音的端侧任务专用模型，实现了 Web Speech API 的本地语音识别。该实现将语音转文字过程在用户设备上本地完成，可改善用户隐私、降低延迟，并支持低网络连接或无网络场景。开发者只需在现有 Web Speech API 代码中做少量修改，例如设置 recognition.processLocally = true，即可启用端侧语音识别。

微软表示，借助 Aion-1.0-Instruct 小语言模型、新的语言检测和翻译 API 以及端侧语音识别，开发者可以利用内置于浏览器的模型打造基于 AI 的 Web 体验，无需依赖专用硬件、云服务或特定领域专业知识。

微软 Build 2026 开发者大会专题