谷歌今夏推进 Gemini Intelligence:重塑安卓手机 AI 交互,可操控浏览器填写表单等

文章报道谷歌在 2026 年 The Android Show | I/O Edition 推出 Gemini Intelligence 的系统性方案,目标将 Gemini 从问答型助手转为更主动的安卓助手,核心是任务自动化——不仅在应用内操作,也能通过 Chrome 在网页上代为完成事务(例如复杂表单填写)。谷歌强调自动化有明确边界,仅在用户允许的应用内并处理用户直接指派的任务。新工具包括可根据文字描述生成小组件代码的 Create My Widget 和面向语音输入、整理口述文本的 Gboard Rambler;算力采用端侧(Gemini Nano)与云端结合的策略,车机通过 Android Auto 也将支持该能力。功能将分阶段推送,Chrome 自动浏览计划自 6 月起启动,Google Pixel 与部分三星 Galaxy 从今夏分批获得。

5 月 13 日消息,科技媒体 Android Authority 今天(5 月 13 日)发布博文,报道称在 2026 年 The Android Show | I/O Edition 活动中,谷歌全面升级安卓智能助手生态,提出 Gemini Intelligence 系统性方案。

在定位方面,谷歌希望通过 Gemini Intelligence,在安卓生态中让 Gemini 从“问答助手”转型为更主动的安卓助手形态,重点不是单纯聊天,而是让系统更了解用户需求,并能跨应用、跨网页代为完成任务。

Gemini Intelligence 方案的核心,就是任务自动化。谷歌表示 Gemini Intelligence 不只支持在应用内处理任务,还能借助 Chrome 浏览器完成网页操作。只要一项事务原本能在网页上完成,未来 Gemini 也希望能代用户执行。IT之家附上相关演示视频如下:

最直接的落地场景之一就是填写表单。相比 Chrome 以往主要面向重复表单的自动填充,Gemini Intelligence 目标是代用户完成填写,可以驾驭各种复杂表单。

谷歌同时强调,这类自动化具备明确边界。Gemini 只会在用户允许的应用中工作,也只处理用户直接指派的任务。

除自动化外,Gemini Intelligence 还加入 2 项新工具。Create My Widget(创建我的小组件)允许用户用文字描述需要的小组件功能,再由 Gemini 生成对应代码。

Gboard 的 Rambler(润写)模式则面向语音输入场景,可整理重复、修改频繁的口述内容,把杂乱表达整理成更流畅的文本。

在算力分配上,谷歌采用端侧与云端结合策略。简单请求可交给设备本地的 Gemini Nano(双子座轻量模型)处理,遇到更复杂需求时,再调用云端 Gemini。

车机方面,支持机型连接 Android Auto 后也会看到 Gemini Intelligence。

谷歌目前计划分阶段陆续推送功能更新,其中 Chrome 自动浏览计划自 6 月起启动,Google Pixel 与部分三星 Galaxy 手机将从今年夏季开始分批获得这些能力。

版权声明:本站文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处!

评论加载中...