谷歌 Gboard 输入法新增 Gemini 驱动听写功能，可识别一句话中的多种语言

一句话看懂：谷歌在 2026 年 5 月 12 日的 Android Show 活动上，为 Gboard 输入法推出了名为 Rambler 的 AI 语音听写功能。它由 Gemini 多语言模型驱动，能去除口语中常见的填充词（如“呃”“啊”），并支持在同一句话中切换不同语言且不丢失上下文。

事件核心：发生了什么

谷歌在“Android Show：I/O Edition 2026”上宣布，Gboard 将集成 Rambler 听写功能。该功能基于 Gemini 模型的代码切换能力，允许用户在一句话内混合使用多种语言（例如中英文夹杂），系统仍能连续准确地完成转写。此外，Rambler 具备理解即时修正的能力，比如用户说“周三下午 3 点见面……呃，2 点”，它能够自动采用后者。谷歌强调，Rambler 运行时会向用户明确提示，且不会存储语音录音，仅用于实时音频转写。该功能初期在夏季仅向三星 Galaxy 和谷歌 Pixel 手机开放，后续将扩展至其他 Android 设备。

为什么重要

这一更新直接展示了 Gemini 模型在端侧与云端混合处理上的实际落地能力，是 AI 原生语音交互向日常高频场景渗透的关键动作。与过去单纯的语音转文字不同，Rambler 能以设备端处理为主、云端为辅的方式，实现实时口语润色与多语言混用识别，这显著提升了大模型在输入法这一基础工具中的实用价值。同时，谷歌明确回应隐私顾虑，强调“不存储录音”和“大量投资于安全与隐私友好”，意在打消用户对第三方听写应用的信任差距，巩固自身在 Android 生态输入入口的护城河。

对用户/开发者/创作者的影响

对于普通用户而言，Rambler 极大降低了语音输入的门槛——不再需要刻意避免口语停顿，也无需手动切换语言键盘。对于开发者和创作者，这一功能暗示谷歌正将 Gemini 的能力嵌入到系统级输入法（Gboard）中，未来第三方应用无需额外开发语音接口即可获得智能听写体验。目前公开信息显示，该功能初期仅限指定品牌机型，这意味着非 Pixel 或 Galaxy 用户需要等待适配。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，Rambler 的跨语言识别质量在真实多语混用场景中表现如何，仍需用户实测检验，尤其对中文与英文、方言混合输入的适配情况。第二，谷歌是否会推出面向开发者的 API，让其他输入法或语音应用也能调用类似的 Gemini 多语言听写能力。第三，苹果和微软是否会在 iOS 和 Windows 的输入法中推出同类功能，引发新一轮输入法 AI 军备竞赛。

来源：IT之家 (ITHome)

谷歌 Gboard 输入法新增 Gemini 驱动听写功能，可识别一句话中的多种语言