
谷歌 Gboard 输入法新增 Gemini 驱动听写功能,可识别一句话中的多种语言
一句话看懂:谷歌在 2026 年 5 月 12 日的 Android Show 活动上,为 Gboard 输入法推出了名为 Rambler 的 AI 语音听写功能。它由 Gemini 多语言模型驱动,能去除口语中常见的填充词(如“呃”“啊”),并支持在同一句话中切换不同语言且不丢失上下文。
事件核心:发生了什么
谷歌在“Android Show:I/O Edition 2026”上宣布,Gboard 将集成 Rambler 听写功能。该功能基于 Gemini 模型的代码切换能力,允许用户在一句话内混合使用多种语言(例如中英文夹杂),系统仍能连续准确地完成转写。此外,Rambler 具备理解即时修正的能力,比如用户说“周三下午 3 点见面……呃,2 点”,它能够自动采用后者。谷歌强调,Rambler 运行时会向用户明确提示,且不会存储语音录音,仅用于实时音频转写。该功能初期在夏季仅向三星 Galaxy 和谷歌 Pixel 手机开放,后续将扩展至其他 Android 设备。
为什么重要
这一更新直接展示了 Gemini 模型在端侧与云端混合处理上的实际落地能力,是 AI 原生语音交互向日常高频场景渗透的关键动作。与过去单纯的语音转文字不同,Rambler 能以设备端处理为主、云端为辅的方式,实现实时口语润色与多语言混用识别,这显著提升了大模型在输入法这一基础工具中的实用价值。同时,谷歌明确回应隐私顾虑,强调“不存储录音”和“大量投资于安全与隐私友好”,意在打消用户对第三方听写应用的信任差距,巩固自身在 Android 生态输入入口的护城河。
对用户/开发者/创作者的影响
对于普通用户而言,Rambler 极大降低了语音输入的门槛——不再需要刻意避免口语停顿,也无需手动切换语言键盘。对于开发者和创作者,这一功能暗示谷歌正将 Gemini 的能力嵌入到系统级输入法(Gboard)中,未来第三方应用无需额外开发语音接口即可获得智能听写体验。目前公开信息显示,该功能初期仅限指定品牌机型,这意味着非 Pixel 或 Galaxy 用户需要等待适配。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,Rambler 的跨语言识别质量在真实多语混用场景中表现如何,仍需用户实测检验,尤其对中文与英文、方言混合输入的适配情况。第二,谷歌是否会推出面向开发者的 API,让其他输入法或语音应用也能调用类似的 Gemini 多语言听写能力。第三,苹果和微软是否会在 iOS 和 Windows 的输入法中推出同类功能,引发新一轮输入法 AI 军备竞赛。


