
谷歌I/O大会宣布Gemini接入沃尔沃新车EX60摄像头,解锁多模态视觉感知
一句话看懂:谷歌在2026年5月20日召开的I/O大会上宣布,AI助手Gemini将正式接入沃尔沃即将上市的全电动SUV EX60的外部摄像头数据流,使大模型获得实时视觉感知能力。这是目前公开信息中,主流AI大模型首次以系统级权限深度嵌入量产车硬件,标志着车载AI从文本/语音交互走向多模态空间理解。
事件核心:发生了什么
在Google I/O 2026大会上,谷歌与沃尔沃共同宣布,Gemini将接入沃尔沃EX60的车辆外部摄像头。实现这一能力的技术基础是沃尔沃选择了搭载谷歌嵌入式车载系统Android Automotive OS作为车辆操作系统。Gemini通过获取系统级权限,能够直接访问外部摄像头的数据流,从而实时“看懂”车辆周围的物理环境。官方公布的第一个应用场景是停车辅助:Gemini能准确翻译并解释复杂的停车标识。在此基础上,谷歌还展示了更广泛的能力愿景,包括识别路面标线、解释交通标志,以及对周边地标或餐馆进行交互式问答。谷歌Android Automotive部门副总裁Patrick Brady表示,Gemini通过对驾驶环境的深层理解,将显著提升驾驶便利性。
为什么重要
此次合作的核心意义在于,它展示了AI大模型从“云端”向“端侧”硬件场景渗透的一条实线路径。传统车载语音助手依赖离线词库或封闭指令集,而Gemini接入摄像头后,意味着大模型获得了实时视觉输入——这本质上是一次多模态感知能力在移动场景中的落地。从行业角度看,这并非简单的“语音助手升级”,而是将原本基于文本和语音交互的“副驾驶助手”,升级为具备空间感知能力的“AI车载伙伴”。沃尔沃选择Android Automotive OS作为底层系统,进一步证明了AI大模型与车载操作系统的深度整合正在成为智能座舱演进的一个关键方向。对于谷歌而言,这也是Gemini与安卓生态协同的一次重要展示,与苹果的CarPlay和华为的鸿蒙座舱形成了差异化竞争。
对用户/开发者/创作者的影响
对普通车主与购车者:如果该功能最终量产落地,用户将获得更直观的驾驶辅助体验,尤其是在陌生区域解读停车限制、道路标识等场景,AI可以主动告知“此处停车有时间限制”或“需持有许可”。对车载应用开发者:Android Automotive OS的权限开放逻辑值得关注。Gemini能调用摄像头数据,意味着未来第三方开发者可能获得新的API接口,用于开发基于视觉的AI应用,例如停车位识别、行程记录或本地生活信息增强。但谷歌是否开放这一能力给第三方应用,目前尚无明确信息。对AI行业从业者:这一案例为多模态大模型的硬件落地提供了参考——将大模型“视觉”能力直接接入车规级摄像头,而非依赖手机或云端中转,这种架构对算力、延迟和隐私安全提出了更高要求。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
1. 产品落地时间与区域:EX60的量产时间以及Gemini视觉功能的正式推出周期尚未明确,需关注沃尔沃后续量产信息及具体功能是否如期上线。2. 数据隐私与监管:摄像头数据流直接接入云端大模型,涉及用户隐私、行驶数据采集以及是否满足各国监管要求,特别是欧盟和中国市场的数据合规要求。3. 竞品跟进:华为ADS、特斯拉FSD以及国内新能源车企的座舱AI是否会快速跟进类似的多模态整合模式,值得持续观察。
来源:AIbase


![[程序员] 试了下 Gemini 3.5 Flash,最大感受就是快](https://www.chat-gpts.plus/wp-content/uploads/2026/05/ai_cover_3-528-768x403.jpg)