AI 框选即问！谷歌 Chrome 149 携手 Gemini 3.5 Flash 升级截屏交互

一句话看懂：谷歌在 Chrome 149 浏览器中原生集成了 Gemini 3.5 Flash 模型，并上线了“从屏幕中选择”（Select from screen）功能，用户可直接框选网页任意区域与 AI 对话，无需上传整张图片或切换工具。

事件核心：发生了什么

据谷歌官方更新公告，Chrome 149 内嵌的 Gemini 3.5 Flash 模型新增了一项交互特性：用户在使用浏览器内的 Gemini 时，可用光标精确框选屏幕上的区域（包含图像或文字片段），选中的内容会自动附带到用户的提问中，并直接送入对话式 AI 架构中返回答案。这一功能的操作逻辑类似于 Google Lens，但不再跳转到传统搜索结果页，而是完全在浏览器内完成 AI 推理。

同时，Gemini 3.5 Flash 模型还整合了原生计算机操作工具，使 AI 代理能够更流畅地执行跨平台任务，如填表、点击按钮和数据采集。

为什么重要

这一更新标志着浏览器从“信息展示工具”向“AI 交互入口”的实质性转变。过去，用户要基于网页局部内容咨询 AI，往往需要截图、上传、再提问，流程繁琐。Chrome 149 的“框选即问”将截图交互与 AI 推理彻底打通，降低了使用门槛。

对行业而言，谷歌选择在旗舰浏览器中直接捆绑 Gemini 3.5 Flash 模型而非依赖云端 API，意味着大模型推理正在向边缘侧（浏览器端）迁移。此举可能加速其他浏览器厂商（如 Edge、Safari）跟进类似功能，也将推动 AI 代理能力的标准化——浏览器可以直接成为 AI 调用 Web 能力的统一界面，而非仅仅是一个网页渲染器。

对用户/开发者/创作者的影响

普通用户：在电商场景中，可框选几款鞋款让 AI 分析哪双更适合运动风格；在查阅复杂图表时，框选即可获得解释。操作直觉化，无需学习新软件。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

开发者：这一功能将减少搭建 AI 对话型应用的重复劳动——基于浏览器的原生框选+推送能力，开发者可以更专注于后端推理逻辑，而非交互层面的截图上传适配。

创作者：可选取网页中的设计元素让 AI 进行创意延展或修改，提升了灵感采集与再创作的效率。不过，目前该功能仅在 Chrome 149 中提供，尚需关注其对隐私数据（如框选内容是否上传至谷歌服务器）的处理策略。

值得关注的后续

1. 产品落地节奏：Chrome 149 目前已在稳定版通道发布，但“从屏幕中选择”功能是否默认为所有用户开启、是否因地区分批推送，需等待谷歌后续公告。

2. 隐私与安全影响：框选内容直接进入对话 AI 架构，用户需知悉哪些数据会留在本地、哪些会上传。谷歌是否提供开关选项，将影响企业用户和隐私敏感者的采纳意愿。

3. 竞品反应：微软 Edge 已集成 Copilot，苹果 Safari 的 AI 集成计划尚在传闻阶段。Chrome 149 的升级可能促使对手加速推出类似“框选即问”的交互方案，浏览器端的 AI 代理能力将成为下一轮竞争焦点。

来源：AIbase

AI 框选即问！谷歌 Chrome 149 携手 Gemini 3.5 Flash 升级截屏交互

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

AI 再强大，我们还是在商业逻辑之下

Token 消耗激增，Gartner 预测到 2028 年 AI 编程成本将超过人类开发者平均薪资

豆包收费，这是好事儿

发表回复取消回复