
一句话看懂:GitHub 宣布,VS Code 中的 Copilot 浏览器工具已正式转为普遍可用(GA),默认开启。这意味着 Copilot Agent 现在可以像真人一样操作浏览器去打开网页、点击、输入、截图并读取控制台错误,并直接将这些信息返回给开发者。
事件核心:发生了什么
根据 GitHub Changelog 在 2026 年 7 月 1 日的公告,浏览器工具在预览反馈的基础上正式上线。核心变化包括:Copilot 的 Agent 现在可以驱动真实的浏览器实例,不仅能阅读页面内容和捕获控制台日志,还能执行点击、输入、悬停、拖拽以及处理弹窗等操作。当需要连贯步骤时,Agent 也可以运行脚本化的流程。此外,开发者自己的 DevTools(元素检查、控制台输出、调试)始终可用。在隐私控制层面,默认情况下 Agent 无法读写开发者打开的页面,只有开发者手动选择“Share with Agent”后才能交互,且可随时撤销授权。Agent 自己打开的页面则使用全新隔离会话,无法访问用户日常浏览的 Cookie 和存储数据。企业管理员可以通过 workbench.browser.enableChatTools 等策略集中管理开关和站点访问黑白名单。
为什么重要
这次更新标志着 GitHub Copilot 从一个“写代码的助手”向“能执行任务的 Agent”迈出了实质性一步。过去,开发者需要手动复制浏览器错误信息或截图丢给 AI;现在,Agent 能自主完成端到端的 Web 应用调试与测试环节——打开页面、操作、收集反馈、返回结果。这直接改变了开发者在调试前端、验证 API 响应或测试用户流程时的人机协作方式。同时,GA 版本的隐私隔离设计(会话隔离、默认不共享标签、敏感权限默认拒绝)表明微软在让 AI Agent 控制浏览器时,把安全性和信任控制作为了必须解决的前置条件,这对企业级采用尤为关键。
对用户/开发者/创作者的影响
对于使用 VS Code 的开发者,现在可以直接对 Copilot 下达指令如“打开这个应用的本地环境,点击登录按钮,看看控制台有没有错误”,而不需要手动操作和截屏。对于依赖 Web 端的前端开发者与测试工程师,这降低了自动化验证的门槛——无需专门编写 Puppeteer 脚本,即可用自然语言让 AI 完成浏览器交互与日志采集。对于企业团队而言,管理员可以获得可控的 Agent 行为(黑白名单、独立开关),这解决了引入 AI 浏览器操作时的合规担忧。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,Agent 的浏览器操作能力是否局限在 VS Code 内,还是会扩展到 GitHub Actions 或 CLI 场景,值得关注。第二,目前 Agent 在网页上只能读取和操作,尚不能执行修改 DOM 并保存的操作——这是否会在未来版本中被放开,取决于隐私和安全隐患的平衡。第三,竞品如 Cursor、JetBrains AI Assistant 是否会快速复制类似能力,将成为这场 Agent 化编辑器竞赛的下一个看点。


