![[分享发现] 一个网页应用即是一个 mcp](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_3-977.jpg)
一句话看懂:一位开发者展示让 AI Agent 直接操作网页并与之对话,处理 60 多条信息仅花费约 2 分钱、耗时不到 2 分钟。如果主流网站都支持 MCP(模型上下文协议),网页浏览这一基础行为可能被重新定义。
事件核心:发生了什么
在 V2EX 社区,一位开发者分享了自己的实验:使用 AI Agent 直接浏览并操作网页,用户全程通过自然语言与 Agent 对话。整个流程包含 60 多条信息、约 1800 字,AI Agent 调用了约 17 个工具,在输入上万文字、输出约 5000 字的情况下,总耗时不到 2 分钟。API 调用费用极低——使用 v4-flash 模型,总计约 2 分钱人民币;如果网页直接从接口取数,费用可降至 0.5 分钱。按月估算(60 × 30 条信息),每月成本不到 1.5 毛钱。
这一实验还提出了一个核心猜想:当主流网站都支持某种统一的 MCP 协议或第三方适配层时,用户不再需要手动浏览网页,而是通过对话让 AI 直接获取并处理信息,浏览行为本身将发生根本性变化。
为什么重要
该实验揭示了两个关键趋势:一是 AI 推理成本已降至极低水平,使得“AI 代理化”的日常操作在商业上可行;二是 MCP 协议一旦普及,传统的网页交互逻辑——用户打开浏览器、阅读页面、点链接——可能会被“对话 + 工具调用”替代。这对于搜索引擎、内容网站、电子商务等依赖页面流量的商业模式构成潜在冲击,同时也为开发者提供了一种全新的接口设计思路:即把每个网页应用视为一个可交互的“MCP 服务”,而非静态信息载体。
从技术路线上看,这代表 AI 从生成内容走向主动执行任务,正在模糊“使用应用”和“对话”之间的边界。目前公开信息显示,该实验基于 v4-flash 模型和自定义工具调用实现,但尚未披露具体协议实现细节。
对用户/开发者/创作者的影响
对普通用户:未来通过对话就能完成网页上大部分操作(如查询、填写表单、预订服务),可能大幅降低使用复杂网站的门槛。但同时需警惕过度依赖导致隐私风险,因为 Agent 需要获取操作权限。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
对开发者:若 MCP 协议成为行业标准,开发网站时需要同时准备供人类使用的 UI 和供 AI Agent 调用的“MCP 接口”。成本极低(每月 1.5 毛)可能加速这一转型。目前公开信息显示,尚未有大规模网站支持该协议,但对开发者生态来说是一个值得投入的实验方向。
对创作者/内容生产者:以页面浏览量为营收模式的网站可能面临流量被“截流”的风险,因为用户不再访问页面,而是直接通过 Agent 获取摘要或数据。内容价值需要重新定义。
值得关注的后续
1. 协议标准化进展:是否有组织(如 OpenAI、Anthropic 或 W3C)牵头形成统一的 MCP 规范?还是当前以第三方适配层为主?这决定了普及速度。
2. 商业落地场景:是否会率先在电商比价、招聘信息抓取、企业报销自动化等高频重复操作中出现成熟产品?成本和速度已初步验证可行性。
3. 监管与隐私风险:当 AI Agent 可以模拟人类操作浏览网页时,网页权限控制、用户数据授权、反爬虫机制将面临新挑战。监管是否会对这类“代理化”交互设置限制?


