[分享发现] 一个网页应用即是一个 mcp

一句话看懂：一位开发者展示让 AI Agent 直接操作网页并与之对话，处理 60 多条信息仅花费约 2 分钱、耗时不到 2 分钟。如果主流网站都支持 MCP（模型上下文协议），网页浏览这一基础行为可能被重新定义。

事件核心：发生了什么

在 V2EX 社区，一位开发者分享了自己的实验：使用 AI Agent 直接浏览并操作网页，用户全程通过自然语言与 Agent 对话。整个流程包含 60 多条信息、约 1800 字，AI Agent 调用了约 17 个工具，在输入上万文字、输出约 5000 字的情况下，总耗时不到 2 分钟。API 调用费用极低——使用 v4-flash 模型，总计约 2 分钱人民币；如果网页直接从接口取数，费用可降至 0.5 分钱。按月估算（60 × 30 条信息），每月成本不到 1.5 毛钱。

这一实验还提出了一个核心猜想：当主流网站都支持某种统一的 MCP 协议或第三方适配层时，用户不再需要手动浏览网页，而是通过对话让 AI 直接获取并处理信息，浏览行为本身将发生根本性变化。

为什么重要

该实验揭示了两个关键趋势：一是 AI 推理成本已降至极低水平，使得“AI 代理化”的日常操作在商业上可行；二是 MCP 协议一旦普及，传统的网页交互逻辑——用户打开浏览器、阅读页面、点链接——可能会被“对话 + 工具调用”替代。这对于搜索引擎、内容网站、电子商务等依赖页面流量的商业模式构成潜在冲击，同时也为开发者提供了一种全新的接口设计思路：即把每个网页应用视为一个可交互的“MCP 服务”，而非静态信息载体。

从技术路线上看，这代表 AI 从生成内容走向主动执行任务，正在模糊“使用应用”和“对话”之间的边界。目前公开信息显示，该实验基于 v4-flash 模型和自定义工具调用实现，但尚未披露具体协议实现细节。

对用户/开发者/创作者的影响

对普通用户：未来通过对话就能完成网页上大部分操作（如查询、填写表单、预订服务），可能大幅降低使用复杂网站的门槛。但同时需警惕过度依赖导致隐私风险，因为 Agent 需要获取操作权限。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

对开发者：若 MCP 协议成为行业标准，开发网站时需要同时准备供人类使用的 UI 和供 AI Agent 调用的“MCP 接口”。成本极低（每月 1.5 毛）可能加速这一转型。目前公开信息显示，尚未有大规模网站支持该协议，但对开发者生态来说是一个值得投入的实验方向。

对创作者/内容生产者：以页面浏览量为营收模式的网站可能面临流量被“截流”的风险，因为用户不再访问页面，而是直接通过 Agent 获取摘要或数据。内容价值需要重新定义。

值得关注的后续

1. 协议标准化进展：是否有组织（如 OpenAI、Anthropic 或 W3C）牵头形成统一的 MCP 规范？还是当前以第三方适配层为主？这决定了普及速度。

2. 商业落地场景：是否会率先在电商比价、招聘信息抓取、企业报销自动化等高频重复操作中出现成熟产品？成本和速度已初步验证可行性。

3. 监管与隐私风险：当 AI Agent 可以模拟人类操作浏览网页时，网页权限控制、用户数据授权、反爬虫机制将面临新挑战。监管是否会对这类“代理化”交互设置限制？

来源：V2EX (创意工作者社区)

[分享发现] 一个网页应用即是一个 mcp

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

Claude Fable 5分批重新上线！GPT-5.6秒跟

AI编程的商业模式已经在互联网大厂跑通了

黄仁勋：Prompt正在过时，Loop才是新范式

发表回复取消回复