
浏览器内的“静默AI战争”
一句话看懂:2026年5月5日,Google在Chrome 148中默认内置了Prompt API,允许任何网页直接调用本地AI模型(Gemini Nano)进行推理,无需API Key、联网或数据离设备。这一做法遭到Mozilla、苹果WebKit团队和W3C TAG的强烈反对,但Chrome占据全球65%浏览器份额,Google已事实上赢得了这场“静默战争”。
事件核心:发生了什么
Chrome 148此次更新的核心是向所有网站开放了调用Gemini Nano大模型的接口。Gemini Nano是一个约4GB大小的本地模型,Chrome在用户未主动确认的情况下将其下载到设备中。通过一行JavaScript代码——例如await self.ai.languageModel.create({systemPrompt})——开发者即可实现文本生成、摘要、分类甚至图像描述等推理任务,且计算全部在本地完成,延迟为零,成本为零,数据不出设备。
反对者的核心逻辑是:AI模型输出具有非确定性,两个浏览器用不同底层模型实现“相同API”可能产生不同结果,违背了Web标准“一次编写,处处一致”的根本承诺。但Google认为,Web平台从未真正保证过输出一致——字体渲染、Canvas像素、音频处理在不同浏览器或系统间均有差异,这些差异并未“杀死”Web,开发者已习惯于用渐进增强策略应对。
为什么重要
这场争议的真正焦点并非技术规范,而是生态控制权。Google通过这次更新,将浏览器从信息浏览工具升级为AI推理交付平台,并在超过40亿设备上预先安装了自家模型。这直接触及了苹果和Mozilla的核心商业利益:苹果的App Store生态依赖闭源控制,而浏览器内AI能力的扩展可能削弱其应用分发和云服务收入;Mozilla则担忧开放性会被单一厂商的模型层绑架。
从行业格局看,Google正在复制PWAs、Web Components和Service Workers等技术的普及路径:先主动推进有争议的功能,凭借Chrome的垄断地位迫使开发者采纳,再等待竞争对手2到5年后跟进兼容实现,最后以“事实标准”形式纳入Web规范。目前微软Edge尽管与Chrome同属Chromium内核,却已完全禁用该功能,表明即便在Chromium阵营内部也存在分歧。
对用户/开发者/创作者的影响
对普通用户而言,本地AI推理意味着:浏览器内的拼写检查、内容摘要、自动翻译等功能将变得更即时、完全离线可用,且无需担心隐私泄露到服务器。但风险在于,Google可能将Gemini Nano作为浏览器内的推荐或过滤层,影响用户获取信息的主动性。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
对开发者而言,Prompt API提供了一个低成本、零延迟的本地推理入口,适合需要即时响应的轻量级任务,如表单内容分类、短文本摘要或敏感词过滤。但开发者必须意识到:不能依赖不同浏览器输出完全相同的结果,应将本地API作为“渐进增强层”,在浏览器不支持时回退到云端OpenAI或Anthropic的调用。
对内容创作者和AI创业公司而言,Google此举进一步压缩了第三方AI服务的市场空间:如果浏览器内置的本地模型能完成80%的轻量任务,用户将更少转向独立的AI笔记本或摘要工具。
值得关注的后续
首先,Firefox和Safari最终是否会“跟进兼容”而非彻底阻拦。目前苹果和Mozilla的反对主要停留于W3C标准讨论,但一旦Chrome用户形成依赖,两家的技术路线可能被迫调整——Mozilla可能采用开源模型,苹果则会用Core ML优化方案。
其次,监管层面的反应。该功能涉及用户设备未经明确同意即下载大模型资源,可能触发欧盟数字市场法案或美国联邦贸易委员会关于默认设置和用户控制权的调查。
最后,Gemini Nano的能力边界将决定其实际应用范围。目前该模型在推理质量上无法与GPT-4o或Claude Sonnet竞争,但若其性能随着Chrome版本更新持续提升,或将蚕食更多云端API调用场景,改变整个AI应用的定价和部署模型。
来源:dev.to


