我们一直将 AI Gateway 解释为 C̶o̶n̶t̶e̶n̶t̶ 令牌交付网络。就像人工智能模型的 CDN。 CDN 的一大功能是能够动态重新路由或拒绝流量,而无需重新部署。当寓言…

Vercel 的 AI Gateway 正式上线了路由规则功能,允许开发者在不修改应用程序代码的情况下,动态地将旧模型的 API 请求重定向至新模型。这解决了大模型频繁退役(retired)导致的生产环境兼容性问题,本质上为 AI 调用层引入了类似 CDN 的流量路由能力。

我们一直将 AI Gateway 解释为 C̶o̶n̶t̶e̶n̶t̶ 令牌交付网络。就像人工智能模型的 CDN。 CDN 的一大功能是能够动态重新路由或拒绝流量,而无需重新部署。当寓言...

一句话看懂:Vercel 的 AI Gateway 正式上线了路由规则功能,允许开发者在不修改应用程序代码的情况下,动态地将旧模型的 API 请求重定向至新模型。这解决了大模型频繁退役(retired)导致的生产环境兼容性问题,本质上为 AI 调用层引入了类似 CDN 的流量路由能力。

事件核心:发生了什么

Vercel 联合创始人 Guillermo Rauch 在 X 上宣布,Vercel AI Gateway 新增了“路由规则”特性。通过一条简单的 CLI 命令,开发者可以将针对已退役模型的请求(例如 Anthropic 的 Claude Fable 5)自动改写并转发至可用的模型(如 Claude Opus 5)。这意味着当模型因 GPU 算力竞争或厂商策略调整而下架时,使用 AI Gateway 的生产工作负载无需重新部署,只要在网关层配置一条重写规则即可无缝切换。Vercel 开发者官方账号随后也发布了相关更新日志,明确声明“无需在应用或智能体代码中进行任何更改”。

为什么重要

AI 模型的生命周期正变得越来越短——GPU 算力供不应求,模型快速迭代的同时也快速退役。传统方式下,一个依赖旧模型的 API 调用一旦遇到模型下架,整个后端的稳定性就会受到威胁,开发者必须紧急修改代码并重新上线,这在实时推理业务中代价极高。AI Gateway 把模型调用抽象成可动态配置的路由层,就像 CDN 为网站内容提供的流量管理一样,让开发者不需要触及推理逻辑就能应对底层的模型变动。这种架构降低了企业对特定模型厂商的耦合度,也降低了大规模部署 AI 能力时的运维风险,可能成为未来企业级 AI 基础设施的标准组件。

对用户/开发者/创作者的影响

对于使用 AI API 构建应用的团队来说,这意味着更少的停机焦虑和更灵活的模型策略。团队可以提前为即将退役的模型设置 fallback 规则,而不必在模型下线当天匆忙改代码。对于本身体量较小、没有专职运维的独立开发者或小型团队,这项功能直接减少了因模型变更导致的被动维护成本。此外,路由规则的引入也暗示着 AI Gateway 正从单纯的请求代理升级为具备可编程流量治理能力的中间层,后续可能支持按用户、按请求内容或按时段进行更细粒度的路由分发。但需要注意的是,该功能目前仅适用于 Vercel AI Gateway 平台,暂未公开是否支持接入私有部署或第三方网关。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

目前公开信息显示,路由规则功能已经上线并可经 CLI 操作。值得关注的三点是:第一,Vercel 是否会将此规则能力扩展到更多高级路由策略,例如权重分配或多模型并行;第二,其他云厂商(如 Cloudflare、AWS 的类似 AI 代理服务)是否会迅速跟进类似功能,使模型路由成为行业标配;第三,当模型厂商意识到网关可以轻松替换掉它们的模型时,是否会调整自己的 License 条款或 API 使用协议,从而限制这种重定向行为。此外,Guillermo 在帖子中提到了“恢复丢失的令牌”这一概念,未来 AI Gateway 是否会推出令牌级别的流量计费与模型映射优化,也值得长期关注。

来源:Follow Builders · X · Guillermo Rauch

celebrityanime
celebrityanime
文章: 11290

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注