Show HN: 直接在 Claude、Codex 和 Cursor 中进行最优模型路由

WorkWeave 公司开源了一个叫 Router 的轻量代理工具,能自动为每个 API 请求选择“最合适、最便宜”的模型,实测在 RouterArena 的准确-成本排行榜上排名第一,得分 76.09。

Show HN: 直接在 Claude、Codex 和 Cursor 中进行最优模型路由

一句话看懂:WorkWeave 公司开源了一个叫 Router 的轻量代理工具,能自动为每个 API 请求选择“最合适、最便宜”的模型,实测在 RouterArena 的准确-成本排行榜上排名第一,得分 76.09。

事件核心:发生了什么

WorkWeave 昨天在 GitHub 发布了一个名为 Router 的开源项目。它的核心功能是作为一个透明代理,让开发者把 Claude Code、OpenAI Codex CLI、opencode 甚至 Cursor 的 API 请求指向 localhost:8080。Router 会基于一个本地运行的小型嵌入器(而非依靠提示词猜测)为每次请求打分,自动从用户启用的供应商(Anthropic、OpenAI、Gemini 等)中选择模型来响应。它还支持通过 OpenRouter 调用 DeepSeek、Kimi、GLM、Qwen、Llama 等开源模型。安装非常简单:对于 Claude Code 等工具,只需运行 npx @workweave/router,输入一个上游 API Key 即可;它也可以完整自托管,自带一个可视化的仪表盘页面(默认地址 http://localhost:8080/ui/),并输出标准 OTLP 追踪数据供外部监控。

为什么重要

Router 的出现代表了一种“路由层”产品形态正在从企业级工具走向普通开发者。此前,开发者依赖手动切换模型(例如遇到复杂代码用 Claude Sonnet,简单问答用 GPT-4o-mini),或者依赖模型自身的调度。Router 提供了一个无需修改代码、即插即用的解决方案,并且它的路由算法不是基于“感觉得用什么模型”,而是基于可与训练集对照的分数模型——这显著降低了使用多模型生态的成本和技术门槛。它在 RouterArena 排行榜上第一的成绩,也表明这个路线在准确率和成本平衡上已经具备实用价值。WorkWeave 自身是一家工程智能平台公司,客户包括 Robinhood、PostHog,其产品背景提升了该路由器的可信度。

对用户/开发者/创作者的影响

对于使用 AI 编程工具(如 Claude Code、Cursor)的开发者,Router 可以直接降低 API 账单:每次请求都会自动选择成本更低的模型来完成任务,而不是一直用最贵的模型。对于将多个模型 API 集成到自己应用中的开发者,Router 可以大幅简化代码——你只需要维护一个端点和一个路由密钥,就能调用几乎所有主流闭源和开源模型。此外,它提供了非常完整的可观测性支持(开箱即用的 OTLP 追踪),意味着运维团队可以清楚看到每次路由决策的明细,这对于在预算敏感或合规要求高的场景下使用多模型是很有价值的。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,Cursor 目前标注为“早期 Beta,性能可能不是最佳”,需要关注后续的稳定性和 latency 表现。第二,Router 自托管需要运行 PostgreSQL,这对只想“试一试”的个人开发者门槛较高——一个全托管版本(类似 npx 命令体验)是否长期免费或提供付费额度值得关注。第三,竞品(例如 OpenRouter 的智能路由、AIP 网关等)是否会跟进类似算法或直接集成这一路由算法,可能影响 Router 的开源生态能够发展多快。

来源:github.com

celebrityanime
celebrityanime
文章: 9599

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注