AI组队“拼单”新模式:OpenRouter 发布 Fusion API,主打性能与性价比双重优化

AI 模型聚合平台 OpenRouter 近期推出了名为 “Fusion API” 的复合模型服务,通过同时调用多个模型并整合最优答案,在多项测试中实现了比单一头部模型(如 Claude Fable5)更高的性能,同时成本最多可降低约一半。这不是一个概念产品,而是已经发布可用、有基准测试数据的正式服务。

AI组队“拼单”新模式:OpenRouter 发布 Fusion API,主打性能与性价比双重优化

一句话看懂:AI 模型聚合平台 OpenRouter 近期推出了名为 “Fusion API” 的复合模型服务,通过同时调用多个模型并整合最优答案,在多项测试中实现了比单一头部模型(如 Claude Fable5)更高的性能,同时成本最多可降低约一半。这不是一个概念产品,而是已经发布可用、有基准测试数据的正式服务。

事件核心:发生了什么

2026 年 6 月,OpenRouter 发布 Fusion API,其核心逻辑不再是调用单一模型,而是“多模型协作”。用户请求会被并行发送给多个模型(例如 Claude Opus4.8、GPT-5.5、Gemini3.1 Pro 等),随后由专门的“评审模型”对各候选回答进行结构化分析,最终再由一个模型整合成最终答案。开源或闭源模型均可被编入这个协作群组中。

官方公布的基准测试显示,由 Claude Opus4.8 与 GPT-5.5 组合、并以 Opus4.8 做最终合成的方案,性能得分达到 69.0%,超过了当前公认的头部模型 Claude Fable5。此外,采用 Gemini3 Flash、Kimi K2.6、DeepSeek V4 Pro 的组合,在测试分数与 Claude Fable5 差距控制在 1% 以内的前提下,调用成本仅为后者的约一半。

为什么重要

Fusion API 的推出,实质上是提供了一种新的“大模型调用中间层”思路。它不是靠单一模型的迭代升级来提升性能,而是通过工程化手段在推理阶段多模型协作,实现“1+1 > 2”的效果。这对算力分配和成本结构都有直接影响:对于 API 开发者而言,不再需要在“用最贵模型保下限”和“用便宜模型赌上限”之间二选一,而是可以通过组合策略实现性能与成本的动态平衡。这也意味着,模型聚合平台的价值不再仅仅是“多个 API 的超市”,而是有能力成为一个提供增值推理服务的中间层平台。

对用户/开发者/创作者的影响

对于面向 API 调用的开发者或企业,Fusion API 提供了一种可量化的方案:在明确知道测试得分差异的前提下,选择成本更低的模型组。对于依赖稳定输出质量的应用(如客服、文档生成),多模型并行加评审的机制天然具有更高的容错性与准确率;但同时,响应延迟会因多模型串并行而增加,实时交互类场景是否适用于此方案,还需根据具体业务测试。对于普通用户,该 API 的最终使用者更可能是上层应用,因此多数用户不会直接操作 Fusion,但可能感受到相关应用中更低的订阅价格或更高的回答质量。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

首先,Fusion API 的稳定性和实际落地效果。目前基准测试由 OpenRouter 自主完成,可复现性需经第三方验证或更多用户实测。其次,定价策略是否会推动竞品(如 Together AI、Anthropic、或者云厂商的模型网关服务)跟进类似的“模型组”产品,从而改变 API 市场的定价逻辑。最后,评审模型的成本与准确性——如果评审模型本身是闭源且费用较高,则整体成本优势可能有所收窄,长期看是否有开源替代方案也是观察点。

来源:AIbase

celebrityanime
celebrityanime
文章: 8028

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注