AI组队“拼单”新模式：OpenRouter 发布 Fusion API，主打性能与性价比双重优化

一句话看懂：AI 模型聚合平台 OpenRouter 近期推出了名为 “Fusion API” 的复合模型服务，通过同时调用多个模型并整合最优答案，在多项测试中实现了比单一头部模型（如 Claude Fable5）更高的性能，同时成本最多可降低约一半。这不是一个概念产品，而是已经发布可用、有基准测试数据的正式服务。

事件核心：发生了什么

2026 年 6 月，OpenRouter 发布 Fusion API，其核心逻辑不再是调用单一模型，而是“多模型协作”。用户请求会被并行发送给多个模型（例如 Claude Opus4.8、GPT-5.5、Gemini3.1 Pro 等），随后由专门的“评审模型”对各候选回答进行结构化分析，最终再由一个模型整合成最终答案。开源或闭源模型均可被编入这个协作群组中。

官方公布的基准测试显示，由 Claude Opus4.8 与 GPT-5.5 组合、并以 Opus4.8 做最终合成的方案，性能得分达到 69.0%，超过了当前公认的头部模型 Claude Fable5。此外，采用 Gemini3 Flash、Kimi K2.6、DeepSeek V4 Pro 的组合，在测试分数与 Claude Fable5 差距控制在 1% 以内的前提下，调用成本仅为后者的约一半。

为什么重要

Fusion API 的推出，实质上是提供了一种新的“大模型调用中间层”思路。它不是靠单一模型的迭代升级来提升性能，而是通过工程化手段在推理阶段多模型协作，实现“1+1 > 2”的效果。这对算力分配和成本结构都有直接影响：对于 API 开发者而言，不再需要在“用最贵模型保下限”和“用便宜模型赌上限”之间二选一，而是可以通过组合策略实现性能与成本的动态平衡。这也意味着，模型聚合平台的价值不再仅仅是“多个 API 的超市”，而是有能力成为一个提供增值推理服务的中间层平台。

对用户/开发者/创作者的影响

对于面向 API 调用的开发者或企业，Fusion API 提供了一种可量化的方案：在明确知道测试得分差异的前提下，选择成本更低的模型组。对于依赖稳定输出质量的应用（如客服、文档生成），多模型并行加评审的机制天然具有更高的容错性与准确率；但同时，响应延迟会因多模型串并行而增加，实时交互类场景是否适用于此方案，还需根据具体业务测试。对于普通用户，该 API 的最终使用者更可能是上层应用，因此多数用户不会直接操作 Fusion，但可能感受到相关应用中更低的订阅价格或更高的回答质量。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

首先，Fusion API 的稳定性和实际落地效果。目前基准测试由 OpenRouter 自主完成，可复现性需经第三方验证或更多用户实测。其次，定价策略是否会推动竞品（如 Together AI、Anthropic、或者云厂商的模型网关服务）跟进类似的“模型组”产品，从而改变 API 市场的定价逻辑。最后，评审模型的成本与准确性——如果评审模型本身是闭源且费用较高，则整体成本优势可能有所收窄，长期看是否有开源替代方案也是观察点。

来源：AIbase

AI组队“拼单”新模式：OpenRouter 发布 Fusion API，主打性能与性价比双重优化

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

阿里云QoderWork上线“意识”功能，实现AI自主记忆与技能进化

​美管制 Anthropic 恰逢其时，“欧洲版 OpenAI”借势起飞主张摆脱美国依赖

DeepSeek完成逾70亿美元首轮融资:估值超500亿美元

发表回复取消回复

美管制 Anthropic 恰逢其时，“欧洲版 OpenAI”借势起飞主张摆脱美国依赖