又一大模型发布,号称比肩Fable 5和Mythos

6月22日,日本AI独角兽Sakana AI发布了两款名为Fugu的“编排器模型”,它们不直接回答问题,而是调度其他大模型协作完成任务。测试中,Fugu在部分基准上超越了Fable 5和Mythos Preview,这代表一种“模型调度”正成为人工智能领域的新竞争力。

又一大模型发布,号称比肩Fable 5和Mythos

一句话看懂:6月22日,日本AI独角兽Sakana AI发布了两款名为Fugu的“编排器模型”,它们不直接回答问题,而是调度其他大模型协作完成任务。测试中,Fugu在部分基准上超越了Fable 5和Mythos Preview,这代表一种“模型调度”正成为人工智能领域的新竞争力。

事件核心:发生了什么

6月22日,Sakana AI(由Transformers论文第五作者Llion Jones联合创立)发布了Sakana Fugu系列编排器模型,包括Fugu和Fugu Ultra两个版本。与传统大语言模型不同,Fugu本身不输出答案,而是充当“总指挥”,根据任务类型选择最适合的worker模型来执行。官方技术报告显示,在工程、科学和推理等八个基准测试中,Fugu Ultra的表现在三项上接近甚至超过Mythos Preview和Fable 5。Fugu Ultra还通过了300个乱序魔方的“一次性算法求解”测试,在盲棋和模拟股票交易中也取得了优于多个基线模型的结果。Fugu模型的训练思路是让语言模型学会理解任务、选择专家模型、拆分子任务并整合结果,而非让单个模型变得更大或更全能。

为什么重要

过去几年AI的进步主要依靠堆算力和扩大模型规模,但Sakana AI的Fugu系列提供了一条新路径:通过编排现有顶尖模型来形成“集体智能”,从而突破单一模型的能力上限。这种“模型编排”思路让AI竞争从“谁的模型更大、更强”扩展到“谁的系统更会调度、组合和整合多个专家模型”。同时,报告强调编排器实现了模块化和模型无关,worker模型池可以随时更换,这在地缘政治层面被视为应对单一供应商断供风险的手段。Sakana AI称这是“AI主权的现实蓝图”。编排能力本身正成为一种独立的竞争力,它证明如果调度得当,现有模型组合就能实现甚至超越更昂贵单一模型的成绩。

对用户/开发者/创作者的影响

对于企业和开发者而言,Sakana Fugu意味着可以不再绑定单一API或模型供应商,而是根据成本、隐私、延迟和合规需求,自由组合多种模型形成定制化服务。比如,开发者可以配置让数学推理强的模型处理计算任务、让编程强的模型处理代码生成,而调度层由Fugu负责。对于内容创作者和普通用户,这意味着未来可能接触到“由多个模型协作”产出的答案,其质量有望超过任何一种现成模型的独立回复。但同时,编排模型每次调用多个底层模型,会带来更高的延迟和成本,尤其是Fugu Ultra这类深度协作模式,错误发生时更难排查问题来源。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,Sakana Fugu目前已有体验地址和GitHub技术报告,但实际能力仍需在真实开发者和用户的大规模使用中验证,厂商自报的基准成绩不等于落地表现。第二,多模型编排带来的算力成本和延迟问题如何平衡,是否会推出按调用计费的商业API模式,值得关注。第三,这种“调度模型vs训练大模型”的路线是否会被其他团队跟进,尤其是OpenAI、Google和Anthropic等拥有强大单一模型的公司,是否会推出类似编排方案来强化自身生态。

来源:36氪 · 24小时热榜

celebrityanime
celebrityanime
文章: 9629

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注