又一大模型发布，号称比肩Fable 5和Mythos

一句话看懂：6月22日，日本AI独角兽Sakana AI发布了两款名为Fugu的“编排器模型”，它们不直接回答问题，而是调度其他大模型协作完成任务。测试中，Fugu在部分基准上超越了Fable 5和Mythos Preview，这代表一种“模型调度”正成为人工智能领域的新竞争力。

事件核心：发生了什么

6月22日，Sakana AI（由Transformers论文第五作者Llion Jones联合创立）发布了Sakana Fugu系列编排器模型，包括Fugu和Fugu Ultra两个版本。与传统大语言模型不同，Fugu本身不输出答案，而是充当“总指挥”，根据任务类型选择最适合的worker模型来执行。官方技术报告显示，在工程、科学和推理等八个基准测试中，Fugu Ultra的表现在三项上接近甚至超过Mythos Preview和Fable 5。Fugu Ultra还通过了300个乱序魔方的“一次性算法求解”测试，在盲棋和模拟股票交易中也取得了优于多个基线模型的结果。Fugu模型的训练思路是让语言模型学会理解任务、选择专家模型、拆分子任务并整合结果，而非让单个模型变得更大或更全能。

为什么重要

过去几年AI的进步主要依靠堆算力和扩大模型规模，但Sakana AI的Fugu系列提供了一条新路径：通过编排现有顶尖模型来形成“集体智能”，从而突破单一模型的能力上限。这种“模型编排”思路让AI竞争从“谁的模型更大、更强”扩展到“谁的系统更会调度、组合和整合多个专家模型”。同时，报告强调编排器实现了模块化和模型无关，worker模型池可以随时更换，这在地缘政治层面被视为应对单一供应商断供风险的手段。Sakana AI称这是“AI主权的现实蓝图”。编排能力本身正成为一种独立的竞争力，它证明如果调度得当，现有模型组合就能实现甚至超越更昂贵单一模型的成绩。

对用户/开发者/创作者的影响

对于企业和开发者而言，Sakana Fugu意味着可以不再绑定单一API或模型供应商，而是根据成本、隐私、延迟和合规需求，自由组合多种模型形成定制化服务。比如，开发者可以配置让数学推理强的模型处理计算任务、让编程强的模型处理代码生成，而调度层由Fugu负责。对于内容创作者和普通用户，这意味着未来可能接触到“由多个模型协作”产出的答案，其质量有望超过任何一种现成模型的独立回复。但同时，编排模型每次调用多个底层模型，会带来更高的延迟和成本，尤其是Fugu Ultra这类深度协作模式，错误发生时更难排查问题来源。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，Sakana Fugu目前已有体验地址和GitHub技术报告，但实际能力仍需在真实开发者和用户的大规模使用中验证，厂商自报的基准成绩不等于落地表现。第二，多模型编排带来的算力成本和延迟问题如何平衡，是否会推出按调用计费的商业API模式，值得关注。第三，这种“调度模型vs训练大模型”的路线是否会被其他团队跟进，尤其是OpenAI、Google和Anthropic等拥有强大单一模型的公司，是否会推出类似编排方案来强化自身生态。

来源：36氪 · 24小时热榜

又一大模型发布，号称比肩Fable 5和Mythos

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

Eval bug: Hexagon HMX matmul hangs on small remainder batch during prefill

物理AI第一块万亿市场，在公路货运先跑通闭环了

微信AI全网最细体验，我又爱上了刷朋友圈

发表回复取消回复