神话级Claude 5，登顶了

一句话看懂：Anthropic 全新模型 Claude Fable 5 在 Agent Arena 智能体竞技场榜单上断层第一，以高达 11.2% 的综合净提升创下该榜单史上最大分差，并在多项编码评测中碾压前任王者 GPT-5.5 和自家 Opus-4.8。

事件核心：发生了什么

根据最新发布的 Arena Agent Arena 榜单，被称为“神话级”的 Claude Fable 5 模型一举夺魁。在五个核心信号维度中，Fable 5 在确认任务成功率（18.2%）和好评与投诉比（30.6%）两个最接近真实工作的指标上实现断崖式领先。此外，它还包揽了 Code Arena 和 Text Arena 两大单项榜首，前端编码对决胜率高达 72%，分差达 98 分。在 Vals AI 三方评测和 Artificial Analysis 智能指数（得分 64.9）中同样位列第一。发布仅 24 小时，Fable 5 在 OpenRouter 上的日处理 Token 量已达约 2050 亿，超过自家旗舰 Opus 4.8 的 1470 亿，且定价为 10 美元/50 美元每百万 Token，是 Opus 4.8 的两倍。

为什么重要

Fable 5 的发布节奏令人侧目：从 Opus 4.7 到 Opus 4.8 用了 42 天，而从 Opus 4.8 到 Fable 5 仅耗时 12 天，间隔持续缩短，能力跳变却在增大。这一现象表明，Anthropic 正在加速模型迭代，且实际能力提升不仅体现在标准评测分数上，更在真实任务执行（如编码、工具调用）中形成实质性领先。这对整个 AI 行业的竞争格局意味着，闭源模型的能力迭代正从“季度更新”加速到“周级升级”，迫使追赶者必须重新评估技术路线和投入节奏。同时，Fable 5 的高定价（翻倍）策略，也验证了“更强能力对应更高付费意愿”的商业逻辑在当下仍然有效。

对用户/开发者/创作者的影响

对普通用户，Fable 5 的“手搓游戏模拟器”“生成可交互网页应用”等实操案例意味着 AI 的实用性边界被大幅拓展——用户不再需要等待社区或官方提供特定工具，直接通过自然语言描述即可快速获得可运行的高级应用。对开发者和创作者，Fable 5 在前端编码（72% 胜率）和复杂任务自动化上的表现，将显著提升工作效率，例如一句话生成一个完整的网页版 Windows 操作系统或上古卷轴游戏克隆。但对持续使用 API 的团队，需注意 Token 消耗和成本翻倍的变化——沃顿商学院教授 Ethan Mollick 也指出，Fable 启动工作流时 Token 被迅速消耗。企业采购 wise，应尽快测试 Fable 5 在自身核心流程（如代码生成、客户交互）中的消耗效率，评估是否值得溢价。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

1. Fable 5 的公开 API 落地时间以及价格策略是否会根据用量变化进一步调整——目前仅在 Agent Arena 等测试平台出现，大规模向开发者开放仍需观察。2. 竞品（如 OpenAI 的 GPT-5.5）是否会加速推出下一轮更新以回应这一“断层第一”——12 天的迭代间隔已经把竞争压力推至极限。3. 在“工具幻觉”项排名第一的 Fable 5，其实际可用性还需在内测用户群体中验证，特别是复杂多步骤任务中的稳定性和幻觉控制情况。

来源：36氪 · 24小时热榜

神话级Claude 5，登顶了

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

快被 AI 取代的专业，还值得报吗？

融资 813 亿，估值 3000 亿，这家 AI 公司创办仅一年

物理 AI 概念大涨，索辰科技触板！同标的指数规模最大的 —— 软件开发 ETF 华宝（159036）盘中上探 3.29%

发表回复取消回复