刚刚，Claude Mythos 5发布！5000万行代码1天搞定

一句话看懂：Anthropic 在 2026 年 6 月 10 日发布了最强旗舰模型“Claude Mythos 5”，同时推出带安全护栏的公开版“Claude Fable 5”。在5000万行Ruby代码的全库迁移测试中，Fable 5仅用一天就完成了原本需要工程团队两个多月的工作量，API定价比预览版降低一半以上。

事件核心：发生了什么

Anthropic 发布了两款新旗舰：Fable 5 面向所有用户开放，Mythos 5 只限受信任用户。二者底层模型一致，但 Mythos 5 在网络安全、生物科研等领域解除了安全限制。

关键数据：在 SWE-bench Pro 测试中，Fable 5 得分 80.3%，高于 GPT-5.5 的 58.6%；在财务推理评测中突破 90% 大关，比上一代 Opus 高出 10 个百分点；盲打通关《宝可梦·火红版》，不需要前置地图或游戏状态读取工具。

Mythos 5 的生物科研能力独立跑通：设计出 14 个蛋白质靶向复合物，其中 9 个进入真实药物管线；自主训练出的微型 ML 模型（大小仅为参考模型的 1/100），在基因组学研究中击败了同期《Science》论文成果。

API 定价：输入每百万 Token 10 美元，输出每百万 Token 50 美元，相比预览版砍掉了超过一半。

为什么重要

这次发布代表“权限分层”正式成为前沿 AI 的产品机制。Anthropic 没有采用传统的“拒绝回答”方式，而是给 Fable 5 挂了一组独立分类器：普通提问直接由 Mythos 级能力处理，但一旦检测到涉及网络安全、生物化学或模型蒸馏的高风险请求，系统自动降级调用上一代 Opus 4.8 回答。官方称超过 95% 的会话不会触发降级，但剩余不到 5% 的请求会进入更严格的安全路径。

这种设计将能力与安全拆解成了可路由的产品架构，而非依赖模型自身的拒绝策略。对同行而言，这意味着安全可控的“最强大脑”可能不再是单一模型，而是一套分类器+模型路由+权限分级的系统。

Anthropic 同时强调 Token 效率：长周期任务越复杂，Fable 5 的优势越明显——在 Slay the Spire 游戏中接入持久化记忆后，模型表现提升幅度是 Opus 4.8 的 3 倍。这解决了 Agent 化落地中“模型很强但消耗 Token 太多”的账本问题。

对用户/开发者/创作者的影响

普通用户：使用 Fable 5 基本能获得接近 Mythos 5 的体验，但在敏感领域（如黑客技术、病毒研究）提问时，会无征兆被降级到 Opus 4.8 回答。生物学家正常的病毒研究、安全工程师的授权攻防演练，也可能因分类器过严而遭遇降级。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

开发者：API 成本大幅下降，可以用原来的预算覆盖更长任务；但需要评估数据留存要求——从 Mythos 级模型起，所有流量需保留 30 天用于安全监控，企业客户需重新审查合规条款。

创作者：中等强度推理下，Fable 5 就能在复杂编程、长文档推理和图表解读上展现出接近人类专家的微观判断力，但“全力使用”的 Token 成本仍然很高，需要在预算和结果之间做权衡。

值得关注的后续

1. 分类器的误伤率能否快速降低——目前公开信息显示，Anthropic 也承认当前护栏比理想状态更严格，后续调整方向直接影响企业用户选择权。2. GPT-5.5 和 Gemini 3.1 Pro 在 SWE-bench Pro 上的差距明显，竞品是否会在短期内发布新版本跟进。3. Mythos 5 的“权限模式”是否会扩展到更多场景，比如医疗、法律等高风险领域，形成一套行业通用的安全分层标准。

来源：量子位 · 每日最新

刚刚，Claude Mythos 5发布！5000万行代码1天搞定