
刚刚,Claude Mythos 5发布!5000万行代码1天搞定
一句话看懂:Anthropic 在 2026 年 6 月 10 日发布了最强旗舰模型“Claude Mythos 5”,同时推出带安全护栏的公开版“Claude Fable 5”。在5000万行Ruby代码的全库迁移测试中,Fable 5仅用一天就完成了原本需要工程团队两个多月的工作量,API定价比预览版降低一半以上。
事件核心:发生了什么
Anthropic 发布了两款新旗舰:Fable 5 面向所有用户开放,Mythos 5 只限受信任用户。二者底层模型一致,但 Mythos 5 在网络安全、生物科研等领域解除了安全限制。
关键数据:在 SWE-bench Pro 测试中,Fable 5 得分 80.3%,高于 GPT-5.5 的 58.6%;在财务推理评测中突破 90% 大关,比上一代 Opus 高出 10 个百分点;盲打通关《宝可梦·火红版》,不需要前置地图或游戏状态读取工具。
Mythos 5 的生物科研能力独立跑通:设计出 14 个蛋白质靶向复合物,其中 9 个进入真实药物管线;自主训练出的微型 ML 模型(大小仅为参考模型的 1/100),在基因组学研究中击败了同期《Science》论文成果。
API 定价:输入每百万 Token 10 美元,输出每百万 Token 50 美元,相比预览版砍掉了超过一半。
为什么重要
这次发布代表“权限分层”正式成为前沿 AI 的产品机制。Anthropic 没有采用传统的“拒绝回答”方式,而是给 Fable 5 挂了一组独立分类器:普通提问直接由 Mythos 级能力处理,但一旦检测到涉及网络安全、生物化学或模型蒸馏的高风险请求,系统自动降级调用上一代 Opus 4.8 回答。官方称超过 95% 的会话不会触发降级,但剩余不到 5% 的请求会进入更严格的安全路径。
这种设计将能力与安全拆解成了可路由的产品架构,而非依赖模型自身的拒绝策略。对同行而言,这意味着安全可控的“最强大脑”可能不再是单一模型,而是一套分类器+模型路由+权限分级的系统。
Anthropic 同时强调 Token 效率:长周期任务越复杂,Fable 5 的优势越明显——在 Slay the Spire 游戏中接入持久化记忆后,模型表现提升幅度是 Opus 4.8 的 3 倍。这解决了 Agent 化落地中“模型很强但消耗 Token 太多”的账本问题。
对用户/开发者/创作者的影响
普通用户:使用 Fable 5 基本能获得接近 Mythos 5 的体验,但在敏感领域(如黑客技术、病毒研究)提问时,会无征兆被降级到 Opus 4.8 回答。生物学家正常的病毒研究、安全工程师的授权攻防演练,也可能因分类器过严而遭遇降级。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
开发者:API 成本大幅下降,可以用原来的预算覆盖更长任务;但需要评估数据留存要求——从 Mythos 级模型起,所有流量需保留 30 天用于安全监控,企业客户需重新审查合规条款。
创作者:中等强度推理下,Fable 5 就能在复杂编程、长文档推理和图表解读上展现出接近人类专家的微观判断力,但“全力使用”的 Token 成本仍然很高,需要在预算和结果之间做权衡。
值得关注的后续
1. 分类器的误伤率能否快速降低——目前公开信息显示,Anthropic 也承认当前护栏比理想状态更严格,后续调整方向直接影响企业用户选择权。2. GPT-5.5 和 Gemini 3.1 Pro 在 SWE-bench Pro 上的差距明显,竞品是否会在短期内发布新版本跟进。3. Mythos 5 的“权限模式”是否会扩展到更多场景,比如医疗、法律等高风险领域,形成一套行业通用的安全分层标准。
来源:量子位 · 每日最新


