Anthropic 祭出双旗舰模型 Fable、Mythos,屠榜所有基测!网友:除了贵没毛病

Anthropic 祭出双旗舰模型 Fable、Mythos,屠榜所有基测!网友:除了贵没毛病

Anthropic 祭出双旗舰模型 Fable、Mythos,屠榜所有基测!网友:除了贵没毛病

一句话看懂:Anthropic 于昨晚发布了两款旗舰大模型——Claude Fable 5 和 Claude Mythos 5,前者面向公众开放,后者仅限安全机构使用。两者性能在几乎所有主流基准测试中均取得行业领先成绩,但高定价和差异化安全策略也引发了广泛讨论。

事件核心:发生了什么

Anthropic 此次发布的 Fable 5 定位为通用级高性能模型,综合性能超越此前所有公开发布的 Claude 版本。在软件工程领域,它曾在 1 天内完成需团队两个月手动攻坚的 5000 万行 Ruby 代码库迁移;在编码评估 FrontierCode Diamond 测试中得分领跑全球前沿模型,且 token 效率显著提升。视觉任务方面,它能仅凭截图还原 Web 应用源代码,并独立通关《精灵宝可梦火红》全流程。此外,Fable 5 具备百万级 token 的长上下文处理能力和更强的自主推理能力。

Mythos 5 与 Fable 5 基于同一底层模型,但取消了部分安全限制,释放全部能力。它已部署在关键基础设施运营方和网络安全防御机构中,在生命科学领域可将部分环节效率提升 10 倍,并首次在盲测中产出 80% 认可度的原创科学假设。价格方面,两款模型定价为每百万输入 token 10 美元、每百万输出 token 50 美元,不足前代 Mythos Preview 版本的一半。

为什么重要

此次发布的标志性意义在于 Anthropic 首次按照风险等级差异化开放模型能力。前 Tesla AI 负责人 Andrej Karpathy 评价称,Fable 5 在几乎所有基准测试上均取得最佳成绩,且实际使用中的能力跃迁配得上“大版本号升级”。但多位开发者指出,真正关键的不是排行榜数字,而是模型在长期复杂任务中的表现——Fable 5 在持续数天的科研、代码迁移等项目中展现出接近“独立完成项目”的能力。然而,部分用户认为进步幅度有限,一位财务分析用户表示“它更像智能手机的迭代,很难再感到震撼”。定价方面,高成本也让普通消费者担忧“还能跟得上吗”。

对用户/开发者/创作者的影响

对开发者:Fable 5 的软件工程能力已从代码生成扩展到大型代码库理解与跨模块修改,其在超大规模代码迁移中的效率提升意味着开发者可能更少依赖团队人力,但需要自研或购买 API 能力,成本较高。目前仅 Pro、Max、Team 等套餐用户可免费体验至 6 月 22 日,之后需消耗积分使用。

对企业用户:Mythos 5 不向公众开放,仅面向安全机构和科研组织。生命科学、网络安全领域的机构可获得跨维度效率提升,但需通过严格审核。对于普通企业,Fable 5 的自主推理能力(如金融因果分析)可能减少人工介入,但初期部署成本需要权衡。

对内容创作者:模型在复杂文档分析、图表解读上表现出色,能辅助知识工作类任务,但视觉专用模型的“独立通关游戏”案例更多展示其基础推理上限,并非直接适用创作场景。高输出 token 价格(50 美元/百万)可能限制高频使用。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

1. 模型迭代与竞品反应:Fable 5 和 Mythos 5 是否能在实际任务中稳定复现官方案例的成果,以及 Google、OpenAI 等竞争对手是否会跟进差异化安全策略或降价回应。
2. 开发者生态与定价长期走势:高 token 成本是否会催生更多企业自研轻量化模型,或推动 Anthropic 推出更平价的订阅选项。目前公开信息显示,6 月 23 日后的积分消耗机制尚未明确细则。
3. 监管与安全影响:Mythos 5 仅开放给经过审核的机构,这一模式是否会成为行业惯例,尤其是针对生物、化学等双用途技术的限制措施,可能影响模型商业化的速度与范围。

来源:InfoQ CN

celebrityanime
celebrityanime
文章: 6845

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注