Claude Mythos让梁文锋决定融资

The Information 最新消息显示,DeepSeek创始人梁文锋在看到 Anthropic 的 Claude Mythos 模型展现出远超预期的能力后,意识到必须大规模储备算力才能维持竞争,这直接推动了 DeepSeek 74 亿美元融资的决策。融资完成后,公司宣布团队规模将翻倍至约600人,并加速…

Claude Mythos让梁文锋决定融资

一句话看懂:The Information 最新消息显示,DeepSeek创始人梁文锋在看到 Anthropic 的 Claude Mythos 模型展现出远超预期的能力后,意识到必须大规模储备算力才能维持竞争,这直接推动了 DeepSeek 74 亿美元融资的决策。融资完成后,公司宣布团队规模将翻倍至约600人,并加速适配华为芯片。

事件核心:发生了什么

据 The Information 报道,DeepSeek 启动融资的直接导火索是梁文锋对 Anthropic 在 2026 年4月发布的 Claude Mythos 模型的评估。Anthropic 在 4 月首次公开预览 Claude Mythos,而 DeepSeek 融资传闻在 4 月中旬首次传出,时间线吻合。梁文锋意识到,如果不通过融资储备充足算力,DeepSeek 将无法跟上行业前沿模型的训练节奏。

在 74 亿美元融资中,梁文锋个人出资 200 亿人民币(约30亿美元),占总融资额的五分之二。融资完成后,DeepSeek 设立员工持股计划,并发布公开声明,所有部门启动大规模招聘,计划将公司约300人的团队至少翻倍。核心的 Harness 团队已进入每日面试状态,该团队负责人崔添翼今年3月从 Jane Street 跳槽加入。

为什么重要

DeepSeek 此前的模式是梁文锋自掏腰包维持实验室运营,一直拒绝商业化。此次转向风险投资,标志着其从纯研究导向向资源囤积型竞争策略的重大转变。梁文锋的决策逻辑是:如果不储备弹药,DeepSeek 可能在未来算力竞赛中被淘汰。同时,DeepSeek 长达 15 个月未发布新一代模型,原因是其大部分精力用于将系统从英伟达 CUDA 软件迁移至华为芯片。梁文锋认为华为芯片几年内就能追上英伟达水平,DeepSeek 应率先完成适配。这一适配代价导致 DeepSeek 错过了去年下半年 Claude Code 掀起的编程工具热潮,但在梁文锋看来,编程工具和 AI 聊天机器人都是通往 AGI 的临时产物。

对用户/开发者/创作者的影响

对于开发者而言,DeepSeek 的融资和扩招可能意味着其模型 API 服务将更稳定,价格可能继续维持低价策略。目前,DeepSeek V4 Flash 的价格比 Anthropic 模型便宜 20 到 50 倍,且是唯一将所有模型底层代码完全公开的主要 AI 实验室。这为依赖低成本、开源模型的开发者和中小企业提供了不可替代的选择。对于创作者和企业采购者而言,DeepSeek 的融资意味着其模型迭代周期可能缩短,未来新模型发布后,现有的 V4 系列产品(在Vercel AI Gateway 上 token 用量已从不到 1% 飙升至 17%)可能会面临版本更替带来的 API 接口或定价调整风险。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

1. DeepSeek 适配华为芯片的进展:目前适配代价导致模型发布空窗期长达 15 个月,融资后是否能加速推进,以及国产芯片集群的训练效率是否达到承诺水平,将直接决定其下一代旗舰模型发布时间。2. 团队扩张后的方向:新增的 300 人将主要投向 AI 系统开发、基础设施和产品开发,这是否意味着 DeepSeek 将加速推出面向编程、创作等具体场景的应用层产品,还是继续聚焦底层模型研究,值得观察。3. 开源策略的可持续性:DeepSeek 是目前最激进的开源 AI 实验室,但其融资声明中未明确开源策略是否会因投资方诉求而调整。目前公开信息显示,梁文锋在路演中强调继续开源、保持低价、专注 AGI,但实际执行可能需要平衡股东利益与理想主义之间的张力。

来源:量子位 · 每日最新

celebrityanime
celebrityanime
文章: 10431

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注