
DeepSeek 将 V4 Pro 的价格优惠永久化
一句话看懂:DeepSeek 宣布将其 V4 Pro 模型原定于 2026 年 5 月 31 日结束的 75% 折扣优惠永久化,从此 API 调用价格直接降至原价的四分之一,同时 V4 Flash 模型的缓存命中价格也大幅降低至原价的十分之一。
事件核心:发生了什么
根据 DeepSeek 官方 API 定价页面更新,V4 Pro 模型的输入(缓存未命中)价格从此前的每百万 tokens 1.74 美元永久降至 0.435 美元,输出价格从 3.48 美元永久降至 0.87 美元;缓存命中后价格更低,仅 0.003625 美元。与此同时,V4 Flash 模型的缓存命中价格已从 0.028 美元降至 0.0028 美元,该调整自 2026 年 4 月 26 日起生效。这意味着原本作为短期促销的「75% 折扣」已被彻底固定为新的长期定价策略。
为什么重要
这一举动改变了 DeepSeek 在 API 市场的竞争定位。永久降价相当于将高端推理模型的调用成本直接拉低到与许多轻量级开源模型相当的水平,这会迫使其他闭源 API 提供商(如 OpenAI、Anthropic、Google)在定价策略上做出回应。此外,DeepSeek 通过显著降低缓存命中价格(低至竞品的十分之一甚至更低),激励开发者在业务中充分利用其上下文缓存机制,进一步降低大规模应用成本。这体现了一种「以量换价」的商业策略:通过更低单价吸引更多开发者流量,从而摊薄推理集群的固定成本。
对用户/开发者/创作者的影响
最直接受益的是使用 V4 Pro 进行高吞吐量推理的开发者与企业。原先每月在 API 上花费 1000 美元的场景现在只需 250 美元,这对于需要大批量进行内容生成、代码补全、长文档理解的 AI 应用来说,意味着利润率明显改善。V4 Flash 模型支持 1M 上下文窗口和 384K 最大输出,尤其适合文档分析、对话记忆等长文本场景,降价后更值得优先考虑。不过需要注意,V4 Pro 的并发限制为 500,V4 Flash 为 2500,开发者在高并发场景下需合理分配请求类型。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,DeepSeek 是否会进一步将 V4 系列模型开源?目前 V4 仍是闭源 API 产品,永久降价可能是开源前吸引开发者的铺垫。第二,竞品(如 OpenAI 的 GPT-4o、Anthropic 的 Claude Opus)是否会在未来 1-2 个月内调价跟进?第三,随着价格下降,DeepSeek 的 API 用量可能快速攀升,需观察其推理基础设施是否能维持稳定延迟与可用性,尤其是高频缓存命中场景下的服务质量。


