
利润腰斩也要卷AI!小米模型永久降价99%,雷军还要再砸600亿
一句话看懂:小米宣布旗下 MiMo-V2.5 系列 API 永久降价,最高降幅达 99%,同时将 Token 使用额度提升至原来的 5-8 倍。尽管 2026 年 Q1 财报显示利润腰斩,雷军仍计划未来三年在 AI 领域投入 600 亿元,延续了国内大模型厂商“不计成本抢市场”的竞争节奏。
事件核心:发生了什么
5 月 27 日起,小米永久性调整 MiMo-V2.5 和 MiMo-V2.5 Pro 的 API 定价。以 Pro 版本为例,输入缓存命中价降至 0.025 元/百万 tokens,较原价最高降幅达 99%;输出定价降至 6 元/百万 tokens,降幅超 70%。同时,Token Plan 套餐的使用量提升至 5-8 倍,已订阅用户的积分数额也被重置。值得注意的是,高阶的 MiMo-V2-Pro 和 MiMo-V2-Omni 价格未变,引导开发者向高性价比的 V2.5 系列迁移。此次降价与 DeepSeek 近期永久调价为原价 1/4 的动作形成呼应,两家来自中国的模型厂商在定价上正逼近“地板价”。
为什么重要
小米此次降价的深层逻辑与技术优化有关:其团队通过滑动窗口注意力机制(SWA)和多级存储优化,将 KV 缓存的传输数据量降至优化前的约七分之一,提升了缓存命中率和推理效率。这释放了一个明确信号——在模型能力差距缩小后,国内厂商正在通过系统级推理优化来压低成本、换取调用量。与 OpenAI、Anthropic 等近期涨价的美国公司不同,中国模型以低价策略快速抢占 OpenRouter 等海外平台的调用量榜单,形成了“美国提价、中国压价”的分化格局。即使小米一季度经调整净利润同比下跌 43.1%,雷军仍宣布今年 AI 投入至少 160 亿元,凸显出该赛道已被视为公司战略重心。
对用户/开发者/创作者的影响
开发者和中小企业:调用 MiMo-V2.5 系列的成本骤降,尤其是缓存命中场景下每百万 tokens 仅需几分钱,大幅降低了构建智能体、聊天机器人或业务分析系统的门槛。但需注意,缓存命中的实际成本会受显存占用影响,定价虽低,实际开销仍取决于部署模式。
创作者和内容工作者:MiMo-V2.5-TTS(语音合成)仍保持免费接入,适合低预算尝试文本转语音场景。如果追求更高性能,可选择坚持原价的 MiMo-V2-Pro 系列。
企业采购决策者:国内大模型 API 价格战已进入“毫厘之争”,建议优先观察缓存命中率、输出质量与模型响应速度的平衡,避免仅按单价选型。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
1. 定价是否会继续下探:目前 DeepSeek 和小米均已宣布“永久降价”,但市场是否会出现更激进的“零利润”定价仍有待观察。
2. 开发者生态能否乘势扩大:降价后调用量是否显著上升,以及小米能否吸引更多第三方应用接入,将是检验“以价换量”战略是否有效的关键指标。
3. 海外厂商能否跟进:若中国模型以低价持续占据榜单前列,是否倒逼 OpenAI 等公司调整定价策略,将直接影响全球 AI 商业化的竞争格局。
来源:InfoQ CN


