利润腰斩也要卷AI！小米模型永久降价99%，雷军还要再砸600亿

一句话看懂：小米宣布旗下 MiMo-V2.5 系列 API 永久降价，最高降幅达 99%，同时将 Token 使用额度提升至原来的 5-8 倍。尽管 2026 年 Q1 财报显示利润腰斩，雷军仍计划未来三年在 AI 领域投入 600 亿元，延续了国内大模型厂商“不计成本抢市场”的竞争节奏。

事件核心：发生了什么

5 月 27 日起，小米永久性调整 MiMo-V2.5 和 MiMo-V2.5 Pro 的 API 定价。以 Pro 版本为例，输入缓存命中价降至 0.025 元/百万 tokens，较原价最高降幅达 99%；输出定价降至 6 元/百万 tokens，降幅超 70%。同时，Token Plan 套餐的使用量提升至 5-8 倍，已订阅用户的积分数额也被重置。值得注意的是，高阶的 MiMo-V2-Pro 和 MiMo-V2-Omni 价格未变，引导开发者向高性价比的 V2.5 系列迁移。此次降价与 DeepSeek 近期永久调价为原价 1/4 的动作形成呼应，两家来自中国的模型厂商在定价上正逼近“地板价”。

为什么重要

小米此次降价的深层逻辑与技术优化有关：其团队通过滑动窗口注意力机制（SWA）和多级存储优化，将 KV 缓存的传输数据量降至优化前的约七分之一，提升了缓存命中率和推理效率。这释放了一个明确信号——在模型能力差距缩小后，国内厂商正在通过系统级推理优化来压低成本、换取调用量。与 OpenAI、Anthropic 等近期涨价的美国公司不同，中国模型以低价策略快速抢占 OpenRouter 等海外平台的调用量榜单，形成了“美国提价、中国压价”的分化格局。即使小米一季度经调整净利润同比下跌 43.1%，雷军仍宣布今年 AI 投入至少 160 亿元，凸显出该赛道已被视为公司战略重心。

对用户/开发者/创作者的影响

开发者和中小企业：调用 MiMo-V2.5 系列的成本骤降，尤其是缓存命中场景下每百万 tokens 仅需几分钱，大幅降低了构建智能体、聊天机器人或业务分析系统的门槛。但需注意，缓存命中的实际成本会受显存占用影响，定价虽低，实际开销仍取决于部署模式。
创作者和内容工作者：MiMo-V2.5-TTS（语音合成）仍保持免费接入，适合低预算尝试文本转语音场景。如果追求更高性能，可选择坚持原价的 MiMo-V2-Pro 系列。
企业采购决策者：国内大模型 API 价格战已进入“毫厘之争”，建议优先观察缓存命中率、输出质量与模型响应速度的平衡，避免仅按单价选型。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

1. 定价是否会继续下探：目前 DeepSeek 和小米均已宣布“永久降价”，但市场是否会出现更激进的“零利润”定价仍有待观察。
2. 开发者生态能否乘势扩大：降价后调用量是否显著上升，以及小米能否吸引更多第三方应用接入，将是检验“以价换量”战略是否有效的关键指标。
3. 海外厂商能否跟进：若中国模型以低价持续占据榜单前列，是否倒逼 OpenAI 等公司调整定价策略，将直接影响全球 AI 商业化的竞争格局。

来源：InfoQ CN

利润腰斩也要卷AI！小米模型永久降价99%，雷军还要再砸600亿