
京东云率先上线 MiniMax M3
一句话看懂:京东云于 2026 年 6 月 1 日率先将 MiniMax 最新模型 M3 接入其 JoyBuilder 模型开发平台,并通过自研推理优化技术提升服务效率。这是 MiniMax M3 在云平台上的首次公开上线,标志着大模型领域又一次基础模型与云服务平台的快速结合。
事件核心:发生了什么
据京东云官方消息,MiniMax M3 模型于 2026 年 6 月 1 日正式上线,京东云的 JoyBuilder 模型开发平台已第一时间接入该模型并同步开放服务。京东云方面表示,为了支持 M3 的高效推理,平台采用了其自研推理框架,具体技术包括 PD(预填充与生成)分离部署、KV Cache 缓存以及投机采样等推理优化技术。这些技术旨在提升模型推理吞吐量与响应效率。目前公开信息显示,这是 MiniMax M3 首次通过云服务平台向开发者和企业用户提供调用能力。
为什么重要
MiniMax 作为国内头部大模型创业公司之一,其 M3 模型的快速云化对行业有多个层面意义。首先,它表明大模型训练与推理技术已进入“模型迭代快、配套跟上”的阶段:从模型发布到云平台上线,时间窗口正在压缩。其次,京东云结合 PD 分离部署、KV Cache 缓存等自研技术优化推理,反映出当前云厂商的竞争重点已从单纯“接入模型”转向“提供差异化推理效率与成本控制方案”。这对整个大模型商业化的节奏——尤其是推理成本能否进一步下降——具有直接参考价值。最后,京东云率先接入 MiniMax M3,而非阿里云、华为云等主流平台,也暗示了模型公司与云平台之间的合作关系正在从单一绑定走向更多元的选择。
对用户/开发者/创作者的影响
对于开发者和企业用户而言,MiniMax M3 通过京东云 JoyBuilder 平台提供 API 服务,意味着可以直接在熟悉的云开发环境中调用最新模型,无需自行部署或维护硬件。京东云强调的推理优化技术——如 PD 分离部署和 KV Cache 缓存——理论上能降低每次 API 调用的延迟和单位成本,这对需要高频调用模型的应用场景(如智能客服、内容生成、代码辅助)尤为关键。对于 AI 应用创作者来说,这意味着可以更快地测试和集成 MiniMax M3 的能力,从而加速产品迭代。不过,具体定价、速率限制及可用区域目前尚未公布,开发者需关注平台上线的实际条款。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
以下三个方向值得持续观察:第一,MiniMax M3 在京东云上的定价策略是否具有竞争力,是否会引发其他云厂商跟进下调同类模型 API 价格;第二,其他主流云平台(如阿里云、腾讯云、华为云)是否会在近期相继上线 MiniMax M3,或推出各自优化版本的接入服务;第三,京东云自研推理框架在实际生产环境中的表现——包括吞吐量提升幅度和部署稳定性——是否有公开的基准数据或用户实测反馈。此外,MiniMax M3 模型本身的性能评价(尤其是与同期发布的竞品如 GPT、Claude、通义千问等模型的对比)也是行业判断其长期价值的关键。
来源:Readhub · AI


