大厂速度！京东云首发上线 MiniMax M3 大模型，推理效率迎跨越式升级

一句话看懂：6月2日，京东云 JoyBuilder 平台率先完成 MiniMax M3 大模型的接入与开放服务，并通过自研推理框架与多项优化技术，显著提升了模型的推理吞吐量和响应效率。

事件核心：发生了什么

MiniMax 于2026年6月2日发布了 M3 模型。同日，京东云旗下的 JoyBuilder 模型开发平台宣布完成同步接入，并第一时间面向用户开放。据官方信息，京东云将自研推理框架与 PD 分离部署、KV Cache 缓存、投机采样等推理优化技术深度融合，使得 M3 模型在部署后的推理吞吐量更高、整体响应效率大幅提升。这并非简单的“模型上架”，而是在底层推理架构上进行了针对性优化。

为什么重要

此次事件体现了几个关键趋势。首先，大模型从训练到落地的竞赛，已从“谁能做出更好的模型”延展至“谁的部署效率更高、成本更低”。京东云通过技术优化率先缩短了 MiniMax M3 从发布到可用服务的“时差”，说明平台方在推理层面的工程化能力正成为核心竞争力。其次，PD 分离部署等技术的应用，表明行业正在系统性地解决大模型推理时显存占用高、响应慢的痛点，这对降低企业使用大模型的门槛具有实际价值。

对用户/开发者/创作者的影响

对于开发者而言，这意味着调用 MiniMax M3 模型可以获得更快的响应速度和更高的并发支持，尤其是在需要实时交互的应用场景（如智能客服、实时内容生成）中体验改善明显。对于企业采购方来说，更高吞吐量意味着相同算力下可处理更多请求，单位推理成本有望下降。对于内容创作者，使用基于 M3 模型的 AI 写作、编辑等工具时，等待时间将进一步缩短。目前公开信息显示，该服务已通过京东云 JoyBuilder 平台开放。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，MiniMax M3 模型本身的性能表现和 API 定价是否具有竞争力，将直接影响用户是否选择迁移到该模型。第二，其他云平台（如阿里云、华为云）是否会在近期跟进接入自身推理优化后的 M3 模型，形成新一轮平台竞争。第三，京东云对推理优化技术的长期投入，是否会转化为针对不同模型的开箱即用方案，从而吸引更多中小型开发者入驻。

来源：Readhub · AI

大厂速度！京东云首发上线 MiniMax M3 大模型，推理效率迎跨越式升级