
大厂速度!京东云首发上线 MiniMax M3 大模型,推理效率迎跨越式升级
一句话看懂:6月2日,京东云 JoyBuilder 平台率先完成 MiniMax M3 大模型的接入与开放服务,并通过自研推理框架与多项优化技术,显著提升了模型的推理吞吐量和响应效率。
事件核心:发生了什么
MiniMax 于2026年6月2日发布了 M3 模型。同日,京东云旗下的 JoyBuilder 模型开发平台宣布完成同步接入,并第一时间面向用户开放。据官方信息,京东云将自研推理框架与 PD 分离部署、KV Cache 缓存、投机采样等推理优化技术深度融合,使得 M3 模型在部署后的推理吞吐量更高、整体响应效率大幅提升。这并非简单的“模型上架”,而是在底层推理架构上进行了针对性优化。
为什么重要
此次事件体现了几个关键趋势。首先,大模型从训练到落地的竞赛,已从“谁能做出更好的模型”延展至“谁的部署效率更高、成本更低”。京东云通过技术优化率先缩短了 MiniMax M3 从发布到可用服务的“时差”,说明平台方在推理层面的工程化能力正成为核心竞争力。其次,PD 分离部署等技术的应用,表明行业正在系统性地解决大模型推理时显存占用高、响应慢的痛点,这对降低企业使用大模型的门槛具有实际价值。
对用户/开发者/创作者的影响
对于开发者而言,这意味着调用 MiniMax M3 模型可以获得更快的响应速度和更高的并发支持,尤其是在需要实时交互的应用场景(如智能客服、实时内容生成)中体验改善明显。对于企业采购方来说,更高吞吐量意味着相同算力下可处理更多请求,单位推理成本有望下降。对于内容创作者,使用基于 M3 模型的 AI 写作、编辑等工具时,等待时间将进一步缩短。目前公开信息显示,该服务已通过京东云 JoyBuilder 平台开放。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,MiniMax M3 模型本身的性能表现和 API 定价是否具有竞争力,将直接影响用户是否选择迁移到该模型。第二,其他云平台(如阿里云、华为云)是否会在近期跟进接入自身推理优化后的 M3 模型,形成新一轮平台竞争。第三,京东云对推理优化技术的长期投入,是否会转化为针对不同模型的开箱即用方案,从而吸引更多中小型开发者入驻。
来源:Readhub · AI
![[程序员] 目前有没有能辅助前端"切图"或提取 UI 元素的 AI 工具?](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_5-59-768x403.jpg)

![[Codex] 怎么 codex 更新后,需要重新登录,而且还需要手机验证码](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_3-59-768x403.jpg)