LM Studio 与苹果合作,成功用四台 Mac Studio 运行万亿参数 Kimi K2.6 大模型

在 WWDC 2026 期间,LM Studio 与苹果合作,通过四台 Mac Studio 组成的集群成功运行了月之暗面(Moonshot AI)的万亿参数大模型 Kimi K2.6。这一演示证明了在消费级硬件上部署前沿超大模型的可能性,并展示了苹果生态在本地 AI 推理上的技术能力。

LM Studio 与苹果合作,成功用四台 Mac Studio 运行万亿参数 Kimi K2.6 大模型

一句话看懂:在 WWDC 2026 期间,LM Studio 与苹果合作,通过四台 Mac Studio 组成的集群成功运行了月之暗面(Moonshot AI)的万亿参数大模型 Kimi K2.6。这一演示证明了在消费级硬件上部署前沿超大模型的可能性,并展示了苹果生态在本地 AI 推理上的技术能力。

事件核心:发生了什么

6 月 20 日,LM Studio 与苹果联合展示了在四台 Mac Studio 上运行 Kimi K2.6 大模型。该模型总参数为 1 万亿,采用 MoE(混合专家)架构,激活参数为 320 亿,支持长上下文、多模态输入及智能体任务处理。四台 Mac Studio 通过苹果的内存共享和互联技术,将统一内存容量汇聚至约 1.5TB,从而承载推理需求。同时,演示使用了 LM Studio 的远程访问功能 LM Link,用户可在 MacBook Neo 和 iPhone 上与集群交互,数据和通信均保持本地处理。此前开发者测试显示,类似配置下该模型生成速度可达约 28 tokens/s,且功耗低于传统 GPU 集群。

为什么重要

此次合作是面向本地化推理的一次突破。过去,运行万亿参数级大模型依赖大规模 GPU 集群,成本极高且不适合个人或小型团队。而四台 Mac Studio 的集群方案将硬件门槛大幅降低,结合 Thunderbolt 5 RDMA 等多设备内存共享能力,探索了在本地实现高性能推理的可行路径。这也体现了苹果在 AI 基础设施上的布局:不依赖云端,而是通过生态内硬件的协同,推动大模型在本地运行的安全性和可控性。对开源社区而言,LM Studio 作为本地模型运行平台,为开发者提供了更灵活的实验环境。

对用户/开发者/创作者的影响

对开发者,这一案例意味着可以在相对可负担的硬件上测试和部署 MoE 架构的万亿参数模型,减少对云服务的依赖,降低数据隐私风险。对普通用户,若后续产品化落地,可能通过 Mac 或 iPhone 远程调用本地集群的强大模型能力,实现类似智能助手、代码生成或内容创作的功能,同时保持数据不外传。不过,当前配置(四台 Mac Studio)仍属多设备方案,个人用户需评估成本;LM Studio 还需持续优化 LM Link 的连接体验和模型兼容性。

值得关注的后续

目前公开信息显示,该演示尚属技术验证阶段。后续值得关注:第一,LM Studio 是否会推出针对这类多设备集群的标准化部署方案,降低配置门槛;第二,月之暗面是否会将 Kimi K2.6 的开源版本或精简版本开放给本地社区,完善模型生态;第三,苹果是否会在后续硬件(如 Mac Pro 或新款 Mac Studio)上进一步提升统一内存容量,以支持更大的单机模型推理。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 9040

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注