16GB 内存直接跑 12B 多模态！谷歌 AI Edge Gallery 登陆 Mac，端侧 AI 再迎生产力爆发

一句话看懂：谷歌正式在 macOS 上推出实验性应用 AI Edge Gallery，允许用户在 16GB 内存的 Mac 上本地运行 12B 参数多模态模型 Gemma-4-12B-it，并提供端侧语音转录工具 Eloquent。这意味着无需联网和云端算力，即可实现高隐私的离线 AI 交互与语音处理。

事件核心：发生了什么

根据 AIbase 在 2026 年 6 月 4 日的报道，谷歌将实验性应用 AI Edge Gallery 部署至 macOS 平台。该应用定位与常见的开源模型管理平台（如 Ollama、LM Studio）不同，专注于托管和优化谷歌自家开源大模型生态。目前仅提供五款经过指令调优的专属模型，包括旗舰模型 Gemma-4-12B-it（120 亿参数），以及采用端侧参数卸载架构的 Gemma-4-E2B-it、Gemma-4-E4B-it 等。

谷歌称，通过与 macOS 的底层架构深度适配，搭载 12B 参数的 Gemma 模型能在 16GB 内存的普通 Mac 上流畅运行，支持文本、视觉、音频等多模态输入，具备离线代码编写与逻辑分析能力。同时，谷歌还发布了端侧语音效率工具 Eloquent，提供离线智能转写、实时去除语气词和润色功能，并支持用户自定义行业术语词库，所有处理均在本地芯片闭环完成，不上传云端。

为什么重要

此举对端侧 AI 生态具有多重意义。首先，它将运行 12B 级别多模态模型的内存门槛压低至 16GB，直接挑战了当前行业对“端侧模型需小参数”的普遍认知，可能加速其他厂商（如 Meta、苹果）对自家模型的本地优化投入。其次，谷歌选择深度垂直自己的模型堆栈而非开放通用平台，意在构建从模型到工具链的封闭生态，与 OS 层深度绑定，对现有开源管理平台形成差异化竞争。最后，Eloquent 的发布指向了极高商业价值的语音转录市场，通过“不出芯片”的隐私卖点，可能吸引金融、医疗、法律等对数据保密有刚性需求的行业用户。

对用户/开发者/创作者的影响

对普通 Mac 用户而言，16GB 内存即可在本地运行具备多模态能力的 AI 助手，通话、会议、邮件起草等场景可直接离线完成，不再受网络和云端费用限制。对开发者与创作者来说，Gemma-4-12B-it 的编码和逻辑分析能力提供了不依赖 GPU 集群的本地开发辅助，而 Eloquent 的自定义词库功能可极大提升特定领域（如编程术语、专业名词）的转录准确率。对想调用谷歌模型做应用的第三方开发者，目前仅限谷歌自有模型，API 接入形态尚未公开，生态开放度待观察。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

目前公开信息显示，AI Edge Gallery 仍处于实验性阶段，模型库仅五款。后续可关注三点：一是谷歌是否会开放更多第三方模型或允许开发者上传微调版本，以扩大模型生态；二是 Eloquent 转录工具的准确率在实际行业场景下与主流云端方案（如 Whisper、Deepgram）的对比差异；三是竞品厂商（如苹果、微软）是否会加速在自家操作系统层面推出类似深度集成的端侧模型工具。

来源：AIbase

16GB 内存直接跑 12B 多模态！谷歌 AI Edge Gallery 登陆 Mac，端侧 AI 再迎生产力爆发