在 Docker Model Runner 中使用 Claude Code

一句话看懂：开发者可以通过 Docker Model Runner 将 Claude Code 的 API 调用指向本地运行的大模型，从而避免云 API 的 token 消耗和费用，同时保护私有代码和数据隐私。

事件核心：发生了什么

开发者 Pradumna Saraf 在 dev.to 发布了一篇实操指南，详细介绍了如何将 Anthropic 的编程助手 Claude Code 与 Docker Model Runner 结合，使用本地模型（如 Phi-4、GPT-OSS 等）替代 Anthropic 的云端 API。具体步骤包括：在 Docker Desktop 中启用 Model Runner 的 TCP 访问（端口 12434），拉取本地模型（例如 ai/phi4:14B-Q4_K_M），通过设置环境变量 ANTHROPIC_BASE_URL 将 Claude Code 指向本地端点，并通过 --model 参数指定模型名称。此外，还可以通过 shell 配置文件（如 ~/.zshrc）持久化环境变量，避免每次重新设置。

为什么重要

这一方案直接回应了 Claude Code 用户的几个核心痛点：第一，token 消耗成本——随着项目复杂度增加，云 API 调用费用会快速上升，本地运行可大幅降低费用；第二，数据隐私——涉及专有代码或敏感数据时，用户不希望暴露给云端模型；第三，离线可用性——在无网络环境下（如飞行中）仍可使用 AI 编程助手。Docker Model Runner 作为 Docker 生态的组成部分，降低了本地部署大模型的门槛，开发者无需额外安装复杂的推理框架，即可通过标准 Docker 命令管理模型，这种“容器化 AI”的轻量级方式可能加速“本地 + 云端”混合工作流的普及。

对用户/开发者/创作者的影响

对于使用 Claude Code 的开发者，该方案提供了即时的成本控制和隐私保护手段。操作门槛不高：只需 Docker Desktop 或 Docker Engine、启用 Model Runner、下载模型并修改一个环境变量。但需要注意，本地模型（如 Phi-4 14B）的代码理解和生成能力可能不及 Anthropic 的旗舰云端模型，因此适用场景可能偏向“调试、代码注释、小规模重构”等任务，而非复杂的大型代码库分析。指导中也提到，可以通过 docker model package 命令对模型进行上下文窗口定制（例如将 GPT-OSS 扩展到 32K context），以提升处理大文件的能力。这意味着开发者可以按需调优本地模型，但性能和响应速度受限于本地硬件。

值得关注的后续

一是本地模型的代码能力是否能通过微调或定制达到云端模型的实用水平，目前公开信息显示不同模型间的差异明显，例如 Phi-4 和 GPT-OSS 的编码能力对比仍需实测；二是 Docker Model Runner 是否会进一步支持模型分片、量化或 GPU 加速，从而提升本地推理的效率；三是 Claude Code 本身是否会官方支持本地模式或提供类似的环境变量配置文档，Anthropic 的态度将影响这一工作流的推广范围。

来源：dev.to

在 Docker Model Runner 中使用 Claude Code