Ornith-1.0：用于代理编码的自支架法学硕士

一句话看懂：DeepReinforce 发布了首个开源模型 Ornith-1.0，基于 Gemma 4 和 Qwen 3.5 打造，在编码基准测试中达到同尺寸开源模型的顶尖水平，支持 Agent 任务场景下的多工具调用。

事件核心：发生了什么

2026年6月29日，DeepReinforce 发布了 Ornith-1.0 系列模型，这是该公司的首个模型版本。模型采用 MIT 开源协议，包含 9B Dense、31B Dense、35B MoE 及 397B MoE 四个变体，均基于预训练的 Gemma 4 和 Qwen 3.5 进行微调。底层模型的许可证兼容性良好——Gemma 4 采用 Apache 2.0 许可（不附带此前 Gemma 模型的附加条款），Qwen 3.5 同样为 Apache 2.0 许可。在编码相关基准测试中，Ornith-1.0 在同类参数的开放模型中实现了最优性能。Simon Willison 使用 LM Studio 运行了 35B 量化的 GGUF 版本（约20GB），并结合 Pi 工具链进行测试，发现模型能够高效执行多轮工具调用，例如在 Datasette 代码库中定位并解码特定 actor cookie 的逻辑，以及找到插入对话框的触发代码。

为什么重要

Ornith-1.0 的发布为开源编码 Agent 模型树立了新的性能标杆。其“自支架”特性意味着模型具备在复杂 Agent 工作流中自主调度和调用外部工具的能力，这直接挑战了闭源模型在代理编码领域的优势。深层意义上，DeepReinforce 选择基于 Gemma 4（Apache 2.0）和 Qwen 3.5（Apache 2.0）进行二次开发，而非从头训练，验证了高性能开源基座模型（特别是 Apache 2.0 许可的基座）可以快速催生专业的垂直 Agent 模型，这可能会加速开源生态在智能编程助手中的竞争，同时降低开发者构建私有编码 Agent 的成本和法律风险。

对用户/开发者/创作者的影响

对于开发者，Ornith-1.0 可直接在本地使用 LM Studio 等推理工具运行，无需依赖云端 API，适合处理需频繁调用工具或涉及敏感代码库的 Agent 任务。创作者可以利用其高效的文本生成能力（测试中达到 103 tokens/秒）辅助代码审查或文档生成。对于企业采购者，MIT 许可证允许商业集成和定制，但需注意虽然基座模型许可证兼容，仍需自行验证 397B MoE 版本的部署成本与收益。对 AI 应用开发者而言，该模型在工具调用连贯性上的表现降低了构建多步骤编程 Agent 的工程门槛。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，截至发布日，DeepReinforce 的公开信息有限，团队背景和后续训练计划尚不明确，需关注其是否会持续维护模型并开放更多的基准测试分数。第二，397B MoE 变体的实际推理效率、显存占用以及 Agent 任务中的极限表现尚未被充分评测，这是评估其能否替代闭源解决方案的关键。第三，随着 Gemma 4 和 Qwen 3.5 许可的完全开放，可能会有更多团队借鉴 Ornith-1.0 的“自支架”思路推出竞品，从而推动开源编码 Agent 领域的技术演进。

来源：Simon Willison

Ornith-1.0：用于代理编码的自支架法学硕士

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

防止蒸馏第三方模型，Meta 限制 AI 工程师使用 Claude 与 Codex

荒诞：AI 让一部人无班可上，又让另一部人无班可下

科技公司推动美股走强 标普 500 指数势创六年来最佳季度表现

发表回复取消回复

科技公司推动美股走强标普 500 指数势创六年来最佳季度表现