Ornith-1.0:用于代理编码的自支架法学硕士

DeepReinforce 发布了首个开源模型 Ornith-1.0,基于 Gemma 4 和 Qwen 3.5 打造,在编码基准测试中达到同尺寸开源模型的顶尖水平,支持 Agent 任务场景下的多工具调用。

Ornith-1.0:用于代理编码的自支架法学硕士

一句话看懂:DeepReinforce 发布了首个开源模型 Ornith-1.0,基于 Gemma 4 和 Qwen 3.5 打造,在编码基准测试中达到同尺寸开源模型的顶尖水平,支持 Agent 任务场景下的多工具调用。

事件核心:发生了什么

2026年6月29日,DeepReinforce 发布了 Ornith-1.0 系列模型,这是该公司的首个模型版本。模型采用 MIT 开源协议,包含 9B Dense、31B Dense、35B MoE 及 397B MoE 四个变体,均基于预训练的 Gemma 4 和 Qwen 3.5 进行微调。底层模型的许可证兼容性良好——Gemma 4 采用 Apache 2.0 许可(不附带此前 Gemma 模型的附加条款),Qwen 3.5 同样为 Apache 2.0 许可。在编码相关基准测试中,Ornith-1.0 在同类参数的开放模型中实现了最优性能。Simon Willison 使用 LM Studio 运行了 35B 量化的 GGUF 版本(约20GB),并结合 Pi 工具链进行测试,发现模型能够高效执行多轮工具调用,例如在 Datasette 代码库中定位并解码特定 actor cookie 的逻辑,以及找到插入对话框的触发代码。

为什么重要

Ornith-1.0 的发布为开源编码 Agent 模型树立了新的性能标杆。其“自支架”特性意味着模型具备在复杂 Agent 工作流中自主调度和调用外部工具的能力,这直接挑战了闭源模型在代理编码领域的优势。深层意义上,DeepReinforce 选择基于 Gemma 4(Apache 2.0)和 Qwen 3.5(Apache 2.0)进行二次开发,而非从头训练,验证了高性能开源基座模型(特别是 Apache 2.0 许可的基座)可以快速催生专业的垂直 Agent 模型,这可能会加速开源生态在智能编程助手中的竞争,同时降低开发者构建私有编码 Agent 的成本和法律风险。

对用户/开发者/创作者的影响

对于开发者,Ornith-1.0 可直接在本地使用 LM Studio 等推理工具运行,无需依赖云端 API,适合处理需频繁调用工具或涉及敏感代码库的 Agent 任务。创作者可以利用其高效的文本生成能力(测试中达到 103 tokens/秒)辅助代码审查或文档生成。对于企业采购者,MIT 许可证允许商业集成和定制,但需注意虽然基座模型许可证兼容,仍需自行验证 397B MoE 版本的部署成本与收益。对 AI 应用开发者而言,该模型在工具调用连贯性上的表现降低了构建多步骤编程 Agent 的工程门槛。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,截至发布日,DeepReinforce 的公开信息有限,团队背景和后续训练计划尚不明确,需关注其是否会持续维护模型并开放更多的基准测试分数。第二,397B MoE 变体的实际推理效率、显存占用以及 Agent 任务中的极限表现尚未被充分评测,这是评估其能否替代闭源解决方案的关键。第三,随着 Gemma 4 和 Qwen 3.5 许可的完全开放,可能会有更多团队借鉴 Ornith-1.0 的“自支架”思路推出竞品,从而推动开源编码 Agent 领域的技术演进。

来源:Simon Willison

celebrityanime
celebrityanime
文章: 10436

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注