Kimi K2.7-Code:一种具有更高令牌效率的开源编码模型

Kimi 团队开源了专注于编程的智能代理模型 Kimi K2.7-Code,相比前代 K2.6,它在真实世界的长周期编码任务上表现更强,同时将思维令牌(thinking-token)消耗降低了约 30%,提升了令牌效率。

Kimi K2.7-Code:一种具有更高令牌效率的开源编码模型

一句话看懂:Kimi 团队开源了专注于编程的智能代理模型 Kimi K2.7-Code,相比前代 K2.6,它在真实世界的长周期编码任务上表现更强,同时将思维令牌(thinking-token)消耗降低了约 30%,提升了令牌效率。

事件核心:发生了什么

据 Hugging Face 页面发布的信息,Kimi K2.7-Code 是基于 K2.6 架构优化而来的编码代理模型。该模型采用混合专家(MoE)架构,总参数量为 1T,每个 token 激活参数 32B,支持 256K 上下文长度。在评测数据中,K2.7-Code 在多个编码和数据科学基准上优于前代 K2.6,例如在内部基准 Kimi Code Bench v2 上得分为 62.0(K2.6 为 50.9),在 MLS-Bench Lite 上为 35.1(K2.6 为 26.7)。在代理使用方面,MCP-Atlas 得分为 76.0(K2.6 为 69.4),MCP-Mark-Verified 为 81.1(K2.6 为 72.8)。该模型已开源,支持通过 Moonshot AI 平台以 API 形式调用,并推荐在 vLLM、SGLang 和 KTransformers 推理引擎上部署。

为什么重要

此次更新聚焦于两个行业痛点:长周期软件工程任务的端到端完成能力,以及计算效率。相较于盲目扩大参数规模,Kimi K2.7-Code 在思维令牌上减少了约 30% 的消耗,意味着在资源成本不涨的前提下实现了智能层的进步。这对开源生态是一种信号:代理型编码模型正从“能回答”走向“能完成复杂任务”,同时模型设计者开始更关注推理环节的 token 经济性。在闭源领域 GPT-5.5 和 Claude Opus 4.8 表现依然全面领先的背景下,Kimi 团队通过持续提升开源模型的基准表现,维持了在编码智能体赛道上的竞争身位。

对用户/开发者/创作者的影响

对于开发者而言,K2.7-Code 的直接利好是令牌效率更高,意味着在同等推理预算下可以完成更多的代码生成与调试迭代。对于使用代理工具的工程师,模型在 MLS-Bench 和 MCP 类基准上的进步说明其在自动开发、工具调用和多步骤项目推进上更可靠。开源部署的特性让企业更能掌控数据和成本,尤其适合长期运行的生产环境搭建。目前公开信息显示,K2.7-Code 采用与 K2.6 相同的架构,企业用户可以复用原有部署方案,不需要额外适配成本。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,Kimi 团队是否会为 K2.7-Code 推出轻量量化版本或更低成本的服务套餐,这将直接影响中小团队的使用门槛。第二,其他开源模型如 Qwen2.5-Coder 或 DeepSeek-Coder 是否会在编码代理任务上快速跟进优化工具链和端到端工作流。第三,K2.7-Code 在社区中的真实使用反馈与基准之间是否存在差异,特别是令牌节省在实际重编码任务中是否可持续。

来源:huggingface.co

celebrityanime
celebrityanime
文章: 7159

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注