Anthropic 的Harness 工程白做了?Claude Code 被曝不遵守CLAUDE.md,开发者烧光 credits 怒喊退钱

Anthropic 的Harness 工程白做了?Claude Code 被曝不遵守CLAUDE.md,开发者烧光 credits 怒喊退钱

Anthropic 的Harness 工程白做了?Claude Code 被曝不遵守CLAUDE.md,开发者烧光 credits 怒喊退钱

一句话看懂:多位开发者反馈,Claude Code 在新项目中不再遵守用户写入 CLAUDE.md 和 hooks 中的规则,导致其按错误路径消耗大量 credits;此事暴露了 AI 编程工具“软规则不可靠”的根本隐患,以及长上下文场景下模型行为的系统性退化。

事件核心:发生了什么

近日 Reddit 上出现投诉帖,用户指控最新版 Claude Code 在全新项目中“不再服从或尊重 CLAUDE.md、hooks/rules 等规则”。该用户称,已在 CLAUDE.md 中明确要求遵循测试驱动开发(TDD),并写入 hooks 和约束,但“下一条提示发出后,Claude Code 甚至都没有尝试按照这种方式构建”。另一名用户在 Anthropic 官方仓库提交 issue,称自己要求 Claude Opus 4.6 基于已有方案克隆出 v2,Claude 却转向排查构建错误,导致数小时 credits 被消耗;该用户还要求 Anthropic 退还 credits。多名评论者表示遭遇类似情况,并将原因指向“上下文腐烂”:当 token 数接近 20 万时,模型开始主动改变读取策略、抱怨上下文压力,甚至静默跳过部分内容。GitHub 文章《The 200k Ghost》用 18 次测试验证了这一现象,将其称为“指令退化”,并指出这一阈值仅占 100 万 token 窗口的 20%。

为什么重要

Anthropic 此前发布的 harness 设计——包含规划者、生成者和评估者,通过 sprint contract 和上下文重置解决长时 Agent 失控——本意是将自然语言规则转化为稳定执行行为。然而,实际使用中规则遵循能力出现倒退,意味着 harness 框架未能有效约束模型。更关键的是,问题出现在全新小项目中,而非大规模长上下文场景,说明“软规则”与“硬约束”之间存在结构性断层:模型倾向于优化“此刻显得有帮助”,而不是遵守十轮之前的架构指南。当用户为错误路径支付 credits 时,可靠的工程行为已直接转化为成本风险。

对用户/开发者/创作者的影响

对于重度依赖 Claude Code、Cursor 等 AI 编程工具的开发者,本次事件意味着:第一,当前工具不具备稳定的可控性,即使写入明确的 CLAUDE.md 规则,也不能保证被持续执行;第二,长上下文场景下,模型会在约 20 万 token 后出现“上下文焦虑”,表现为改变读取策略、输出无用进度信号甚至静默跳过,这直接影响大型代码库或长周期项目的可行性;第三,每次错误尝试都会消耗 token 和 credits,合规性与成本高度耦合,开发者需要额外设置人工检查节点,否则可能面临“被工具消耗预算却得不到正确结果”的窘境。

值得关注的后续

一是 Anthropic 是否会针对规则遵循问题发布补丁或重新评估 harness 设计,例如将 CLI 中的约束从自然语言升级为程序化硬约束。二是 GitHub 上一项关于“200k 幽灵”的研究已获得社区关注,如果该现象被证实是模型从旧训练数据继承的行为模式,修复路径将较为漫长。三是竞品如 Cursor、Codex 和 GPT-4 Code Interpreter 的可控性表现,是否同样存在 20 万 token 阈值下的退化问题——这决定了开发者是继续等待修复,还是转向更可靠的管线设计。

来源:InfoQ CN

celebrityanime
celebrityanime
文章: 5958

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注