
Anthropic 被曝雇 1000 名人类工程师训练 Claude Code,每项任务 280 美元
一句话看懂:Anthropic 被曝通过数据标注公司 Snorkel AI,雇佣约 1000 名人类软件工程师,以每项任务 280 美元的报酬,人工微调其编程助手 Claude Code 的代码输出质量,旨在让模型生成更简洁、更易于维护的代码。
事件核心:发生了什么
据 Business Insider 报道,Anthropic 正在推进一个代号为“Marlin”(马林鱼)的内部项目。该项目由数据标注公司 Snorkel AI 执行,核心是通过 1000 名具有软件工程背景的外包人员,对 Claude Code 进行精细化训练。具体操作是:外包人员需对两个不同模型生成的代码进行 A/B 测试,比较输出结果,选择更优答案,并判断模型是否达到了提示词要求的详细程度。每项任务报酬为 280 美元(约合 1902 元人民币),通常需要约一小时完成,部分提交内容需与 Snorkel 的审批层进行多轮沟通。外包人员并不知道自己所评估的是哪个版本的模型。该项目目前仍在进行中。
为什么重要
这一事件暴露了当前顶级 AI 编程工具训练过程中的一个关键秘密:即使在 AI 辅助编程热潮席卷的当下,大规模人类工程师的高价介入依然是提升模型“代码基因”的重要手段。Anthropic 没有完全依赖自动化数据合成,而是选择投入真金白银让一线开发者对输出进行人工评审和微调。这反映出:
1. 训练壁垒高企:训练出一个好用、稳定、符合专业开发者预期的编程助手,不仅需要强大的基座模型,还需要大量领域专家参与的标注和反馈数据,这构成了一道极高的竞争护城河。
2. 与竞品拉差距:在 OpenAI、谷歌 Gemini 等竞品纷纷抢占编程市场时,Anthropic 通过这种“重人工”的精细微调,意图让 Claude Code 在代码质量、可维护性等长期运维维度上形成差异化优势。
3. 人类标注成本仍在上升:每项任务 280 美元的高单价说明,AI 公司为了对齐专业开发者的使用偏好,愿意付出远比普通数据标注高昂的代价。
对用户/开发者/创作者的影响
对于正在使用或评估编程助手的开发者与团队而言,这一消息意味着:
1. 代码质量可能获得实质性提升:通过对大量真实开发场景的 A/B 测试和人工筛选,Claude Code 未来的输出将更贴近“更简化、更易于维护”的工程师偏好,这对长期项目维护和代码可读性有潜在正面影响。
2. 市场选择需更关注精准度:如果 Anthropic 的这一训练策略成功,Claude Code 在与 GitHub Copilot、其他基于大模型的编程工具竞争时,可能在代码简洁性和细节准确性上更胜一筹。开发者可以关注其后续的实际性能测试对比。
3. 使用体验可能持续优化:由于人类工程师直接参与了提示词层面的审查,未来 Claude Code 对复杂提示的解析能力和执行准确性有望提升,减少“AI 写出的代码无法直接使用”的情况。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
目前公开信息显示,该项目背后的公司关系、定价和产品上线时间仍有待明确。建议关注以下观察点:
1. 产品落地与定价:经过“Marlin”项目微调的 Claude Code 版本何时正式发布,其订阅价格是否会因此高于竞品?
2. 竞品跟进:OpenAI、谷歌等公司是否会采取类似的大规模人工微调策略,从而引发新一轮的编程模型训练军备竞赛?
3. 开发者生态反馈:最终商用版本上线后,来自真实用户(尤其是大型企业开发团队)的反响如何,是否确实减少了代码中的安全隐患和低效冗余?
来源:Readhub · AI


