人工智能、阿什比工程和未来

一句话看懂：一位资深工程师在 Hacker News 上发帖引发讨论：AI 编码工具（如“vibe coding”）降低了写代码的门槛，但并没有降低工程的核心成本——代码审查、沟通与规划。数据显示，非正式代码审查的纠错效果会随着每小时阅读代码量增加而消失，这意味着 AI 生成大量代码可能正在加重核心开发者的负担，而非解放生产力。

事件核心：发生了什么

这篇讨论源于程序员圈子对“AI 让代码成本归零”说法的反思。原帖提到，阿什比工程（Ashby Engineering）团队强调每个变更都要被团队充分理解，但在实践中，AI 使得效率较低的 80% 开发者也能产出大量代码，而这些代码需要由核心的 20% 开发者来审查。有一个值得注意的实证线索：在 GitHub 和 Codeberg 上通行的非正式代码审查，其对错误率的正面影响会随着审查者每小时阅读代码量的增加而消失。换句话说，代码写得太快太多，审查会变得低效甚至无效。有评论者还指出，AI 的正式引入后，客户问题数量存在约 30% 的波动，但数据仅回溯到 2025 年 1 月，且“多数 AI”与“非多数 AI”的分界线本身就不清晰，因此无法证明 AI 能稳定降低工单率——更合理的假设是：AI 在理想条件下不增加问题，但在外部压力下会放大问题。

为什么重要

这个论点直接挑战了“AI 让工程变得廉价且快速”的主流叙事。它揭示了一个结构性矛盾：AI 改变了“写代码”的分布，但没有改变“理解、验证、集成”这些核心工程约束。20% 的核心开发者被淹没在 80% 同事用 AI 生成的大量代码里，而审查效率的边际递减使得这种模式可能适得其反。当 SaaS 市场的代码成本真的趋近于零时，真正稀缺的将不是代码量，而是能做出正确技术判断和架构决策的人才。原帖作者直言，这种模式甚至不需要 AI 就可以操作——让一部分人制造混乱，另一部分人清理混乱。如果越来越多的组织在下半年因价格上涨和效率反噬而开始反思 AI 使用规模，整个 AI 工程工具的商业可行性将面临考验。

对用户/开发者/创作者的影响

对开发者：“副手模式”（sidekick mode）——由作者几个月前开始使用——被证实比“委托模式”（delegate mode）更有效：AI 作为辅助理解的工具，而不是替代思考的写代码机器。你在使用 Copilot 或 Cursor 时，真正花时间写详细 PR 描述和规格说明，会比直接让 AI 写出完整函数更有利于长期项目的健康。不要为了速度牺牲清晰度，代码审查的瓶颈不是写代码的速度，而是审查者理解代码的速度。
对团队管理者：如果团队内部存在明显的 80/20 生产力分层，急于推广 AI 代码生成工具可能会事实上把审查成本转嫁给少数核心工程师。需要建立“AI 产出必须先通过人类审查才能合入”的流程，同时控制每人每天的代码审查量上限，而不是简单依赖“AI 产出多 = 效率高”的 KPI。
对企业采购决策者：本文提供了可核查的数据局限性与逻辑推理，可以用作评估 AI 编码工具 ROI 的参考。下半年可能出现的价格上调，叠加效率上的质疑，意味着目前大规模推广 AI 编码的决策需要更审慎的实证，而不是依赖“成本归零”的流行话术。

值得关注的后续

是否有实证研究能验证“代码审查量增加导致纠错效果消失”的阈值？这直接关系到团队应如何设置 AI 代码的合入门槛。
随着主流 AI 编码工具（如 GitHub Copilot、Codeium）在 2025 年下半年的定价调整，市场上是否会出现大企业用户主动缩减使用规模的现象，如同文中所推测的那样？
基于“副手模式”和“委托模式”的对比，是否会催生新一代以“辅助理解和审查”为核心的 AI 工程工具，而非仅仅聚焦于代码生成？

来源：hackernews

人工智能、阿什比工程和未来