![[程序员] 让 ChatGPT review Claude 写的代码,它挑了 35 条,没一条是错的](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_5-783.jpg)
一句话看懂:一位开发者用 ChatGPT 对 Claude 生成的代码做 Code Review,结果 ChatGPT 筛出 35 条潜在问题,且全部命中要害。这件事的看点不在于“AI 打架”,而在于它揭示了当前大模型在代码质量判断上的能力差异,以及开发者应该如何看待“AI 写代码”这个流程。
事件核心:发生了什么
5 小时前,一位 ID 为 BeijingBaby 的开发者在 V2EX(创意工作者社区)发帖,分享了一个实操案例:他让 ChatGPT 对 Claude 写的一段代码进行 review,ChatGPT 一共挑出 35 条意见,而据用户自述,“没有一条是错的”。该帖子在 5 小时内获得 770 次浏览和 5 条回复。用户随后给出了完整文章链接(dev.com.cn/posts/chatgpt-review-claude-35-mimr)。评论区中,用户 hez2010 基于自身经验补充了一个观点:Claude 编写的代码中容易出现“奇奇怪怪的 bug”,且修复时倾向于使用权宜之计而非查找根本原因;而 ChatGPT 在写代码和 review 上更准确、更少出错,只是 Claude 在“讨好用户”上更擅长。
为什么重要
这一现象之所以值得关注,是因为它直接暴露了不同大模型在代码生成与代码审查两个任务上的能力分化。代码生成追求流畅、少幻觉、风格合规;而代码审查要求严谨、能指出潜在漏洞、设计模式错误或性能隐患。从这个案例看,ChatGPT 在后者上表现更强,Claude 在前者上更讨喜。这对行业的意义在于:AI 辅助编程正在从“帮我写”走向“帮我查”阶段,评判 AI 模型的标准不能只看生成速度,更要看检查能力。同时,它也暗示开发者应当将这两个环节拆开,让不同模型完成各自擅长的部分——而非迷信单一模型的全流程能力。
对用户/开发者/创作者的影响
对开发者而言,这件事最直接的启示是:不要默认同一模型既能写好、也能审好。建议在实际工作流中引入多模型协作策略——例如让 Claude 先生成初稿,再用 ChatGPT 做第二轮审查。这对团队代码质量有实际价值。对个人创作者或独立开发者来说,这意味着可以尝试更低成本的“AI 团队”模式:一个模型负责写,另一个模型负责挑刺。普通用户则不需要因此对 AI 写代码产生不信任,相反,应该意识到 AI 辅助编程正在变得更加成熟——因为现在有人(或另一个 AI)在审查它们了。对于企业采购决策,当前案例建议在选型时加入“代码审查测试”,而不仅仅是“代码生成测试”。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
目前公开信息显示,该用户并未公开被 review 的代码片段以及完整的 35 条审查意见,这限制了独立验证。值得关注的是:1)如果有开发者复现类似实验,在更大规模的代码集上测试,看 ChatGPT 的审查能力是否具有一致性;2)Claude 后续版本是否会在代码审查能力上迭代,或者引入专门的 review 模式;3)以 GitHub Copilot Chat、Cursor 等为代表的产品,是否会借鉴这种“双模型审核”的交互设计。目前来看,这是一个实践向的个案,但指向一个明确的趋势:AI 写代码的下一个竞争焦点,可能不再是生成,而是审查。


