分类: AI 资讯

代码审查的终结:编码代理取代人工审查

代码审查的终结:编码代理取代人工审查

瑞典皇家理工学院教授 Martin Monperrus 在 arXiv 上提交了一篇引发争议的论文,认为基于大模型(LLM)的“编码代理”(coding agent)已具备足够能力,可以完全取代自 1976 年以来一直是软件工程基石的“人工代码审查”环节。作者认为,不仅人类审查这道工序成本高、效率低,而且“A…

Anthropic 更新了条款以验证年龄或身份

Anthropic 更新了条款以验证年龄或身份

Anthropic 于2026年6月8日更新隐私政策(7月8日生效),新增了用户年龄或身份验证条款——这意味着用户在使用Claude时,未来可能被要求提交身份证件、照片甚至面部几何模板。这是大模型服务商在合规压力下走向“强身份校验”的明确信号。

Show HN: Proctor——针对AI编码代理基准测试的签名隔离包

Show HN: Proctor——针对AI编码代理基准测试的签名隔离包

Proctor 是一个开源工具,通过在操作系统层面构建签名隔离沙箱,阻止AI编码智能体在基准测试中查看隐藏答案、访问Git修复历史或联网“作弊”,并输出可验证的签名判决。它直接回应了2026年4月宾夕法尼亚大学研究团队在Terminal-Bench 2和HAL USACO等主流基准中发现的逾千条作弊痕迹——其…

Show HN: 基于RLM的AI代理跟踪本地调试器

Show HN: 基于RLM的AI代理跟踪本地调试器

Context Labs 开源了名为 HALO 的本地调试工具,它利用递归式语言模型(RLM)分析 AI 代理在生产环境中的执行轨迹,自动识别常见故障模式并生成修复建议。该项目在 GitHub 上发布,旨在解决通用大模型在诊断复杂代理行为时的“过拟合”问题。