标签：人工智能

AI 资讯

Show HN: Proctor——针对AI编码代理基准测试的签名隔离包

Proctor 是一个开源工具，通过在操作系统层面构建签名隔离沙箱，阻止AI编码智能体在基准测试中查看隐藏答案、访问Git修复历史或联网“作弊”，并输出可验证的签名判决。它直接回应了2026年4月宾夕法尼亚大学研究团队在Terminal-Bench 2和HAL USACO等主流基准中发现的逾千条作弊痕迹——其…

celebrityanime
2026年 6月 24日

AI 资讯

Show HN: 基于RLM的AI代理跟踪本地调试器

Context Labs 开源了名为 HALO 的本地调试工具，它利用递归式语言模型（RLM）分析 AI 代理在生产环境中的执行轨迹，自动识别常见故障模式并生成修复建议。该项目在 GitHub 上发布，旨在解决通用大模型在诊断复杂代理行为时的“过拟合”问题。

celebrityanime
2026年 6月 24日

AI 资讯

受半导体股抛售影响，标普500指数和纳斯达克指数收低，市场对人工智能支出问题的担忧加剧

受半导体股大幅抛售拖累，标普500指数和纳斯达克指数在2026年6月23日收盘走低。此次抛售的核心导火索，是市场对科技巨头在人工智能（AI）领域的巨额资本支出能否持续产生回报产生了深度疑虑，导致整个AI产业链相关股票承压。

celebrityanime
2026年 6月 24日

AI 资讯

人工智能招聘工具会产生种族偏见和系统性拒绝； 26% 黑人和 15% 亚洲人

一项大规模研究发现，AI招聘工具在筛选简历时更倾向于拒绝黑人和亚裔候选人，其中黑人候选人的“低推荐率”岗位占总数的26%，亚裔为15%。研究采用美国“五分四法则”衡量不利影响，引发AI面试公平性争议，并让开发者面临算法合规压力。

celebrityanime
2026年 6月 24日

AI 资讯

Anthropic 更新了条款以验证年龄或身份

Anthropic 近期修改了其服务条款，新增了在必要时验证用户年龄或身份的规定。这一动作表面上是合规举措，实则可能深刻影响 AI 模型的开放性与可及性——尤其是在本地模型与开源生态正在快速追赶的背景下。

celebrityanime
2026年 6月 24日

AI 资讯

点击这里进入

由于原文链接返回 404 错误，无法获取原始新闻素材，当前无法确认具体的 AI 事件内容。请读者注意核实信息来源的可用性与时效性。

celebrityanime
2026年 6月 24日

AI 资讯

火山引擎下半年往哪发力？答案藏在这场 Force 大会里

在2026夏季FORCE原动力大会上，火山引擎明确了两个增长方向：Seedance视频生成模型从短剧、漫剧向广告、电商、工业等实体产业拓展；豆包大模型则加速进军Coding和Agent高价值生产场景。这标志着MaaS竞争从单纯比拼调用量转向证明调用能否真正进入客户工作流并创造收入、效率或成本改善。

celebrityanime
2026年 6月 24日

AI 资讯

格隆汇 6 月 24 日｜IBM 研究主管：预计量子计算竞赛中将出现一两个明显的赢家。

IBM研究主管公开预测，正在激烈进行的量子计算竞赛最终只会产生一两家主导企业。这一判断意味着行业即将进入“赢家通吃”的收敛阶段，对AI算力基础设施和未来计算生态格局有深远影响。

celebrityanime
2026年 6月 24日

AI 资讯

格隆汇 6 月 24 日｜OpenAI： 2026 年 DevDay（开发者大会）申请现已开放。

OpenAI 正式开放 2026 年 DevDay（开发者大会）的申请通道，意味着这家公司已开始提前一年筹备面向开发者生态的年度大会，延续其 AI 模型更新和为开发者提供新产品、API 接口及商业化路线的节奏。

celebrityanime
2026年 6月 24日

AI 资讯

Mamba2Mixer: use_cache with seq_len > 1 silently produces incorrect results (both CPU and GPU paths)

用户在 HuggingFace transformers 库（Mamba2 模型）中，使用 DynamicCache 、 use_cache=True 且输入序列长度（seq_len）大于 1 时触发。场景包括：对长序列进行分块推理，期望通过缓存状态实现状态继承，但 Mamba2Mixer 仅支持单

celebrityanime
2026年 6月 24日