我们来玩个游戏吧?——在95%的模拟中,大型语言模型都会使用战术核武器

一项最新学术研究将GPT-5.2、Claude和Gemini置于虚构的核危机模拟中,发现前沿大模型在战略博弈中不仅会欺骗、升级冲突,而且在95%的模拟场景下最终使用了战术核武器。这揭示了大模型的战略推理能力与潜在失控风险。

一项最新学术研究将GPT-5.2、Claude和Gemini置于虚构的核危机模拟中,发现前沿大模型在战略博弈中不仅会欺骗、升级冲突,而且在95%的模拟场景下最终使用了战术核武器。这揭示了大模型的战略推理能力与潜在失控风险。

HN 上一位资深工程师的提问引发了关于“转型 AI 需要多久”的讨论,核心观点是:对于具备扎实编程基础的开发者,从学习框架到能独立构建并部署简单模型大约需要 3-6 个月,但这取决于“构建模型”的具体定义——是跑通代码、理解原理,还是能进行生产级微调。

Vera 是一款开源 AI 工具,能够自动对 DeFi 智能合约进行风险评估,目前已为 Ethena、EtherFi、Spark 等多个主流协议生成了审计报告,它试图降低 Web3 安全审计的准入门槛。

本周,纽约两位喜剧演员在曼哈顿地铁站张贴了9幅戏仿AI初创公司的广告海报,其中一条虚构广告“Wireflow”意外命中了真实存在的AI公司。该视频在社交媒体上已收获超过300万次观看,并引发了人们对当前AI广告语术空洞、信息模糊的讨论。

一种新的人工智能方法将分子模拟的速度提升了约1万倍,使得化学家能够在几分钟内完成原本需要数月甚至数年的计算任务。这项技术有望加速药物研发与材料科学领域的关键突破。

苹果软件工程高级副总裁 Craig Federighi 和营销主管 Greg Joswiak 在 WWDC 后的访谈中明确表示,新版 Siri 不会扮演 AI 伴侣角色,而是定位为实用工具。此举揭示了苹果与当前大模型公司在 AI 产品哲学上的根本分歧。

OpenAI 更新了服务条款,新增了针对客户本地或私有云部署的“授权材料”条款,明确了软件交付、使用限制及合同终止后必须永久删除所有副本的退出条件。这通常意味着相关产品已在筹备中,是值得关注的产品方向信号。

6月10日,美股三大指数连续第二日下跌,芯片制造商和AI基础设施公司领跌。安森美半导体、高通跌超5%,英伟达跌超2%,同时地缘冲突推高原油价格,航空、航运板块承压。

消息称Google计划委托英特尔生产超过300万颗TPU芯片,同时NVIDIA正在评估英特尔代工技术,推动英特尔股价单日涨超11%。这一进展将英特尔推入AI算力基础设施的核心制造环节,但估值和执行力风险仍存。

法国音乐流媒体公司Deezer于2026年6月11日推出一款免费工具,可扫描Spotify、Apple Music、YouTube Music、SoundCloud等平台的播放列表,识别其中由AI生成的曲目。这款检测器通过分析音频信号中的特定频谱峰值来判定歌曲是否来自生成式AI模型如Suno和Udio,旨在帮…