让克劳德成为一名化学家

Hacker News 上的一篇讨论揭示了 AI(如 Claude)在化学合成规划中的能力与巨大局限——写出合成路线只占实际工作的10%,从理论到实验室操作之间存在着 AI 目前难以跨越的鸿沟。

Hacker News 上的一篇讨论揭示了 AI(如 Claude)在化学合成规划中的能力与巨大局限——写出合成路线只占实际工作的10%,从理论到实验室操作之间存在着 AI 目前难以跨越的鸿沟。

毕马威(KPMG)因一份关于“智能体 AI”的报告被瑞银、英国国民医疗服务体系、瑞士联邦铁路和伦敦交通局等机构指认内容造假,被迫撤回报告。AI 检测公司 GPTZero 指出,这些错误源于 AI 生成的“幻觉”内容。

Meta 通过强制抽调约 6500 名工程师和产品经理组建应用人工智能团队,并要求员工编写测试题和编程习题来训练 AI 模型,引发了大规模内部不满,甚至出现员工闯入直播公开斥责高管的事件。这反映出科技巨头在 AI 转型过程中面临的内部管理挑战与人才冲突。

一位开发者利用即将停服的 AI 游戏平台《Fable》,在极短时间内使用 AI 辅助生成了 80 款风格各异的迷你游戏,并打包发布为 MiniGames World。这件事不仅展示了 AI 在快速原型化和游戏内容生成上的潜力,也侧面揭示了依赖单一 AI 平台构建产品的风险。

开发者 Zohar Babin 发布了一个名为“web-researcher-mcp”的开源 AI 工具,能让 Claude 等 AI 助手在用户指定的可信网站(如 PubMed、SEC、arXiv)内进行搜索和全文阅读,并将所有搜索结果附上真实可点击的链接与 APA/MLA 格式引用——旨在解决当前 AI…

智谱发布其迄今最强开源模型GLM-5.2,支持真实可用的1M超长上下文,今晚已面向GLM Coding Plan用户开放,API下周上线,模型将按MIT协议开源;同时,Suno升级音轨分离技术,直接从零生成纯净音轨。

追觅生态品牌 Eclix 计划在 2026 年 9 月发布一款彻底去掉传统 App 入口的 AI 手机,定价 5000 元以上,直接以 AI Agent 作为系统交互核心。同时,月之暗面 Kimi 与一家国有银行合作推出全球首张 AI 原生信用卡,将消费积分直接兑换为 AI 算力额度。这两件事分别从终端硬件和…

四大会计师事务所之一的毕马威(KPMG)撤回了2025年10月发布的一份关于企业AI使用情况的报告,原因是报告中被指存在大量由AI幻觉引发的错误信息。UBS、英国国家医疗服务体系(NHS)等机构均公开否认报告中对它们AI使用情况的描述。

四大会计师事务所之一的毕马威(KPMG)于2026年6月撤回了其在2025年10月发布的一份关于AI应用的报告,原因是多家机构指出报告中的描述不实。研究机构GPTZero判定这些不准确信息源于AI“幻觉”,意味着毕马威可能在使用AI工具撰写关于AI的报告时,未能有效验证AI生成的内容。

独立开发者 Tomasz 在 Hacker News 上发布了一款名为 Verso 的 Mac 原生文字处理软件,主打“一次购买、永久使用”,定价 14.99 美元,并提供 7 天免费试用。这款软件在“功能过多”与“订阅制泛滥”的写作工具市场中,试图用极简设计和买断制重新捕获对成本敏感、追求专注的写作者。