智能体最后的考试,Fable 5 竟然不敌 GPT 5.5

UC伯克利发布全新基准测试“智能体最后的考试”(ALE),要求AI在Siemens NX、Unreal Engine等专业软件中完成真实工作任务。结果,GPT 5.5以24.0%的通过率击败了Claude Fable 5(22.0%),且最难的档位几乎所有模型都得了零分。

UC伯克利发布全新基准测试“智能体最后的考试”(ALE),要求AI在Siemens NX、Unreal Engine等专业软件中完成真实工作任务。结果,GPT 5.5以24.0%的通过率击败了Claude Fable 5(22.0%),且最难的档位几乎所有模型都得了零分。

研究团队提出E-CloudBind框架,用电子密度点云替代传统原子坐标来预测蛋白-配体结合亲和力,在低分辨率结构、AlphaFold预测结构及分布外测试中均显著优于现有模型,且对坐标误差不敏感。

北京大学秦旭团队提出了一套全新的具身智能数据采集方案——通过“神经腕带+全景头环”的组合,捕捉人类在真实操作中的肌电信号与第一视角视觉,试图补上传统视频、动捕和机器人日志难以记录的关键过程:意图、发力趋势和微控制。这意味着Physical AI的训练数据正在从“看见动作”升级到“理解操控”。

美国政府援引出口管制指令,强制下架了 Anthropic 上线仅72小时的旗舰模型 Fable 5 和 Mythos 5,禁止全球所有外籍人士使用,尚属 AI 行业首次。此举意味着美国政府对前沿大模型的监管从“审查批准”演进到了“部署后强制召回”。

2026年6月12日,韶关举行的第五届粤港澳大湾区算力产业大会释放明确信号:这座粤北城市正在从“建设算力、出售机房资源”转向“运营算力、直接售卖标准化AI能力”。大会发布了Token工厂、公共算力服务平台以及“来数加工”跨境算力专区,核心变化是企业不再需要自建GPU集群,而可以像买水电一样按需购买Token服…

新通教育与36氪研究院联合发布一份聚焦AI对留学与就业影响的白皮书,为计划出国留学或面临职业转型的群体提供数据与趋势参考。

国产GPU厂商摩尔线程宣布完成对MiniMax最新旗舰模型M3的适配。这意味着国产大模型在国产算力芯片上迈出了关键一步,对AI应用的成本控制和供应链安全有直接意义。

针对高考志愿填报季的普遍焦虑,五位来自AI创业、影视、大厂开发、金融科技、法律等领域的从业者用自身经历和行业观察给出判断——专业不再是“护身符”,AI正在快速贬值重复执行和信息差类的技能,真正重要的是思维能力和复合能力。

Snowflake 通过其 Cortex AI 平台,正在将视频、音频、图像等非结构化媒体数据转化为可查询的结构化智能,这意味着企业 AI 分析的重点将从“文本”转向“氛围”与“情绪”,并且可以直接在数据仓库内完成,无需额外迁移数据或管理基础设施。

AI 正在将原本高成本、高门槛的针对性网络钓鱼改造为可批量、自动化的工业级威胁。《2025 年微软数字防御报告》数据显示,AI 生成的钓鱼邮件点击率(54%)是传统方式(12%)的 4.5 倍,攻击收益最高可提升 50 倍。攻击者正在用大模型、语音合成、深度伪造等技术,复制原先需要人工数周完成的侦察、画像、内…