北大董豪谈具身大模型演进趋势:从模仿到强化、从单任务 Scaling 到通用 Scaling

北大董豪教授总结了具身智能从“模仿+强化”到“多任务通用”的技术演进路径,并提出“任务数量-数据量”的新 Scaling Law,为家用和通用机器人指明方向,其中大多数家务任务的容错性决定了其商业化落地可能比自动驾驶更快。

北大董豪教授总结了具身智能从“模仿+强化”到“多任务通用”的技术演进路径,并提出“任务数量-数据量”的新 Scaling Law,为家用和通用机器人指明方向,其中大多数家务任务的容错性决定了其商业化落地可能比自动驾驶更快。

针对近期网络流传的“阿里合伙人周靖人拟离职”消息,阿里巴巴集团于6月14日正式辟谣,称该传闻为谣言,并指出有人故意组织扩散。此时距离周靖人刚被任命为阿里巴巴首席科学家并牵头成立AI未来研究院仅过去6天。

全国一体化算力网正在加速建设,旨在让算力像水电一样随取随用。新闻联播报道显示,这一工程已带动数据中心密集开工、光纤网络沿高铁线大幅扩容,并将催生百万量级就业岗位。

用户在使用 Langfuse 自托管部署(Enterprise Edition)时,配置了 LLM-as-a-Judge 评估器,并设置为在实时传入的 GENERATION 类型观察上运行。当应用追踪中包含多个 GENERATION 观察时,评估器对每一个目标观察都创建了两个分数记录,而不是预期的单

用户在自托管 Langfuse 环境中,通过 Google AI SDK 调用 gemini-2.5-flash 模型,并在生产环境下发现 Langfuse 追踪的成本与 Google Cloud 账单中的实际支出存在显著差异。

2026年6月13日,新通教育与36氪研究院联合发布《AI时代留学就业白皮书》,首次提出面向2030年的'CORE'能力模型和'专业分区图谱',将AI对就业的影响从'技能替代'讨论推进到'能力重构'层面,并基于134家企业的调研数据,揭示了企业招聘逻辑正从看名校标签转向考核人机协同、共情韧性等内核能力。

Anthropic 发布的旗舰模型 Claude Fable 5 与 Mythos 5 因被美国政府发现可用于网络攻击的越狱漏洞,在要求修复时遭 CEO 拒绝,最终被实施出口管制封禁。Anthropic 已开启退款通道,但事件背后暴露了其对自身 AI 安全定位的背弃,以及大股东亚马逊的特殊立场。

谷歌DeepMind联合创始人发布长达57页的报告,正式提出“AGI已过时”,并详细推演出从AGI到ASI(超级智能)的路线图——核心判断是,即使单个模型能力停滞,靠算力堆出一亿个普通人水平的AI,其群体智能本身就是ASI。

Hacker News 上的一篇讨论揭示了 AI(如 Claude)在化学合成规划中的能力与巨大局限——写出合成路线只占实际工作的10%,从理论到实验室操作之间存在着 AI 目前难以跨越的鸿沟。

OpenAI 的 GPT-5.5、GPT-5.4 及编码智能体 Codex 已通过 AWS Bedrock 平台开放使用,企业无需新增供应商关系即可在 AWS 的治理框架内调用 OpenAI 模型。这是 OpenAI 与微软云独家合作松动后,首个跨平台分发的重要落地动作。