黄仁勋说的Physical AI,被这家中国跨界选手带进了生命科学实验室

华大智造子公司涌生智能与上海人工智能实验室联合发布了ProtoPilot多智能体系统和BioLab Bench评测体系,首次让AI从“写实验方案”真正走向“在实验室动手做实验”。在第三方基准测试中,ProtoPilot在开放式问答上得分52.38%,超越OpenAI最强旗舰GPT-5.6 Sol的43.5%…

黄仁勋说的Physical AI,被这家中国跨界选手带进了生命科学实验室

一句话看懂:华大智造子公司涌生智能与上海人工智能实验室联合发布了ProtoPilot多智能体系统和BioLab Bench评测体系,首次让AI从“写实验方案”真正走向“在实验室动手做实验”。在第三方基准测试中,ProtoPilot在开放式问答上得分52.38%,超越OpenAI最强旗舰GPT-5.6 Sol的43.5%,逼近人类专家水平(54%)。这意味着,AI在生命科学领域首次实现了从自然语言实验意图到湿实验物理执行的完整闭环。

事件核心:发生了什么

2026年7月3日,涌生智能和上海人工智能实验室联合推出了两项成果:一是自进化多智能体系统ProtoPilot,二是全链路Agent评测体系BioLab Bench。ProtoPilot通过三个协同Agent(Orchestrator、Protocol Expert、Coding Agent),解决了过去AI for Bio领域的三大难题:实验需求模糊、方案写得好但跑不通、缺乏反馈闭环。在ProtocolQA基准测试中,ProtoPilot开放式问答得分52.38%,非开放式问答得分85.18%,均显著高于GPT-5.6 Sol(分别为43.5%和未超越专家水平)。在代码转化和设备执行环节,ProtoPilot的Gate Pass Rate达到96.6%,而第二名LabScript-AI仅为64.6%,GPT-5.5仅为17.7%。跨设备迁移测试中,在MGI AlphaTool等四个主流平台上通过率波动仅5.9个百分点,远低于LabScript-AI的47.1个百分点。

为什么重要

此前,AI在生命科学领域的应用集中在“理解”和“分析”层面,如文献阅读、蛋白质结构预测等。即使OpenAI与Ginkgo Bioworks的合作,模型也只负责实验设计,实际执行仍由人工编写。ProtoPilot第一次补上了从方案到物理执行的完整链条,使得AI for Bio的竞争核心从“模型能否回答问题”转向“模型能否在真实设备上完成实验”。这不仅证明了Physical AI在生命科学实验室的可行性,也展示了中国团队在跨界整合底层设备、场景数据和模型能力上的独特优势——涌生智能提供自动化实验平台和湿实验验证,上海人工智能实验室提供大模型基础与评测标准。

对用户/开发者/创作者的影响

对于生命科学领域的研究人员和生物技术企业,这意味着可以直接用自然语言描述实验意图(如“构建8个GLuc突变体”),系统会自主生成可执行的实验方案并驱动设备完成操作,大幅降低实验门槛和人力成本。对于AI开发者,ProtoPilot提供了从实验意图到设备代码的完整技术路径参考,BioLab Bench则首次定义了全链路评测标准,可用于验证自身Agent系统的真实执行能力。目前公开信息显示,该系统已支持MGI AlphaTool、Hamilton STAR、OpenTrons OT-2、Tecan EVO四个主流自动化平台,具备跨设备通用性。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,ProtoPilot是否会开放API或提供云端/本地部署方案?这直接影响生物企业能否将其快速接入现有实验室流程。第二,竞品(如OpenAI的GPT-Rosalind、谷歌的Co-Scientist)是否会跟进湿实验物理执行,推动行业标准形成。第三,该系统在不同设备上的实际运行稳定性、以及专家湿实验反馈闭环的迭代速度,将决定其是否能从“59%的任务通过率”进一步接近100%实用。

来源:量子位 · 每日最新

celebrityanime
celebrityanime
文章: 11243

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注