AI+ 化学论文 | Nature Machine Intelligence 2026 | CoCoGraph:当图扩散遇到化学价键约束

一篇发表在《Nature Machine Intelligence》上的论文,提出了一种名为 CoCoGraph 的图扩散模型,通过将化学价键约束“焊死”在扩散过程中,实现了100%的分子生成化学有效性,同时参数量仅为同类模型的十分之一。这项研究提供了一个“硬约束前置”的设计范例,大幅提升了分子生成的效率与质…

AI+ 化学论文 | Nature Machine Intelligence 2026 | CoCoGraph:当图扩散遇到化学价键约束

一句话看懂:一篇发表在《Nature Machine Intelligence》上的论文,提出了一种名为 CoCoGraph 的图扩散模型,通过将化学价键约束“焊死”在扩散过程中,实现了100%的分子生成化学有效性,同时参数量仅为同类模型的十分之一。这项研究提供了一个“硬约束前置”的设计范例,大幅提升了分子生成的效率与质量。

事件核心:发生了什么

罗维拉维尔吉利大学与ICREA的研究团队开发了CoCoGraph(协作约束图扩散模型),其创新点在于重构了图扩散的噪声过程:不再像传统方法那样随机“加噪-去噪”,而是采用“双边缘交换(DES)”操作,在保持每个原子化合价不变的前提下,在分子连接空间中翻滚。这确保了从扩散轨迹的第一帧到最后一帧,所有分子都天然满足价键规则。配合一个63K参数的轻量“时间模型”来动态优化去噪进度,CoCoGraph的Base版本(仅534K总参数)在GuacaMol基准上取得了95.7%~96.3%的分布匹配(KL散度)得分,并实现了100%的化学有效性。团队还基于此模型生成了820万个新分子,并组织121位化学专家进行“图灵测试”,结果显示专家判断真实分子与生成分子的全局准确率仅为62%,略高于随机水平。

为什么重要

这项工作的核心意义在于验证了一条被低估的技术路线:将领域内的物理硬约束(如化合价)设计进生成过程的底层结构,而非依靠庞大模型去“学习”避免非法输出。这直接带来了参数效率的飞跃和100%的可靠性。对于AI化学社区,它意味着“什么样的噪声过程”可能比“网络多深”更决定模型上限。对行业而言,这意味着在药物发现、材料设计等场景中,开发者可以信任模型输出,免除昂贵的后期过滤与重采样循环,从而大幅提升高通量虚拟筛选的效率。同时,CoCoGraph的DES技术可自然拓展到基于分子核心的局部编辑(Inpainting),为药物先导化合物优化提供了一个即插即用的可控采样工具。

对用户/开发者/创作者的影响

对于从事分子生成、药物设计的研究者和开发者:CoCoGraph证明了只要噪声过程设计得当,小模型也能在合法化学空间内高效探索。如果你正在使用VAE/GAN或传统图扩散模型,这意味着有机会用更少的算力(单张4090 GPU即可运行)和更简单的架构,获得更可靠的、即产即用的分子结构。对于A for Science的工具开发者:该工作的“双模型协作”架构(主力扩散模型+轻量时间状态估计器)是一个可复用的设计模式,可用于其他存在组合约束的生成任务。对于企业采购方:当评估生成模型时,“100%化学有效性”应被看作一项硬性指标,而非可容忍的加分项——CoCoGraph的模式降低了采购集成后的二次开发成本。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,该方法能否平滑迁移到更大的化学空间(如包含反应中间体、配合物或结晶形态)?DES操作对特定环状结构是否有局限,作者尚未在文中完全展开。第二,其公开的820万分子数据库(Zenodo: 10.5281/zenodo.18939448)是否会成为社区新基准?第三,从研究到工业应用,CoCoGraph的模型是否会被打包成API或Python库供云平台调用?考虑到其极低参数量,本地化部署和在线推理的壁垒已经相当低。最后,人类专家盲测62%的准确率,提示“AI生成的分子”已逼近真实化学空间的模糊边界,这将对专利审查策略产生长期影响,值得关注后续监管与法律界讨论。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 9045

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注