
IJCAI 2026|基于口袋增强的底物特异性酶设计
一句话看懂: 研究人员在 IJCAI 2026 上提出了 EnzyPGM,一种将“底物结合口袋”作为生成中心条件的酶设计模型,在 84,336 组酶-底物样本上训练后,生成的酶在结合亲和力上比现有最佳方法降低了 0.47 kcal/mol(即结合更紧密),标志着 AI 酶设计从“生成一个稳定的蛋白质”进入“围绕特定底物设计催化环境”的阶段。
事件核心:发生了什么
来自中国的研究团队(Zefeng Lin 等)提出了 EnzyPGM(口袋条件生成模型用于底物特异性酶设计)。该模型不再将“结合口袋”作为生成后的质量评估指标,而是将其纳入生成过程的约束条件。其核心包含两个模块:Residue Function Fusion(RFF)用于注入酶功能先验信息(如 EC 编号和保守位点),Residue-atom Bi-scale Attention(RBA)则显式建模口袋残基与底物原子之间的空间和化学匹配关系。研究同时发布了 EnzyPock 数据集,包含覆盖 1,036 个 EC 功能家族和 17,404 个 PDB 条目的 84,336 组样本。在测试中,EnzyPGM 的 Vina score(结合能评分)达到 -7.12,相比 EnzyGen 提升了 0.47 kcal/mol,并且在未见过的酶家族和底物上仍能维持 pLDDT 75 以上的结构置信度。
为什么重要
传统酶设计方法,包括近年来的蛋白质扩散模型,更擅长生成与天然蛋白质相似的整体结构,但对于“这个酶能否结合并转化给定的底物分子”这一核心功能问题,缺乏细粒度的建模。EnzyPGM 的意义在于,它把“口袋-底物”相互作用从后验验证变量转变为生成条件变量。这种范式改变直接影响了 AI 酶设计的实用化进程:对于生物制造、药物合成和绿色催化等需要针对特定底物设计催化剂的场景,模型需要理解的不是“如何生成一个蛋白”,而是“如何生成一个能容纳和稳定目标底物的局部环境”。该工作显示,显式建模口袋-底物原子级别的相互作用,能够在保持整体结构合理性的同时,显著提升底物特异性结合能力。
对用户/开发者/创作者的影响
对于从事合成生物学和酶工程的研究人员,EnzyPGM 提供了一个新的生成工具:输入目标底物分子、希望催化的反应类型(EC 编号)以及已知的功能保守位点,即可获得候选酶序列和结构。相比依赖定向进化的湿实验筛选,这种方法有望大幅减少前期筛选工作量。对于 AI 模型开发者,该工作展示了一个关键工程选择:将多模态信息(序列、结构、底物分子、功能注释)融合到一个统一的生成框架中,并利用双尺度注意力机制处理跨模态的细粒度匹配。此外,EnzyPock 数据集的公开(论文称后续发布)将为后续研究提供标准化的训练和评测基准,降低入门门槛。
值得关注的后续
第一,代码和数据集的开源时间与质量,这将决定该工作能否被社区快速复现和改进。第二,在真实湿实验验证中的表现:目前的评估指标为计算模拟的 Vina score 和 pLDDT,而酶在溶液中的实际催化活性与选择性需要实验验证,这是从“计算合理”到“功能可用”的关键一步。第三,是否会出现竞品模型采用不同的技术路线(如基于扩散模型的直接口袋生成),从而引发该方向的技术路线竞争。
来源:Readhub · AI


