Site4Drug:用 AI 智能体解决药物靶点发现的上游瓶颈

来自加州大学伯克利分校与密歇根大学的研究者在 ICML 2026 研讨会上发布了 Site4Drug——一个无需蛋白质三维结构、仅凭氨基酸序列即可预测药物结合位点的 AI 智能体系统,为解决药物发现流程中“位点选错”这一隐性瓶颈提供了可审计的自动化方案。

Site4Drug:用 AI 智能体解决药物靶点发现的上游瓶颈

一句话看懂:来自加州大学伯克利分校与密歇根大学的研究者在 ICML 2026 研讨会上发布了 Site4Drug——一个无需蛋白质三维结构、仅凭氨基酸序列即可预测药物结合位点的 AI 智能体系统,为解决药物发现流程中“位点选错”这一隐性瓶颈提供了可审计的自动化方案。

事件核心:发生了什么

Site4Drug 提出了一种全新范式:将药物靶点区域选择重新定义为“约束优先、证据整合”的决策问题,而非依赖专家直觉。系统输入仅为蛋白质氨基酸序列(无需 PDB 三维结构),输出包含推荐结合模态(抗体表位或小分子口袋)、候选区域排名及完整审计日志。其核心由两个模块构成:一是证据聚合引擎,从序列中自动提取粗粒度拓扑与疏水性剖面、PTM 修饰掩码、功能基序命中与半胱氨酸代理等三类信号;二是多智能体专家评审面板(BioAgent、ChemAgent、RiskAgent 与 DecisionAgent),对候选区域进行二次审裁并输出标准化风险标记。实验采用自行构建的 89 个多模态数据集进行验证:在小分子口袋预测任务(n=63)中,Site4Drug 无需任何结构信息即达到 31.7% 的 Top-1 显著命中率,与依赖 AlphaFold3 预测结构的经典工具 fpocket 表现相当;对照实验中,若去除所有证据信号退化为纯序列投票,命中率骤降至 4.8%。所有代码已在 GitHub 开源。

为什么重要

当前主流药物发现工具(如 BoltzGen、DrugCLIP)均要求用户预定义结合位点,但位点选择这一步骤几乎完全依赖经验直觉且未被记录。当下游筛选失败时,无法区分是位点选错还是结合模型本身失效。Site4Drug 的价值在于:第一,打破了“三维结构已知”这一隐含前提,使无结构靶标(尤其是膜蛋白,占上市药物靶点约 60%)的位点分析成为可能;第二,通过生成结构化的约束证据摘要与审计日志,使位点选择过程可追溯、可调试,从根本上改变了该步骤的“黑箱”性质;第三,支持抗体表位与经典小分子口袋两种结合模态的预测,填补了现有工具(如 fpocket)仅支持口袋发现的空白。从技术路线看,这是少有的将 LLM 智能体用于生物学上游步骤的工作,展现了约束推理而非单纯模式识别在科学决策中的潜力。

对用户/开发者/创作者的影响

对药物研发从业者的直接影响:site4Drug 可作为序列级预筛选工具,在投入昂贵的分子对接或湿实验之前,快速判断一个无结构靶标是否具有可药性位点。对 AI 工具开发者而言,该架构展示了一套可复用的“信号提取 + 多智能体评审”设计模式——类似思路可迁移到蛋白质设计、酶工程等其他需要约束排序的生物学决策问题。由于代码完全开源且设计为与下游工具(如 BoltzGen、DrugCLIP)对接,使用门槛较低。值得注意的局限是:当前版本仅为研究阶段,在抗体表位和混合模态任务上的样本量较小(分别为 26 组和 8 组),其泛化能力仍待更大规模的基准测试验证。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

首先,系统对半胱氨酸/二硫键的代理处理(仅计数而非精确配对)可能遗漏结构约束信息,未来是否升级为精确配对预测是评估其成熟度的关键。其次,目前验证集以已知结构靶标的反向映射为主,新靶标(尤其是全新膜蛋白)上的零样本表现尚未披露。第三,多智能体评审中的 ChemAgent 与 DecisionAgent 的评判标准是否引入药物化学领域的量化规则(如 Lipinski 规则),将影响其在实际筛选流程中的工程可用性。当前公开信息显示,论文已被 ICML 2026 Workshop 接收,短期内有开放的在线演示的可能性较高。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 7602

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注