生物学变天:小扎的新开源模型,彻底掀翻谷歌 AlphaFold 王座!

生物学变天:小扎的新开源模型,彻底掀翻谷歌 AlphaFold 王座!

生物学变天:小扎的新开源模型,彻底掀翻谷歌 AlphaFold 王座!

一句话看懂:Meta 旗下 Biohub 发布 ESMFold2 模型及 ESM Atlas 数据库,一次性预测 11 亿个蛋白质结构,比谷歌 DeepMind 的 AlphaFold 数据库多出 8 亿条,且模型完全开源、不限商用,对 AlphaFold 形成了正面超越。

事件核心:发生了什么

5 月 27 日,扎克伯格夫妇创立的 Biohub 正式上线了 ESM Atlas 蛋白质结构数据库,包含 11 亿个预测蛋白质结构和 68 亿条蛋白质序列信息。AlphaFold 数据库积累了约 2 亿个结构预测,ESM Atlas 的规模是它的 5 倍以上。背后的 AI 模型 ESMFold2 由 Biohub 科学负责人 Alex Rives 带领开发,采用了与 AlphaFold 不同的“蛋白质语言模型”技术路线——将蛋白质序列当作自然语言来理解,从序列直接预测三维结构。Biohub 团队称,ESMFold2 在预测蛋白质之间相互作用方面表现优于 AlphaFold3,更重要的是团队用该模型设计了全新蛋白质,并在实验室合成验证了其功能。

为什么重要

AlphaFold 是 AI 改变科学的标志性案例,2024 年获得诺贝尔化学奖。ESMFold2 从两个维度挑战了其霸主地位:第一,技术路线不同,它利用更大规模的环境微生物蛋白质数据进行训练(这部分在 AlphaFold 数据库中几乎是空白),覆盖了更多“未知”蛋白质;第二,商业模式颠覆——ESMFold2 完全开源且不限商用,而 AlphaFold3 在发布初期限制了商业使用,DeepMind 旗下 Isomorphic Labs 的蛋白质相互作用模型甚至完全闭源。参考 Meta 的 Llama 系列在大语言模型上的成功经验,开源策略可能撬动全球更多学术和产业力量参与迭代和应用。MIT 计算生物学家 Ovchinnikov 直言,“很多人会很兴奋地想试一试 ESMFold2”。

对用户/开发者/创作者的影响

对从事蛋白质研究、药物设计和合成生物学的学术及产业用户而言,ESM Atlas 数据库提供了一个免费的、规模更大的结构预测资源。开发者可以直接使用开源模型进行二次开发、微调或商用部署,不再受闭源模型的许可限制。但专业机构需要注意,学界反馈显示 ESMFold2 在预测“全新结构”蛋白质时的表现仍待验证,多位专家指出预测结果需要独立实验验证。首尔国立大学的 Martin Steinegger 团队此前发现,第一版 ESMFold 在陌生结构预测上表现一般,这一疑虑对 ESMFold2 依然悬而未决。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,开源社区和生物医药企业能否围绕 ESMFold2 形成生态,进而推动新药发现或蛋白质设计领域的实质突破;第二,DeepMind 是否会调整 AlphaFold 的开源策略或推出性能更强的模型回应对手;第三,该模型在“全新结构”蛋白质预测上的真实表现是否经得起独立第三方的严格测试。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 4562

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注