Nat. Comput. Sci. | 面向分子发现的大语言模型化学空间导航器

一句话看懂：研究人员首次证明，Meta 的通用大语言模型 Llama-3.1-8B 可以通过轻量级微调直接转化为高性能分子生成模型，名为 SmileyLlama。它不仅能精准生成满足特定药物化学性质的分子，还能结合强化学习针对新冠病毒蛋白酶进行结构优化，为 AI 药物发现提供了一条低成本、高效率的新路径。

事件核心：发生了什么

来自麻省理工学院等机构的研究团队在《自然·计算科学》上发表研究，提出了 SmileyLlama 模型。该工作基于 Meta 的开源模型 Llama-3.1-8B-Instruct，首先使用约 200 万个来自 ChEMBL 数据库的药物样分子进行监督微调（SFT），再通过直接偏好优化（DPO）强化模型对化学性质的遵循能力。经过训练，SmileyLlama 在 GuacaMol 标准测试中分子有效性达到 95.8%，新颖性达到 98.7%，性能接近甚至超越专门从头训练的化学语言模型。更重要的是，用户只需用自然语言描述目标性质（如“分子量≤500”、“包含特定骨架”），模型即可定向生成符合要求的 SMILES 字符串。在将模型整合进 iMiner 强化学习框架后，针对 SARS-CoV-2 主蛋白酶（MPro）的分子优化实验中，SmileyLlama 在仅使用约 25% 的训练迭代次数下即达到相似或更优的对接分数，且有效避免了传统方法中常见的“多样性崩塌”问题。

为什么重要

这项研究首次验证了一个关键设想：通用大语言模型不需要从头进行大规模的化学预训练，只需通过轻量级微调就能达到专用模型的生成水平。这大幅降低了在分子发现领域应用 AI 的资源门槛——科研团队不再需要拥有庞大的算力和专有数据集来训练化学语言模型，而是在现有开源 LLM 基础上进行针对性优化即可。同时，SmileyLlama 保留了 LLM 的自然语言理解能力，使得化学性质描述本身成为一种可编程的“空间导航器”，研究人员无需修改模型权重即可动态调整探索方向。这种范式对于药物发现这类多目标优化问题尤为实用，也意味着未来 AI 驱动的分子设计可能从“模型即黑箱”走向“模型即可对话的科研工具”。

对用户/开发者/创作者的影响

对于从事药物发现和材料设计的科研团队，SmileyLlama 提供了一条可复用的技术路径：基于开源 LLM，结合 SFT 和 DPO 即可构建自己的定向分子生成模型。开发者和 AI 工程师可以关注其技术细节，包括如何将 RDKit 计算的性质组织为自然语言提示、如何设计 DPO 训练中的“赢家/输家”标注策略，以及如何将生成模型与 AutoDock Vina 等分子对接工具集成。对于大模型厂商和 AI 平台，这项研究也展示了 LLM 在垂直科学场景中的深度应用潜力——类似方法可能被扩展至材料科学、化学合成规划等领域，催生新的专业模型生态。不过目前公开信息显示，SmileyLlama 在低数据量任务（如宏环结构、共价战头）上表现仍较弱，且 DPO 训练会降低分子的多样性，这些限制需要用户在实际应用中评估权衡。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

首先，SmileyLlama 所采用的“LLM+微调+偏好优化”方法论是否会被推广到其他开源模型（如 Gemma、Qwen 等），并形成标准化的分子生成模型开发流程；其次，该模型在更复杂药物性质（如代谢稳定性、脱靶效应）上的表现尚待验证，团队是否会在后续工作中解决这些短板；最后，研究团队是否会将 SmileyLlama 开源发布或提供 API 服务，这将直接影响其能否被药物研发社区广泛采用和继续改进。

来源：Readhub · AI

Nat. Comput. Sci. | 面向分子发现的大语言模型化学空间导航器