
一句话看懂:2026年6月18日,通义实验室联合多家机构开源了首个统一科学大模型 LOGOS,通过创新“科学语法”将蛋白质、分子、材料等异构数据统一编码。仅1B参数的 LOGOS-1B 在多个任务上超越8×7B参数规模的 NatureLM,以1/56的参数规模完成逆合成预测、MOF材料生成等任务,打破了传统“一个任务一个专家模型”的 AI for Science 碎片化格局。
事件核心:发生了什么
通义实验室、ATH-Token Foundry 与中国人民大学“火前人工智能研究院”联合开源了 LOGOS(Language Of Generative Objects in Science)科学大模型。这是首个基于统一“科学语法”的多领域科学生成式基础模型,核心创新在于将蛋白质、小分子、材料、化学反应等异构科学对象编码为统一的离散 token 序列,实现了在大模型框架下的跨领域知识整合与自回归生成。
模型通过空间交互离散化技术在推理时不依赖稀缺的3D坐标数据或专用几何网络,保证预训练与下游任务的形态和目标准则高度一致。评测数据显示,LOGOS-1B 在口袋条件配体生成、逆合成预测(Top-1准确率74.8%)、口袋位点识别(HOLO4K 数据集 Top-n 准确率58.5%)以及 MOF 材料生成(新构建单元比例提升76%)等六项代表性任务中,性能持平或超越领域专用方法。在部分任务中,它甚至超越参数规模为8×7B的 NatureLM,参数仅为对手的1/56。
为什么重要
传统 AI for Science 领域长期依赖“一个任务一个专家模型”的范式,这种碎片化模式导致知识迁移困难、模型复用率低、重复训练成本高。LOGOS 通过构建统一的“科学语法”,首次将多种科学对象纳入同一个自回归大模型框架,直接挑战了该领域的底层技术路线。更重要的是,它用1B参数实现了对更大规模模型的性能超越,表明“小参数+统一架构”或许比“堆算力”在科学计算领域更具可行性。这对算力相对有限的学术机构和企业而言,打开了更经济的科学计算大门。
对用户/开发者/创作者的影响
LOGOS 已开源,意味着生物医药、材料科学、化学合成等领域的研究者和开发者可以直接下载模型进行下游任务微调或推理。对于 AI 应用开发者而言,无需再为蛋白质设计、分子生成、材料筛选等任务分别训练专用模型,一个统一模型即可覆盖多个场景。这降低了跨领域科学计算的入门门槛,尤其对中小型实验室和创业公司,能够以极低算力成本在药物分子逆向推理、MOF 材料新结构发现等任务中获取高质量结果。目前公开信息显示,模型权重与推理代码已在开源平台发布,但具体许可证(如是否商用、是否需要署名)暂未详细说明,开发者需关注后续开源协议细则。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
首先,LOGOS 的开源协议将直接影响其商用价值——如果采用宽松许可证(如 Apache 2.0),将极大推动制药、新材料领域的创业生态;其次,NatureLM 等竞品是否会因 LOGOS 的参数效率优势而调整自身模型设计与开源策略,值得观察;第三,目前评测覆盖的任务数量有限,模型在实际复杂工业场景中的稳定性和泛化能力尚需第三方复现验证,后续如果有机构在更广泛科学任务上做独立基准测试(如材料物性预测、蛋白质-分子对接),将是判断其真正天花板的关键证据。
来源:AIbase


