南京大学自然语言处理研究组多篇论文被 ACL2026、ICML2026 录用

一句话看懂：南京大学自然语言处理研究组近日有7篇论文被顶级学术会议 ACL2026 和 ICML2026 录用，涉及多语言大模型扩展、推理模型主动提问能力、几何视觉感知评估等前沿方向，这些成果在技术路线上与当前行业热点——低资源语言支持、Agent 交互深度和视觉基础能力——高度关联。

事件核心：发生了什么

南京大学自然语言处理研究组宣布，其7篇论文被 ACL2026（含 Findings）和 ICML2026 录用。论文覆盖四大方向：一是多语言大模型扩展，提出 DeltaMoE 方法，通过参数差分融合解决预训练与后训练参数冲突，在低资源语言上显著提升性能；二是大模型主动交互推理，提出 Proactive Interactive Reasoning 框架，将推理模型从被动求解者转变为主动提问者，在数学推理、代码生成等任务上降低冗余推理轮次；三是基础几何感知评估，发布 GePBench 基准测试，证明即使是顶尖多模态模型在几何形状识别上也落后于人类；四是机器翻译的强化学习优化、新知识引发幻觉的机制分析、深度研究报告生成框架 CogGen，以及多智能体系统编排拓扑的熵动力学分析。

为什么重要

这套成果在三个层面体现价值：首先，DeltaMoE 为多语言大模型提供了一条数据高效的扩展路径——通过参数融合而非大规模标注数据来扩展语言能力，这对于降低 LLaMA、Qwen 等闭源/开源模型在低资源语言上的部署成本有直接意义；其次，PIR 框架将推理模型的“自我对话”扩展到“与用户对话”，本质上改变了 Agent 与人类交互的闭环方式，可能影响下一代对话系统和自动化工作流的设计范式；最后，GePBench 揭示了当前多模态大模型在基础几何感知上的系统性短板，这一发现如果被行业采纳，可能会推动文生图、文档理解、医学图像分析等下游任务的数据增强策略改变。

对用户/开发者/创作者的影响

对开发者而言，DeltaMoE 的差分扩展方法可以直接用于微调开源模型的语言能力，尤其在缺少目标语言标注数据的场景下，显著降低国际化产品的本地化门槛；PIR 框架提供的“思考-提问-反馈”交互范式，可以被集成到 RAG 或 Agent 开发中，减少无效推理算力消耗；GePBench 的实验结果提醒多模态模型的应用者，在涉及尺寸估计、位置判断的自动化流程中（如 UI 自动化、3D 建模辅助），需要额外加入几何校验环节。对于创作者使用文生图工具时，几何感知不足的问题可能会在复杂构图场景下持续存在，需要人工后编辑。

值得关注的后续

第一，DeltaMoE 方法是否会被整合到主流开源多语言模型（如 Qwen、Bloom）的微调流程中，以及是否配套发布可复现的代码或 API；第二，PIR 框架在非数学/代码类任务（如开放式问答、文档摘要）上的泛化效果尚未公开评估，后续测试结果将决定其是否适合通用 Agent 系统；第三，GePBench 的合成数据生成引擎是否向社区开放，如果开放，可能成为多模态模型几何能力评测的标准数据集。目前公开信息显示，这些论文的具体代码和模型权重尚未全面发布，社区需要等待官方开源才能复现实验结果。

来源：Readhub · AI

南京大学自然语言处理研究组多篇论文被 ACL2026、ICML2026 录用