树的流动和返回：统一决策树和扩散模型

一句话看懂：MIT 研究人员在 ICML 2026 发表了一篇论文，首次从数学上证明决策树和扩散模型本质上遵循相同的优化原理，并基于此推出了两种新方法。这不仅在理论上连接了两种看似无关的模型家族，还带来了实际性能提升。

事件核心：发生了什么

这篇由 Sai Niranjan Ramachandran 和 Suvrit Sra 提交的论文（arXiv:2605.00414），于 2026 年 5 月 21 日更新至 v2 版本，并被 ICML 2026 接收。论文的核心贡献在于建立了一个严格的数学对应关系，将离散的、树状结构的决策树与连续的、动态的扩散模型统一起来。他们发现，这两者在适当的极限条件下共享同一个优化原则——全局轨迹评分匹配（GTSM）。作者还提出了两个具体应用实例：一是 TreeFlow，在表格数据生成上实现了比现有方法更高的保真度，并获得了 2 倍的计算加速；二是 DSMTree，一种蒸馏方法，能够将决策树的层级逻辑转移到神经网络中，在多个基准测试上匹配教师模型性能，差距在 2% 以内。

为什么重要

这一发现的意义在于打破了机器学习中离散与连续方法之间的隔阂。传统上，决策树因其可解释性和高效性广泛应用于表格数据，而扩散模型则在图像、音频等连续数据生成上占据主导。论文通过数学统一，证明了梯度提升（一种经典决策树训练方法）在理想化版本下，是扩散模型全局评分匹配的渐近最优解。这意味着，开发者未来可以将扩散模型强大的生成能力，用在决策树擅长的场景（如结构化数据分析），或者反过来用决策树的层级结构来提升扩散模型的训练效率。理论上的统一也为探索更高效的混合模型开辟了新路径。

对用户/开发者/创作者的影响

对于从事数据科学和机器学习开发的工程师，这两项具体工具值得关注：TreeFlow 使得在表格数据上直接使用扩散模型成为可能，且比现有方案快 2 倍，这对需要高保真合成表格数据（如金融风控、医疗隐私数据）的团队影响最直接。DSMTree 则提供了一种新的知识蒸馏方案，帮助将可解释的决策逻辑嵌入神经网络，这对需要部署高性能模型同时保留一定可解释性的企业（如银行业）具有吸引力。对创作者而言，虽然目前尚未直接作用于图像或视频生成，但理论统一可能间接推动更高效的生成模型架构出现。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

首先，TreeFlow 和 DSMTree 的代码是否开源尚待确认，这直接影响开发者能否立即试用。其次，论文中提到的 2 倍加速是针对特定硬件和数据集的结果，实际产品化后的扩展性需进一步观察。最后，理论上的统一是否催生出新的商业化方案——例如，是否能出现基于决策树的扩散模型训练框架或 SaaS 服务，值得追踪。目前公开信息显示，该工作已获得 ICML 2026 录用，但尚未披露具体的开源计划或产品路线图。

来源：Hacker News · 24h最热

树的流动和返回：统一决策树和扩散模型