
单卡 10 秒级!计算所联合 ETH 单图 3D 化新研究:同质量生成提速 2.67 倍
一句话看懂:中国科学院计算技术研究所与ETH Zurich等机构推出了Fast-SAM3D技术,在不重新训练模型的前提下,将单图3D重建速度提升2.67倍,单对象生成可缩短至十秒级别,且重建质量几乎不下降。
事件核心:发生了什么
研究者发现,高质量的3D重建流程(SAM3D)慢在三个环节:稀疏结构生成器、稀疏潜在生成器以及网格解码器。然而,并非所有步骤都需要相同计算量——形状token变化平滑、纹理只在高熵区需要反复更新、不同物体复杂度差异巨大。Fast-SAM3D因此提出了三项针对性优化:模态感知步长缓存(区分形状与布局token)、联合时空token雕刻(优先计算边缘与突变区域)、频谱感知token聚合(根据物体复杂度分配解码预算)。结果是单对象生成提速至2.67倍,场景生成提速至2.01倍,而F1@0.05几何精度从92.34微升至92.59,vIoU从0.543提升至0.552。
为什么重要
此前单图3D重建的加速思路多复制2D扩散模型经验,但容易导致姿态漂移或结构坍塌。Fast-SAM3D的训练无关特性意味着它可以直接嵌入现有SAM3D流程,不需要额外数据收集或重训基础模型,这对已投入SAM3D的团队是低成本升级路径。更关键的是:当3D生成从“能做”走向“可用”,系统级效率优化正变得和模型能力本身一样重要——商业场景关心的是能否在真实业务中稳定、快速、低成本地运行。
对用户/开发者/创作者的影响
对3D内容创作者:此前生成一个场景需要7-8分钟,现在缩减到约4分钟,大幅降低试错成本,可以将照片素材更快转化为可编辑3D资产。对电商与商品展示团队:单图转3D的成本下降后,批量3D化才具备常规流程的可行性。对机器人与具身智能开发者:更快的在线重建意味着机器人能从现场图像中更迅速恢复可操作物体,直接影响感知与规划效率。对AR/VR应用开发者:重建延迟降到10秒级,交互体验将更加自然。目前公开信息显示,该方案仅需单卡即可运行,没有额外硬件门槛。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
第一,代码已在GitHub开源(github.com/wlfeng0509/Fast-SAM3D),社区能否复现并验证加速效果。第二,该方案是否会被集成到SAM3D的正式版本中,以及能否适配其他单图3D生成框架。第三,随着领域竞争从生成效果转向运行效率,是否有更多团队跟进训练无关的加速路线,或反过来推动新模型原生内置效率优化。
来源:Readhub · AI


