
今年 CVPR 看点是广东:何恺明再获至高大奖,广工大打破大厂名校垄断
一句话看懂:2026年CVPR颁发多项重磅奖项,何恺明的ResNet与YOLO共同获得时间检验奖,同时广东工业大学团队以本科生阵容拿下最佳学生论文提名,打破了Google、Meta、英伟达等大厂和名校的垄断局面。
事件核心:发生了什么
CVPR 2026(6月6日在丹佛举办)公布了全部奖项,投稿量达16092篇,录用4071篇,较去年增长23.71%。核心奖项包括:
- 最佳论文:D4RT(Google DeepMind、UCL、牛津),实现从单段视频高效重建动态4D场景,在A100上跑200+ FPS,比去年最佳论文VGGT快约9倍。
- 最佳论文荣誉提名:Meta的SAM 3D(单图3D重建基座模型),以及英伟达的NitroGen(通用游戏智能体大模型,在1000多款游戏、4万小时视频上训练)。
- 最佳学生论文:清华×微软的TRELLIS.2(4B参数3D生成模型),全华人阵容。
- 最佳学生论文提名:ChordEdit——来自广东工业大学、惠州学院、深圳大学、北大的纯国内高校团队,一作是本科生,解决一步式文生图模型的编辑难题。
- 时间检验奖:双双颁给2016年论文——ResNet(引用超32万)和YOLO v1(引用近8万),何恺明是ResNet核心作者之一,也是广东满分高考状元。
为什么重要
这次CVPR释放了几个关键信号:第一,华人研究者持续主导AI核心方向——从最佳论文D4RT一作张楚晗,到时间检验奖的ResNet,华人贡献占比极高。第二,广东工业大学团队以本科生身份拿下大奖提名,说明非顶尖名校团队在有扎实理论创新(如最优传输方法)的情况下,仍能在CVPR这一顶级舞台突围,打破了大厂和名校对顶会奖项的“圈层垄断”。第三,几何重建连续两年获最佳论文(去年VGGT、今年D4RT),表明4D动态场景理解正成为CV领域的主流方向。第四,时间检验奖同时授予ResNet和YOLO,强调了2016年这两项工作在深度学习地基和实时检测上的奠基性作用,影响持续十年至今。
对用户/开发者/创作者的影响
- 开发者:D4RT(动态4D重建)、SAM 3D(单图3D)、NitroGen(游戏智能体)等模型正在或即将开源,可大幅降低3D重建、游戏AI开发门槛。尤其是D4RT的“按需查询”架构,位姿估计200+ FPS的实时性,对机器人、AR/VR和自动驾驶从业者来说值得关注。
- 创作者:ChordEdit使一步式扩散模型(如SD Turbo)具备可控、稳定的实时图像编辑能力,不再需要多步推理,未来可能在AI设计工具中快速落地。
- 学生/研究者:广东工业大学团队的获奖案例表明,本科阶段深入理论(如最优传输)并完成实证工作,依然可能冲击顶会Oral,具有示范效应。
值得关注的后续
- D4RT、SAM 3D、NitroGen等模型的具体开源时间和代码仓库是否公开——这决定了实际应用门槛。
- 广东工业大学团队的ChordEdit是否会以API或Demo形式对外开放,以及后续是否吸引大厂合作。
- 时间检验奖的持续影响力——ResNet和YOLO在2026年仍被颁发十年奖项,说明基础架构的“长寿”价值,未来新架构需思考长期竞争力。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
来源:Readhub · AI


