
一句话看懂:阿里云旗下 Wan Video 于 2026 年 7 月 3 日上线了名为“Music to Dance”的功能,用户只需上传一个角色图像并选择歌曲,即可自动生成与该音乐节奏同步的舞蹈视频。这一动作将 AI 视频生成从简单的“动作生成”推向“音画同步”的新阶段。
事件核心:发生了什么
据阿里云官方 X 账号发布,Wan Video 新增的“Music to Dance”功能允许用户上传一个静态角色(可以是 AI 生成或真实人物图像),添加一首歌曲后,系统能自动生成一段节奏同步的舞蹈视频。目前支持的舞种包括街舞、踢踏舞、拉丁舞、K-Pop 和中国古典舞。该功能已在 wan.video 网站上开放体验。从官方演示片段看,生成的舞蹈动作能够根据音乐节拍进行实时适配,而非简单的动作模板拼接。
为什么重要
这一功能的意义在于它直接攻克了 AI 视频生成领域“节奏对齐”的技术难点。过去,AI 生成人类动作视频往往存在肢体僵硬、动作与音乐脱节的问题,而 Wan Video 通过将音频节奏分析模块与动作生成模型深度耦合,实现了从“动作模仿”到“音乐伴舞”的跨越。从市场竞争看,这是继 Runway、Pika 等海外工具之后,国产 AI 视频模型首次在“音画同步”交互上推出明确产品功能,有望加速短视频和音乐可视化领域的内容生产效率。对阿里云而言,Wan Video 作为其大模型(通义系列)在视频生成方向的产品落地,这一功能也验证了多模态大模型在创意工具体验精细化方面的算力可用性。
对用户/开发者/创作者的影响
对于内容创作者和短视频运营者而言,这一功能大幅降低了“音乐舞蹈类”内容的制作门槛。过去需要真人拍摄、专业编舞或后期逐帧对齐的环节,现在通过上传素材和选择音乐即可一次性生成。对于 AI 应用开发者,Wan Video 开放的产品形态暗示了其可能在未来提供 API 接口,允许第三方应用调用“音乐伴舞”能力,从而嵌入到虚拟偶像直播、教育演示、游戏角色动画等场景。对于普通用户,该功能目前免费可用,意味着个人可以低成本制作个性化的舞蹈视频,例如用于社交媒体分享或节日庆祝。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
以下三点值得持续跟踪:第一,Wan Video 是否会开放“自定义音乐”的自由度(目前仅支持平台提供歌曲还是可以本地上传);第二,该功能生成的舞蹈动作是否支持多人物互动或连续场景编辑,这将决定其能否用于更复杂的剧情内容;第三,竞品如字节跳动的豆包大模型、百度的文心一言等,是否会迅速跟进推出类似“音画同步”的视频生成功能,从而引发新一轮 AI 视频工具的功能竞赛。


