
腾讯云发布音视频 AI 品牌 WAND:内置六大自研模型与60+项AI能力
一句话看懂:6月5日,腾讯云在2026 AI行业应用大会上正式发布音视频AI品牌WAND,内置六大自研媒体专属模型和60多项AI能力,标志着其音视频服务从单一媒体处理能力向AI应用原生的媒体基座升级。
事件核心:发生了什么
腾讯云音视频服务基于20多年的技术积累,发布了AI原生能力基座WAND。该品牌架构分为模型引擎、能力层和场景方案三层:底层包含编解码、增强、擦除、生成、理解、音频六大自研媒体专属模型,弥补主流生成式大模型在媒体生产流程中的不足;能力层将60余项媒体AI能力重组为生成、理解、处理和编码四大类,通过API、预设Agent工作流(Agentic Workflow)和技能三种模式开放,支持在Agent端跨工具端到端自动执行完整工作流。
在具体业务场景中,WAND已展示出效果:电商应用中,生成模型可为不同品类定制策略,降低误差率;短动画剧创作中,可将脚本生成、角色一致性保持等步骤串联为自动化工作流,平均制作效率提升90%,服务了国内超80%头部动画剧平台;体育直播场景中,通过自研模型协同调度,相比传统方案节省超50%码率,已支持数千场全球顶级赛事。此外,其AI增强和无痕擦除技术获得NAB Show 2026年度产品奖。
为什么重要
WAND的发布意味着腾讯云音视频服务从“提供媒体处理能力”向“成为AI应用和Agent的媒体基座”进行战略转向。其核心变化在于:不再只是开放单个API或SDK,而是以Agent-Native模式将媒体能力作为AI Agent可统一调度的一部分。这降低了开发者在构建视频生成、直播剪辑等AI应用时的集成门槛——尤其是短剧、电商、体育等需要高速处理视音频的场景。同时,六大自研媒体模型覆盖了从编解码到生成的完整链路,显示出腾讯云在视频AI领域试图构建从底层到应用的完整技术栈,与单纯依赖外部大模型或通用视觉模型的方案形成差异化竞争。
对用户/开发者/创作者的影响
对开发者:Agent工作流模式减少了多工具切换的繁琐,可直接通过预设流程实现“一句话生成短剧”或“自动直播剪辑”,对需要快速部署视频AI能力的中小团队尤为友好。API层面依然保持开放,利于定制化需求。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
对内容创作者:短动画剧制作效率提升90%,意味着低成本、批量化创作内容成为可能;电商场景中图像处理错误率下降,可直接提升商品图生成的可商用性。
对企业用户:体育直播等强实时场景节省码率并支持高并发,对直播平台、赛事转播方意味着更低的带宽成本和更稳定的体验。但具体定价与接入门槛尚未公布,企业用户需关注后续商用细则。
值得关注的后续
- WAND的定价模型和开放范围何时公布,特别是API调用和Agent工作流是否将按量计费,以及面向中小开发者的免费额度。
- 该品牌是否能真正推动“零代码”音视频AI应用落地,还是仍需专业开发者在Agent工作流基础上做二次开发。
- 国内外竞品(如阿里云、AWS媒体服务)是否会跟进类似“Agent-Native”架构,以及腾讯云作为连续11次市场份额领先者,能否借此保持先发优势。
来源:AIbase


