腾讯云发布音视频 AI 品牌 WAND：内置六大自研模型与60+项AI能力

一句话看懂：6月5日，腾讯云在2026 AI行业应用大会上正式发布音视频AI品牌WAND，内置六大自研媒体专属模型和60多项AI能力，标志着其音视频服务从单一媒体处理能力向AI应用原生的媒体基座升级。

事件核心：发生了什么

腾讯云音视频服务基于20多年的技术积累，发布了AI原生能力基座WAND。该品牌架构分为模型引擎、能力层和场景方案三层：底层包含编解码、增强、擦除、生成、理解、音频六大自研媒体专属模型，弥补主流生成式大模型在媒体生产流程中的不足；能力层将60余项媒体AI能力重组为生成、理解、处理和编码四大类，通过API、预设Agent工作流（Agentic Workflow）和技能三种模式开放，支持在Agent端跨工具端到端自动执行完整工作流。

在具体业务场景中，WAND已展示出效果：电商应用中，生成模型可为不同品类定制策略，降低误差率；短动画剧创作中，可将脚本生成、角色一致性保持等步骤串联为自动化工作流，平均制作效率提升90%，服务了国内超80%头部动画剧平台；体育直播场景中，通过自研模型协同调度，相比传统方案节省超50%码率，已支持数千场全球顶级赛事。此外，其AI增强和无痕擦除技术获得NAB Show 2026年度产品奖。

为什么重要

WAND的发布意味着腾讯云音视频服务从“提供媒体处理能力”向“成为AI应用和Agent的媒体基座”进行战略转向。其核心变化在于：不再只是开放单个API或SDK，而是以Agent-Native模式将媒体能力作为AI Agent可统一调度的一部分。这降低了开发者在构建视频生成、直播剪辑等AI应用时的集成门槛——尤其是短剧、电商、体育等需要高速处理视音频的场景。同时，六大自研媒体模型覆盖了从编解码到生成的完整链路，显示出腾讯云在视频AI领域试图构建从底层到应用的完整技术栈，与单纯依赖外部大模型或通用视觉模型的方案形成差异化竞争。

对用户/开发者/创作者的影响

对开发者：Agent工作流模式减少了多工具切换的繁琐，可直接通过预设流程实现“一句话生成短剧”或“自动直播剪辑”，对需要快速部署视频AI能力的中小团队尤为友好。API层面依然保持开放，利于定制化需求。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

对内容创作者：短动画剧制作效率提升90%，意味着低成本、批量化创作内容成为可能；电商场景中图像处理错误率下降，可直接提升商品图生成的可商用性。

对企业用户：体育直播等强实时场景节省码率并支持高并发，对直播平台、赛事转播方意味着更低的带宽成本和更稳定的体验。但具体定价与接入门槛尚未公布，企业用户需关注后续商用细则。

值得关注的后续

WAND的定价模型和开放范围何时公布，特别是API调用和Agent工作流是否将按量计费，以及面向中小开发者的免费额度。
该品牌是否能真正推动“零代码”音视频AI应用落地，还是仍需专业开发者在Agent工作流基础上做二次开发。
国内外竞品（如阿里云、AWS媒体服务）是否会跟进类似“Agent-Native”架构，以及腾讯云作为连续11次市场份额领先者，能否借此保持先发优势。

来源：AIbase

腾讯云发布音视频 AI 品牌 WAND：内置六大自研模型与60+项AI能力