腾讯云发布音视频 AI 品牌 WAND:内置六大自研模型与60+项AI能力

腾讯云发布音视频 AI 品牌 WAND:内置六大自研模型与60+项AI能力

腾讯云发布音视频 AI 品牌 WAND:内置六大自研模型与60+项AI能力

一句话看懂:6月5日,腾讯云在2026 AI行业应用大会上正式发布音视频AI品牌WAND,内置六大自研媒体专属模型和60多项AI能力,标志着其音视频服务从单一媒体处理能力向AI应用原生的媒体基座升级。

事件核心:发生了什么

腾讯云音视频服务基于20多年的技术积累,发布了AI原生能力基座WAND。该品牌架构分为模型引擎、能力层和场景方案三层:底层包含编解码、增强、擦除、生成、理解、音频六大自研媒体专属模型,弥补主流生成式大模型在媒体生产流程中的不足;能力层将60余项媒体AI能力重组为生成、理解、处理和编码四大类,通过API、预设Agent工作流(Agentic Workflow)和技能三种模式开放,支持在Agent端跨工具端到端自动执行完整工作流。

在具体业务场景中,WAND已展示出效果:电商应用中,生成模型可为不同品类定制策略,降低误差率;短动画剧创作中,可将脚本生成、角色一致性保持等步骤串联为自动化工作流,平均制作效率提升90%,服务了国内超80%头部动画剧平台;体育直播场景中,通过自研模型协同调度,相比传统方案节省超50%码率,已支持数千场全球顶级赛事。此外,其AI增强和无痕擦除技术获得NAB Show 2026年度产品奖。

为什么重要

WAND的发布意味着腾讯云音视频服务从“提供媒体处理能力”向“成为AI应用和Agent的媒体基座”进行战略转向。其核心变化在于:不再只是开放单个API或SDK,而是以Agent-Native模式将媒体能力作为AI Agent可统一调度的一部分。这降低了开发者在构建视频生成、直播剪辑等AI应用时的集成门槛——尤其是短剧、电商、体育等需要高速处理视音频的场景。同时,六大自研媒体模型覆盖了从编解码到生成的完整链路,显示出腾讯云在视频AI领域试图构建从底层到应用的完整技术栈,与单纯依赖外部大模型或通用视觉模型的方案形成差异化竞争。

对用户/开发者/创作者的影响

对开发者:Agent工作流模式减少了多工具切换的繁琐,可直接通过预设流程实现“一句话生成短剧”或“自动直播剪辑”,对需要快速部署视频AI能力的中小团队尤为友好。API层面依然保持开放,利于定制化需求。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

对内容创作者:短动画剧制作效率提升90%,意味着低成本、批量化创作内容成为可能;电商场景中图像处理错误率下降,可直接提升商品图生成的可商用性。

对企业用户:体育直播等强实时场景节省码率并支持高并发,对直播平台、赛事转播方意味着更低的带宽成本和更稳定的体验。但具体定价与接入门槛尚未公布,企业用户需关注后续商用细则。

值得关注的后续

  • WAND的定价模型和开放范围何时公布,特别是API调用和Agent工作流是否将按量计费,以及面向中小开发者的免费额度。
  • 该品牌是否能真正推动“零代码”音视频AI应用落地,还是仍需专业开发者在Agent工作流基础上做二次开发。
  • 国内外竞品(如阿里云、AWS媒体服务)是否会跟进类似“Agent-Native”架构,以及腾讯云作为连续11次市场份额领先者,能否借此保持先发优势。

来源:AIbase

celebrityanime
celebrityanime
文章: 5778

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注