​腾讯会议推出 AI 同传功能:实时翻译时延低至 3 秒

​腾讯会议推出 AI 同传功能:实时翻译时延低至 3 秒

​腾讯会议推出 AI 同传功能:实时翻译时延低至 3 秒

一句话看懂:腾讯会议正式向所有用户开放AI同声传译功能,支持中英实时互译,翻译延迟控制在3秒内,并具备模仿说话人音色的能力,旨在提升跨语言会议沟通的流畅度与信息完整性。

事件核心:发生了什么

根据腾讯会议官方介绍,AI同传功能已于2026年5月21日面向全部用户开放,核心特点是翻译时延低至3秒,实现语音与译文的近乎同步输出。该功能不仅能实时转换中英文语音,还支持模仿原说话人的音色和语调,帮助参会者快速识别发言者。此外,用户可选择系统默认语音,并独立调节原声与译文的音量大小,适应不同会议场景需求。

在技术集成上,AI同传与实时转录、会议字幕深度打通,形成“可听、可译、可见、可录”的完整工作流:外语发言内容即时转化为目标语言文字,并以双语字幕形式显示在屏幕底部,信息完整性得到保障。翻译内容仅在会议期间生效,不会影响录播文件。目前该功能支持Windows、macOS、Android和iOS四大操作系统,会议主持人可独立控制是否允许参会者开启AI同传。

为什么重要

这项更新是腾讯会议将大语言模型的语音理解与生成能力直接植入高频办公场景的一次落地。传统同声传译需要专业译员和复杂设备,人力成本高且时延难以压缩;而AI同传将延迟降至3秒,基本消除了传统翻译中的等待感和打断感,直接降低了跨国会议的协作门槛。更重要的是,腾讯选择了“开放给所有用户”而非仅限付费企业版,这很可能加速AI同传在中小型企业的普及,并倒逼钉钉、飞书等竞品在实时翻译功能上加速跟进。

声纹模仿能力是此次功能的差异化亮点。在多人会议场景中,仅靠文字翻译很难区分发言者,而语音克隆+音色还原让参会者“听声辨人”,增强了远程会议的临场感和交互效率。这一技术路径也暗示腾讯在语音合成(TTS)与说话人验证上取得了可商用的进展。

对用户/开发者/创作者的影响

普通用户:在日常跨国会议、线上培训、海外客户沟通中,可直接使用AI同传代替人工译员,节省沟通时间与成本。需注意翻译内容在当前会议会话中有效,不会被录制进文件,减少了数据外泄顾虑。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

企业采购与IT管理员:可依据主持人控制机制,为不同组织设置功能权限,保护会议隐私。AI同传与后续AI摘要、任务提取和会中问答形成联动,有望成为企业智能会议方案的标配模块。

开发者与第三方集成商:目前公开信息显示该功能深度内嵌于腾讯会议客户端,尚未开放API接口。若后续开放能力,开发者可将多语言实时翻译集成至自有应用(如在线教育、远程医疗、国际展会),形成更广泛的应用场景。

值得关注的后续

第一,该功能的收费模式。目前面向所有用户开放,但未来是否会划入腾讯会议企业版或按使用时长计费,将直接影响中小用户的接受度和竞品的定价策略。第二,声纹模仿的安全边界。腾讯如何确保该能力不被用于伪造发言者身份或会议欺诈,可能需要配套的声纹授权验证机制或水印标记。第三,语言支持扩展。目前仅开放中英互译,后续是否会增加日语、韩语、法语等语种,将决定该功能在亚太及全球市场的覆盖能力。

来源:AIbase

celebrityanime
celebrityanime
文章: 3283

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注