
一句话看懂:2026年7月3日,巨量引擎(ByteDance Engine)正式发布其自研广告治理大模型 Mamoda 2.5 版本,将识别能力从文本全面扩展至图片与视频全形态。这意味着平台对违规广告的检测将从“看懂文字”进化到“看懂画面”,对短视频创作者、广告主和普通用户的内容体验都将产生直接影响。
事件核心:发生了什么
Mamoda 是巨量引擎专为广告内容风控研发的大模型,1.0 版本仅能识别文本违规。2.5 版本首次突破多媒体内容处理瓶颈,实现了对图片及短视频素材的深度理解,尤其覆盖了视频的全形态分析能力。以往依赖关键词或图像标签的粗粒度筛查,现在可以更灵敏地识别视频中的潜在合规风险,例如不当场景、敏感元素或误导性视觉表达。
为什么重要
在短视频和直播电商主导的数字广告生态中,视觉内容已成为主要的风险载体。传统规则引擎或单一识别模型很难应对复杂的画面语义。Mamoda 2.5 表明平台治理正从“文本过滤”向“视觉理解”升级,这不仅是技术迭代,更反映了行业在处理高并发、多模态内容风控时的真实需求。对于广告平台来说,模型能力的提升意味着可以更高效地发现违规内容,同时减少误伤正常广告,有助于平衡用户体验与治理效率。
对用户/开发者/创作者的影响
- 普通用户:将体验到更干净的广告环境,劣质或违规的视觉广告将更快被过滤。
- 广告主与创作者:需要更注意素材的视觉合规性,过去的“文字合规”策略不再足够。画面中的场景、道具、人物行为等都可能被模型识别,合规门槛上升但规则也更清晰。
- AI开发与风控从业者:Mamoda 2.5 的技术路线为多模态大模型在内容治理场景的商业化落地提供了参考案例,可能推动更多平台跟进建设类似能力。
值得关注的后续
- 落地影响范围:目前公开信息显示,该模型主要应用于巨量引擎的广告审核流程,未来是否会开放给第三方开发者或中小广告主使用,值得关注。
- 竞品跟进:腾讯广告、快手磁力引擎等平台在视觉内容治理上的技术动作,可能因 Mamoda 2.5 的发布而加速。
- 监管与技术迭代:随着视频内容治理能力提升,相关政策与平台规则可能同步细化,创作者需关注平台后续更新的具体合规细则。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
来源:AIbase


