从可灵到 Gemini,AI 视频集体告别「抽卡模式」:导演模型要火?-雷科技

从可灵到 Gemini,AI 视频集体告别「抽卡模式」:导演模型要火?-雷科技

从可灵到 Gemini,AI 视频集体告别「抽卡模式」:导演模型要火?-雷科技

一句话看懂:过去一年,AI 视频生成依赖“抽卡”——输入提示词赌模型生成好片段。近期,从谷歌 Gemini 到快手可灵 O1,多家模型推出可编辑、可连续修改的功能,AI 视频正从“出片机器”转型为“生产工具”,创作者的核心能力也将从剪辑转向调度模型的“导演模型”能力。

事件核心:发生了什么

最近一两个月内,几款主流视频模型集中改变了产品形态。Runway 推出 Aleph 2.0,支持基于原视频语境的局部修改,不再每次生成都从头开始。谷歌的 Gemini Omni 走对话式编辑路线,用户可像聊天一样逐轮提出修改要求,模型在上一版基础上迭代。国内方面,快手可灵 O1 将生成、修改、参考、风格重绘、镜头延展等全流程整合到一个引擎中,试图减少创作者在多个工具间切换的内耗。字节跳动的 Seedance 2.0 则强调多模态参考生成,引入音频和动作控制,实现音画同步。这些产品的共同信号是:AI 视频的竞争焦点,已从一次性生成画质的高低,转向生成结果是否可持续编辑、修改和复用。

为什么重要

“抽卡模式”的核心痛点是不可控——模型产出十个七、八分的片段,但彼此无法对齐,创作者只能重抽。新功能将生产者从“赌概率”中解放出来,系统性地降低了视频创作的不确定性。这直接改变了 AI 视频的商业化路径:谁能打通“生成-编辑-控制”的完整工作流,谁就能在工具型产品中占据用户黏性。同时,它推动了技术路线从“追求单次出片美感”转向“稳定性和可操作性”,意味着模型厂商需要更注重后训练、微调、可控性优化,而非单纯堆砌参数。

对用户/开发者/创作者的影响

对创作者而言,视频生产的重心正从“素材加工”变为“意图调度”。过去靠剪辑、调色、转场等手艺活拉开差距,未来核心能力转向描述镜头语言、判断模型输出是否可用、以及知道如何连续提问让模型改到满足需求。这种变化类似于 Excel 将会计从计算中解放、非线性剪辑软件将剪辑师从胶片切割中解放——工具自动化了机械部分,但放大了“知道要什么”的决策价值。对开发者来说,模型的可编辑性意味着可衍生出更多接口和插件生态,例如基于 Gemini 或可灵 API 构建自动化视频编辑工具。对普通用户,门槛降低,但“写出好提示词”的能力需要重新学习。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,可灵 O1 和 Seedance 2.0 的“全流程整合”是否能在实际创作中跑通,减少用户在不同工具间的搬运成本,取决于编辑功能的精准度和响应速度。第二,谷歌 Gemini 与 Runway 的对话式编辑和局部修改,是否会大幅降低视频二次创作的失败率,并吸引专业影视团队入场。第三,当“可编辑”成为标配,模型厂商之间的差异化会不会转向对镜头语言、节奏和叙事的理解能力,例如是否支持更精细的动效控制或情绪调色。最后,这类工具的定价和服务模式(如按编辑次数收费还是订阅制)尚未明确,也可能影响用户采纳速度。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 5758

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注