![[推广] 一个对话式的 AI 视频生成工具 Gemini Omni Video,像聊天一样做视频](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_2-255.jpg)
[推广] 一个对话式的 AI 视频生成工具 Gemini Omni Video,像聊天一样做视频
一句话看懂:一位独立开发者基于 Google Gemini Omni 模型,推出了一款对话式 AI 视频生成工具,用户无需反复抽卡或调整复杂参数,可以通过连续对话精调画面细节,旨在解决现有 AI 视频工具“一锤子买卖”的痛点。
事件核心:发生了什么
近日,一位独立开发者在 V2EX 社区发布了自己开发的 AI 视频产品 Gemini Omni Video,并邀请社区测试反馈。该工具的核心逻辑是将视频生成转变为“创意对话”流程:用户用自然语言描述场景后,AI 即时生成 4K 视频;如果对画面不满意,可以继续提出如“让光线更暖一些”“添加雨天效果”等具体指令,AI 会在保留原有画面基础上实时重新渲染,而非重新生成。
开发者在帖子中披露,他开发这款工具的初衷是受够了当前主流 AI 视频工具的“抽卡式”使用体验——用户往往需要不断更换提示词,从头尝试。目前该产品已上线公测,网址为 https://geminiomnivideo.ai,属于个人独立开发项目。
为什么重要
从技术路径看,Gemini Omni Video 将 Google 的 Gemini Omni 模型能力封装为“对话式视频编辑”,跳出了大多数 AI 视频工具“一次性生成+手动剪辑”的范式。这种“意图理解+保留场景迭代”的方式,有可能降低短视频、宣发物料等场景的试错成本,让非专业用户更接近“像和人沟通一样”完成视频制作。
不过,目前公开信息显示,该产品仍处于早期测试阶段,是否具备持续的生产级稳定性、模型推理成本如何控制、是否支持长视频和高帧率等细节尚未披露。其竞品包括 Runway Gen-3、Pika Labs 以及国内许多视频生成工具,但“对话式双向编辑”是差异化卖点。
对用户/开发者/创作者的影响
对短视频创作者、营销人员及个人开发者的影响较为直接:
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
1. 降低使用门槛:不用学习剪辑软件或复杂提示词工程,通过自然语言对话即可调整画面风格、光影、运镜等参数。
2. 减少重复劳动:传统“抽卡”模式下每次调整都需要重新生成全部画面,该工具在理解意图后只修改受限区域或属性,理论上更节省时间和算力。
3. 独立开发者的示范:该项目由个人完成,证明基于大模型 API 进行垂直场景封装仍存在创新空间,也鼓励更多开发者关注“交互模式优化”而非单纯堆砌算力。
值得关注的后续
1. 产品稳定性与负荷测试:公开测试后,用户反馈将直接暴露迭代频率、计算延迟、常见 Bug 等实际情况,直接影响早期使用者的留存。
2. 定价与商业化落地:目前为免费测试期,后续若转向收费,其定价策略是否匹配“对话式迭代”对 API 调用成本的消耗,是走向生产环境的关键。
3. 大模型厂商是否跟进:Google 官方或竞对(如 OpenAI 的 Sora 后续版本)可能推出类似交互能力,独立产品的窗口期有限。


