[推广] 一个对话式的 AI 视频生成工具 Gemini Omni Video，像聊天一样做视频

一句话看懂：一位独立开发者基于 Google Gemini Omni 模型，推出了一款对话式 AI 视频生成工具，用户无需反复抽卡或调整复杂参数，可以通过连续对话精调画面细节，旨在解决现有 AI 视频工具“一锤子买卖”的痛点。

事件核心：发生了什么

近日，一位独立开发者在 V2EX 社区发布了自己开发的 AI 视频产品 Gemini Omni Video，并邀请社区测试反馈。该工具的核心逻辑是将视频生成转变为“创意对话”流程：用户用自然语言描述场景后，AI 即时生成 4K 视频；如果对画面不满意，可以继续提出如“让光线更暖一些”“添加雨天效果”等具体指令，AI 会在保留原有画面基础上实时重新渲染，而非重新生成。

开发者在帖子中披露，他开发这款工具的初衷是受够了当前主流 AI 视频工具的“抽卡式”使用体验——用户往往需要不断更换提示词，从头尝试。目前该产品已上线公测，网址为 https://geminiomnivideo.ai，属于个人独立开发项目。

为什么重要

从技术路径看，Gemini Omni Video 将 Google 的 Gemini Omni 模型能力封装为“对话式视频编辑”，跳出了大多数 AI 视频工具“一次性生成+手动剪辑”的范式。这种“意图理解+保留场景迭代”的方式，有可能降低短视频、宣发物料等场景的试错成本，让非专业用户更接近“像和人沟通一样”完成视频制作。

不过，目前公开信息显示，该产品仍处于早期测试阶段，是否具备持续的生产级稳定性、模型推理成本如何控制、是否支持长视频和高帧率等细节尚未披露。其竞品包括 Runway Gen-3、Pika Labs 以及国内许多视频生成工具，但“对话式双向编辑”是差异化卖点。

对用户/开发者/创作者的影响

对短视频创作者、营销人员及个人开发者的影响较为直接：

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

1. 降低使用门槛：不用学习剪辑软件或复杂提示词工程，通过自然语言对话即可调整画面风格、光影、运镜等参数。

2. 减少重复劳动：传统“抽卡”模式下每次调整都需要重新生成全部画面，该工具在理解意图后只修改受限区域或属性，理论上更节省时间和算力。

3. 独立开发者的示范：该项目由个人完成，证明基于大模型 API 进行垂直场景封装仍存在创新空间，也鼓励更多开发者关注“交互模式优化”而非单纯堆砌算力。

值得关注的后续

1. 产品稳定性与负荷测试：公开测试后，用户反馈将直接暴露迭代频率、计算延迟、常见 Bug 等实际情况，直接影响早期使用者的留存。

2. 定价与商业化落地：目前为免费测试期，后续若转向收费，其定价策略是否匹配“对话式迭代”对 API 调用成本的消耗，是走向生产环境的关键。

3. 大模型厂商是否跟进：Google 官方或竞对（如 OpenAI 的 Sora 后续版本）可能推出类似交互能力，独立产品的窗口期有限。

来源：V2EX (创意工作者社区)

[推广] 一个对话式的 AI 视频生成工具 Gemini Omni Video，像聊天一样做视频