Google DeepMind 发布 Nano Banana 2 Lite 和 Gemini Omni Flash

Google DeepMind 于 2026 年 6 月 30 日发布了两款新模型:面向高速、低成本图像生成的 Nano Banana 2 Lite,以及面向高质量视频生成与对话式编辑的 Gemini Omni Flash。这两款模型均已向开发者开放 API,并开始整合进 Google 的消费者产品线。

Google DeepMind 发布 Nano Banana 2 Lite 和 Gemini Omni Flash

一句话看懂:Google DeepMind 于 2026 年 6 月 30 日发布了两款新模型:面向高速、低成本图像生成的 Nano Banana 2 Lite,以及面向高质量视频生成与对话式编辑的 Gemini Omni Flash。这两款模型均已向开发者开放 API,并开始整合进 Google 的消费者产品线。

事件核心:发生了什么

根据 Google DeepMind 官方博客,此次发布包含两个核心动作:

  • Nano Banana 2 Lite(模型名 gemini-3.1-flash-lite-image)登场:这是 Nano Banana 家族中速度最快、成本最低的图像模型。官方给出的关键指标是:文本生成图像时延约 4 秒,每生成一张 1K 分辨率图像的成本为 0.034 美元。它在保持良好提示遵循、角色一致性和图像内文字渲染能力的前提下,优先优化吞吐量和成本。
  • Gemini Omni Flash(模型名 gemini-omni-flash-preview)面向开发者:该模型支持通过文本、图像和视频输入进行高质量视频生成与对话式编辑。其定价为每秒视频输出 0.10 美元,与早前公布的标准一致。目前以预览版形式通过 Google AI Studio、Gemini API 和 Gemini Enterprise Agent Platform 开放。

同时,Nano Banana 2 Lite 已开始向 AI Mode in Search、Gemini 应用、NotebookLM、Google Photos、Google Flow 和 Google Ads 等消费级产品推送。

为什么重要

此次发布标志着 Google DeepMind 在生成式多媒体领域完成了关键的产品线闭环。此前,其图像生成(Nano Banana 系列)与视频生成(Gemini Omni 系列)各自独立发展,这一次通过统一 API 和平台让开发者能够串联起“快速图像原型——高质量视频生成与编辑”的完整工作流。

Nano Banana 2 Lite 的定价(0.034 美元/张)和时延(4 秒)表明,大规模、高并发的图像生成场景(如电商图批量生成、广告素材迭代、实时交互原型)已进入可规模商用的成本区间。这直接对 Midjourney、Stability AI 以及国内外同类竞品形成价格与速度的双重挤压。

Gemini Omni Flash 的开放则意味着多模态推理与视频生成能力的结合不再是演示阶段的 demo,而是可编程、可集成的核心能力,尤其适用于需要多轮创作对话的场景,例如视频脚本的可视化修改、3D 动效的即时生成等。

对用户/开发者/创作者的影响

  • 开发者:如果当前正在使用第一代 Nano Banana(gemini-2.5-flash-image),官方明确建议直接切换到 Nano Banana 2 Lite,可立即获得更高质量、更快速度和更低成本。对于需要处理视频生成任务的团队,Gemini Omni Flash 的预览版提供了原生集成的可能性,无需自行搭建复杂的多模型流水线。
  • 内容创作者与广告商:Nano Banana 2 Lite 整合进 Google Ads 和 AI Mode in Search,意味着创作者可以直接在广告构建或搜索过程中使用低成本图像生成来快速产出素材,而视频编辑能力结合 Gemini Omni 的对话式交互(如“把桌面的红苹果变成绿苹果”),将显著降低视频后制门槛。
  • 企业采购决策者:需要关注的是,Nano Banana 2 Lite 适用于低带宽、高吞吐场景,而复杂、精准度要求高的任务仍应选用 Nano Banana Pro。如果企业已有 Gemini Enterprise Agent Platform,这两个模型可以直接接入现有代理工作流,降低迁移成本。

值得关注的后续

  • Gemini Omni Flash 何时脱离预览版以及价格是否调整:目前定价 0.10 美元/秒视频输出,预览版结束后可能变化,长期定价策略将直接影响视频生成应用的商业可行性。
  • 竞品跟进:OpenAI 的 Sora 目前仍停留在展示阶段,Google 率先将视频生成能力以 API 方式开放给开发者,这一时间差可能重塑开发者的多模态模型选用习惯。
  • 消费者侧的实际体验:Nano Banana 2 Lite 已进入 Search、Photos 等高频产品,用户的“无感使用”程度将决定其是否真正成为基础设施级模型,而非只是在开发者市场叫好不叫座。
GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

来源:Google DeepMind

celebrityanime
celebrityanime
文章: 10855

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注