Gemini 3.5 Flash:更贵,但谷歌计划用它来做一切

Gemini 3.5 Flash:更贵,但谷歌计划用它来做一切

Gemini 3.5 Flash:更贵,但谷歌计划用它来做一切

一句话看懂:谷歌在 I/O 大会上正式发布 Gemini 3.5 Flash 模型,跳过预览版直接全量上线,并立即将其部署到旗下多个核心产品中。模型价格大幅上涨,输入输出价格分别达到 3 美元/百万 token 和 9 美元/百万 token,是其前代 3 Flash Preview 的 3 倍,同时逼近自家 3.1 Pro 的定价水平。

事件核心:发生了什么

Gemini 3.5 Flash 于 2026 年 5 月 19 日面向全球数十亿用户开放。模型 ID 为 gemini-3.5-flash,知识截止于 2025 年 1 月,支持 1,048,576 个输入 token 和 65,536 个输出 token。新模型不再带有“预览”标签,直接进入正式可用(GA)状态。平台功能基本沿用 Gemini 3.x 系列,但移除了计算机使用(computer use)能力。谷歌还推出了尚处 Beta 阶段的 Interactions API,负责服务端历史管理,类似 OpenAI 的 Responses 接口。

在价格方面,3.5 Flash 的输入价格为 1.50 美元/百万 token,输出价格为 9 美元/百万 token,显著高于 3 Flash Preview(0.5 美元/4.5 美元)和 3.1 Flash-Lite(0.25 美元/1.5 美元)。与竞品横向对比:OpenAI 的 GPT-5.5 价格为上一代 GPT-5.4 的两倍,Claude Opus 4.7 约为 4.6 版本的 1.46 倍。谷歌方面表示,3.5 Pro 将在“下个月”推出,价格预计更高。

为什么重要

此次发布释放了两个关键信号。第一,谷歌正在加速 Flash 系列从“平价模型”向“主力模型”的定位迁移。尽管价格显著上涨,谷歌仍计划将其部署到免费面向消费者的多个核心产品中,说明内部评估认为模型性能——尤其是在推理、代码生成等任务上的表现——值得这一成本。第二,三大 AI 实验室(谷歌、OpenAI、Anthropic)几乎同时提价,表明行业正在试探 API 客户的价格承受上限。这与过去一年价格战持续下行的趋势形成明显对比,商业逻辑正从“烧钱抢用户”转向“用更高定价覆盖更大算力投入”。

第三方评测机构 Artificial Analysis 的数据显示,在自有基准上运行 3.5 Flash(高配)的测试成本甚至超过 3.1 Pro Preview。这意味着开发者在使用时,需要考虑 token 化方式和推理 token 数量的增加对实际成本的影响,而不仅仅是看官方报价。

对用户/开发者/创作者的影响

对于普通用户,使用 Gemini 3.5 Flash 的免费产品体验可能会变得更流畅,因为谷歌愿意为其承担更高的推理成本。但 API 开发者最直接的感受是成本上升:输入价格翻三倍,输出价格翻两倍。以生成一张《骑自行车的鹈鹕》SVG 图片为例,输入 11 个 token、输出 14,403 个 token 的成本接近 13 美分。若将 3.5 Flash 用于批量任务或长上下文对话,预算压力不可忽视。对内容创作者而言,3.5 Flash 在代码、艺术风格指令(如“复古飞行员太阳镜”等细节)上的处理效果较好,适合用于需要高指令遵循度的生成场景。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

  1. 3.5 Pro 的定价与定位:“下个月”推出的 3.5 Pro 是否会继续拉高价格天花板,以及它将如何与 3.5 Flash 形成分层,是 API 开发者最关心的问题。
  2. Interactions API 的生态影响:该接口处于 Beta 阶段,未来如果成为标准,开发者管理服务端对话历史的方式可能被谷歌重新定义,从而影响多平台迁移成本。
  3. 用户对涨价的接受度:免费产品内嵌更贵的模型,可能推动用户量增长,但也可能让第三方 API 客户转向开源模型或竞品。谷歌是否会推出长期合约折扣或缓存优惠,值得追踪。

来源:Simon Willison

celebrityanime
celebrityanime
文章: 2966

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注