Gemini 3.5 Flash：更贵，但谷歌计划用它来做一切

一句话看懂：谷歌在 I/O 大会上正式发布 Gemini 3.5 Flash 模型，跳过预览版直接全量上线，并立即将其部署到旗下多个核心产品中。模型价格大幅上涨，输入输出价格分别达到 3 美元/百万 token 和 9 美元/百万 token，是其前代 3 Flash Preview 的 3 倍，同时逼近自家 3.1 Pro 的定价水平。

事件核心：发生了什么

Gemini 3.5 Flash 于 2026 年 5 月 19 日面向全球数十亿用户开放。模型 ID 为 gemini-3.5-flash，知识截止于 2025 年 1 月，支持 1,048,576 个输入 token 和 65,536 个输出 token。新模型不再带有“预览”标签，直接进入正式可用（GA）状态。平台功能基本沿用 Gemini 3.x 系列，但移除了计算机使用（computer use）能力。谷歌还推出了尚处 Beta 阶段的 Interactions API，负责服务端历史管理，类似 OpenAI 的 Responses 接口。

在价格方面，3.5 Flash 的输入价格为 1.50 美元/百万 token，输出价格为 9 美元/百万 token，显著高于 3 Flash Preview（0.5 美元/4.5 美元）和 3.1 Flash-Lite（0.25 美元/1.5 美元）。与竞品横向对比：OpenAI 的 GPT-5.5 价格为上一代 GPT-5.4 的两倍，Claude Opus 4.7 约为 4.6 版本的 1.46 倍。谷歌方面表示，3.5 Pro 将在“下个月”推出，价格预计更高。

为什么重要

此次发布释放了两个关键信号。第一，谷歌正在加速 Flash 系列从“平价模型”向“主力模型”的定位迁移。尽管价格显著上涨，谷歌仍计划将其部署到免费面向消费者的多个核心产品中，说明内部评估认为模型性能——尤其是在推理、代码生成等任务上的表现——值得这一成本。第二，三大 AI 实验室（谷歌、OpenAI、Anthropic）几乎同时提价，表明行业正在试探 API 客户的价格承受上限。这与过去一年价格战持续下行的趋势形成明显对比，商业逻辑正从“烧钱抢用户”转向“用更高定价覆盖更大算力投入”。

第三方评测机构 Artificial Analysis 的数据显示，在自有基准上运行 3.5 Flash（高配）的测试成本甚至超过 3.1 Pro Preview。这意味着开发者在使用时，需要考虑 token 化方式和推理 token 数量的增加对实际成本的影响，而不仅仅是看官方报价。

对用户/开发者/创作者的影响

对于普通用户，使用 Gemini 3.5 Flash 的免费产品体验可能会变得更流畅，因为谷歌愿意为其承担更高的推理成本。但 API 开发者最直接的感受是成本上升：输入价格翻三倍，输出价格翻两倍。以生成一张《骑自行车的鹈鹕》SVG 图片为例，输入 11 个 token、输出 14,403 个 token 的成本接近 13 美分。若将 3.5 Flash 用于批量任务或长上下文对话，预算压力不可忽视。对内容创作者而言，3.5 Flash 在代码、艺术风格指令（如“复古飞行员太阳镜”等细节）上的处理效果较好，适合用于需要高指令遵循度的生成场景。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

3.5 Pro 的定价与定位：“下个月”推出的 3.5 Pro 是否会继续拉高价格天花板，以及它将如何与 3.5 Flash 形成分层，是 API 开发者最关心的问题。
Interactions API 的生态影响：该接口处于 Beta 阶段，未来如果成为标准，开发者管理服务端对话历史的方式可能被谷歌重新定义，从而影响多平台迁移成本。
用户对涨价的接受度：免费产品内嵌更贵的模型，可能推动用户量增长，但也可能让第三方 API 客户转向开源模型或竞品。谷歌是否会推出长期合约折扣或缓存优惠，值得追踪。

来源：Simon Willison

Gemini 3.5 Flash：更贵，但谷歌计划用它来做一切