
Gemini 3.5 Flash:更贵,但谷歌计划用它来做一切
一句话看懂:谷歌在 I/O 大会上正式发布 Gemini 3.5 Flash 模型,跳过预览版直接全量上线,并立即将其部署到旗下多个核心产品中。模型价格大幅上涨,输入输出价格分别达到 3 美元/百万 token 和 9 美元/百万 token,是其前代 3 Flash Preview 的 3 倍,同时逼近自家 3.1 Pro 的定价水平。
事件核心:发生了什么
Gemini 3.5 Flash 于 2026 年 5 月 19 日面向全球数十亿用户开放。模型 ID 为 gemini-3.5-flash,知识截止于 2025 年 1 月,支持 1,048,576 个输入 token 和 65,536 个输出 token。新模型不再带有“预览”标签,直接进入正式可用(GA)状态。平台功能基本沿用 Gemini 3.x 系列,但移除了计算机使用(computer use)能力。谷歌还推出了尚处 Beta 阶段的 Interactions API,负责服务端历史管理,类似 OpenAI 的 Responses 接口。
在价格方面,3.5 Flash 的输入价格为 1.50 美元/百万 token,输出价格为 9 美元/百万 token,显著高于 3 Flash Preview(0.5 美元/4.5 美元)和 3.1 Flash-Lite(0.25 美元/1.5 美元)。与竞品横向对比:OpenAI 的 GPT-5.5 价格为上一代 GPT-5.4 的两倍,Claude Opus 4.7 约为 4.6 版本的 1.46 倍。谷歌方面表示,3.5 Pro 将在“下个月”推出,价格预计更高。
为什么重要
此次发布释放了两个关键信号。第一,谷歌正在加速 Flash 系列从“平价模型”向“主力模型”的定位迁移。尽管价格显著上涨,谷歌仍计划将其部署到免费面向消费者的多个核心产品中,说明内部评估认为模型性能——尤其是在推理、代码生成等任务上的表现——值得这一成本。第二,三大 AI 实验室(谷歌、OpenAI、Anthropic)几乎同时提价,表明行业正在试探 API 客户的价格承受上限。这与过去一年价格战持续下行的趋势形成明显对比,商业逻辑正从“烧钱抢用户”转向“用更高定价覆盖更大算力投入”。
第三方评测机构 Artificial Analysis 的数据显示,在自有基准上运行 3.5 Flash(高配)的测试成本甚至超过 3.1 Pro Preview。这意味着开发者在使用时,需要考虑 token 化方式和推理 token 数量的增加对实际成本的影响,而不仅仅是看官方报价。
对用户/开发者/创作者的影响
对于普通用户,使用 Gemini 3.5 Flash 的免费产品体验可能会变得更流畅,因为谷歌愿意为其承担更高的推理成本。但 API 开发者最直接的感受是成本上升:输入价格翻三倍,输出价格翻两倍。以生成一张《骑自行车的鹈鹕》SVG 图片为例,输入 11 个 token、输出 14,403 个 token 的成本接近 13 美分。若将 3.5 Flash 用于批量任务或长上下文对话,预算压力不可忽视。对内容创作者而言,3.5 Flash 在代码、艺术风格指令(如“复古飞行员太阳镜”等细节)上的处理效果较好,适合用于需要高指令遵循度的生成场景。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
- 3.5 Pro 的定价与定位:“下个月”推出的 3.5 Pro 是否会继续拉高价格天花板,以及它将如何与 3.5 Flash 形成分层,是 API 开发者最关心的问题。
- Interactions API 的生态影响:该接口处于 Beta 阶段,未来如果成为标准,开发者管理服务端对话历史的方式可能被谷歌重新定义,从而影响多平台迁移成本。
- 用户对涨价的接受度:免费产品内嵌更贵的模型,可能推动用户量增长,但也可能让第三方 API 客户转向开源模型或竞品。谷歌是否会推出长期合约折扣或缓存优惠,值得追踪。


