Gemini 3.5深夜登场，谷歌CEO劈柴亲自算账：速度快4倍、一年还省超10亿美元，曝内部已被颠覆

一句话看懂：谷歌在2025年I/O大会上发布了Gemini 3.5 Flash模型，运行速度相比其他前沿模型快4倍，且成本更低。谷歌CEO Sundar Pichai透露，若大企业将80%的工作负载切换至此模型，每年可节省超10亿美元，该模型已在内部显著改变开发流程。

事件核心：发生了什么

北京时间5月20日凌晨，谷歌I/O大会发布Gemini 3.5 Flash，这是一款面向智能体和编码场景的模型。Pichai展示了关键数据：该模型在多项编码基准测试中超越前代Gemini 3.1 Pro，例如在Terminal-Bench 2.1（76.2%）和GDPval-AA（1656 Elo）上表现更优，同时每秒输出token数比同类前沿模型快4倍。成本方面，以一家顶尖公司每日处理1万亿token计算，将80%工作负载从其他模型切换到3.5 Flash，年节省超10亿美元。该模型已从即日起在谷歌所有产品和API上开放。

此外，谷歌推出新模型Gemini Omni，可从任意输入（文本、图像、音频、视频）生成对应输出，首阶段支持视频生成，编辑仅需自然语言。同时，Gemini应用新增两款智能体：Daily Brief用于整理个人日程；Gemini Spark作为24/7个人助理，可在用户指示下跨Gmail、Docs等工具执行任务。搜索功能也迎来升级，默认模型切换为Gemini 3.5 Flash，并引入智能体和个性化搜索界面。

为什么重要

Gemini 3.5 Flash的发布直接回应了谷歌在AI编程工具市场的短板，此前Cursor、Claude Code和GitHub Copilot几乎主导该赛道。谷歌通过更低成本、更高性能的模型，试图争夺开发者生态。Pichai强调，该模型在内部已彻底改变工作方式：每天处理的内部开发token量从3月约5000亿飙升至3万亿，形成高效迭代闭环。这具体体现了“推理成本”已成为大模型商业化竞争的核心——同等或更强能力下，更低成本意味着更广的部署场景和更高的企业采购吸引力。Gemini Omni则展示了从“预测文本”向“模拟现实”的扩展，将多模态理解与生成融合，为视频创作工具提供了新路径。

对用户/开发者/创作者的影响

对开发者：Gemini 3.5 Flash以不到可比前沿模型一半的成本提供编码能力提升，企业可显著降低API调用开销，尤其适合高频代码生成和智能体任务场景。不过谷歌尚未公布详细API定价，开发者需持续关注价格变化。同时，Antigravity平台的引入使开发者能构建更复杂的智能体工作流。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

对普通用户：Gemini应用新增Daily Brief和Spark智能体，每日可用性提升：前者从Gmail/日历主动整理事项，后者可执行重复任务并持续在后台运行。这些功能首先面向美国付费用户（AI Plus/Pro/Ultra），尚未公布全球落地时间表。

对创作者：Gemini Omni降低了视频生成的门槛，用户通过对话即可编辑视频的细节、场景或风格，并保持一致性。所有生成的视频含SynthID数字水印，可通过Google搜索验证，为内容出处提供了保障，但也可能引发对AI生成内容真实性的讨论。

值得关注的后续

Gemini 3.5 Pro预计下月发布，其能力改进程度将决定谷歌在高端模型市场的竞争力。
Omni系列的视频生成能力是否提供API访问、如何定价，将直接影响创作者工具生态。
谷歌搜索的全新AI模式（如个性化搜索仪表盘、智能体搜索）今夏开始逐步上线，是否改变用户搜索习惯并影响广告收入模式，值得持续跟踪。

来源：InfoQ CN

Gemini 3.5深夜登场，谷歌CEO劈柴亲自算账：速度快4倍、一年还省超10亿美元，曝内部已被颠覆