
Gemini 3.5深夜登场,谷歌CEO劈柴亲自算账:速度快4倍、一年还省超10亿美元,曝内部已被颠覆
一句话看懂:谷歌在2025年I/O大会上发布了Gemini 3.5 Flash模型,运行速度相比其他前沿模型快4倍,且成本更低。谷歌CEO Sundar Pichai透露,若大企业将80%的工作负载切换至此模型,每年可节省超10亿美元,该模型已在内部显著改变开发流程。
事件核心:发生了什么
北京时间5月20日凌晨,谷歌I/O大会发布Gemini 3.5 Flash,这是一款面向智能体和编码场景的模型。Pichai展示了关键数据:该模型在多项编码基准测试中超越前代Gemini 3.1 Pro,例如在Terminal-Bench 2.1(76.2%)和GDPval-AA(1656 Elo)上表现更优,同时每秒输出token数比同类前沿模型快4倍。成本方面,以一家顶尖公司每日处理1万亿token计算,将80%工作负载从其他模型切换到3.5 Flash,年节省超10亿美元。该模型已从即日起在谷歌所有产品和API上开放。
此外,谷歌推出新模型Gemini Omni,可从任意输入(文本、图像、音频、视频)生成对应输出,首阶段支持视频生成,编辑仅需自然语言。同时,Gemini应用新增两款智能体:Daily Brief用于整理个人日程;Gemini Spark作为24/7个人助理,可在用户指示下跨Gmail、Docs等工具执行任务。搜索功能也迎来升级,默认模型切换为Gemini 3.5 Flash,并引入智能体和个性化搜索界面。
为什么重要
Gemini 3.5 Flash的发布直接回应了谷歌在AI编程工具市场的短板,此前Cursor、Claude Code和GitHub Copilot几乎主导该赛道。谷歌通过更低成本、更高性能的模型,试图争夺开发者生态。Pichai强调,该模型在内部已彻底改变工作方式:每天处理的内部开发token量从3月约5000亿飙升至3万亿,形成高效迭代闭环。这具体体现了“推理成本”已成为大模型商业化竞争的核心——同等或更强能力下,更低成本意味着更广的部署场景和更高的企业采购吸引力。Gemini Omni则展示了从“预测文本”向“模拟现实”的扩展,将多模态理解与生成融合,为视频创作工具提供了新路径。
对用户/开发者/创作者的影响
对开发者:Gemini 3.5 Flash以不到可比前沿模型一半的成本提供编码能力提升,企业可显著降低API调用开销,尤其适合高频代码生成和智能体任务场景。不过谷歌尚未公布详细API定价,开发者需持续关注价格变化。同时,Antigravity平台的引入使开发者能构建更复杂的智能体工作流。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
对普通用户:Gemini应用新增Daily Brief和Spark智能体,每日可用性提升:前者从Gmail/日历主动整理事项,后者可执行重复任务并持续在后台运行。这些功能首先面向美国付费用户(AI Plus/Pro/Ultra),尚未公布全球落地时间表。
对创作者:Gemini Omni降低了视频生成的门槛,用户通过对话即可编辑视频的细节、场景或风格,并保持一致性。所有生成的视频含SynthID数字水印,可通过Google搜索验证,为内容出处提供了保障,但也可能引发对AI生成内容真实性的讨论。
值得关注的后续
- Gemini 3.5 Pro预计下月发布,其能力改进程度将决定谷歌在高端模型市场的竞争力。
- Omni系列的视频生成能力是否提供API访问、如何定价,将直接影响创作者工具生态。
- 谷歌搜索的全新AI模式(如个性化搜索仪表盘、智能体搜索)今夏开始逐步上线,是否改变用户搜索习惯并影响广告收入模式,值得持续跟踪。
来源:InfoQ CN


