Gemini 3.5深夜登场,谷歌CEO劈柴亲自算账:速度快4倍、一年还省超10亿美元,曝内部已被颠覆

Gemini 3.5深夜登场,谷歌CEO劈柴亲自算账:速度快4倍、一年还省超10亿美元,曝内部已被颠覆

Gemini 3.5深夜登场,谷歌CEO劈柴亲自算账:速度快4倍、一年还省超10亿美元,曝内部已被颠覆

一句话看懂:谷歌在2025年I/O大会上发布了Gemini 3.5 Flash模型,运行速度相比其他前沿模型快4倍,且成本更低。谷歌CEO Sundar Pichai透露,若大企业将80%的工作负载切换至此模型,每年可节省超10亿美元,该模型已在内部显著改变开发流程。

事件核心:发生了什么

北京时间5月20日凌晨,谷歌I/O大会发布Gemini 3.5 Flash,这是一款面向智能体和编码场景的模型。Pichai展示了关键数据:该模型在多项编码基准测试中超越前代Gemini 3.1 Pro,例如在Terminal-Bench 2.1(76.2%)和GDPval-AA(1656 Elo)上表现更优,同时每秒输出token数比同类前沿模型快4倍。成本方面,以一家顶尖公司每日处理1万亿token计算,将80%工作负载从其他模型切换到3.5 Flash,年节省超10亿美元。该模型已从即日起在谷歌所有产品和API上开放。

此外,谷歌推出新模型Gemini Omni,可从任意输入(文本、图像、音频、视频)生成对应输出,首阶段支持视频生成,编辑仅需自然语言。同时,Gemini应用新增两款智能体:Daily Brief用于整理个人日程;Gemini Spark作为24/7个人助理,可在用户指示下跨Gmail、Docs等工具执行任务。搜索功能也迎来升级,默认模型切换为Gemini 3.5 Flash,并引入智能体和个性化搜索界面。

为什么重要

Gemini 3.5 Flash的发布直接回应了谷歌在AI编程工具市场的短板,此前Cursor、Claude Code和GitHub Copilot几乎主导该赛道。谷歌通过更低成本、更高性能的模型,试图争夺开发者生态。Pichai强调,该模型在内部已彻底改变工作方式:每天处理的内部开发token量从3月约5000亿飙升至3万亿,形成高效迭代闭环。这具体体现了“推理成本”已成为大模型商业化竞争的核心——同等或更强能力下,更低成本意味着更广的部署场景和更高的企业采购吸引力。Gemini Omni则展示了从“预测文本”向“模拟现实”的扩展,将多模态理解与生成融合,为视频创作工具提供了新路径。

对用户/开发者/创作者的影响

对开发者:Gemini 3.5 Flash以不到可比前沿模型一半的成本提供编码能力提升,企业可显著降低API调用开销,尤其适合高频代码生成和智能体任务场景。不过谷歌尚未公布详细API定价,开发者需持续关注价格变化。同时,Antigravity平台的引入使开发者能构建更复杂的智能体工作流。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

对普通用户:Gemini应用新增Daily Brief和Spark智能体,每日可用性提升:前者从Gmail/日历主动整理事项,后者可执行重复任务并持续在后台运行。这些功能首先面向美国付费用户(AI Plus/Pro/Ultra),尚未公布全球落地时间表。

对创作者:Gemini Omni降低了视频生成的门槛,用户通过对话即可编辑视频的细节、场景或风格,并保持一致性。所有生成的视频含SynthID数字水印,可通过Google搜索验证,为内容出处提供了保障,但也可能引发对AI生成内容真实性的讨论。

值得关注的后续

  • Gemini 3.5 Pro预计下月发布,其能力改进程度将决定谷歌在高端模型市场的竞争力。
  • Omni系列的视频生成能力是否提供API访问、如何定价,将直接影响创作者工具生态。
  • 谷歌搜索的全新AI模式(如个性化搜索仪表盘、智能体搜索)今夏开始逐步上线,是否改变用户搜索习惯并影响广告收入模式,值得持续跟踪。

来源:InfoQ CN

celebrityanime
celebrityanime
文章: 3508

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注