Gemini 3.5 Pro全网首曝,编程追平GPT-5.5,谷歌终于狠起来了

Gemini 3.5 Pro全网首曝,编程追平GPT-5.5,谷歌终于狠起来了

Gemini 3.5 Pro全网首曝,编程追平GPT-5.5,谷歌终于狠起来了

一句话看懂:谷歌在I/O大会前夕意外跳级曝光Gemini 3.5 Pro(代号Cappuccino),编码能力追平GPT-5.5,并抢先泄露24/7全时Agent「Gemini Spark」。这意味着谷歌正从「只卷模型」转向「模型+Agent+生态」三线作战,但编程能力仍落后于Anthropic,距离前沿模型Mythos有明显差距。

事件核心:发生了什么

爆料人Lentils放出的信息显示,Gemini 3.5 Pro检查点已开始产出,新产品直接从传闻中的3.2跳级命名。同期泄露的3.2 Flash在编码和推理上达到GPT-5.5的92%,成本仅为其1/15至1/20。更重磅的是,谷歌全新Agent「Gemini Spark」也遭曝光:它能全天候待命,处理邮件、执行在线任务,甚至可能「未经询问」代用户下单或分享信息,数据来源涵盖Google应用、聊天记录、位置信息及远程浏览器登录凭证。

不过,科技记者Alex Heath从多个信源确认:新版Gemini的性能大致落在GPT-5.5档位,距离Anthropic最新模型Mythos仍有明显差距。英国AI安全研究所评测显示,Mythos是第一个同时通过其两套网络安全测试范围的模型,GPT-5.5仅通过一套。

为什么重要

这次曝光揭示了谷歌AI策略的两个关键转向。第一,命名跳级到3.5反映出谷歌希望在I/O大会上讲一个更大的故事,用版本号压制竞争对手的声量。第二,Spark Agent的泄露表明谷歌不再仅靠模型Elo评分竞争,而是押注10亿级用户分发入口:当用户把邮件、日程、购物、浏览数据反哺给Gemini训练时,这将形成OpenAI和Anthropic难以复制的数据飞轮。

但编程能力仍是谷歌的软肋。XDA的实测显示,Claude Code能一次理解复杂创意提示,而谷歌的Antigravity(内部IDE)输出质量被形容为「微软画图」水平,且定价策略多次调整,社区抱怨额度用完无提醒。目前AI编程已出圈:产品经理用自然语言直接生成原型,设计师丢Figma稿拿前端代码——谷歌至今没有产品进入这个对话。

对用户/开发者/创作者的影响

对普通用户,Spark Agent可能改变日常数字生活:全天候管理邮件、执行跨步骤任务,但需权衡隐私风险——它可能未经询问分享个人信息或完成购买,且会保存远程浏览器登录凭证。对开发者,新Gemini在SVG生成、交互式3D编码和动画上已超过3.1 Pro,且可能原生支持MCP第三方工具接入,但编程能力提升尚未达到质变,短期内Claude仍是默认选项。对创作者,一个prompt生成4个风格各异的矢量插画被证实,多模态生成能力有显著提升。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,Spark Agent是否会随新Gemini一同上线,其「未经询问代下单」条款是否会在正式版中调整,以及隐私保护机制如何设计。第二,谷歌如何弥合编程差距——目前公开信息显示,其AI编程平台Antigravity在4个月内仅获得6%的开发者采用率,定价和体验问题是否会在I/O上推出新方案。第三,三巨头仍在加码补贴战:OpenAI给Codex追加ultrafast模式并提供2个月免费切换,Anthropic将Claude Code额度提升50%,价格下降趋势对开发者和企业采购者有利。

来源:36氪 · 24小时热榜

celebrityanime
celebrityanime
文章: 2137

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注