格隆汇 6 月 3 日|微软 (MSFT.O) 人工智能负责人:MAI Image 2.5 及其 Flash 版本在图像编辑方面的得分已超越 Nano Banana 2。

格隆汇 6 月 3 日|微软 (MSFT.O) 人工智能负责人:MAI Image 2.5 及其 Flash 版本在图像编辑方面的得分已超越 Nano Banana 2。

格隆汇 6 月 3 日|微软 (MSFT.O) 人工智能负责人:MAI Image 2.5 及其 Flash 版本在图像编辑方面的得分已超越 Nano Banana 2。

一句话看懂:微软人工智能负责人公开表示,其 MAI Image 2.5 模型(含 Flash 轻量版本)在图像编辑性能评测中,得分已超越竞品 Nano Banana 2。此举表明微软在图像生成与编辑领域的模型迭代正在加速,并已具备对标头部闭源产品的实力。

事件核心:发生了什么

6 月 3 日,微软人工智能部门负责人通过格隆汇等渠道披露,微软旗下的图像编辑模型 MAI Image 2.5 及其优化版本 MAI Image 2.5 Flash,在针对图像编辑能力的专项评测中,得分已超越 Nano Banana 2。Nano Banana 2 是当前图像编辑领域一款被广泛引用的高性能模型,此前在多项基准测试中保持领先。微软此次公开宣称超越,意味着 MAI Image 2.5 在图像编辑任务(如修图、局部重绘、风格迁移等)上已实现可量化的技术进步,而 Flash 版本则在推理速度或资源占用上做了针对性优化。

为什么重要

这一表态直接影响 AI 图像生成与编辑领域的竞争格局。此前,图像编辑赛道主要由 OpenAI、Stability AI 以及部分开源社区模型主导,微软虽有基于 DALL-E 的 Copilot 集成,但自研模型 MAI Image 系列的竞争力一直未公开对齐头部产品。如今 MAI Image 2.5 在明确评测维度上超越 Nano Banana 2,至少释放三个信号:一是微软在大模型领域的投入正从文本(GPT 系列)向多模态视觉大模型全面延伸;二是微软的模型迭代周期加快,从 MAI Image 2.0 到 2.5 的进步幅度可能超出行业预期;三是 Flash 轻量版的推出,意味着微软有意推动该模型在云端推理、 API 调用、甚至本地部署等商业化场景中落地,降低算力门槛。

对用户/开发者/创作者的影响

对普通 AI 绘画用户和内容创作者而言,MAI Image 2.5 若集成到微软现有产品(如 Designer、Copilot、Azure AI Studio),他们可能很快能通过更低成本或更高画质的方式完成批量图像编辑,无需再依赖独立付费工具。对于开发者来说,微软将极有可能开放 MAI Image 2.5 的 API 接口,届时图像编辑类应用的开发成本有望进一步下降,尤其 Flash 版本适合对延迟敏感的实时编辑场景,如直播、社交滤镜或在线修图平台。对于企业采购方,如果 Azure 平台同步提供该模型的企业级微调服务,将增加在图像编辑任务上替换第三方 SaaS 产品的理由,尤其当模型在特定垂直行业(如电商商品图处理、广告素材生产)表现优于竞品时。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

首先,MAI Image 2.5 及其 Flash 版本的具体评分基准和评测方法论目前尚未被完整公开,需要等待微软发布正式技术报告或榜单位置,以确认超越的幅度和具体任务分布。其次,Nano Banana 2 的团队是否会更新大版本或发布 Nano Banana 3 来反超,以及开源社区模型(如 Stable Diffusion 系列)是否会快速适配类似能力,都将是近期看点。最后,Flash 版本是否会尽快上线 Azure AI 服务并公布定价,将是判断微软是否真正将其推向商业化规模的关键节点,若定价低于同类 API(如 DALL-E 3 API 或 Midjourney 企业计划),将迅速改变中小企业和独立开发者的选择倾向。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 5227

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注