仅次于 OpenAI!智象未来图像生成模型评分位列全球第二 — 快科技 — 科技改变未来

智象未来(HiDream.ai)的商用图像生成模型 HiDream-O1-Image-1.5,在全球独立 AI 模型评测平台 Artificial Analysis 的文生图排行榜上获得全球第二的综合评分,仅次于 OpenAI。这一成绩意味着中国团队在图像生成赛道正逼近国际头部的技术水平。

仅次于 OpenAI!智象未来图像生成模型评分位列全球第二 -- 快科技 -- 科技改变未来

一句话看懂:智象未来(HiDream.ai)的商用图像生成模型 HiDream-O1-Image-1.5,在全球独立 AI 模型评测平台 Artificial Analysis 的文生图排行榜上获得全球第二的综合评分,仅次于 OpenAI。这一成绩意味着中国团队在图像生成赛道正逼近国际头部的技术水平。

事件核心:发生了什么

根据媒体报道,智象未来推出的 HiDream-O1-Image-1.5 商用版模型,在 Artificial Analysis 的 Text to Image Leaderboard 中获得了 1265 ELO 评分。该榜单采用匿名对比、用户投票与 ELO 动态排名机制,以尽可能降低品牌认知对评测结果的影响,能够更真实地反映用户在开放生成场景中的偏好判断。在超过 4000 个样本对比中,该模型最终位列全球第二,仅次于 OpenAI。

半月前,智象未来开源版模型 HiDream-O1-Image-Dev-2604 已在该榜单开源模型类别中取得全球第一的成绩。此次胜出的商用版 1.5 版本,则针对广告营销、品牌设计、电商视觉、游戏内容、影视分镜和 IP 创作等更高要求的商业场景,在图像质量、文字渲染、复杂排版、多主体一致性及视觉叙事能力上均有提升。

为什么重要

这一排名首先反映出图像生成领域竞争格局的变化。此前开源与闭源模型长期由海外公司主导,而智象未来同时开源与商用版本都进入了全球第一、第二的位置,表明国产大模型在图像生成的底层能力上已具备国际竞争力。

从技术路线看,HiDream-O1-Image-1.5 的核心架构为原生全模态架构——Unified Transformer(UiT),它抛弃了传统“文本编码器 + VAE + 扩散模型”的模块化路径,将图像像素、文本 Token、视频体素、音频等多种原始信号映射到一个共享 Token 空间,由同一套 Transformer 完成理解、生成与推理。这种架构在文字密集排版、多主体生成、分镜头叙事等复杂任务中减少了细节损耗与语义错位,验证了全模态统一建模的商业化可行性。

对行业而言,UiT 架构的可扩展性意味着它在多图一致性、视频首帧生成乃至长视频生成上的底层能力更稳定。如果智象未来后续推出视频生成模型,将具备更强的技术延续性。

对用户/开发者/创作者的影响

对于从事广告、设计、影视、电商等行业的创作者,HiDream-O1-Image-1.5 的商用版提供了更可靠的工具,尤其在需要精确文字渲染、复杂排版和多个主体一致性的场景中,可能会降低反复修正的成本。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

对于开发者,开源版 HiDream-O1-Image-Dev-2604 的全球第一成绩,说明该架构在开放评测与开发者社区中已跑通,具备二次开发的基础。目前开源版已可下载使用,商用版预计将通过 API 或企业级服务方式向市场提供。

对于普通用户,目前该模型尚未公开对消费者提供免费或付费试用入口,商业落地的具体产品与价格还需要后续观察。

值得关注的后续

一是商用版何时上线、如何收费。目前公布的信息集中在模型评测成绩,尚未给出具体的发布日、API 定价或订阅方案,这将直接影响它的实际应用规模。

二是其他竞品的反应。OpenAI 的模型仍居榜首,但优势差距正在缩小;Google、Midjourney 等也在持续迭代。国内字节跳动、阿里、百度的图像生成模型同样在推进商业化,竞争格局可能在未来半年内出现进一步变化。

三是开发者生态的扩大。开源版能否吸引更多开发者基于 UiT 架构构建工具、插件或下游应用,将决定该技术路线的长远生命力。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 9067

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注