智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布,融资持续提速

智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布,融资持续提速

智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布,融资持续提速

一句话看懂:智象未来在5月19日开放日发布了基于原生全模态架构的超2000亿参数图像大模型HiDream-O1-Image-Pro,同时在半个月内完成新一轮亿级融资,由深创投、金浦投资等机构参与。该模型在复杂文本渲染、指令编辑等任务上刷新SOTA,标志着原生全模态路线的规模化验证加速。

事件核心:发生了什么

智象未来于2026年5月19日在北京举办首届开放日,正式发布HiDream-O1-Image-Pro。该模型采用原生全模态架构Unified Transformer(UiT),参数规模超2000亿,为闭源版本。相比此前8B参数的开源版本,Pro版在复杂文本渲染、多主体个性化等任务上达到新的SOTA水平。同时,公司宣布完成新一轮亿级融资,投资方包括深创投、金浦投资、财鑫资本、复聚资本等,这是继此前超5亿元融资后的新一轮动作。目前智象未来已形成“1+1+3”业务架构:底层HiDream系列大模型,中层HiHarness企业服务平台,上层覆盖商业营销(HiBurst)、影视创作(帧赞)和社媒创作(vivago)三大智能体应用。

为什么重要

传统图像生成模型多采用“文本+图像”分离编码(如LDM架构),在复杂语义理解和高保真细节还原上存在瓶颈。智象未来的UiT架构将图像像素、文本标记和任务条件统一纳入共享标记空间,从底层实现多模态深度融合。此次2000亿+参数模型的发布,验证了这种“原生全模态”架构在大规模下的可扩展性。从行业视角看,AI竞争正从内容生成转向对物理世界的理解与预测,视觉生成被视为通向世界模型的关键路径。半月内连续完成多轮融资,深创投、金浦投资等多元资本入局,说明资本市场对该技术路线及其商业化落地(如HiBurst已覆盖TikTok、Meta等平台,年生产电商营销视频超百万条)的持续看好。

对用户/开发者/创作者的影响

对于专业内容创作者,HiDream-O1-Image-Pro的高保真文字渲染和多主体个性化能力,可显著提升广告海报、影视分镜等需精准控制元素的生成质量。开发者可通过HiHarness企业服务平台调用模型能力,构建定制化应用。企业用户可关注三大智能体产品:商业营销智能体HiBurst已服务跨境电商场景,年覆盖GMV超亿元;影视创作工具“帧赞”累计制作短漫剧超5000分钟;社媒创作智能体vivago已覆盖100多个国家、超4000万用户。对于技术研究者,该架构的开源版本(8B参数)在Artificial Analysis榜单上排名开源第一,是研究原生全模态路线的有效参考。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

首先,闭源Pro版的具体定价与API开放计划尚未披露,后续商用成本将直接影响中小团队的使用门槛。其次,智象未来与上影集团、蓝色光标等产业伙伴的合作已启动,需观察在影视创作和商业营销场景的实际落地效果。最后,随着2000亿+参数模型的推出,竞争对手(如Stability AI、OpenAI)在原生全模态路线上是否会加速跟进,是判断行业格局变化的重要参照。

来源:量子位 · 每日最新

celebrityanime
celebrityanime
文章: 3137

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注