独家丨商汤科技正研发新图像模型:代号 U1 Pro,内部称将对标 OpenAI

商汤科技正在秘密研发一款代号“U1 Pro”的多模态图像生成大模型,由联合创始人林达华带队,内部定位直接对标 OpenAI 的 GPT-Image 2。该模型预计今年 7 月启动内测,主打“会思考的设计”场景。

独家丨商汤科技正研发新图像模型:代号 U1 Pro,内部称将对标 OpenAI

一句话看懂:商汤科技正在秘密研发一款代号“U1 Pro”的多模态图像生成大模型,由联合创始人林达华带队,内部定位直接对标 OpenAI 的 GPT-Image 2。该模型预计今年 7 月启动内测,主打“会思考的设计”场景。

事件核心:发生了什么

据新浪科技独家消息,商汤科技近期正秘密推进一款面向“设计”场景的多模态大模型研发,内部代号“U1 Pro”。该模型由商汤联合创始人、首席科学家林达华牵头,被定位为商汤日日新模型家族的新成员。目前公开的信息显示,U1 Pro 被设计为“会思考的图像生成模型”,能够在复杂设计需求下实现设计、生成、评审的长程循环,并支持 8K 分辨率输出。

商汤研究院负责该模型的推进,预计 2026 年 7 月启动内部邀请测试,并同步向客户提供服务。据知情人士透露,在大量内部评测中,相同提示词下 U1 Pro 生成的图片效果与 GPT-Image 2 高度接近,部分指标甚至更具优势。这一动作发生在 OpenAI 近期可能在图像生成领域发力、将“设计”作为重点方向的行业预期之中。

为什么重要

这一新闻释放了两个关键信号。第一,商汤选择跳过或绕开当前大模型主流的编程竞赛(如 Anthropic 与智谱的竞争),直接切入图像生成赛道,且瞄准的是“设计”这一高附加值垂直场景。这意味着多模态模型的应用价值正从通用聊天、代码辅助向专业创作领域迁移。第二,U1 Pro 内部对标 GPT-Image 2,说明商汤判断 OpenAI 在该领域已建立优势——LMSYS Chatbot Arena 的文生图评分中,GPT-Image 2 在图像质量、文字渲染和指令遵循上大幅领先谷歌的 Nano Banana 2。若 U1 Pro 真能实现接近或超越的效果,将直接改变国内生成式 AI 在图像市场的竞争格局。

对用户/开发者/创作者的影响

对于设计师、UI/UX 从业者及内容创作者而言,U1 Pro 若如期上线,将提供一款“会思考的图像生成工具”,即模型不仅能理解指令,还能在设计过程中自行迭代评审,这可能会大幅缩短从创意到成稿的循环时间。对于开发者,该模型预计会通过商汤日日新 API 开放,降低接入高质量图像生成能力的门槛。目前公开信息显示,U1 Pro 在分辨率(8K)和长程设计循环上的能力,意味着它更适合工业级应用场景,如海报生成、产品渲染、品牌视觉设计等,而不是简单的娱乐化图片生成。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

第一,7 月内测能否如期启动,以及测试反馈是否达到对标 GPT-Image 2 的水平。第二,商汤是否会开放部分基础能力免费或低门槛调用,以吸引设计领域开发者和创作者生态。第三,OpenAI 是否会在同一时间窗口发布新的图像生成模型,以及 Anthropic、智谱等公司是否会跟进“设计”赛道,引发新一轮投资和研发竞赛。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 9908

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注