独家丨商汤科技正研发新图像模型：代号 U1 Pro，内部称将对标 OpenAI

一句话看懂：商汤科技正在秘密研发一款代号“U1 Pro”的多模态图像生成大模型，由联合创始人林达华带队，内部定位直接对标 OpenAI 的 GPT-Image 2。该模型预计今年 7 月启动内测，主打“会思考的设计”场景。

事件核心：发生了什么

据新浪科技独家消息，商汤科技近期正秘密推进一款面向“设计”场景的多模态大模型研发，内部代号“U1 Pro”。该模型由商汤联合创始人、首席科学家林达华牵头，被定位为商汤日日新模型家族的新成员。目前公开的信息显示，U1 Pro 被设计为“会思考的图像生成模型”，能够在复杂设计需求下实现设计、生成、评审的长程循环，并支持 8K 分辨率输出。

商汤研究院负责该模型的推进，预计 2026 年 7 月启动内部邀请测试，并同步向客户提供服务。据知情人士透露，在大量内部评测中，相同提示词下 U1 Pro 生成的图片效果与 GPT-Image 2 高度接近，部分指标甚至更具优势。这一动作发生在 OpenAI 近期可能在图像生成领域发力、将“设计”作为重点方向的行业预期之中。

为什么重要

这一新闻释放了两个关键信号。第一，商汤选择跳过或绕开当前大模型主流的编程竞赛（如 Anthropic 与智谱的竞争），直接切入图像生成赛道，且瞄准的是“设计”这一高附加值垂直场景。这意味着多模态模型的应用价值正从通用聊天、代码辅助向专业创作领域迁移。第二，U1 Pro 内部对标 GPT-Image 2，说明商汤判断 OpenAI 在该领域已建立优势——LMSYS Chatbot Arena 的文生图评分中，GPT-Image 2 在图像质量、文字渲染和指令遵循上大幅领先谷歌的 Nano Banana 2。若 U1 Pro 真能实现接近或超越的效果，将直接改变国内生成式 AI 在图像市场的竞争格局。

对用户/开发者/创作者的影响

对于设计师、UI/UX 从业者及内容创作者而言，U1 Pro 若如期上线，将提供一款“会思考的图像生成工具”，即模型不仅能理解指令，还能在设计过程中自行迭代评审，这可能会大幅缩短从创意到成稿的循环时间。对于开发者，该模型预计会通过商汤日日新 API 开放，降低接入高质量图像生成能力的门槛。目前公开信息显示，U1 Pro 在分辨率（8K）和长程设计循环上的能力，意味着它更适合工业级应用场景，如海报生成、产品渲染、品牌视觉设计等，而不是简单的娱乐化图片生成。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

第一，7 月内测能否如期启动，以及测试反馈是否达到对标 GPT-Image 2 的水平。第二，商汤是否会开放部分基础能力免费或低门槛调用，以吸引设计领域开发者和创作者生态。第三，OpenAI 是否会在同一时间窗口发布新的图像生成模型，以及 Anthropic、智谱等公司是否会跟进“设计”赛道，引发新一轮投资和研发竞赛。

来源：Readhub · AI

独家丨商汤科技正研发新图像模型：代号 U1 Pro，内部称将对标 OpenAI

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

发表回复取消回复

事件核心：发生了什么

为什么重要

对用户/开发者/创作者的影响

想把多个 AI 模型放在一个入口？

值得关注的后续

celebrityanime

相关文章

AI 再强大，我们还是在商业逻辑之下

Token 消耗激增，Gartner 预测到 2028 年 AI 编程成本将超过人类开发者平均薪资

豆包收费，这是好事儿

发表回复取消回复