告别单轮傻瓜问答!云知声发布原生智能体大模型U2,自主攻克百步复杂工作流

告别单轮傻瓜问答!云知声发布原生智能体大模型U2,自主攻克百步复杂工作流

告别单轮傻瓜问答!云知声发布原生智能体大模型U2,自主攻克百步复杂工作流

一句话看懂:6月8日,云知声正式发布原生智能体大模型U2,不再局限于单轮对话,而是能自主处理超过100步的复杂工作流,在GPQA Diamond测试中得分87.9,超越GLM-5.1等多个主流模型。这标志着AI从“被动回答”向“主动执行”迈进了一步。

事件核心:发生了什么

云知声于6月8日推出新一代通用大语言模型U2,定位于原生智能体(Agent),面向个人、开发者和企业。与依赖单轮对话的传统模型不同,U2强化了任务执行的连续循环能力,可在复杂办公、软件工程、深度研究及多工具协作场景中,自主分解宏观抽象任务并持续推进百步级工作流,实现从“被动响应”到“主动执行”的转变。在权威评测中,U2的GPQA Diamond得分为87.9(强于GLM-5.1、DeepSeek-V4-Flash等),在真实办公能力评测GDPval中取得72.5分,展示了在复杂逻辑推理和工程化交付方面的优势。

为什么重要

当前大模型普遍停留在短链文本生成和单轮问答,难以胜任需要多步规划和工具调用的系统工程任务。U2以“智能体”为原生设计,而非在现有模型上叠加插件层,这一架构创新有望提升AI在真实生产环境中的落地效率。它让模型从对话工具升级为可独立工作的“数字员工”,对金融、研发、运营等高频多步骤场景具有直接价值。同时,其评测数据表明,在中文大模型竞争日趋激烈的背景下,智能体能力正成为新的差异化焦点,而不仅仅是参数规模和对话流畅度。

对用户/开发者/创作者的影响

对普通用户:未来可以在日常办公、资料研究中获得更高效的工具,例如让AI自动拆解项目计划、分步执行报表生成或数据清洗,无需逐条指令操作。对开发者和企业:U2提供的原生智能体架构可能降低复杂工作流的开发成本,类似SaaS中的“自动化工作流”但更灵活。企业采购时可关注其API是否支持多工具编排和长链路任务管理。对内容创作者:在多轮调研和内容策划场景下,U2的“主动执行”特性可能减少人工反馈次数,提升创作效率。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

首先,U2是否开放API公测以及定价策略,将直接影响开发者生态的构建速度。其次,云知声作为港股上市公司,U2落地效果需在Q3财报中验证,尤其是行业客户付费率。最后,GLM-5.1、DeepSeek等竞品是否会迅速跟进发布类似智能体架构模型,将决定这一赛道的竞争烈度。目前公开信息显示,U2尚处于发布阶段,具体企业合作案例和性能表现有待后续披露。

来源:AIbase

celebrityanime
celebrityanime
文章: 6342

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注