
一句话看懂:2026年6月,清华教授唐杰带领的智谱AI推出编程能力排名全球第二的大模型GLM-5.2,在国产模型被质疑差距拉大的焦虑时刻,证明了中国AI在“让模型干活”这一关键能力上已跻身世界前三。
事件核心:发生了什么
2026年6月12日,美国政府以“国家安全”为由,下架了上线仅三天的美国AI模型Fable 5。该模型凭借在20分钟内复刻游戏《我的世界》等惊人表现引发行业震动。6月17日,智谱AI开放GLM-5.2模型,在权威编程评测榜单Code Arena上以1595分位列全球第二,仅次于已下架的Fable 5。这意味着,在尚可使用的模型中,GLM-5.2排名第一,打破了此前由谷歌Gemini占据的“全球前三”格局。智谱AI此前于2026年1月赴港股上市,盘中市值一度飙升至1.2万亿港元,尽管公司年营收仅约7亿元。
为什么重要
唐杰团队将研发资源集中押注Coding(编程)方向,是在判断“Chat这一仗已基本打完”后主动切换范式的结果。传统大模型比拼对话能力,而新范式的核心是模型能否自主规划、写代码、跑测试、修Bug,成为“能干活的智能体”。GLM-5.2的成绩验证了这条技术路线的可行性——中国模型不再仅在参数或对话评测上追赶,而是在“让AI替代人类完成实际工作任务”的关键维度上,实现了全球前三的突破。这一进展也解释了资本市场为何愿意给一家营收规模极小的公司极高估值:投资者押注的不是当前收入,而是下一轮AI范式变革中的地位。
对用户/开发者/创作者的影响
1. 开发者与程序员:GLM-5.2的开源(及公开API)意味着国产编程辅助工具可能迎来质的飞跃。开发者可尝试用其替代Claude或GPT系列完成代码调试、跨文件改Bug、自动化测试等任务,大幅缩短开发周期。尤其在企业内部落地时,国产模型在数据合规和部署成本上更具优势。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
2. 企业采购与IT决策者:智谱的To B战略(政府、银行、学校等客户)导致其回款周期长,但其模型在关键能力上的世界级排名,将推动更多企业将其纳入采购清单,用于内部流程自动化、代码审查、自动化运维等场景。需留意的是,智谱C端生态较弱,短期用户增长红利有限。
3. AI行业观察者:唐杰的“死磕”策略证明,长期投入单一技术方向(如Coding)有可能形成结构性壁垒。同类型创业公司若想在竞争中突围,可能需要建立类似的“判断力护城河”,而非追逐短期流量或参数竞赛。
值得关注的后续
1. 产品落地节奏:GLM-5.2的API定价与开放策略尚未公布,是否会影响Claude、OpenAI等国际产品的定价体系?若智谱同步推出面向开发者的低门槛工具,可能加速国产编程生态成熟。
2. 竞品反应:谷歌Gemini、苹果等海外巨头是否会针对Coding领域加大投入?国内其他大模型公司(如DeepSeek、百度、阿里)是否会调整研发重心,从“聊天”转向“干活”?
3. 监管与合规风险:Fable 5因“国家安全”被下架,提示了大模型在自主操作电脑、自动化执行任务等场景下面临的监管不确定性。智谱在To B和政府场景的部署,需密切关注国内外对“智能体”类产品的合规要求变化。
来源:36氪 · 24小时热榜


