1.2万亿,清华教授,挑战美国最强AI,一战封神

2026年6月,清华教授唐杰带领的智谱AI推出编程能力排名全球第二的大模型GLM-5.2,在国产模型被质疑差距拉大的焦虑时刻,证明了中国AI在“让模型干活”这一关键能力上已跻身世界前三。

2026年6月,清华教授唐杰带领的智谱AI推出编程能力排名全球第二的大模型GLM-5.2,在国产模型被质疑差距拉大的焦虑时刻,证明了中国AI在“让模型干活”这一关键能力上已跻身世界前三。

百川智能联合清华大学团队发布医疗增强大模型Baichuan-M4,在权威医疗评测HealthBench中超越GPT-5.5,核心变化是从被动问答转向主动问诊,并引入全程记忆与证据锚定技术,提升了AI在临床决策中的安全性与可用性。

微软正同时扮演大模型“中间商”的双重角色:一方面通过新加坡中转,将 OpenAI 的 GPT 模型销售给字节跳动、腾讯、美团等中国大型企业;另一方面,从 2025 年初起,将中国公司深度求索(DeepSeek)的模型上架 Azure 云,卖给海外用户,甚至考虑将其用于自家 Copilot 产品。彭博社和科技媒…

苹果在 iOS 27 照片应用中推出基于 Apple 智能的 AI 扩图(Extend)工具,可智能补全照片边缘内容,生成画面自然但无法保证与现实完全一致,外媒实测发现存在悬浮卡车、错误新增台阶等问题。

研究人员发现,大语言模型(LLM)更容易被文本“风格”而非实际内容欺骗,导致角色标签(如 、 )之间的边界失效。一种叫“去风格化”的简单改写,就能让攻击成功率从61%骤降至10%,揭示了当前模型在感知自身角色上的根本性软肋。
![[程序员] 除了 chartgpt、claude code,还有其他好用的 AI 推荐吗?](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_1-860-768x403.jpg)
一位程序员在 V2EX 询问除了 ChatGPT 和 Claude Code 之外,还有哪些 AI 工具适用于软件开发,社区推荐集中在 Cursor、ZCode、OpenCode 等针对编码优化的特定产品上,但讨论焦点很快转向了模型可用性的实际问题。

智谱AI计划于今年8月正式发布新一代基础大模型GLM-5.5,据称参数规模或突破万亿。此前因美国对Anthropic两款顶尖模型实施访问限制,全球大模型竞争格局出现空隙,智谱正借此窗口加速追赶全球第一梯队。

一个开源实验项目测评了13种主流大语言模型对291位公众人物的“了解程度”,发现模型间知识库覆盖差异悬殊(置信度从90到18不等),但不同模型对人气的排序高度相似(0.65相关系数)——这意味着大模型的“知识边界”比我们想象得更随机。

Hacker News 用户围绕“如何让 LLM 生成高质量代码”展开讨论,核心观点是:不要指望 LLM 自动产出优质代码,关键取决于开发者如何构建提示词(prompt engineering)、拆分任务以及迭代验证,而非模型本身。

智谱在 6 月 13 日开源的 744B 参数模型 GLM-5.2,在长程强化学习阶段放弃了开源社区广泛使用的 GRPO 算法,转向带价值网络的 PPO。这一技术选择,第一次把“GRPO 在长程任务上不适用”这个业界传闻,摆在了公开且可复现的技术博客里。