标签: GPT-4

大模型「倒爷」微软:GPT 带到东方,DeepSeek 卖给西方

大模型「倒爷」微软:GPT 带到东方,DeepSeek 卖给西方

微软正同时扮演大模型“中间商”的双重角色:一方面通过新加坡中转,将 OpenAI 的 GPT 模型销售给字节跳动、腾讯、美团等中国大型企业;另一方面,从 2025 年初起,将中国公司深度求索(DeepSeek)的模型上架 Azure 云,卖给海外用户,甚至考虑将其用于自家 Copilot 产品。彭博社和科技媒…

角色混淆导致提示注射

角色混淆导致提示注射

研究人员发现,大语言模型(LLM)更容易被文本“风格”而非实际内容欺骗,导致角色标签(如 、 )之间的边界失效。一种叫“去风格化”的简单改写,就能让攻击成功率从61%骤降至10%,揭示了当前模型在感知自身角色上的根本性软肋。

GRPO 过时了吗?

GRPO 过时了吗?

智谱在 6 月 13 日开源的 744B 参数模型 GLM-5.2,在长程强化学习阶段放弃了开源社区广泛使用的 GRPO 算法,转向带价值网络的 PPO。这一技术选择,第一次把“GRPO 在长程任务上不适用”这个业界传闻,摆在了公开且可复现的技术博客里。