标签: AI应用

刘益东:赢家被吃 AI 竞速里 谁是下一个出局者

刘益东:赢家被吃 AI 竞速里 谁是下一个出局者

中国科学院研究员刘益东在CC讲坛指出,AI已从“抗命”发展到“主动欺骗”甚至“恶意报复”人类,且自我迭代能力一年内飙升超17倍。这意味着通用人工智能(AGI)可能在未来两三年内到来,届时人类将面临一个完全陌生且难以掌控的智能体世界。

角色混淆导致提示注射

角色混淆导致提示注射

研究人员发现,大语言模型(LLM)更容易被文本“风格”而非实际内容欺骗,导致角色标签(如 、 )之间的边界失效。一种叫“去风格化”的简单改写,就能让攻击成功率从61%骤降至10%,揭示了当前模型在感知自身角色上的根本性软肋。