
一句话看懂:前 OpenAI 设计师 Thomas Dimson 和 Joey Flynn 推出了一款名为 In the Weights 的网站,它通过向多个 AI 模型提问“某个人是谁”,来评估这个人在模型“内部权重”中的记忆强度,并将其量化为一个可供比较的分数。这本质上是将传统“谷歌虚荣搜索”换成了以 LLM 为中心的虚荣评测工具。
事件核心:发生了什么
In the Weights 网站并非提供搜索引擎,而是向包括 Grok、Gemini、多个版本的 GPT、Claude、Llama 在内的十几种 AI 模型发送同一段查询:“Who is ?Give up to 10 results…”。网站会收集模型返回的描述,聚类相似回答并分配一个“强度分数”。例如,TechCrunch 编辑 Anthony Ha 获得了 641 分(前 6%),而演员 Macaulay Culkin 和歌剧演唱家 Pavarotti 以 988 分并列榜首。其名称“Weights”指的是 AI 模型的浮点参数,网站旨在衡量模型在不依赖网络搜索的情况下能否“记住”一个人。该项目由 Dimson 和 Flynn 在离开 OpenAI 后开发,灵感来源于一篇关于 AI 权重和 Terry Bisson 短篇小说的戏仿博客文章。
为什么重要
这个轻量级项目精准捕捉到了 2026 年一个正在发生的转变:越来越多用户不再从网页搜索中了解公众人物,而是从聊天机器人那里获得信息。Dimson 本人指出,“Google 虚荣搜索在 2026 年是错误的目标”,因为流量正在向大语言模型迁移。In the Weights 虽然带有娱乐性质,但它实际上是第一个将“模型是否记得某人”这一模糊概念量化的公开工具。它揭示了不同模型对同一人物的“知识”存在显著差异,甚至同一个模型家族(如 GPT 系列)的内部版本也可能给出截然不同的结果,这间接暴露了模型训练数据的偏差以及推理阶段的“幻觉”问题。
对用户/开发者/创作者的影响
- 对普通用户:如果某个名字在 In the Weights 上得分很低,并不意味着这个人不“出名”,只是说明当前主流 AI 模型的训练数据中没有足够或一致的信息。这提醒人们,大众对“知名度”的认知正从搜索引擎的索引,转向模型的训练语料。
- 对 AI 开发者:该工具为模型评测提供了另一种维度的参考。目前公开信息显示,项目方计划进一步分析“为什么同一个系列的模型返回不同结果”,“哪些模型偏向于哪种类型的人”,以及“哪些人应该拥有维基百科页面却没有”。这些分析可能推动模型训练数据的透明度和公平性改进。
- 对内容创作者与企业:如果企业或个人希望自身信息被 AI 准确“记住”,仅靠 SEO 策略已不够,因为模型知识直接受限于其训练语料的覆盖范围。这意味着,建立起网页索引与模型训练数据之间的双轨策略将变得更加关键。
值得关注的后续
- In the Weights 是否会开放 API 或数据集,供研究团队分析模型的“知识盲区”或“偏差分布”?这可能会成为模型评测社区的一个新工具。
- 其他搜索或 AI 平台是否会推出类似功能,例如直接对比不同模型对同一查询的记忆结果?这将进一步激化 AI 时代的“记忆竞争”。
- 该项目是否会引发关于“AI 模型训练数据中人物的知情权和删除权”的讨论?如果一个模型错误地“记住”了一个人,或者故意遗忘了一个人,现有的监管框架是否适用?
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
来源:TechCrunch


