Ask HN: 发明大型语言模型（LLMs）的那个人后来怎么样了？

一句话看懂：一篇来自 Hacker News 的讨论引发了人们对 Transformer 论文《Attention Is All You Need》八位共同作者去向的关注。这些被誉为“LLM 发明者”的研究人员，如今分散在谷歌、创业公司及其他 AI 研究机构，各自推动着大型语言模型技术走向商业化与开源化。

事件核心：发生了什么

这篇题为“Ask HN: 发明大型语言模型（LLMs）的那个人后来怎么样了？”的帖子，指向了 2017 年谷歌发表的具有里程碑意义的论文《Attention Is All You Need》及其作者群。根据公开资料，八位作者中：Ashish Vaswani、Noam Shazeer、Niki Parmar、Jakob Uszkoreit、Llion Jones 和 Lukasz Kaiser 在很长一段时间内继续留在谷歌从事研究；Aidan N. Gomez 后来成为了一名研究员，并创立了专注于模型效率的 Cohere 公司；Illia Polosukhin 则联合创立了去中心化 AI 平台 NEAR Protocol。目前，Noam Shazeer 和 Niki Parmar 等人在 2021 年离开谷歌，联合创办了 AI 聊天机器人公司 Character.ai。

为什么重要

Transformer 架构是现代几乎所有大语言模型（LLMs）的基础，如 OpenAI 的 GPT 系列、Google 的 PaLM 以及 Meta 的 LLaMA。这些创始人的后续去向，直接影响了 AI 行业的人才流向、商业模式选择以及技术路线竞争。例如，Shazeer 等人离开谷歌创立 Character.ai，表明顶尖研究者更倾向于在创业公司中探索交互式 AI 应用；而 Polosukhin 转向区块链 AI 领域，则开辟了去中心化算力与模型训练的新方向。这种分散化趋势意味着，大型语言模型的发展不再完全由科技巨头主导，创业生态正在加速分化。

对用户/开发者/创作者的影响

对于普通用户和开发者而言，这些“发明者”的去向意味着更多样的 AI 产品选择。例如，Cohere 公司为开发者提供了专注于企业级文本生成的 API，以更高的可控性和较低成本吸引开发需求；Character.ai 则面向 C 端用户提供角色扮演对话体验，降低了生成式 AI 的使用门槛。对于创作者来说，了解这些团队的技术侧重（如模型大小、可定制性）有助于选择更适合的工具，而不是盲目跟随主流模型。同时，开源社区（如基于 NEAR 的模型）也为去中心化应用开发提供了算力入口。

AI 工具推荐

想把多个 AI 模型放在一个入口？

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型，适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接：通过此链接购买，我可能获得佣金，不影响你的价格。

值得关注的后续

1. 商业化落地速度：Cohere 和 Character.ai 虽然融资规模不小，但用户增长和收入数据仍需验证，尤其是与 OpenAI 和 Google 的直接竞争。2. 人才流动是否再次集中：随着市场降温，部分创始团队是否会回巢大厂或与其他公司合并，将影响技术路线统一性。3. 去中心化 AI 的合规挑战：Illia Polosukhin 的 NEAR 平台若支持大模型训练，可能面临算力监管和模型滥用问题，这将是政策关注点。

来源：news.ycombinator.com

Ask HN: 发明大型语言模型（LLMs）的那个人后来怎么样了？