Ask HN: 发明大型语言模型(LLMs)的那个人后来怎么样了?

Ask HN: 发明大型语言模型(LLMs)的那个人后来怎么样了?

Ask HN: 发明大型语言模型(LLMs)的那个人后来怎么样了?

一句话看懂:一篇来自 Hacker News 的讨论引发了人们对 Transformer 论文《Attention Is All You Need》八位共同作者去向的关注。这些被誉为“LLM 发明者”的研究人员,如今分散在谷歌、创业公司及其他 AI 研究机构,各自推动着大型语言模型技术走向商业化与开源化。

事件核心:发生了什么

这篇题为“Ask HN: 发明大型语言模型(LLMs)的那个人后来怎么样了?”的帖子,指向了 2017 年谷歌发表的具有里程碑意义的论文《Attention Is All You Need》及其作者群。根据公开资料,八位作者中:Ashish Vaswani、Noam Shazeer、Niki Parmar、Jakob Uszkoreit、Llion Jones 和 Lukasz Kaiser 在很长一段时间内继续留在谷歌从事研究;Aidan N. Gomez 后来成为了一名研究员,并创立了专注于模型效率的 Cohere 公司;Illia Polosukhin 则联合创立了去中心化 AI 平台 NEAR Protocol。目前,Noam Shazeer 和 Niki Parmar 等人在 2021 年离开谷歌,联合创办了 AI 聊天机器人公司 Character.ai。

为什么重要

Transformer 架构是现代几乎所有大语言模型(LLMs)的基础,如 OpenAI 的 GPT 系列、Google 的 PaLM 以及 Meta 的 LLaMA。这些创始人的后续去向,直接影响了 AI 行业的人才流向、商业模式选择以及技术路线竞争。例如,Shazeer 等人离开谷歌创立 Character.ai,表明顶尖研究者更倾向于在创业公司中探索交互式 AI 应用;而 Polosukhin 转向区块链 AI 领域,则开辟了去中心化算力与模型训练的新方向。这种分散化趋势意味着,大型语言模型的发展不再完全由科技巨头主导,创业生态正在加速分化。

对用户/开发者/创作者的影响

对于普通用户和开发者而言,这些“发明者”的去向意味着更多样的 AI 产品选择。例如,Cohere 公司为开发者提供了专注于企业级文本生成的 API,以更高的可控性和较低成本吸引开发需求;Character.ai 则面向 C 端用户提供角色扮演对话体验,降低了生成式 AI 的使用门槛。对于创作者来说,了解这些团队的技术侧重(如模型大小、可定制性)有助于选择更适合的工具,而不是盲目跟随主流模型。同时,开源社区(如基于 NEAR 的模型)也为去中心化应用开发提供了算力入口。

GamsGo AI

AI 工具推荐

想把多个 AI 模型放在一个入口?

GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。

了解 GamsGo AI

推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。

值得关注的后续

1. 商业化落地速度:Cohere 和 Character.ai 虽然融资规模不小,但用户增长和收入数据仍需验证,尤其是与 OpenAI 和 Google 的直接竞争。2. 人才流动是否再次集中:随着市场降温,部分创始团队是否会回巢大厂或与其他公司合并,将影响技术路线统一性。3. 去中心化 AI 的合规挑战:Illia Polosukhin 的 NEAR 平台若支持大模型训练,可能面临算力监管和模型滥用问题,这将是政策关注点。

来源:news.ycombinator.com

celebrityanime
celebrityanime
文章: 6242

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注