xAI 再失华人大将:预训练负责人已离职,马斯克又留不住人了

xAI 再失华人大将:预训练负责人已离职,马斯克又留不住人了

xAI 再失华人大将:预训练负责人已离职,马斯克又留不住人了

一句话看懂:xAI 预训练负责人庄钧堂今日官宣离职,这位曾主导 Grok 2 至 Grok 5 全系列模型预训练、并曾在 OpenAI 参与 GPT-4 和 DALL-E 3 的核心华人大将,在马斯克宣布 xAI 并入 SpaceX 仅三天后选择离开,同时段内 xAI 还有多名员工宣布离职,团队稳定性进一步承压。

事件核心:发生了什么

庄钧堂在社交媒体正式公开离职消息,结束了在 xAI 为期两年的工作。他此前在 xAI 主导了从 Grok 2 到 Grok 5 全部迭代版本的预训练,并负责了 Grok 在 X 平台、特斯拉车载场景下的语音模型,以及 xAI 面向企业的 API 模型。加入 xAI 前,庄钧堂在 OpenAI 工作三年,期间联合署名了 GPT-4 技术报告,参与了 GPT-4o 核心开发,并作为首位贡献者搭建了 OpenAI 的 Embedding 模型,同时主导完成了 DALL-E 3 的图像生成模型。他的学术背景具有跨学科特点:清华工程物理本科、辅修法律,耶鲁统计学硕士、生物医学工程博士,博士期间提出的 AdaBelief 优化器曾被 PyTorch、TensorFlow、Google Flax 等主流框架收录。值得注意的是,仅在宣布离职的今天,xAI 就有多名员工相继发出离职消息,时间点紧挨马斯克三天前宣布 xAI 不再独立运营、并入 SpaceX 统一更名为 “SpaceXAI”。

为什么重要

这起人事变动折射出 xAI 在技术人才管理上的深层问题。庄钧堂是过去一年内 xAI 可查证离职的第 80 余名员工,从 2024 年中开始至今,其 11 位联创已全部离开。尽管马斯克今年 3 月从 Mistral AI 挖来联创 Devendra Chaplot 直接向他汇报,但后者入职仅一个月便离职。马斯克本人公开承认 xAI “没有建立在正确的基础上,正在从头重建”。

庄钧堂的离开对 xAI 的技术延续构成直接挑战:他同时主导了大型语言模型、语音模型和 API 模型的预训练,且 Grok 4 和 Grok 5 的研发仍在进行中,过去两年 xAI 迭代速度虽快(从 Grok 2 到 Grok 5),但核心训练人才的流失可能打乱训练节奏——目前马斯克正对外强调新的 Grok 模型正在 Colossus 2 集群上正常训练。

对用户/开发者/创作者的影响

对 Grok 的普通用户而言,短期内 Grok 在 X 平台的对话、搜索、语音能力预计仍维持现有状态,不会立刻中断,但新版本模型的训练质量和部署节奏存在不确定性——如果 xAI 无法在预训练负责人的后续人选上快速补位,Grok 5 或未来版本的性能提升幅度可能低于预期。

对调用 xAI 企业 API 的开发者来说,庄钧堂主导的企业 API 模型的维护和迭代计划尚不明确。现有 API 签约的客户需要关注后续服务协议中是否有技术路线变更条款。

对关注 AI 模型竞品的行业从业者,xAI 人才持续外流意味着:一方面,这些具有尖端预训练经验的人才正在进入市场,可能进入 OpenAI、Mistral 或中国本土大模型公司;另一方面,xAI 选择引入 Cursor 员工进驻办公室以缓解人事危机,这一跨界合作模式的效果需要持续观察。

值得关注的后续

1. 新任预训练负责人能否在短期内到位,以及 Grok 5 的发布节奏是否会因核心人才流失而延迟或调整。目前马斯克否认 “Grok 将死” 传闻并称新模型正在正常训练,但这与离职潮直接发生的时间矛盾仍需后续交付物验证。

2. Cursor 团队进驻 xAI 办公室后,能否在技术管理和团队稳定性上发挥作用,或者仅仅是过渡性安排。马斯克正在尝试通过外部雇佣而非内部提拔来解决人员流失问题,这一策略的成败将影响 xAI 后续的人才结构。

3. xAI 并入 SpaceX 后,其算力策略的变化:马斯克刚刚将 Colossus 集群租给 Anthropic,同时称新模型在 Colossus 2 上训练,这种自用 + 出租混合模式是否意味着 xAI 算力需求在收缩,或只是在拆分部署,将影响市场对大模型算力供给的判断。

来源:Readhub · AI

celebrityanime
celebrityanime
文章: 3142

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注