![[酷工作] [招聘] AI for code 创业团队: LLM Training / Alignment/ 强化学习方向核心成员](https://www.chat-gpts.plus/wp-content/uploads/2026/06/ai_cover_4-625.jpg)
一句话看懂:一家专注“代码智能”的AI创业公司,由20年强化学习经验的技术专家创立,已完成2亿元融资,正在招募LLM训练和对齐方向的核心人才,目标是将AI从“代码辅助”推向“自主软件工程”。
事件核心:发生了什么
该团队在V2EX社区发布招聘信息,明确其核心方向:大模型训练(Pre-training、SFT、Middle Training)、强化学习与对齐(RLHF、Preference Optimization)、Code LLM优化、Coding Agent系统构建,以及软件工程任务评测(如SWE-bench)。岗位聚焦于大模型训练/RL算法工程师,要求对Transformer结构、PPO/DPO/GRPO等方法有系统理解和实战经验。办公地点可选北京、上海、深圳,提供有竞争力薪资、早期期权和充足GPU算力。
为什么重要
这则招聘反映出AI for Code赛道正在从“调用API做演示”转向“自研模型+强化学习驱动”的深水区。团队强调“从0到1构建系统”而非单纯使用API,表明其目标是打造底层模型能力,而非直接与Codex或Claude做表层竞争。2亿元融资和20年RL背景的创始人组合,说明资本和行业对“代码+强化学习”技术路线的价值判断正在形成共识。同时,招聘中对“模型稳定性优化”“数据构造”等工程能力的强调,暗示该领域不再是纯学术问题,而是需要大规模工程落地。
对用户/开发者/创作者的影响
对Coding Agent用户:若该团队成功,未来可能推出自主修复Bug、自动重构代码的Agent产品,而非仅靠补全和问答。对AI研究员和工程师:这是进入早期核心团队的窗口期,能直接参与模型训练策略设计,而非仅做工具调用层面的开发。对企业采购方:需要关注这类自研模型团队的产品节奏,判断其是否能在真实软件工程任务中(如SWE-bench)提升效率,而非仅依赖开源模型微调。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
1. 产品落地形态:团队是否会推出独立Coding Agent产品,或是为现有IDE提供插件,将影响开发者选择。2. 与巨头差异化:如原文回复中质疑的,如何与Codex/Claude竞争?团队若不能展示在弱监督数据构造或强化学习细粒度对齐上的独特进展,可能面临同质化风险。3. 开源策略:目前公开信息未提及开源计划,如果他们选择闭源但开放API,需观察定价与性能能否压倒现有成熟服务。4. 招聘结果:能否吸引到有头部大模型团队经验或顶会论文的研究者,将是验证团队技术吸引力的风向标。
![[Question]: Failed to build knowledge graph](https://www.chat-gpts.plus/wp-content/uploads/2026/06/6886-32ff5dfd-768x403.jpg)

