
时薪800、学历硕士起:大厂热抢的AI数据“炼金师”到底在做什么?
一句话看懂:大模型训练依赖的海量互联网数据接近枯竭,AI企业正转向“后训练”阶段,急需金融、法律、医学等专业人才手工制作高质量训练数据。这类岗位的时薪可达500-800元,但同时也存在高重复性、价值感模糊的流水线岗位,行业正在形成明显的分化。
事件核心:发生了什么
随着大模型“预训练阶段”的Scaling Law遭遇数据瓶颈——OpenAI前首席科学家Ilya Sutskever在2024年指出互联网数据即将枯竭,中文语料仅占全球的1.3%(阿里研究院数据)——字节、阿里、DeepSeek、MiniMax、智谱等厂商开始大规模招募高级数据标注员。岗位名称从“数据标注”变为“数据百晓生”“AI出题专家”“数据炼金师”,学历要求普遍提升至硕士及以上,并优先考虑有金融、法律、医学、编程、语言学等行业背景的人才。在Boss直聘上,金融、法律等垂类任务时薪已达500-800元;大厂外包岗的月薪也从传统标注的三四千元涨至8000-10000元。但实际从业者体验两极分化:有十多年从业经验的金融专家Molly在字节Xpert平台做投资尽调任务,时薪300-500元,认为工作“很快乐”;而刚毕业的渊星在一家互联网大厂做AI小说标注外包,月薪约8000元,感觉是“需要文学判断力的流水线”,工作氛围压抑,半年内有两名同事离职。
为什么重要
这一变化标志着AI训练数据供应链的根本转型。过去模型能力靠“数据多、算力大”推动,现在互联网数据已不够用,且质量低、噪声高,模型只能学语言模式,无法形成可靠判断。后训练阶段(RLHF、偏好数据构建、模型评测等)成为提升模型能力的关键,这要求人类专家以高成本、高标准的方式“教”模型思考。它意味着:未来大模型能力的差距,将从算力投入转向“如何高效组织人类经验”的能力,专业数据成为新的稀缺资源。
对用户/开发者/创作者的影响
对开发者:如果正在搭建垂直领域AI应用(如法律问答、医疗诊断、金融分析),高质量标注数据将直接决定模型的专业度,建议关注字节Xpert、阿里等平台的专家数据服务,或用类似模式自建标注团队。对内容创作者:AI小说、创意写作等领域的数据标注工作对文学判断力有要求,但岗位仍以标准化流程为主,价值感有限,适合作为入门或兼职,而非长期职业。对普通用户:模型在金融、医疗等领域的回答质量正在快速提升(Molly观察到金融监管和行业变化已被模型逐渐适应),未来可能会以更低成本获得专业咨询服务。
AI 工具推荐
想把多个 AI 模型放在一个入口?
GamsGo AI 集成 ChatGPT、DeepSeek、Gemini、Claude、Midjourney、Veo 等常用模型,适合写作、绘图、视频和日常 AI 工作流。
推广链接:通过此链接购买,我可能获得佣金,不影响你的价格。
值得关注的后续
1. 专家平台的规模扩张:字节Xpert、阿里等平台从2025年下半年起大量招募专家,后续是否开放更多垂类任务、以及任务供给量是否稳定,将影响从业者收入预期。2. 岗位分化的持续:高薪专家岗与低薪流水线岗并存,行业可能进一步分层——专业壁垒高的岗位时薪上涨,可被标准化替代的岗位仍维持低薪。3. 质检与信任机制:目前平台要求全程录屏防作弊,但渊星的经历显示,主观任务(如小说标注)的“错误”判定存在歧义,质检流程的合理性和透明性将成为影响从业者留存的关键。
来源:36氪 · 24小时热榜


